Tillbaka till BloggenGDPR & Efterlevnad

HDPA Grekland: AFM och AMKA Detektion — Varför Grekiska Identifierare Misslyckas i 52% av Generiska NLP-verktyg

Grekisk AFM upptäcktes med 52% noggrannhet av generiska verktyg. HDPA utfärdade 89 beslut 2024 — en ökning med 162% från 2022. Turism- och sjöfartssektorerna står inför distinkta efterlevnadskrav. Grekiska alfabetets NER-krav.

March 7, 20267 min läsning
Greece HDPAAFM AMKA detectionGreek alphabet NERtourism GDPRGreek identifiers

Greklands Hellenic Data Protection Authority (HDPA) utfärdade 89 verkställande beslut 2024, en ökning med 162% från 34 beslut 2022. Den skarpa ökningen av verkställighet återspeglar både växande HDPA-kapacitet och sektorsspecifika efterlevnadsbrister inom turism — som står för 38% av HDPA-fallen — och sjöfartsverksamhet.

AFM: Greklands Primära Kommersiella Identifierare

Den ΑΦΜ (Αριθμός Φορολογικού Μητρώου, Skatteregistreringsnummer) är ett 9-siffrigt nummer som tilldelas alla grekiska medborgare, invånare och företag för skatteadministration. Kontrollsiffran använder en viktad summationsalgoritm: multiplicera siffrorna 1-8 med vikter (256,128,64,32,16,8,4,2), summera, ta modulo 11. Om resultatet = 10, är numret ogiltigt. Annars är kontrollsiffran = resultatet modulo 10.

AFM förekommer i alla grekiska kommersiella dokument — fakturor, kontrakt, anställningsavtal och myndighetsformulär. Det är den primära kommersiella identifieraren för både individer och företag i Grekland.

Upptäcktsnoggrannhet: Generiska NLP-verktyg upptäcker AFM med 52% noggrannhet (HDPA 2024 analys). Misslyckandemodellerna:

  • AFM:s 9-siffriga format matchar många referensnummer och datumkomponenter i grekiska dokument
  • Den viktade modulo-11/modulo-10 tvåstegs kontrollsiffran är inte vanligt implementerad i generiska verktyg
  • Grekiska dokument presenterar ofta AFM utan explicit etikett i kontext (inbäddad i adressblock, inte märkt "ΑΦΜ:")

AMKA: Greklands Socialförsäkringsidentifierare

Den ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, Socialförsäkringsregistreringsnummer) är ett 11-siffrigt nummer som kodar födelsedatum och kön:

  • Siffror 1-6: Födelsedatum i DDMMYY-format
  • Siffra 7: Kön (udda = man, jämn = kvinna)
  • Siffror 8-11: Sekventiellt nummer med kontrollsiffra

Födelsedatum + könkodningen gör AMKA strukturellt liknande Sveriges personnummer — och skapar samma GDPR-speciella kategori oro: numret avslöjar biologiskt kön som en fråga av register.

AMKA förekommer i alla grekiska vårddokument, socialförsäkringsinlämningar och arbetsgivarregister. Varje grekisk medborgare och laglig invånare har en AMKA, vilket gör det motsvarande ett socialförsäkringsnummer för vård och tillgång till sociala förmåner.

Grekiska Alfabetet: NLP Infrastruktur Utmaningen

Grekisk text använder det grekiska alfabetet — ett helt annat skriftsystem än latinskriftspråk. Detta skapar en grundläggande infrastrukturutmaning för PII-detektion:

Unicode-områden: Grekiska tecken upptar Unicode-området U+0370 till U+03FF (Grekiska och Koptiska blocket) och U+1F00 till U+1FFF (Grekiska Utökad för polytoniska former). Verktyg som endast hanterar ASCII eller Latin Utökade tecken misslyckas helt med att bearbeta grekisk text.

Grekiska NER-modeller: spaCys el_core_news-modell tillhandahåller grekisk NER-kapacitet — men kräver explicit grekisk språkkonfiguration. Organisationer som använder standard-språkkonfigurationer (vanligtvis engelska) kommer inte att få något resultat för grekisk-skriven dokument.

Blandade skript dokument: Grekiska affärs- och myndighetsdokument blandar ofta grekisk skrift (huvudinnehåll) med latinsk skrift (varumärkesnamn, tekniska termer, engelska anteckningar). NLP-pipelines måste hantera båda skripten i samma dokument.

Namnigenkänning på grekiska: Grekiska namn förekommer i nominativ form (Γεώργιος Παπαδόπουλος) men också i genitiv/ackusativformer i grekiska meningar (Γεωργίου Παπαδόπουλου i genitiv). Kasusmedveten NER-igenkänning kräver grekisk morfologisk analys.

Turismsektorn: Säsongsdata Bearbetning Efterlevnad

Turism står för 38% av HDPA:s verkställande fall. Utmaningen för efterlevnad är skala och säsongsbetonad:

Hotell PMS-system: Fastighetsförvaltningssystem bearbetar fullständig gästinformation — passnummer, nationalitet, födelsedatum, kontaktdata — för alla gäster. HDPA:s verkställighet har funnit många hotell PMS-system som behåller gästdata i mer än 5 år utan dokumenterat syfte och utan säkerhetsåtgärder proportionerliga till datavolymen.

IBAN och betalningsdata: Grekiska turistföretag bearbetar betalningsdata från EU- och internationella gäster. Gästfakturor (hotellräkningar) innehåller delvisa kortnummer; reservationssystem innehåller fullständiga betalningsuppgifter med utgångsdatum. PCI DSS-efterlevnad överlappar med GDPR-krav för betalningsdata.

Personaldataomsättning: Säsongsarbetare inom hotell och restaurang slutför vanligtvis kontrakt på 4-6 månader. HDPA:s verkställighet har funnit upprepade brister i att återkalla systemåtkomst för avgångna säsongsanställda — ett mönster som är vanligt i alla branscher med hög personalomsättning.

För HDPA-efterlevnad i grekisk-språkiga sammanhang: AFM och AMKA-detektion med kontrollsummevalidering, grekisk alfabet NER-stöd (spaCy el_core_news), och grekisk pass/nationellt ID-detektion är de tekniska kraven. För efterlevnad specifikt inom turismsektorn är dokumentation av hotell PMS-dataretention och procedurer för återkallande av säsongsanställdas åtkomst de ytterligare organisatoriska krav som HDPA:s verkställighet klargör.

Källor:

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.