Grške avtoritete Hellenic Data Protection Authority (HDPA) je izdala 89 odločb o pretikih leta 2024, kar je 162-odstotni porast glede na 34 odločb leta 2022. Nagel porast v izterjavi HDPA odraža tako rastoče zmogljivosti HDPA kot tudi sektorsko specifične napake pri skladnosti v turizmu — ki predstavlja 38 % primerov HDPA — in pomorskih operacijah.
AFM: Glavni komercialnem identifikator Grčije
ΑΦΜ (Αριθμός Φορολογικού Μητρώου, Davčna registracijska številka) je 9-mestna številka, dodeljena vsem grškim državljanom, prebivalcem in podjetjem za davčno upravo. Kontrolna številka uporablja obteženi seštevek algoritma: pomnoži števke 1-8 s težami (256,128,64,32,16,8,4,2), seštej, vzemi modulo 11. Če je rezultat = 10, je številka neveljavna. V nasprotnem primeru je kontrolna številka = rezultat modulo 10.
AFM se pojavi v vseh grških trgovinskih dokumentih — računih, pogodbah, pogodbe o zaposlitvi in vladnih obrazcih. Je primarni komercialni identifikator tako za posameznike kot za podjetja v Grčiji.
Natančnost zaznave: Generična orodja NLP zaznajo AFM z 52-odstotno natančnostjo (analiza HDPA 2024). Načini napak:
- 9-mestna oblika AFM se ujema z mnogimi referenčnimi številkami in datumskimi komponentami v grških dokumentih
- Dvostopenjska kontrolna številka, obtežena modulo-11/modulo-10, ni običajno implementirana v generičnih orodjih
- Grški dokumenti pogosto predstavljajo AFM brez eksplicitne oznake v kontekstu (vdelane v naslovne bloke, ne oznake "ΑΦΜ:")
AMKA: Grški identifikator socialne varnosti
ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, Številka registra socialne varnosti) je 11-mestna številka, ki kodira datum rojstva in spol:
- Števke 1-6: Datum rojstva v obliki DDMMYY
- Števka 7: Spol (liho = moški, sodo = ženski)
- Števke 8-11: Zaporedna številka s kontrolno številko
Kodiranje datuma rojstva + spola naredi AMKA strukturno podobno švedskemu personnummer — in ustvari isto GDPR-ske posebne kategorije pomena: številka razkriva biološki spol kot dejstvo zapisa.
AMKA se pojavi v vseh grških zdravstvenih dokumentih, seznamih socialne varnosti in zapisih delodajalcev. Vsak grški državljan in zakoniti rezident ima AMKA, kar ga naredi enakovrednim številki socialne varnosti za dostop do zdravstva in socialnih ugodnosti.
Grška abeceda: Izziv infrastrukture NLP
Grešče besedilo uporablja grško abecedo — popolnoma drugačen sistem pisanja od latiničnih jezikov. To ustvari temeljni infrastrukturni izziv za zaznavanje PII:
Unicode razponi: Grški znaki zasedajo razpon Unicode U+0370 do U+03FF (grški in koptski blok) in U+1F00 do U+1FFF (grška razširjena za poltonske oblike). Orodja, ki ravnajo le z ASCII ali latiničnimi razširjenimi znaki, ne morejo obdelati grške besede sploh.
Grški NER modeli: Spacy-jev el_core_news model zagotavlja grško možnost prepoznavanja NER — vendar zahteva eksplicitno grško konfiguracijo jezika. Organizacije, ki uporabljajo privzete konfiguracije jezika (tipično angleščina), ne bodo prejele rezultatov za grške dokumente s pisavo.
Dokumenti mešanih pisav: Grški poslovni in vladni dokumenti pogosto mešajo grško pisavo (glavna vsebina) z latiničnimi pisavami (imena blagovnih znamk, tehnični izrazi, angleške opombe). Cevovodi NLP morajo rokovati obema pisavama v istem dokumentu.
Prepoznavanje imen v grščini: Grška imena se pojavijo v imenovalnem primeru (Γεώργιος Παπαδόπουλος), vendar tudi v rodilniku/tožilniku oblikah v grških stavkih (Γεωργίου Παπαδόπουλου v rodilniku). Zavedljivo prepoznavanje NER zahteva grško morfološko analizo.
Turizem: Skladnost obdelave podatkov s sezonskostjo
Turizem predstavlja 38 % primerov izterjave HDPA. Izziv skladnosti je obseg in sezonskost:
Hotelski PMS sistemi: Sistemi upravljanja lastnosti obdelujejo popolne podatke gostov — številke potnih listov, državljanstvo, datume rojstva, kontaktne podatke — za vse goste. Izterjava HDPA je ugotovila, da mnogi hotelski PMS sistemi zadržijo podatke gostov 5 + let brez dokumentiranega namena in brez varnostnih ukrepov, sorazmerni z obsegom podatkov.
IBAN in podatki o plačilih: Grška turična podjetja obdelujejo podatke o plačilih od gostov iz EU in mednarodnih. Gostinski računi (hotelske račune) vsebujejo delne številke kartic; rezervacijski sistemi vsebujejo polne podatke o plačilih s datumi veljavnosti. Skladnost PCI DSS se prekriva z zahtevami GDPR za podatke o plačilih.
Promet kadrov: Sezonski delavci v gostinskstvu običajno opravijo pogodbe 4-6 mesecev. Izterjava HDPA je ugotovila ponavljajoče se napake pri odpravi dostopa do sistema za odhajajoče sezonske delavce — vzorec, ki je pogost za katero koli industrijo z visoko fluktuacijo zaposlenih.
Za skladnost HDPA v grško-jezikovnih kontekstih: zaznavanje AFM in AMKA z validacijo kontrolne vsote, grška podpora za prepoznavanje abecede NER (spacy el_core_news) in zaznavanje grške potne liste / nacionalnega ID-ja so tehnične zahteve. Za skladnost v turizmu posebej so dokumentacija o ohranitvi podatkov v hotelskem PMS in postopki odpravljanja dostopa za sezonske delavce dodatne organizacijske zahteve, ki jih izterjava HDPA razjasnjuje.
Viri: