HDPA Görögország: AFM és AMKA azonosítók felismerése
A görög Adatvédelmi Hatóság (HDPA) 2024-ben 89 végrehajtási határozatot hozott — ez 162%-os növekedés a 2022-es 34 határozathoz képest. Az érvényesítés gyors felgyorsulása egyszerre tükrözi a HDPA megnövekedett kapacitását és az ágazat-specifikus megfelelési hiányosságokat: az idegenforgalom a HDPA-ügyek 38%-át teszi ki, és hasonlóan érintett a hajózási szektor is.
AFM: Görögország elsődleges kereskedelmi azonosítója
Az ΑΦΜ (Αριθμός Φορολογικού Μητρώου, adóazonosító szám) egy 9 jegyű szám, amelyet minden görög állampolgár, lakos és vállalkozás kap adóügyi nyilvántartás céljára. Az ellenőrző számjegy súlyozott összeg algoritmust alkalmaz: az 1–8. számjegyet rendre (256, 128, 64, 32, 16, 8, 4, 2) súlyokkal kell megszorozni, az eredményt összeadni, majd 11-es modulus szerint osztani. Ha az eredmény 10, a szám érvénytelen; egyébként az ellenőrző számjegy az eredmény 10-es maradéka.
Az AFM minden görög kereskedelmi dokumentumban megjelenik — számlákon, szerződésekben, munkaszerződésekben és kormányzati nyomtatványokon. Mind magánszemélyek, mind vállalkozások elsődleges kereskedelmi azonosítója Görögországban.
Felismerési pontosság: A generikus NLP-eszközök az AFM-t 52%-os pontossággal ismerik fel (HDPA 2024-es elemzése). A hibák fő okai:
- Az AFM 9 jegyű formátuma sok más referenciaszámra és dátumrészletre hasonlít görög dokumentumokban
- A kétlépéses súlyozott modulo-11/modulo-10 ellenőrző számjegy algoritmus nincs implementálva a generikus eszközökben
- Görög dokumentumokban az AFM sokszor explicit jelzés nélkül jelenik meg (pl. beágyazva a cím blokkokba, „ΑΦΜ:” felirat nélkül)
AMKA: Görögország társadalombiztosítási azonosítója
Az ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, Társadalombiztosítási Nyilvántartási Szám) egy 11 jegyű szám, amely kódolja a születési dátumot és a nemet:
- 1–6. számjegy: születési dátum NNHHÉÉ formátumban
-
- számjegy: nem (páratlan = férfi, páros = nő)
- 8–11. számjegy: sorszám ellenőrző számjeggyel
A születési dátum és nem kódolása miatt az AMKA szerkezetileg hasonlít a svéd personnummerra — és ugyanazt a GDPR különleges kategóriájú adatvédelmi problémát veti fel: a szám biológiai nemet rögzít.
Az AMKA minden görög egészségügyi dokumentumban, társadalombiztosítási bejelentésben és munkáltatói nyilvántartásban megjelenik. Minden görög állampolgár és jogszerű lakos rendelkezik AMKA-val — ez az egészségügyi ellátás és a szociális juttatások elérésének azonosítója, a társadalombiztosítási szám görög megfelelője.
A görög ábécé: az NLP-infrastruktúra kihívása
A görög szöveg a görög ábécét alkalmazza — ez teljes mértékben eltér a latin betűs írásmódtól. Ez alapvető infrastrukturális kihívást jelent a PII-felismerés számára.
Unicode-tartományok: A görög karakterek az U+0370–U+03FF tartományban (Görög és Kopt blokk) és az U+1F00–U+1FFF tartományban (Görög kiterjesztett, politonikus formákhoz) helyezkednek el. A csak ASCII vagy Latin Extended karaktereket kezelő eszközök a görög szövegeket egyáltalán nem tudják feldolgozni.
Görög NER-modellek: A spaCy el_core_news modellje biztosít görög NER-képességet — de kifejezett görög nyelvi konfigurációt igényel. Az alapértelmezett (jellemzően angolra beállított) konfigurációt használó szervezetek görög ábécés dokumentumokra semmilyen kimenetet nem kapnak.
Vegyes írású dokumentumok: A görög üzleti és kormányzati dokumentumok gyakran keverik a görög ábécét (a főtartalom) és a latin ábécét (márkanevekhez, műszaki terminusokhoz, angol megjegyzésekhez). Az NLP-csővezetékeknek mindkét írásrendszert kezelniük kell egyazon dokumentumon belül.
Görög névfelismerés: A görög nevek nominatívuszban jelennek meg (Γεώργιος Παπαδόπουλος), de görög mondatokban genitívuszi/akkuzatívuszi formában is előfordulnak (pl. Γεωργίου Παπαδόπουλου genitivuszban). Az eset-érzékeny NER-felismerés görög morfológiai elemzést igényel.
Az idegenforgalmi szektor: idényes adatkezelési megfelelés
Az idegenforgalom a HDPA-végrehajtási esetek 38%-át teszi ki. A megfelelési kihívás a méretben és az idényjellegen rejlik.
Szállodaszektor PMS-rendszerek: Az ingatlan-kezelő rendszerek (PMS) teljes vendéginformációt kezelnek — útlevélszámokat, állampolgárságot, születési dátumot, kapcsolattartási adatokat — minden vendég esetében. A HDPA-végrehajtás során kiderült, hogy sok szállodai PMS-rendszer 5 évnél hosszabb ideig tárolja a vendégadatokat dokumentált cél és az adatmennyiséggel arányos biztonsági intézkedések nélkül.
IBAN és fizetési adatok: Görög idegenforgalmi vállalkozások EU-s és nemzetközi vendégektől érkező fizetési adatokat kezelnek. A vendégszámlák részleges kártyaszámot tartalmaznak; a foglalási rendszerekben teljes fizetési adatok és lejárati dátumok szerepelnek. A PCI DSS-megfelelés átfed a fizetési adatokra vonatkozó GDPR-követelményekkel.
Személyzeti adatok fluktuációja: Az idegenforgalomban dolgozó szezonális munkások általában 4–6 hónapos szerződéssel dolgoznak. A HDPA-végrehajtás ismétlődő hiányosságokat tárt fel a távozó szezonális alkalmazottak rendszer-hozzáférésének visszavonása terén — ez a jelenség jellemző minden magas fluktuációjú iparágra.
A görög nyelvű HDPA-megfeleléshez technikai követelmény: AFM és AMKA felismerés ellenőrző összeg validálással, görög ábécé NER-támogatás (spaCy el_core_news), valamint görög útlevél- és személyigazolvány-szám felismerés. Az idegenforgalmi szektorban ezen felül szükséges a szállodai PMS adatmegőrzési dokumentáció és a szezonális személyzet hozzáférés-visszavonási eljárásainak kidolgozása — amint azt a HDPA-végrehajtás is egyértelművé tette.