HDPA Grezia: AFM eta AMKA Detekzioa
2026rako eguneratua
Greziako datu-babeserako agintaritzak (HDPA) 89 betearazpen-erabaki hartu zituen 2024an. Hori %162ko igoera da 2022ko 34 erabakietatik. Turismoaren sektoreak kasuen %38 biltzen ditu. Itsas operazioek arrisku gehigarria eransten dute.
Nazioarte mailako DPA betearazpenaren testuingururako, ikusi GDPR betetze gida.
AFM: Zerga Erregistro Zenbakia
ΑΦΜ 9 digituko zerga zenbakia da. Herritar, egoiliar eta enpresa guztiek dute bat.
Kontrol-zifra: 1-8 bitarteko digituak 256, 128, 64, 32, 16, 8, 4 eta 2 pisuekin bidertu. Produktuak batu. 11ren moduloa hartu. Emaitza 10 bada, zenbakia baliogabea da. Bestela, kontrol-zifra emaitzaren 10eko moduloa da.
AFM fakturetan, kontratuetan eta gobernuko inprimakietan agertzen da. Herrialdean pertsonen eta enpresen identifikatzaile nagusia da.
Detekzio-hutsunea: NLP tresna generikoek AFM %52ko zehaztasunarekin bakarrik aurkitzen dute (HDPA 2024). Hiru arrazoik azaltzen dute hori. Lehena: 9 digituko formatua erreferentzia-zenbaki eta data-zatien antzekoa da. Bigarrena: bi pausoko modulo kontrol-zifra tresna gehienetan falta da. Hirugarrena: zenbakiak etiketa gabe agertzen da maiz, helbide-bloke baten barruan.
ID egituratuen inguruko informazio gehiagorako, ikusi entitateen erreferentzia.
AMKA: Gizarte Aseguruaren Zenbakia
ΑΜΚΑ 11 digituko zenbakia da. 1-6 digituek jaiotze-data kodetzen dute EEHHHUU formatuan. 7. digituak generoa kodetzen du: bikoitiak emeentzat, bakoitiak arentzat. 8-11 digituek serie-zenbakia eta kontrol-zifra osatzen dituzte.
Diseinua Suediako personnummer-aren antzekoa da. Biek GDPR arazo bera eragiten dute. Zenbakiak sexu biologikoa datu gisa agerian uzten du.
AMKA osasun-erregistroetan, gizarte segurantzako fitxategietan eta nominen gestioetan agertzen da. Herritar eta egoiliar guztiek dute bat. Osasun-laguntzarako eta prestazioak jasotzeko zenbaki nagusia da. Ikus segurtasun eta betetze orria GDPR datu mota honetara nola aplikatzen den jakiteko.
Script Laguntza Hutsunea
Greziar testua hizkuntza latindarretatik bestelako idazkera sistema bat erabiltzen du. Hori PII tresnetan oztopo nagusia da.
Unicode tarteak: Greziar karaktereak U+0370-U+03FF eta U+1F00-U+1FFF tarteetan daude. ASCII edo Latin skripto soiletarako egindako tresnok ez dituzte karaktere hauek prozesatuko.
NER eredua: spaCy-ren el_core_news ereduak greziar NER kudeatzen du. Baina berariazko ezarpena behar du. Biderik gehienek ingelesezko ezarpen lehenetsia erabiltzen dute. Greziar skripto bidezko dokumentuetan emaitzarik ematen ez dute.
Skripto mistoko fitxategiak: Herrialdeko dokumentuek askotan greziar eta latindar skripto biak nahastuta izaten dituzte. Marka izenak eta termino teknikoak latindar skripton agertzen dira. Gorputzeko testua grezieraren idazkeran dago. Bide batek biak kudeatu behar ditu.
Kasu formak: Izenak forma aldatzen dute grezierako esaldietan. Γεώργιος Παπαδόπουλος subjektu formako izen-forma da, Γεωργίου Παπαδόπουλου genitiboan bihurtzen delarik. Tresnak morfologia-analisia behar du biak harrapatzeko.
Hizkuntza anitzeko PII detekzioari buruzko galderei erantzuna emateko, ikusi FAQ.
Turismo Betetze Arriskuak
Turismoaren sektoreak kasuen %38 biltzen ditu. Eskala eta sasoikotasunak arrisku nagusiak sortzen dituzte.
PMS erretentzioa: Hoteleko sistemen bidez pasaporte-zenbakiak, jaiotze-datak eta harremanetarako datuak biltzen dira. HDPA-k sistema asko datu hauek bost urte edo gehiagoz mantentzen dituela aurkitu du. Gehienek ez zuten xede adierazita. Gehienek segurtasun-kontrol ahulak zituzten.
Ordainketa datuak: Hotelek bertako eta atzerriko gonbidatuen txartel datuak kudeatzen dituzte. Folioak txartelaren zenbaki partzialak dituzte. Erreserba-sistemek xehetasun osoak dituzte. PCI DSS eta GDPR biak aplikatzen dira.
Sasoiko langileria: Ostalaritzako langileek 4-6 hilabeteko kontratuetan lan egiten dute askotan. HDPA-k kasu ugaritan langileek lanpostua utzi ondoren sarbidea kendu ez zela aurkitu du. Hutsune hau txandaketa handia duten sektoreetan ohikoa da.
HDPA Betetzearen Egiaztapen Teknikoa
Greziar hizkuntzan idatzitako dokumentuak prozesatzeko, gutxieneko pila hau erabili. AFM detekzioak bi pausoko modulo kontrol-zifra baliozkotzea behar du. AMKA detekzioak jaiotze-data eta genero-digitua analizatzea behar du. Gehitu greziar skripto NER spaCy el_core_news bidez. Sartu pasaporte eta nortasun-agiri detekzioa bi skriptotarako.
Turismo operadoreek bi antolaketa-urrats ere behar dituzte. Lehena: PMS datu erretentzioa dokumentatu. Bigarrena: sasoiko langileek lan utzi ondoren sistemako sarbidea kendu. Urrats hauek HDPAren aurkikuntza ohikoenak konpontzen dituzte.
Ikusi prezioak dokumentu ugari duten ostalaritzako workflows-etarako API planek.
anonym.legal-ek AFM eta AMKA kontrol-zifra osoarekin detektatzen ditu. spaCy el_core_news bidearen bidez greziar skripto NER onartzen du.