Greziko Datuak Babesteko Agintari Helenikoek (HDPA) 89 betearazpen erabaki hartu zituen 2024an. Hori %162ko igoera da 2022ko 34 erabakietatik. Bi sektore jasaten dute presiorik handiena: turismoa eta itsas garraioa.
2026rako eguneratua
Turismoa: Sasoiko Datu Prozesamendu Masiboa
Greziara 30 milioi atzerritar bisitari baino gehiago etorri ziren 2024an. Bisita bakoitzak datu pertsonalak sortzen ditu. Hotelak, POS sistemak, turismo enpresak eta jatetxeek guztiek biltzen dituzte. Arazo nagusia denbora da. Erregistroak udan heltzen dira, ekainean eta irailean. Askoz luzeago mantendu behar dira seguruak.
HDPAren 2024ko hotel ikuskaritzek hiru akats mota ohikoak aurkitu zituzten.
POS erretentzioko akatsak: Jatetxeetako POS sistemek txartel eta ordainagirien erregistroak gordetzen zituzten adierazitako mugak gainditurik. Hotel enpresa gehienek ez zuten erretentzioko plan idatzirik. Erregistroak iraungitze-datarik gabe egon ziren, "kontuetarako" markatuta.
Erreserba plataformen gabeziak: Erreserba plataforma globalak erabiltzen zituzten hotelak sarritan ez zuten Datuak Prozesatzeko Akordiorik. Askok ere ez zituzten Transferentziaren Inpaktu Ebaluazioak egiten EBtik kanpoko sistemetarako transferentzietarako.
Sasoiko sarbide akatsak: Goi-sasoiko langileek gonbidatuen kudeaketa sistemetarako sarbidea lortu zuten. Langile horien egiaztapenak arraroak ziren. Saio-hasierako kredentzialak sarri hilabeteak ireki egon ziren joan eta gero.
Turismoak HDPAko kasuen sektore handienaren zatia hartzen du. Ikusi nola funtzionatzen duten EBko nazio identifikatzaileen detekzioak Europan ikuspegi zabalagoa lortzeko.
Itsas Garraioaren Betetzea: Tripulazioaren Erregistroak Eskalan
Ontzien tonelaziari dagokionez, herrialdeak munduan buruzagia jarraitzen du itsasontzien jabetzaren aldetik. Flota heleniarrak 90.000 itsasgizon baino gehiago enplegatzen ditu. Atenaseko enpresek hainbat herrialdeetako langileekin osatutako flotetan tripulazioaren erregistroak kudeatzen dituzte.
Tripulazioaren erregistroek lau GDPR arazo sortzen dituzte.
Bandera-estatuko legea: Bandera-estatuko legea ontzietan aplikatzen da, edozein tokitan nabigatu arren. GDPRk tripulazioaren erregistroen erabilera estaltzen du ontzian, ez bakarrik lehorreko bulegoan.
Nazioarteko tripulazioak: Tripulazio askok ez dituzte bertako herritarrak. Filipinetatik, Ukrainatik, Indiatik eta Indonesiakoak ohikoak dira. Haien pasaporteak, STCW txartelak eta osasun erregistroak guztiak Atenasen kudeatutako sistemetatik igarotzen dira.
Osasun erregistroak: Itsas lanek ohiko osasun egiaztagiriak behar dituzte. Osasun erregistroak GDPRren 9. artikuluaren kategoria berezia dira. Oinarri legal argi bat, segurtasun sendoa eta sarbide arau zorrotzak behar dituzte.
Itsasgizonaren ID zenbakiak: STCW txartelak eta Itsasgizonaren Liburuak jaulkitzen duen herrialdearen araberako zenbaki formatu bereziak erabiltzen dituzte. ID hauek tripulazioko sistemetan agertzen dira eta PII estaldura osoa lortzeko detekzioa behar dute. ID moten konfiantza-puntuaziorako, ikusi PII detekzio bitarra eta konfiantza-puntuazioa.
Nazio IDak: AFM eta AMKA
AFM (Zerga Zenbakia): AFM 9 digituko zenbakia da. Egiaztapen digitua pisu-batura arau baten bidez ezarrita dago. Herrialdeko merkataritza-ID nagusia da. Negozio-tratuetan, lan-fitxategietan eta zerbitzu publikoetan agertzen da.
NLP tresna generikoak sarritan galtzen dituzte AFMak. 9 digituko ereduak daten eta erreferentzia-kodeekin talka egiten du. Horrek positibo faltsuak sortzen ditu checksum urratsa egiten ez denean. Tresnak ere galtzen dituzte espazioak edo bereizle arraroak dituzten AFMak.
AMKA (Gizarte Aseguruen Zenbakia): AMKA 11 digituko zenbakia da. Jaiotze-data, generoa eta sekuentzia-kode bat gordetzen ditu. Enplegu-kontratuetan, botika-aginduetan eta ospitaleko inprimaketetan agertzen da.
Nazio ID txartela (Astinomiki Taftotita): Letra bat, gero sei edo zazpi digitu, Greziako jaulkitze arauak jarraituz.
Pasaportea: EU formatu estandarra bertako jaulkitze arauekin.
Testuaren NER Helenikoa
Bertako idazkera ez da Latina. Merkataritzako NLP modelo gehienak testu latindarrean entrenatzen dira. Latindarrez entrenatutako tresna batek ezin ditu izenak edo helbideak aurkitu greziar karaktere-fitxategietan.
Hizkuntza honetarako NER soinuak lau gauza behar ditu:
- spaCy el_core_news edo parekidea den NLP modelo heleniko bat
- Bertako karaktere-tarteetarako tokenizazio egokia
- Bertako izen-ereduak, ingelestik eta alemanitik desberdinak direnak
- Helbide-terminoak: "Odos" (kalea), "Plateia" (plaza), "Leoforos" (etorbidea)
Turismo edo itsas garraioko enpresetarako, HDPA mailako PII detekzioak AFM eta AMKA checksum egiaztapenak eta NER helenikoa behar ditu pipeline bakarrean.