Ezkutuko GDPR Betegarritasunaren Hutsuneea
GDPR-ek hizkuntza-lehentasuna ez. 4(1) artikulua "pertsonaltzat datena" definitu, hizkuntzan gabe erabilitzearen berri. Alemaniar Steuer-ID US Segurtasun-zenbakia bezala babesteua. Frantziako NIR UK Asigurazioaren zenbakia bezala erregulazioa.
Baina PII detektzio-tresna gehienak ingelesaren bidez eraikita daude.
ACL 2024an argitaratutako ikerketak aurkitu zuten hibridoa NLP ahalmena F1 0.60-0.83 lortu Europar localerentzat — baina ingelesaren bakarrik tresnak ingelesa ez den testuan 0tik hurren egiten ditu estrukturaren estatu identifikatzailerentzat.
Hizkuntza-berezia PII Detekzioak
Hizkuntza-berezia PII detekzioak ez soilik hizkuntza bakoitzentzat entrenaturiko ereduak, baita hizkuntza bakoitzarentzat balio-duten entitate motak, egituran berezia, eta balian berezia. Alemaniar Steuer-ID detekzioak checksum algoritmo-a egiaztatzen, arabieraren izenak konektazioa egiaztatzen, eta txinaren izenak familia-izenak batean egiaztatzen.
Iturburuak: