Nástroje pro PII pouze v angličtině: Odpovědnost podle GDPR
Aktualizováno pro rok 2026
Realita vymáhání předpisů
GDPR se zaměřuje na výsledky, nikoli na snahu. Firma může v dobré víře používat nástroj pro detekci PII. Pokud ale tento nástroj přehlíží francouzské, německé nebo polské identifikátory, firma přesto porušila článek 32. Pravidlo vyžaduje „vhodná technická opatření." Nástroj, který nedokáže najít identifikátory ve vašich záznamech, tuto podmínku nesplňuje. Dobré úmysly to nezmění.
Obhajoba „používali jsme nástroj" neobstojí. Dozorové orgány zkoumají konkrétní použité nástroje. Pokud anglocentrický nástroj zpracovával vícejazyčné záznamy, stává se klíčovou otázkou článek 32.
Toto je reálný vzorec vymáhání. Byl pozorován v případech GDPR po celé EU.
Co zjišťují dozorové orgány
Data GDPR z roku 2024 ukazují, že porušení článku 32 patří mezi nejčastější důvody pro pokuty. Firmy citují automatizované nástroje pro anonymizaci jako důkaz technických opatření. Dozorové orgány pak prověřují, zda tyto nástroje fungují.
Pro globální zaměstnavatele je riziko systémové. Vezměme personální platformu. Odstraňuje osobní data před analytickým zpracováním. Může odstranit anglické e-mailové adresy a telefonní čísla. Ale francouzská čísla NIR, německá Steuer-ID a polská čísla PESEL ponechá nedotčena. Švédská personnummer zůstanou také.
Firma si myslí, že záznamy jsou čisté. Dozorový orgán zjistí, že 40 % identifikátorů v anonymizovaném datovém souboru je stále přítomno. Jsou to národní identifikátory, které nástroj nikdy nepokrýval.
Formáty identifikátorů, které nástroje pouze v angličtině přehlíží
Národní identifikátory EU se liší od amerických a obecných formátů. Nástroje pouze v angličtině je nedokážou detekovat:
Německé Steuer-Identifikationsnummer: 11místný formát s kontrolním součtem. Nástroje vytvořené pro vzory US SSN (9 číslic) jej nezachytí.
Francouzské NIR (numéro de sécurité sociale): 15místný formát. Kóduje pohlaví, rok a místo narození. Obecné vzory pro identifikátory jej nerozpoznají.
Švédské Personnummer: 10 nebo 12 číslic s Luhnovým kontrolním číslicí. Formát se mění u osob narozených před rokem 1990. Obecné vzory toto neobsahují.
Polské PESEL: 11 číslic s kódovaným datem narození a pohlavím. Bez kontrol kontrolního součtu jsou míry falešně pozitivních výsledků příliš vysoké.
Toto jsou běžné identifikátory. Každý zaměstnavatel, poskytovatel zdravotní péče nebo finanční firma v EU, která zpracovává německé, francouzské, švédské nebo polské záznamy, se s nimi setká. Nejsou vzácné. Kompletní seznam podporovaných typů identifikátorů najdete v referenčním přehledu entit.
GDPR je zaměřeno na výsledky
Článek 32 GDPR požaduje „vhodná technická a organizační opatření." Laťka je nastavena na výsledky. Použila organizace nástroj? To není správná otázka. Chránil nástroj osobní záznamy, které zpracovával? To je správná otázka.
Pro organizace s vícejazyčnými záznamy EU „vhodné" znamená detekovat německá Steuer-ID ve stejném průchodu jako anglické e-mailové adresy. Organizace, která zachytí 95 % anglického obsahu, ale 0 % německých národních identifikátorů, nesplňuje tuto podmínku. Mezera selže u jejích německých záznamů.
Vícejazyčné pokrytí není volitelné. Je součástí toho, co článek 32 vyžaduje. Bez výjimky. Náš průvodce souladu s GDPR pokrývá celý rámec.
Jak hodnotit váš nástroj
Správná otázka pro váš nástroj je jednoduchá. Dokáže najít e-mailové adresy v jakémkoli jazyce? To je méně podstatné. Dokáže najít formáty národních identifikátorů ve vašich skutečných záznamech? To je skutečný test.
Pro operace v EU obsluhující Německo, Francii, Polsko nebo Švédsko to znamená pokrytí rozpoznávačů specifických pro danou lokalitu. Pokud váš nástroj nedokáže prokázat solidní míry detekce pro tyto formáty, zacházejte s mezerou jako s aktivním rizikem pro dodržování předpisů. Naše stránka bezpečnosti a souladu vysvětluje, jak řešíme vícejazyčné pokrytí.
anonym.legal detekuje německé Steuer-ID, francouzské NIR, švédské Personnummer, polské PESEL a národní identifikátory všech členských států EU. Každý rozpoznávač používá validaci s kontrolním součtem pro přesné výsledky.