By · Last updated 2026-03-21

Zpět na blogGDPR a shoda

Nástroje pro PII pouze v angličtině: Odpovědnost podle GDPR

Vymáhání GDPR se vztahuje stejně na úniky ve všech jazycích EU. Pokud váš anglocentrický nástroj pro PII přehlíží německé, francouzské nebo polské identifikátory, máte problém s dodržováním předpisů.

March 21, 20267 min čtení
GDPR compliance liabilitymultilingual PII detectionEnglish-only PII tool risksEU supervisory authoritydata breach notification

Nástroje pro PII pouze v angličtině: Odpovědnost podle GDPR

Aktualizováno pro rok 2026

Realita vymáhání předpisů

GDPR se zaměřuje na výsledky, nikoli na snahu. Firma může v dobré víře používat nástroj pro detekci PII. Pokud ale tento nástroj přehlíží francouzské, německé nebo polské identifikátory, firma přesto porušila článek 32. Pravidlo vyžaduje „vhodná technická opatření." Nástroj, který nedokáže najít identifikátory ve vašich záznamech, tuto podmínku nesplňuje. Dobré úmysly to nezmění.

Obhajoba „používali jsme nástroj" neobstojí. Dozorové orgány zkoumají konkrétní použité nástroje. Pokud anglocentrický nástroj zpracovával vícejazyčné záznamy, stává se klíčovou otázkou článek 32.

Toto je reálný vzorec vymáhání. Byl pozorován v případech GDPR po celé EU.

Co zjišťují dozorové orgány

Data GDPR z roku 2024 ukazují, že porušení článku 32 patří mezi nejčastější důvody pro pokuty. Firmy citují automatizované nástroje pro anonymizaci jako důkaz technických opatření. Dozorové orgány pak prověřují, zda tyto nástroje fungují.

Pro globální zaměstnavatele je riziko systémové. Vezměme personální platformu. Odstraňuje osobní data před analytickým zpracováním. Může odstranit anglické e-mailové adresy a telefonní čísla. Ale francouzská čísla NIR, německá Steuer-ID a polská čísla PESEL ponechá nedotčena. Švédská personnummer zůstanou také.

Firma si myslí, že záznamy jsou čisté. Dozorový orgán zjistí, že 40 % identifikátorů v anonymizovaném datovém souboru je stále přítomno. Jsou to národní identifikátory, které nástroj nikdy nepokrýval.

Formáty identifikátorů, které nástroje pouze v angličtině přehlíží

Národní identifikátory EU se liší od amerických a obecných formátů. Nástroje pouze v angličtině je nedokážou detekovat:

Německé Steuer-Identifikationsnummer: 11místný formát s kontrolním součtem. Nástroje vytvořené pro vzory US SSN (9 číslic) jej nezachytí.

Francouzské NIR (numéro de sécurité sociale): 15místný formát. Kóduje pohlaví, rok a místo narození. Obecné vzory pro identifikátory jej nerozpoznají.

Švédské Personnummer: 10 nebo 12 číslic s Luhnovým kontrolním číslicí. Formát se mění u osob narozených před rokem 1990. Obecné vzory toto neobsahují.

Polské PESEL: 11 číslic s kódovaným datem narození a pohlavím. Bez kontrol kontrolního součtu jsou míry falešně pozitivních výsledků příliš vysoké.

Toto jsou běžné identifikátory. Každý zaměstnavatel, poskytovatel zdravotní péče nebo finanční firma v EU, která zpracovává německé, francouzské, švédské nebo polské záznamy, se s nimi setká. Nejsou vzácné. Kompletní seznam podporovaných typů identifikátorů najdete v referenčním přehledu entit.

GDPR je zaměřeno na výsledky

Článek 32 GDPR požaduje „vhodná technická a organizační opatření." Laťka je nastavena na výsledky. Použila organizace nástroj? To není správná otázka. Chránil nástroj osobní záznamy, které zpracovával? To je správná otázka.

Pro organizace s vícejazyčnými záznamy EU „vhodné" znamená detekovat německá Steuer-ID ve stejném průchodu jako anglické e-mailové adresy. Organizace, která zachytí 95 % anglického obsahu, ale 0 % německých národních identifikátorů, nesplňuje tuto podmínku. Mezera selže u jejích německých záznamů.

Vícejazyčné pokrytí není volitelné. Je součástí toho, co článek 32 vyžaduje. Bez výjimky. Náš průvodce souladu s GDPR pokrývá celý rámec.

Jak hodnotit váš nástroj

Správná otázka pro váš nástroj je jednoduchá. Dokáže najít e-mailové adresy v jakémkoli jazyce? To je méně podstatné. Dokáže najít formáty národních identifikátorů ve vašich skutečných záznamech? To je skutečný test.

Pro operace v EU obsluhující Německo, Francii, Polsko nebo Švédsko to znamená pokrytí rozpoznávačů specifických pro danou lokalitu. Pokud váš nástroj nedokáže prokázat solidní míry detekce pro tyto formáty, zacházejte s mezerou jako s aktivním rizikem pro dodržování předpisů. Naše stránka bezpečnosti a souladu vysvětluje, jak řešíme vícejazyčné pokrytí.


anonym.legal detekuje německé Steuer-ID, francouzské NIR, švédské Personnummer, polské PESEL a národní identifikátory všech členských států EU. Každý rozpoznávač používá validaci s kontrolním součtem pro přesné výsledky.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.