anonym.legal

By · Last updated 2026-03-21

Nazaj na blogGDPR in skladnost

Orodja za PII samo v anglescini: odgovornost GDPR

Izvrsevanrje GDPR se enako nanasa na krsitve v vseh jezikih EU. Ko vase anglescino orientirano orodje za PII prezre nemske, francoske ali poljske identifikatorje, nastane odgovornost.

March 21, 20267 min branja
GDPR compliance liabilitymultilingual PII detectionEnglish-only PII tool risksEU supervisory authoritydata breach notification

Orodja za PII samo v anglescini: odgovornost GDPR

Posodobljeno za leto 2026

Resnicnost izvrsevanrja

GDPR govori o rezultatih, ne o trudu. Podjetje lahko v dobri veri uporablja orodje za zaznavanje PII. Toda ce to orodje prezre francoske, nemske ali poljske identifikatorje, je podjetje se vedno krsilo 32. clen. Pravilo zahteva "ustrezne tehnicne ukrepe". Orodje, ki ne najde identifikatorjev v vasih zapisih, temu ne zadosti. Dobri nameni tega ne spremenijo.

Obramba "uporabljali smo orodje" ne drzala. Nadzorni organi pregledajo specificna uporabljena orodja. Ko je orodje, ki deluje samo v anglescini, obdelovalo vecjezikovne zapise, 32. clen postane kljucno vprasanje.

To je resnicen vzorec izvrsevanrja. Bil je opazovanj v primerih GDPR po vsej EU.

Kar ugotavljajo nadzorni organi

Podatki GDPR iz leta 2024 kazejo, da krsitve 32. clena sodijo med najpogostejse osnove za globe. Podjetja navajajo avtomatizirana orodja za anonimizacijo kot dokaz tehnicnih ukrepov. Nadzorni organi nato preverijo, ali ta orodja delujejo.

Za globalne delodajalce je tveganje sistemsko. Vzemite platformo za upravljanje kadrov. Ta ocisti osebne podatke pred analitiko. Morda odstrani angleske e-postne naslove in telefonske stevilke. Toda puscal francouzi stevilke NIR, nemske Steuer-ID in poljske stevilke PESEL neokrnjene. Ostanejo tudi svédske personnummer.

Podjetje misli, da so zapisi cisti. Nadzorni organ ugotovi, da je 40% identifikatorjev v "anonimiziranem" naboru podatkov se vedno prisotnih. To so nacionalni identifikatorji, ki jih orodje nikoli ni pokrivalo.

Formate identifikatorjev, ki jih orodja samo v anglescini prezrejo

Nacionalni identifikatorji EU se razlikujejo od americkih in genericnih formatov. Orodja, ki delujejo samo v anglescini, jih ne zaznajo:

Nemska Steuer-Identifikationsnummer: 11-stevilcni format s kontrolno vsoto. Orodja, zgrajena za vzorce americke SSN (9-stevilcni), je ne ujamejo.

Francoski NIR (numero de securite sociale): 15-stevilcni format. Kodira spol, leto rojstva in oddelek. Genericki vzorci identifikatorjev ga ne ujamejo.

Svédska Personnummer: 10 ali 12 stevk z Luhnovo kontrolno stevko. Format se razlikuje za osebe, rojene pred letom 1990. Genericki vzorci tega nimajo.

Poljska PESEL: 11 stevk s kodiranim datumom rojstva in spolom. Brez preverjanja kontrolne vsote postane stopnja laznih pozitivov previsoka.

To so pogosti identifikatorji. Vsak delodajalec v EU, ponudnik zdravstvenih storitev ali financna firma, ki obdeluje nemske, francouze, svédske ali poljske zapise, jih bo srecal. Niso redki. Oglejte si naso referenco entitet za celoten seznam podprtih tipov identifikatorjev.

GDPR temelji na rezultatih

Clen 32 GDPR zahteva "ustrezne tehnicne in organizacijske ukrepe". Meja je na rezultatih. Je organizacija uporabljala orodje? To ni pravo vprasanje. Je orodje zascitilo osebne zapise, ki jih je obdelovalo? To je pravo vprasanje.

Za organizacije z vecjezikovnimi zapisi EU "ustrezno" pomeni zaznavanje nemskih Steuer-ID v isti obdelavi kot angleske e-postne naslove. Organizacija, ki zazna 95% anglescine, toda 0% nemskih nacionalnih identifikatorjev, ni dosegla meje. Vrzel ne zadosti njenim nemskim zapisom.

Vecjezikovna pokritost ni neobvezna. Je del tega, kar zahteva 32. clen. Brez izjem. Nas vodnik o skladnosti z GDPR pokriva celoten okvir.

Kako oceniti svojo orodje

Pravo vprasanje za vase orodje je preprosto. Ali najde e-postne naslove v katerem koli jeziku? To je manj pomembno. Ali najde formate nacionalnih identifikatorjev v vasih dejanskih zapisih? To je pravi test.

Za operacije v EU, ki sluzijo Nemciji, Franciji, Poljski ali Svedski, to pomeni pokritost prepoznavnikov, specificnih za jezikovne obmocje. Ce vase orodje ne more pokazati solidnih stopenj zaznavanja za te formate, obravnavajte vrzel kot zivo tveganje za skladnost. Nasa stran o varnosti in skladnosti pojasnjuje, kako obravnavamo vecjezikovno pokritost.


anonym.legal zazna nemsko Steuer-ID, francoski NIR, svédsko Personnummer, poljsko PESEL in nacionalne identifikatorje za vse drzave clanice EU. Vsak prepoznavalec uporablja validacijo, ki uposteva kontrolno vsoto, za natancne rezultate.

Viri

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.