By · Last updated 2026-03-21

Povratak na BlogGDPR & Usklađenost

Alati za PII samo na engleskom: odgovornost prema GDPR-u

GDPR provedba jednako se primjenjuje na povrede podataka na svim EU jezicima. Kada vaš alat za PII usmjeren na engleski propusti njemačke, francuske ili poljske identifikatore, pravne posljedice su stvarne.

March 21, 20267 min čitanja
GDPR compliance liabilitymultilingual PII detectionEnglish-only PII tool risksEU supervisory authoritydata breach notification

Alati za otkrivanje PII samo na engleskom: odgovornost prema GDPR-u

Ažurirano za 2026.

Stvarnost provedbe

GDPR se bavi rezultatima, a ne trudom. Tvrtka može koristiti alat za otkrivanje PII-a u dobroj vjeri. No ako taj alat propusti francuske, njemačke ili poljske ID-ove, tvrtka je svejedno prekršila Članak 32. Propis zahtijeva "odgovarajuće tehničke mjere". Alat koji ne može pronaći ID-ove u vašim zapisima ne ispunjava taj zahtjev. Dobre namjere to ne mijenjaju.

Obrana "koristili smo alat" ne drži vodu. Nadzorna tijela pregledavaju specifične alate koji su korišteni. Kada je alat samo za engleski obrađivao višejezične zapise, Članak 32 postaje ključno pitanje.

Ovo je stvaran obrazac provedbe. Viđen je u GDPR slučajevima diljem EU-a.

Što nadzorna tijela pronalaze

GDPR podaci iz 2024. pokazuju da povrede Članka 32 spadaju među najčešće osnove za novčane kazne. Tvrtke navode automatizirane alate za anonimizaciju kao dokaz tehničkih mjera. Nadzorna tijela zatim provjeravaju funkcioniraju li ti alati.

Za globalne poslodavce, rizik je sistemski. Uzmite HR platformu. Ona uklanja osobne podatke prije analitike. Može ukloniti engleske adrese e-pošte i telefonske brojeve. No ostavlja francuske NIR brojeve, njemačke Steuer-ID-ove i poljske PESEL brojeve nedirnutima. Ni švedski personnumeri ne nestaju.

Tvrtka misli da su zapisi čisti. Nadzorno tijelo pronalazi da je 40% ID-ova u "anonimiziranom" skupu podataka još uvijek tamo. To su nacionalni ID-ovi koje alat nikada nije pokrivao.

Formati identifikatora koje alati samo na engleskom propuštaju

EU nacionalni ID-ovi razlikuju se od američkih i generičkih formata. Alati samo na engleskom ne uspijevaju ih otkriti:

Njemački Steuer-Identifikationsnummer: 11-znamenkasti format s kontrolnom sumom. Alati izgrađeni za uzorke američkog SSN-a (9 znamenki) ga ne hvataju.

Francuski NIR (numéro de sécurité sociale): 15-znamenkasti format. Kodira spol, godinu rođenja i departman. Generički ID obrasci ga ne prepoznaju.

Švedski Personnummer: 10 ili 12 znamenki s Luhn kontrolnom znamenkom. Format se razlikuje za osobe rođene prije 1990. Generički obrasci to ne uzimaju u obzir.

Poljski PESEL: 11 znamenki s kodiranim datumom rođenja i spolom. Bez provjere kontrolne sume, stope lažno pozitivnih rezultata postaju previsoke.

Ovo su uobičajeni identifikatori. Svaki EU poslodavac, pružatelj zdravstvenih usluga ili financijska tvrtka koja rukuje njemačkim, francuskim, švedskim ili poljskim zapisima susretat će ih. Nisu rijetki. Pogledajte našu referencu entiteta za potpuni popis podržanih vrsta ID-ova.

GDPR se temelji na ishodima

GDPR Članak 32 poziva na "odgovarajuće tehničke i organizacijske mjere". Ljestvica je na rezultatima. Je li organizacija koristila alat? To nije pravo pitanje. Je li alat zaštitio osobne zapise koje je obradio? To je pravo pitanje.

Za organizacije s višejezičnim EU zapisima, "odgovarajuće" znači otkrivanje njemačkih Steuer-ID-ova u istom prolazu kao i engleskih adresa e-pošte. Organizacija koja hvata 95% engleskog sadržaja, ali 0% njemačkih nacionalnih ID-ova, nije ispunila ljestvicu. Ta praznina narušava njezine njemačke zapise.

Višejezična pokrivenost nije izborni dodatak. Ona je dio onoga što Članak 32 zahtijeva. Bez iznimke. Naš vodič za GDPR usklađenost pokriva cijeli okvir.

Kako procijeniti vaš alat

Pravo pitanje za vaš alat je jednostavno. Može li pronaći adrese e-pošte na bilo kojim jeziku? To je manje važno. Može li pronaći formate nacionalnih ID-ova u vašim stvarnim zapisima? To je pravi test.

Za EU operacije koje posluju u Njemačkoj, Francuskoj, Poljskoj ili Švedskoj, to znači pokrivenost prepoznavača specifičnih za lokalizaciju. Ako vaš alat ne može pokazati solidne stope otkrivanja za te formate, tretirajte tu prazninu kao živi rizik za usklađenost. Naša stranica o sigurnosti i usklađenosti objašnjava kako upravljamo višejezičnom pokrivenošću.


anonym.legal otkriva njemački Steuer-ID, francuski NIR, švedski Personnummer, poljski PESEL i nacionalne ID-ove za sve EU države. Svaki prepoznavač koristi validaciju svjesnu kontrolne sume za točne rezultate.

Izvori

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.