By · Last updated 2026-03-21

Zurück zum BlogDSGVO & Compliance

Warum englischsprachige PII-Tools eine...

Die Durchsetzung der GDPR gilt gleichermaßen für Verstöße in allen EU-Sprachen.

March 21, 20267 min Lesezeit
GDPR compliance liabilitymultilingual PII detectionEnglish-only PII tool risksEU supervisory authoritydata breach notification

Nur-Englische PII-Tools: Ein DSGVO-Risiko

Aktualisiert für 2026

Die Durchsetzungsrealität

Die DSGVO bewertet Ergebnisse, nicht Absichten. Ein Unternehmen kann ein PII-Erkennungstool in gutem Glauben einsetzen. Wenn dieses Tool jedoch französische, deutsche oder polnische IDs übersieht, hat das Unternehmen trotzdem gegen Artikel 32 verstoßen. Die Regel verlangt „geeignete technische Maßnahmen." Ein Tool, das die IDs in Ihren Daten nicht findet, erfüllt diese Anforderung nicht. Gute Absichten ändern daran nichts.

Die Verteidigung „wir haben ein Tool verwendet" hält nicht stand. Aufsichtsbehörden prüfen die konkret eingesetzten Tools. Wenn ein nur-englisches Tool mehrsprachige Daten verarbeitet hat, wird Artikel 32 zur zentralen Frage.

Dies ist ein echtes Durchsetzungsmuster. Es ist in DSGVO-Fällen in der gesamten EU dokumentiert.

Was Aufsichtsbehörden feststellen

DSGVO-Daten aus 2024 zeigen, dass Artikel-32-Verstöße zu den häufigsten Bußgeldgründen gehören. Unternehmen nennen automatisierte Anonymisierungstools als Belege für technische Maßnahmen. Aufsichtsbehörden prüfen dann, ob diese Tools tatsächlich funktionieren.

Für globale Arbeitgeber ist das Risiko systemisch. Nehmen wir eine HR-Plattform. Sie entfernt personenbezogene Daten vor der Analyse. Englische E-Mail-Adressen und Telefonnummern werden möglicherweise korrekt entfernt. Doch französische NIR-Nummern, deutsche Steuer-IDs und polnische PESEL-Nummern bleiben intakt. Schwedische Personnummer auch.

Das Unternehmen glaubt, die Datensätze seien bereinigt. Die Aufsichtsbehörde stellt fest, dass 40 % der IDs im „anonymisierten" Datensatz noch vorhanden sind. Es sind nationale IDs, die das Tool nie abgedeckt hat.

Identifier-Formate, die nur-englische Tools übersehen

Nationale EU-IDs unterscheiden sich von US- und generischen Formaten. Nur-englische Tools erkennen sie nicht zuverlässig:

Deutsches Steuer-Identifikationsnummer: 11-stelliges Format mit Prüfsumme. Tools, die nur für das US SSN-Format (9-stellig) entwickelt wurden, erkennen es nicht.

Französische NIR (numéro de sécurité sociale): 15-stelliges Format. Es kodiert Geschlecht, Geburtsjahr und Departement. Generische ID-Muster passen nicht.

Schwedisches Personnummer: 10 oder 12 Stellen mit einer Luhn-Prüfziffer. Das Format ändert sich für Personen, die vor 1990 geboren wurden. Generische Muster berücksichtigen das nicht.

Polnisches PESEL: 11 Stellen mit kodiertem Geburtsdatum und Geschlecht. Ohne Prüfsummenvalidierung werden die Falsch-Positiv-Raten zu hoch.

Diese Identifier sind weit verbreitet. Jeder EU-Arbeitgeber, jede Gesundheitseinrichtung und jedes Finanzunternehmen, das deutsche, französische, schwedische oder polnische Daten verarbeitet, wird ihnen begegnen. Sie sind nicht selten. Unsere Entities-Referenz enthält eine vollständige Liste der unterstützten ID-Typen.

DSGVO ist ergebnisbasiert

Artikel 32 der DSGVO verlangt „geeignete technische und organisatorische Maßnahmen." Die Messlatte liegt bei den Ergebnissen. Hat die Organisation ein Tool eingesetzt? Das ist nicht die richtige Frage. Hat das Tool die verarbeiteten personenbezogenen Daten geschützt? Das ist die richtige Frage.

Für Organisationen mit mehrsprachigen EU-Daten bedeutet „geeignet", deutsche Steuer-IDs im gleichen Durchlauf zu erkennen wie englische E-Mail-Adressen. Eine Organisation, die 95 % der englischen Inhalte, aber 0 % der deutschen nationalen IDs erkennt, hat die Anforderung für ihre deutschen Daten nicht erfüllt. Die Lücke versagt bei deutschen Datensätzen.

Mehrsprachige Abdeckung ist nicht optional. Sie ist Teil dessen, was Artikel 32 verlangt. Punkt. Unser DSGVO-Leitfaden erklärt den vollständigen Rahmen.

So bewerten Sie Ihr Tool

Die richtige Frage an Ihr Tool ist einfach. Kann es E-Mail-Adressen in jeder Sprache finden? Das ist weniger entscheidend. Kann es die nationalen ID-Formate in Ihren tatsächlichen Daten finden? Das ist der eigentliche Test.

Für EU-Betriebe, die Deutschland, Frankreich, Polen oder Schweden bedienen, bedeutet das eine locale-spezifische Erkennungsabdeckung. Wenn Ihr Tool keine soliden Erkennungsraten für diese Formate vorweisen kann, behandeln Sie die Lücke als aktuelles Compliance-Risiko. Unsere Sicherheits- und Compliance-Seite erklärt unseren Umgang mit mehrsprachiger Abdeckung.


anonym.legal erkennt deutsche Steuer-ID, französische NIR, schwedisches Personnummer, polnisches PESEL und nationale IDs aller EU-Staaten. Jeder Recognizer verwendet prüfsummenbewusste Validierung für genaue Ergebnisse.

Quellen

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.