By · Last updated 2026-06-05

Zurück zum BlogDSGVO & Compliance

Was Presidio vermisst: Die 220+ Entitätstypen...

Presidio wird mit ~40 Standard-Entitätserkennern ausgeliefert, die sich auf US-Identifikatoren konzentrieren.

June 5, 20267 min Lesezeit
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio Übersieht 220+ DSGVO-Entitäten: Die EU-Lücke

Aktualisiert für 2026

Microsoft Presidio liefert etwa 40 Standard-Entitätserkenner mit. Für US-Deployments reicht das. Es deckt SSNs, US-Pässe, Führerscheine, Kreditkarten und E-Mails ab.

Für EU-Deployments ist die Lücke groß. Die DSGVO gilt für alle personenbezogenen Daten in der EU. Das gilt unabhängig von der Nationalität der betroffenen Person. EU-Teams brauchen Erkenner, die Presidio nicht mitliefert.

Was Presidio Enthält

Die Standard-Erkenner fallen in vier Gruppen.

US-zentrierte IDs:

  • US-Sozialversicherungsnummer (SSN)
  • US-Reisepassnummer
  • US-Führerscheinnummer
  • US-Bankkontonummer
  • US-ITIN
  • US-Arztzulassungsnummer

Universelle IDs:

  • E-Mail-Adresse
  • Telefonnummer
  • IP-Adresse
  • Kreditkartennummer
  • Krypto-Wallet-Adresse
  • URL

Textentitäten (NER-basiert):

  • PERSON
  • LOCATION
  • ORGANIZATION
  • DATE_TIME

Begrenzte internationale Abdeckung:

  • UK NHS-Nummer
  • UK National Insurance Number (NINO)
  • Einige Finanz-IDs

Gesamt: etwa 40 Erkenner.

Was EU-Teams Brauchen

Finanz-IDs

IBAN erscheint in fast jedem EU-Geschäftsdokument. Sie steht in Zahlungen, Rechnungen und Gehaltsabrechnungen. IBAN folgt ISO 13616. Presidio hat keinen IBAN-Erkenner.

Nehmen wir ein deutsches Fintech. Jede Zahlungsdatei enthält eine IBAN. Ohne IBAN-Erkennung sucht das Tool nur nach Kreditkartennummern. Die wichtigste EU-Zahlungs-ID wird übersehen. Das bedeutet, ein zentrales DSGVO-relevantes Datenelement wird nie gefunden.

Nationale Steuer-IDs

Keine dieser IDs ist in Presidios Standardbibliothek:

  • Steueridentifikationsnummer: 11 Ziffern
  • Französische NIR: 15 Ziffern mit Prüfziffer
  • Italienischer Codice Fiscale: 16 Zeichen mit Prüfsumme
  • Spanische NIF/NIE: 9 Zeichen mit Buchstabe
  • Niederländische BSN: 9 Ziffern mit Elfproef-Prüfung

Ein EU-Lohnbuchhaltungsteam bearbeitet Dateien aus vielen Mitgliedstaaten. Ohne diese Erkenner werden die sensibelsten Finanz-IDs in diesen Unterlagen übersehen.

Nationale Gesundheits-IDs

Die UK NHS-Nummer ist abgedeckt. Diese nicht:

  • Französische NIR (auch als Krankenversicherungs-ID genutzt)
  • Deutsche Krankenkassennummer
  • Italienischer Codice Fiscale (auch als Gesundheits-ID genutzt)
  • Niederländische BSN (für Krankenversicherung genutzt)

EU-Gesundheitsorganisationen benötigen diese für DSGVO-konformen Datenschutz.

EU-Führerscheine

EU-Führerscheine fallen unter die Richtlinie 2006/126/EG. Jeder Mitgliedstaat hat sein eigenes Format. Die alphanumerische Struktur unterscheidet sich je nach Land. Presidio hat nur US-Führerscheinerkenner. Es gibt keine Unterstützung für EU-Führerscheine. Damit werden EU-Führerscheindaten unerkannt verarbeitet.

USt-IdNummern

EU-Mehrwertsteuernummern erscheinen in jeder B2B-Transaktion. Format: 2-Buchstaben-Ländercode plus 8–12 alphanumerische Stellen. Presidio hat keinen USt-ID-Erkenner. USt-IDs verknüpfen Unternehmen und ihre Eigentümer. Sie sind personenbezogene Daten im Sinne der DSGVO.

Mehr zu DSGVO-Pflichten finden Sie in unseren DSGVO-Compliance-Ressourcen.

Die Kosten Benutzerdefinierter Erkenner

Wenn EU-Teams die Lücke entdecken, entwickeln sie eigene Erkenner. Die Arbeit summiert sich.

Zeit pro Erkenner (grobe Schätzung):

  • Format recherchieren: 1–2 Stunden
  • Python-Klasse schreiben: 2–4 Stunden
  • Regex und Validierung implementieren: 2–4 Stunden
  • Kontextwörter hinzufügen: 1–2 Stunden
  • Tests schreiben: 2–3 Stunden
  • Deployment und Prüfung: 1–2 Stunden

Das sind 9–17 Stunden pro Erkenner. Das sind grobe Schätzungen.

Beispiel: Ein deutsches Fintech braucht vier Erkenner.

IBAN, Steuer-ID, EU-Führerschein, deutsche USt-ID.

  • 4 Erkenner à 13 Stunden = 52 Arbeitsstunden
  • Bei €100 pro Stunde: etwa €5.200

Das deckt nur den ersten Aufbau. Formate ändern sich mit der Zeit. Neue Randfälle tauchen auf. Presidio-API-Updates können bestehende Erkenner beschädigen. Jede Änderung erfordert einen Entwickler. Die laufenden Kosten steigen Jahr für Jahr.

Die Verwaltete Bibliothek

anonym.legal erweitert Presidio um 285+ Entitätstypen. Das Team hält die Bibliothek aktuell. EU-IDs sind von Anfang an enthalten.

Was über Presidio-Standards hinausgeht:

  • IBAN in allen EU-Mitgliedstaatsformaten
  • Steuer-IDs der Mitgliedstaaten: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL und weitere
  • EU-nationale Gesundheits-IDs
  • USt-Nummern (EU-Format)
  • EU-Führerscheinformate
  • Europäische Reisepassformate
  • Entitätsvarianten in 48 unterstützten Sprachen

Wenn Deutschland ein Steuer-ID-Format aktualisiert, liefert der verwaltete Dienst das Update. Kein Pull Request von Ihrem Team nötig.

Für IDs außerhalb der Bibliothek erlaubt der Custom-Entity-Builder das Hinzufügen von Mustern. Kein Python-Code erforderlich.

Details zu Updates und Prüfpfaden finden Sie auf unserer Sicherheits- und Compliance-Seite.

Deutsches Fintech-Beispiel

Ein deutsches Fintech muss IBANs, BICs, Steuer-IDs und Handelsregisternummern in Kundendateien erkennen.

Presidio-Standarderkennungsrate für diese vier Typen: 0 %.

Keiner ist in der Standardbibliothek. Das ist keine schlechte Präzision. Es sind null Erkennungen. Das Tool übersieht sie nicht teilweise. Es sieht sie überhaupt nicht.

Kostenvergleich:

AnsatzKosten im ersten Jahr
Benutzerdefinierte Erkenner (4 × 13 Std. à €100)~€5.200 plus laufende Pflege
Verwaltete Entitätsbibliothek (Pro-Plan)€180/Jahr, alle vier abgedeckt

Der Unterschied beträgt etwa das 29-Fache im ersten Jahr. In jedem Folgejahr kommen Wartungskosten für den eigenen Weg hinzu. Der Preis des verwalteten Dienstes bleibt konstant.

Fazit

Presidios Standards dienen US-Anwendungsfällen gut. Für EU-Deployments unter der DSGVO reichen sie nicht aus. Die Lücke erfordert entweder eigene Erkennerprogrammierung oder einen verwalteten Dienst.

Für EU-Teams, bei denen Compliance Pflicht ist und Engineering-Zeit knapp ist, entfällt mit einer vorgefertigten EU-Entitätsbibliothek ein 50+-Stunden-Projekt. Dateien können von Tag eins an verarbeitet werden. Kein benutzerdefinierter Code wird zuerst benötigt.

Quellen

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.