Presidio Übersieht 220+ DSGVO-Entitäten: Die EU-Lücke

Aktualisiert für 2026

Microsoft Presidio liefert etwa 40 Standard-Entitätserkenner mit. Für US-Deployments reicht das. Es deckt SSNs, US-Pässe, Führerscheine, Kreditkarten und E-Mails ab.

Für EU-Deployments ist die Lücke groß. Die DSGVO gilt für alle personenbezogenen Daten in der EU. Das gilt unabhängig von der Nationalität der betroffenen Person. EU-Teams brauchen Erkenner, die Presidio nicht mitliefert.

Was Presidio Enthält

Die Standard-Erkenner fallen in vier Gruppen.

US-zentrierte IDs:

US-Sozialversicherungsnummer (SSN)
US-Reisepassnummer
US-Führerscheinnummer
US-Bankkontonummer
US-ITIN
US-Arztzulassungsnummer

Universelle IDs:

E-Mail-Adresse
Telefonnummer
IP-Adresse
Kreditkartennummer
Krypto-Wallet-Adresse
URL

Textentitäten (NER-basiert):

PERSON
LOCATION
ORGANIZATION
DATE_TIME

Begrenzte internationale Abdeckung:

UK NHS-Nummer
UK National Insurance Number (NINO)
Einige Finanz-IDs

Gesamt: etwa 40 Erkenner.

Was EU-Teams Brauchen

Finanz-IDs

IBAN erscheint in fast jedem EU-Geschäftsdokument. Sie steht in Zahlungen, Rechnungen und Gehaltsabrechnungen. IBAN folgt ISO 13616. Presidio hat keinen IBAN-Erkenner.

Nehmen wir ein deutsches Fintech. Jede Zahlungsdatei enthält eine IBAN. Ohne IBAN-Erkennung sucht das Tool nur nach Kreditkartennummern. Die wichtigste EU-Zahlungs-ID wird übersehen. Das bedeutet, ein zentrales DSGVO-relevantes Datenelement wird nie gefunden.

Nationale Steuer-IDs

Keine dieser IDs ist in Presidios Standardbibliothek:

Steueridentifikationsnummer: 11 Ziffern
Französische NIR: 15 Ziffern mit Prüfziffer
Italienischer Codice Fiscale: 16 Zeichen mit Prüfsumme
Spanische NIF/NIE: 9 Zeichen mit Buchstabe
Niederländische BSN: 9 Ziffern mit Elfproef-Prüfung

Ein EU-Lohnbuchhaltungsteam bearbeitet Dateien aus vielen Mitgliedstaaten. Ohne diese Erkenner werden die sensibelsten Finanz-IDs in diesen Unterlagen übersehen.

Nationale Gesundheits-IDs

Die UK NHS-Nummer ist abgedeckt. Diese nicht:

Französische NIR (auch als Krankenversicherungs-ID genutzt)
Deutsche Krankenkassennummer
Italienischer Codice Fiscale (auch als Gesundheits-ID genutzt)
Niederländische BSN (für Krankenversicherung genutzt)

EU-Gesundheitsorganisationen benötigen diese für DSGVO-konformen Datenschutz.

EU-Führerscheine

EU-Führerscheine fallen unter die Richtlinie 2006/126/EG. Jeder Mitgliedstaat hat sein eigenes Format. Die alphanumerische Struktur unterscheidet sich je nach Land. Presidio hat nur US-Führerscheinerkenner. Es gibt keine Unterstützung für EU-Führerscheine. Damit werden EU-Führerscheindaten unerkannt verarbeitet.

USt-IdNummern

EU-Mehrwertsteuernummern erscheinen in jeder B2B-Transaktion. Format: 2-Buchstaben-Ländercode plus 8–12 alphanumerische Stellen. Presidio hat keinen USt-ID-Erkenner. USt-IDs verknüpfen Unternehmen und ihre Eigentümer. Sie sind personenbezogene Daten im Sinne der DSGVO.

Mehr zu DSGVO-Pflichten finden Sie in unseren DSGVO-Compliance-Ressourcen.

Die Kosten Benutzerdefinierter Erkenner

Wenn EU-Teams die Lücke entdecken, entwickeln sie eigene Erkenner. Die Arbeit summiert sich.

Zeit pro Erkenner (grobe Schätzung):

Format recherchieren: 1–2 Stunden
Python-Klasse schreiben: 2–4 Stunden
Regex und Validierung implementieren: 2–4 Stunden
Kontextwörter hinzufügen: 1–2 Stunden
Tests schreiben: 2–3 Stunden
Deployment und Prüfung: 1–2 Stunden

Das sind 9–17 Stunden pro Erkenner. Das sind grobe Schätzungen.

Beispiel: Ein deutsches Fintech braucht vier Erkenner.

IBAN, Steuer-ID, EU-Führerschein, deutsche USt-ID.

4 Erkenner à 13 Stunden = 52 Arbeitsstunden
Bei €100 pro Stunde: etwa €5.200

Das deckt nur den ersten Aufbau. Formate ändern sich mit der Zeit. Neue Randfälle tauchen auf. Presidio-API-Updates können bestehende Erkenner beschädigen. Jede Änderung erfordert einen Entwickler. Die laufenden Kosten steigen Jahr für Jahr.

Die Verwaltete Bibliothek

anonym.legal erweitert Presidio um 285+ Entitätstypen. Das Team hält die Bibliothek aktuell. EU-IDs sind von Anfang an enthalten.

Was über Presidio-Standards hinausgeht:

IBAN in allen EU-Mitgliedstaatsformaten
Steuer-IDs der Mitgliedstaaten: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL und weitere
EU-nationale Gesundheits-IDs
USt-Nummern (EU-Format)
EU-Führerscheinformate
Europäische Reisepassformate
Entitätsvarianten in 48 unterstützten Sprachen

Wenn Deutschland ein Steuer-ID-Format aktualisiert, liefert der verwaltete Dienst das Update. Kein Pull Request von Ihrem Team nötig.

Für IDs außerhalb der Bibliothek erlaubt der Custom-Entity-Builder das Hinzufügen von Mustern. Kein Python-Code erforderlich.

Details zu Updates und Prüfpfaden finden Sie auf unserer Sicherheits- und Compliance-Seite.

Deutsches Fintech-Beispiel

Ein deutsches Fintech muss IBANs, BICs, Steuer-IDs und Handelsregisternummern in Kundendateien erkennen.

Presidio-Standarderkennungsrate für diese vier Typen: 0 %.

Keiner ist in der Standardbibliothek. Das ist keine schlechte Präzision. Es sind null Erkennungen. Das Tool übersieht sie nicht teilweise. Es sieht sie überhaupt nicht.

Kostenvergleich:

Ansatz	Kosten im ersten Jahr
Benutzerdefinierte Erkenner (4 × 13 Std. à €100)	~€5.200 plus laufende Pflege
Verwaltete Entitätsbibliothek (Pro-Plan)	€180/Jahr, alle vier abgedeckt

Der Unterschied beträgt etwa das 29-Fache im ersten Jahr. In jedem Folgejahr kommen Wartungskosten für den eigenen Weg hinzu. Der Preis des verwalteten Dienstes bleibt konstant.

Fazit

Presidios Standards dienen US-Anwendungsfällen gut. Für EU-Deployments unter der DSGVO reichen sie nicht aus. Die Lücke erfordert entweder eigene Erkennerprogrammierung oder einen verwalteten Dienst.

Für EU-Teams, bei denen Compliance Pflicht ist und Engineering-Zeit knapp ist, entfällt mit einer vorgefertigten EU-Entitätsbibliothek ein 50+-Stunden-Projekt. Dateien können von Tag eins an verarbeitet werden. Kein benutzerdefinierter Code wird zuerst benötigt.

Quellen

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.

Kostenlose Testversion starten Funktionen anzeigen

Was Presidio vermisst: Die 220+ Entitätstypen...

Presidio Übersieht 220+ DSGVO-Entitäten: Die EU-Lücke

Was Presidio Enthält

Was EU-Teams Brauchen

Finanz-IDs

Nationale Steuer-IDs

Nationale Gesundheits-IDs

EU-Führerscheine

USt-IdNummern

Die Kosten Benutzerdefinierter Erkenner

Die Verwaltete Bibliothek

Deutsches Fintech-Beispiel

Fazit

Quellen

Verwandte Artikel

Self-Hosted PII Fails Compliance Audits

Configuration Drift: A Hidden GDPR Risk

Multi-Framework Privacy with One Tool

Bereit, Ihre Daten zu schützen?

Was Presidio vermisst: Die 220+ Entitätstypen...

Presidio Übersieht 220+ DSGVO-Entitäten: Die EU-Lücke

Was Presidio Enthält

Was EU-Teams Brauchen

Finanz-IDs

Nationale Steuer-IDs

Nationale Gesundheits-IDs

EU-Führerscheine

USt-IdNummern

Die Kosten Benutzerdefinierter Erkenner

Die Verwaltete Bibliothek

Deutsches Fintech-Beispiel

Fazit

Quellen

Verwandte Artikel

Self-Hosted PII Fails Compliance Audits

Configuration Drift: A Hidden GDPR Risk

Multi-Framework Privacy with One Tool

Bereit, Ihre Daten zu schützen?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow