Presidio Übersieht 220+ DSGVO-Entitäten: Die EU-Lücke
Aktualisiert für 2026
Microsoft Presidio liefert etwa 40 Standard-Entitätserkenner mit. Für US-Deployments reicht das. Es deckt SSNs, US-Pässe, Führerscheine, Kreditkarten und E-Mails ab.
Für EU-Deployments ist die Lücke groß. Die DSGVO gilt für alle personenbezogenen Daten in der EU. Das gilt unabhängig von der Nationalität der betroffenen Person. EU-Teams brauchen Erkenner, die Presidio nicht mitliefert.
Was Presidio Enthält
Die Standard-Erkenner fallen in vier Gruppen.
US-zentrierte IDs:
- US-Sozialversicherungsnummer (SSN)
- US-Reisepassnummer
- US-Führerscheinnummer
- US-Bankkontonummer
- US-ITIN
- US-Arztzulassungsnummer
Universelle IDs:
- E-Mail-Adresse
- Telefonnummer
- IP-Adresse
- Kreditkartennummer
- Krypto-Wallet-Adresse
- URL
Textentitäten (NER-basiert):
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
Begrenzte internationale Abdeckung:
- UK NHS-Nummer
- UK National Insurance Number (NINO)
- Einige Finanz-IDs
Gesamt: etwa 40 Erkenner.
Was EU-Teams Brauchen
Finanz-IDs
IBAN erscheint in fast jedem EU-Geschäftsdokument. Sie steht in Zahlungen, Rechnungen und Gehaltsabrechnungen. IBAN folgt ISO 13616. Presidio hat keinen IBAN-Erkenner.
Nehmen wir ein deutsches Fintech. Jede Zahlungsdatei enthält eine IBAN. Ohne IBAN-Erkennung sucht das Tool nur nach Kreditkartennummern. Die wichtigste EU-Zahlungs-ID wird übersehen. Das bedeutet, ein zentrales DSGVO-relevantes Datenelement wird nie gefunden.
Nationale Steuer-IDs
Keine dieser IDs ist in Presidios Standardbibliothek:
- Steueridentifikationsnummer: 11 Ziffern
- Französische NIR: 15 Ziffern mit Prüfziffer
- Italienischer Codice Fiscale: 16 Zeichen mit Prüfsumme
- Spanische NIF/NIE: 9 Zeichen mit Buchstabe
- Niederländische BSN: 9 Ziffern mit Elfproef-Prüfung
Ein EU-Lohnbuchhaltungsteam bearbeitet Dateien aus vielen Mitgliedstaaten. Ohne diese Erkenner werden die sensibelsten Finanz-IDs in diesen Unterlagen übersehen.
Nationale Gesundheits-IDs
Die UK NHS-Nummer ist abgedeckt. Diese nicht:
- Französische NIR (auch als Krankenversicherungs-ID genutzt)
- Deutsche Krankenkassennummer
- Italienischer Codice Fiscale (auch als Gesundheits-ID genutzt)
- Niederländische BSN (für Krankenversicherung genutzt)
EU-Gesundheitsorganisationen benötigen diese für DSGVO-konformen Datenschutz.
EU-Führerscheine
EU-Führerscheine fallen unter die Richtlinie 2006/126/EG. Jeder Mitgliedstaat hat sein eigenes Format. Die alphanumerische Struktur unterscheidet sich je nach Land. Presidio hat nur US-Führerscheinerkenner. Es gibt keine Unterstützung für EU-Führerscheine. Damit werden EU-Führerscheindaten unerkannt verarbeitet.
USt-IdNummern
EU-Mehrwertsteuernummern erscheinen in jeder B2B-Transaktion. Format: 2-Buchstaben-Ländercode plus 8–12 alphanumerische Stellen. Presidio hat keinen USt-ID-Erkenner. USt-IDs verknüpfen Unternehmen und ihre Eigentümer. Sie sind personenbezogene Daten im Sinne der DSGVO.
Mehr zu DSGVO-Pflichten finden Sie in unseren DSGVO-Compliance-Ressourcen.
Die Kosten Benutzerdefinierter Erkenner
Wenn EU-Teams die Lücke entdecken, entwickeln sie eigene Erkenner. Die Arbeit summiert sich.
Zeit pro Erkenner (grobe Schätzung):
- Format recherchieren: 1–2 Stunden
- Python-Klasse schreiben: 2–4 Stunden
- Regex und Validierung implementieren: 2–4 Stunden
- Kontextwörter hinzufügen: 1–2 Stunden
- Tests schreiben: 2–3 Stunden
- Deployment und Prüfung: 1–2 Stunden
Das sind 9–17 Stunden pro Erkenner. Das sind grobe Schätzungen.
Beispiel: Ein deutsches Fintech braucht vier Erkenner.
IBAN, Steuer-ID, EU-Führerschein, deutsche USt-ID.
- 4 Erkenner à 13 Stunden = 52 Arbeitsstunden
- Bei €100 pro Stunde: etwa €5.200
Das deckt nur den ersten Aufbau. Formate ändern sich mit der Zeit. Neue Randfälle tauchen auf. Presidio-API-Updates können bestehende Erkenner beschädigen. Jede Änderung erfordert einen Entwickler. Die laufenden Kosten steigen Jahr für Jahr.
Die Verwaltete Bibliothek
anonym.legal erweitert Presidio um 285+ Entitätstypen. Das Team hält die Bibliothek aktuell. EU-IDs sind von Anfang an enthalten.
Was über Presidio-Standards hinausgeht:
- IBAN in allen EU-Mitgliedstaatsformaten
- Steuer-IDs der Mitgliedstaaten: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL und weitere
- EU-nationale Gesundheits-IDs
- USt-Nummern (EU-Format)
- EU-Führerscheinformate
- Europäische Reisepassformate
- Entitätsvarianten in 48 unterstützten Sprachen
Wenn Deutschland ein Steuer-ID-Format aktualisiert, liefert der verwaltete Dienst das Update. Kein Pull Request von Ihrem Team nötig.
Für IDs außerhalb der Bibliothek erlaubt der Custom-Entity-Builder das Hinzufügen von Mustern. Kein Python-Code erforderlich.
Details zu Updates und Prüfpfaden finden Sie auf unserer Sicherheits- und Compliance-Seite.
Deutsches Fintech-Beispiel
Ein deutsches Fintech muss IBANs, BICs, Steuer-IDs und Handelsregisternummern in Kundendateien erkennen.
Presidio-Standarderkennungsrate für diese vier Typen: 0 %.
Keiner ist in der Standardbibliothek. Das ist keine schlechte Präzision. Es sind null Erkennungen. Das Tool übersieht sie nicht teilweise. Es sieht sie überhaupt nicht.
Kostenvergleich:
| Ansatz | Kosten im ersten Jahr |
|---|---|
| Benutzerdefinierte Erkenner (4 × 13 Std. à €100) | ~€5.200 plus laufende Pflege |
| Verwaltete Entitätsbibliothek (Pro-Plan) | €180/Jahr, alle vier abgedeckt |
Der Unterschied beträgt etwa das 29-Fache im ersten Jahr. In jedem Folgejahr kommen Wartungskosten für den eigenen Weg hinzu. Der Preis des verwalteten Dienstes bleibt konstant.
Fazit
Presidios Standards dienen US-Anwendungsfällen gut. Für EU-Deployments unter der DSGVO reichen sie nicht aus. Die Lücke erfordert entweder eigene Erkennerprogrammierung oder einen verwalteten Dienst.
Für EU-Teams, bei denen Compliance Pflicht ist und Engineering-Zeit knapp ist, entfällt mit einer vorgefertigten EU-Entitätsbibliothek ein 50+-Stunden-Projekt. Dateien können von Tag eins an verarbeitet werden. Kein benutzerdefinierter Code wird zuerst benötigt.