Globale personenbezogene Daten: SSN, CPF, Aadhaar & mehr
Das US-zentrierte PII-Tool-Problem
Die meisten PII-Tools wurden in den USA entwickelt. Sie sind auf US-Datenformate ausgerichtet. Die Sozialversicherungsnummer hat neun Stellen im Format AAA-BB-CCCC. Ihre Bereichs-, Gruppen- und Serienfelder folgen dokumentierten Regeln. US-fokussierte Tools erkennen sie zuverlässig. Sie erkennen auch US-Telefonnummern, E-Mail-Adressen und Führerscheine. Sie übersehen jede nationale ID außerhalb der USA.
Die DSGVO erlaubt keine Ausnahme für US-Only-Systeme. Nehmen wir die deutsche Steuer-ID. Sie ist eine 11-stellige Steuerkennung. Das Bundeszentralamt für Steuern gibt sie aus. Die letzte Stelle ist eine Prüfziffer. Sie identifiziert einen deutschen Staatsbürger genauso wie eine SSN einen Amerikaner identifiziert. DSGVO-Artikel 4 erfasst „alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen." Eine Steuer-ID fällt darunter. Sie ist ein personenbezogenes Datum. Das gilt unabhängig davon, ob Ihr Tool das Format kennt.
DSGVO-Bußgelder wurden für EU-spezifische PII-Exposition in Systemen mit US-Only-Tools verhängt. Die Compliance-Lücke ist real. Durchsetzungsmaßnahmen haben stattgefunden. Weitere Informationen finden Sie in unserem DSGVO-Leitfaden.
Die europäische Identifier-Landschaft
Die Abdeckungslücke ist groß. Hier ist eine Übersicht nach Ländern.
Deutschland: Steuer-ID — 11 Stellen, prüfsummenvalidiert. Sozialversicherungsnummer — 12 Felder, strukturiert. Reisepass — 10 Zeichen mit Behördencodes.
Frankreich: NIR ist die nationale Sozialversicherungs-ID. Sie hat 15 Stellen. Diese kodieren Geschlecht, Geburtsjahr, Geburtsmonat, Departement, Gemeinde und einen Prüfschlüssel. SIRET hat 14 Stellen. SIREN hat neun.
Schweden: Personnummer verwendet das Format JJMMTT-XXXX. Samordningsnummer gilt für Nicht-Residenten. Der Tageswert ist um 60 versetzt.
Norwegen: Fødselsnummer hat 11 Werte im Format TTMMJJNNNKK. Das Geschlecht ist in der mittleren Gruppe kodiert. D-nummer versetzt den Tageswert um 40.
Brasilien: CPF — Cadastro de Pessoas Físicas — hat 11 Stellen mit zwei Prüfwerten. CNPJ ist die 14-stellige Unternehmens-ID.
Indien: Aadhaar ist eine 12-stellige biometrische ID. Sie verwendet eine Verhoeff-Prüfung. PAN ist eine 10-stellige Steuer-ID mit Buchstaben und Zahlen.
VAE: Die Emirates ID hat 15 Stellen im Format 784-Geburtsjahr-Sequenz-Prüfung.
Ein globales HR-Team, das 12 Länder abdeckt, benötigt ein Tool. Es muss alle 12 nationalen ID-Formate in einem einzigen Durchlauf verarbeiten. Separate Regex-Bibliotheken pro Land zu pflegen ist nicht praktikabel.
Die 285+ Entitätstypen-Architektur
Die Bibliothek mit 285+ Entitätstypen deckt alle EU-Mitgliedstaatenformate ab. Sie deckt auch wichtige APAC-IDs ab. Dazu gehören Aadhaar, PAN, CPF, CNPJ, Emirates ID und die Thai Citizen ID. US-Formate — SSN, EIN, staatliche Führerscheine — sind ebenfalls enthalten. Eine Engine verarbeitet sie alle. Die Bibliothek wird aktualisiert, wenn sich Formate ändern.
Dies ist die Lücke, die die meisten Tools offen lassen. Die Entitätsreferenz zeigt, was abgedeckt ist. Für API-Preise nach Volumen besuchen Sie Preise.