Globale PII-identifikatorer: SSN, CPF, Aadhaar m.fl.
Problemet med US-centrerede PII-værktøjer
De fleste PII-værktøjer er bygget i USA. De er rettet mod amerikanske dataformater. Det amerikanske Social Security Number har ni cifre i AAA-BB-CCCC-format. Dets område-, gruppe- og serienummersegmenter følger dokumenterede regler. US-fokuserede værktøjer opfanger det godt. De registrerer også amerikanske telefonnumre, e-mailadresser og kørekort. De overser alle nationale ID-numre brugt uden for USA.
GDPR tillader ikke en undtagelse for USA-only. Tag det tyske Steuer-ID. Det er et 11-cifret skatte-ID. Bundeszentralamt für Steuern udsteder det. Dets sidste ciffer er en kontrolsum. Det identificerer en tysk borger ligesom et SSN identificerer en amerikaner. GDPR Artikel 4 dækker "enhver oplysning om en identificeret eller identificerbar fysisk person." Et Steuer-ID opfylder denne definition. Det er personoplysninger. Det gælder uanset om dit værktøj kender formatet.
GDPR-bøder er fulgt efter eksponering af EU-specifikke personoplysninger i systemer, der kun bruger US-orienterede værktøjer. Overholdelsesgabet er reelt. Håndhævelsesforanstaltninger er fulgt. Se vores GDPR-overensstemmelsesguide for kontekst.
Det europæiske identifikatorlandskab
Dækningsgabet er stort. Her er en landevis oversigt.
Tyskland: Steuer-ID — 11 cifre, kontrolsumvalideret. Sozialversicherungsnummer — 12 felter, struktureret. Reisepass — 10 tegn med myndighedskoder.
Frankrig: NIR er det nationale CPR-nummer. Det har 15 cifre. De koder køn, fødselsår, fødselsmåned, departement, kommune og en kontrolnøgle. SIRET har 14 cifre. SIREN har ni.
Sverige: Personnummer bruger formatet ÅÅMMDD-XXXX. Samordningsnummer dækker ikke-bosiddende. Dagværdien er forskudt med 60.
Norge: Fødselsnummer har 11 cifre i formatet DDMMÅÅNNNKK. Køn er kodet i den midterste gruppe. D-nummer forskyder dagværdien med 40.
Brasilien: CPF — Cadastro de Pessoas Físicas — har 11 cifre med to kontrolværdier. CNPJ er det 14-cifrede virksomheds-ID.
Indien: Aadhaar er et 12-cifret biometrisk ID. Det bruger et Verhoeff-tjek. PAN er et 10-cifret skatte-ID med bogstaver og tal.
UAE: Emirates ID har 15 cifre i formatet 784-fødselsår-sekvens-tjek.
Et globalt HR-team, der dækker 12 lande, har brug for ét værktøj. Det skal håndtere alle 12 nationale ID-formater i én gennemgang. At vedligeholde separate regex-biblioteker pr. land er ikke en holdbar løsning.
Arkitekturen med 285+ entitetstyper
Biblioteket med 285+ entitetstyper dækker alle EU-medlemsstaters formater. Det dækker også større APAC-ID'er. Disse inkluderer Aadhaar, PAN, CPF, CNPJ, Emirates ID og thailandsk borger-ID. Amerikanske formater — SSN, EIN, statslige kørekort — er inkluderet. Ét system håndterer dem alle. Biblioteket opdateres, efterhånden som formater ændres.
Dette er det gab, de fleste værktøjer efterlader åbent. Se entitetsreferencen for at gennemgå, hvad der er dækket. For API-priser efter volumen, besøg prissætning.