Ett verktoy, 45 land: 260+ enhetstyper
Globale plattformer behandler personopplysninger fra mange land samtidig. Hvert land har sine egne ID-formater. Hvert format har sine egne regler. Ett enkelt deteksjonsverktoy ma handtere alle sammen. De fleste verktoy gjor ikke det.
Problemet med identifikatoroppsplitting
En markedsplass med selgere i 45 land mottar svart forskjellige registreringsdokumenter. En brasiliansk selger sender inn CPF. Den har 11 sifre. To er sjekksiffer som bruker en spesifikk vektingsformel. En indisk selger sender inn PAN. Den har 10 tegn. Bokstaver og sifre forekommer pa faste posisjoner. En tysk selger sender inn Steuer-ID. Den har 11 sifre og et Luhn-sjekksum. En nederlandsk selger sender inn BSN. Den har 9 sifre og bruker mod-11-validering.
Hvert format har forskjellig lengde og struktur. Et regulaert uttrykk bygd for ett format vil ikke matche de andre. Et bredt "10-12 siffer"-monster fanger for mye. Det flagger priser, datoer og referansenumre. Falske positive vokser raskt i stor skala.
40-identifikator-gapet
De fleste PII-verktoy for bedrifter leveres med omtrent 40 identifikatortyper. Vanlige typer inkluderer:
- Amerikansk personnummer (SSN)
- Amerikansk passformat
- Amerikanske forerkortformat
- Generiske kredittkortformater med Luhn-validering
- E-postadresser
- Telefonnumre i NANP-format
- IP-adresser
Disse dekker nordamerikansk samsvar godt. De dekker ikke globale operasjoner.
Hvordan gapet ser ut per region
Sor-Amerika: Brasiliansk CPF og CNPJ bruker kontrollsumalgoritmer fra Brasils skattemyndighet. Argentinsk CUIT bruker en annen vektet sumformel. Colombiansk NIT har sin egen valideringsmetode. Ingen av disse matcher amerikanske monster.
Asia: Indisk PAN, Aadhaar, GSTIN og Voter ID har hvert sitt distinkte format. Japansk My Number har 12 sifre. Sorkoreansk Resident Registration Number og kinesisk nasjonal ID krever hvert sin gjenkjenner.
EU-medlemsland: Full EU-dekning krever IBAN-formater for alle 27 medlemsland. Hvert har en landspesifikk lengde og struktur. Det krever ogsa hvert nasjonalt ID-format. Dette inkluderer tysk Steuer-ID, fransk NIR, nederlandsk BSN, polsk PESEL og svensk personnummer. Det inkluderer ogsa slovensk EMSO, kroatisk OIB, bulgarsk EGN og romensk CNP.
Hva 260+ enhetstyper dekker
Et bibliotek med 260+ enheter dekker alle 27 EU-medlemslands nasjonale ID-er. Det validerer alle EU IBAN-formater. Det dekker soramerikaske ID-er: Brasil CPF og CNPJ, Argentina CUIT, Colombia NIT. Det dekker asiatiske ID-er: India PAN, Aadhaar, GSTIN, Japan My Number, Korea RRN. Det dekker britiske ID-er: NI Number, NHS Number, NINO-varianter. Det dekker medisinske ID-er: US NPI, DEA-numre, sykehus MRN-formater. Det dekker finansielle ID-er: SWIFT-koder, BIC-formater, kontonummermonstre.
Hvorfor deteksjonsdekning er et samsvarssprorsmal
Hvert regelverk krever at dets identifikatorer finnes og beskyttes. GDPR dekker EU-selgerdata. LGPD dekker brasilianske selgerdata. Indias DPDP-lov dekker indiske selgerdata.
"Hensiktsmessig beskyttelse" betyr at verktoy et fant identifikatoren. En oversett Aadhaar er ikke en konfigurasjonssvikt. Det er en dekningssvikt. For globale plattformer er dette gapet forskjellen mellom delvis samsvar og reell beskyttelse.
En enkelt distribusjon med 260+ enhetsdekning handterer alle disse jurisdiksjonene. Ingen separate regionale verktoy. Ingen separate behandlingspipelines. Ingen manuell berikning for formater et 40-gjenkjennerverktoy overser.
For detaljer om hvordan dekning kartlegges til GDPR-forpliktelser, se GDPR-samsvarsressurser. For revisjonslogg og oppdateringspolicyer, se sikkerhets- og samsvarsdetaljer.