Jedan alat, 45 zemalja: 260+ entiteta
Globalne platforme obradjuju licne podatke iz mnogih zemalja istovremeno. Svaka zemlja ima sopstvene formate identifikacionih dokumenata. Svaki format ima svoja pravila. Jedan alat za detekciju mora da ih sve obuhvati. Vecina alata to ne radi.
Problem fragmentacije identifikatora
Trziste sa prodavcima iz 45 zemalja dobija veoma razlicite dokumente pri registraciji. Brazilski prodavac podnosi CPF. On ima 11 cifara. Dve su kontrolne cifre. Koriste specificnu formulu ponderisanja. Indijski prodavac podnosi PAN. On ima 10 karaktera. Slova i cifre se pojavljuju na fiksnim pozicijama. Nemacki prodavac podnosi Steuer-ID. On ima 11 cifara i Luhn kontrolni zbir. Holandski prodavac podnosi BSN. On ima 9 cifara i koristi mod-11 validaciju.
Svaki format ima drugaciju duzinu i strukturu. Jedan regex napravljen za jedan format nece odgovarati drugima. Sirokan obrazac "10-12 cifara" hvata previse. Oznacava cene, datume i referentne brojeve. Lazno pozitivni brzo rastu na velikom obimu.
Jaz od 40 identifikatora
Vecina enterprise PII alata isporucuje se sa oko 40 vrsta identifikatora. Uobicajeni ukljucuju:
- Americki broj socijalnog osiguranja
- Format americkog pasosa
- Americka vozacka dozvola
- Genericki formati kreditnih kartica sa Luhn validacijom
- Email adrese
- Brojevi telefona u NANP formatu
- IP adrese
Ovo dobro pokriva severno-americku uskladjenost. Ne pokriva globalne operacije.
Kako jaz izgleda po regionu
Juzna Amerika: Brazilski CPF i CNPJ koriste algoritme kontrolnih zbira brazilskog poreskog organa. Argentinski CUIT koristi drugaciju formulu ponderisane sume. Kolumbijski NIT ima sopstvenu metodu validacije. Nista od ovoga ne odgovara americkim obrascima.
Azija: Indijski PAN, Aadhaar, GSTIN i Voter ID imaju svaki poseban format. Japanski My Number ima 12 cifara. Korejski broj registracije rezidenta i kineski nacionalni ID zahtevaju sopstvene prepoznavace.
Clanice EU: Potpuna EU pokrivenost zahteva IBAN formate za svih 27 clanica. Svaka ima specificnu duzinu i format. Takodjer su potrebni nacionalni ID formati svake clanice. Ovo ukljucuje nemacki Steuer-ID, francuski NIR, holandski BSN, poljski PESEL i svedski Personnummer. Takodjer ukljucuje slovenacki EMSO, hrvatski OIB, bugarski EGN i rumunski CNP.
Sta pokriva 260+ vrsta entiteta
Biblioteka od 260+ entiteta pokriva nacionalne ID-ove svih 27 clanica EU. Validira sve EU IBAN formate. Pokriva juzno-americke ID-ove: brazilski CPF i CNPJ, argentinski CUIT, kolumbijski NIT. Pokriva azijske ID-ove: indijski PAN, Aadhaar, GSTIN, japanski My Number, korejski RRN. Pokriva britanske ID-ove: NI Number, NHS Number, NINO varijante. Pokriva medicinske ID-ove: americke NPI, DEA brojeve, bolnicke MRN formate. Pokriva finansijske ID-ove: SWIFT kodove, BIC formate, obrasce brojeva racuna.
Zasto je pokrivenost detekcije pitanje uskladjenosti
Svaki okvir zahteva da se njegovi identifikatori pronaidju i zastite. GDPR pokriva podatke prodavaca iz EU. LGPD pokriva podatke brazilskih prodavaca. Indijski DPDP zakon pokriva podatke indijskih prodavaca.
"Odgovarajuca zastita" znaci da je alat pronasao identifikator. Propusteni Aadhaar nije greska u konfiguraciji. To je greska u pokrivenosti. Za globalne platforme, taj jaz je razlika izmedju delimicne i stvarne zastite.
Jedna implementacija sa 260+ pokrivenosti entiteta obraduje sve ove jurisdikcije. Bez zasebnih regionalnih alata. Bez zasebnih cevovoda obrade. Bez rucnog obogacivanja za formate koje alat sa 40 prepoznavaca propusta.
Za detalje o tome kako se pokrivenost mapira na GDPR obaveze, pogledajte resurse za GDPR uskladjenost. Za politiku revizije i azuriranja, pogledajte detalje o bezbednosti i uskladjenosti.