Takaisin BlogiinGDPR & Vaatimustenmukaisuus

Yksi työkalu, 45 maata: Miksi 260+ entiteettityyppiä...

Brasilian CPF:ssä on tarkistusnumerot. Intian PAN on 10-merkkinen alfanumeerinen. EU:n IBANit vaihtelevat maittain.

March 25, 20267 min lukuaika
global PII compliance260 entity typesBrazilian CPFIndian PANIBAN formats

Globaali tunnistamisen fragmentaatio-ongelma

Markkinapaikkapalvelu, jolla on myyjiä 45 maassa, käsittelee rekisteröintidokumentteja, jotka näyttävät täysin erilaisilta riippuen myyjän alkuperämaasta. Brasilialainen myyjä toimittaa CPF:n (Cadastro de Pessoas Físicas) — 11-numeroisen verotunnisteen, jossa on kaksi tarkistusnumeroa, jotka lasketaan erityisen painotetun algoritmin avulla. Intialainen myyjä antaa PAN:n (Permanent Account Number) — 10-merkkisen alfanumeerisen muodon, joka yhdistää kirjaimia ja numeroita tietyssä paikallisessa kaavassa. Saksalainen myyjä antaa Steuer-ID:n (11-numeroisen Luhn-tarkistuksen kanssa). Alankomaalainen myyjä antaa BSN:n (Burger Service Nummer, 9 numeroa mod-11-validoinnilla).

Jokaisella muodolla on erilainen pituus, rakenne ja validointialgoritmi. Yksi regex, joka on suunniteltu yhtä muotoa varten, ei vastaa muita. Yleinen "10-12 numeroa pitkä merkkijono" -kaava tuottaa esteellisiä väärien positiivisten tulosten määriä taloudellisissa asiakirjoissa, jotka sisältävät hintoja, määriä, päivämääriä ja viitenumeroita.

Vaateet yhteensopivuudelle eivät eroa maan mukaan. GDPR kattaa EU:n myyjien tiedot. LGPD kattaa brasilialaisten myyjien tiedot. DPDP-laki kattaa intialaisten myyjien tiedot. Jokainen sääntelykehys vaatii asianmukaista suojaa sen kehyksen alaisille henkilötiedoille — ja "asianmukainen" tarkoittaa, että tunniste havaittiin ja suojattiin, ei vain, että havaintoyritys tehtiin.

40-tunnisteen aukko

Useimmat yritysten PII-havaintotyökalut toimitetaan noin 40 yleisen tunnistetyypin tunnistimien kanssa. Näihin sisältyvät tyypillisesti:

  • Yhdysvaltain sosiaaliturvatunnus
  • Yhdysvaltain passimuoto
  • Yhdysvaltain ajokortti (osavaltiokohtainen)
  • Yleiset luottokorttimuodot (Luhn-validointi)
  • Sähköpostiosoitteet
  • Puhelinnumerot (NANP-muoto)
  • IP-osoitteet

Tämän kattavuustason työkalut täyttävät englanninkielisten Pohjois-Amerikan yhteensopivuusvaatimukset kohtuullisesti hyvin. Ne eivät kata organisaatioiden tunnistemaailmaa, jotka toimivat globaalisti.

Aukko 40 tunnisteen ja globaalin yhteensopivuuden välillä on merkittävä:

Etelä-Amerikan tunnisteet: Brasilian CPF (yksilö) ja CNPJ (yritys) vaativat tarkistusnumeron validoinnin, joka on erityinen Brasilian veroviranomaisen muoto. Argentiinan CUIT seuraa erilaista painotettua summa-algoritmia. Kolumbian NIT käyttää vielä erilaista validointimenetelmää.

Aasian tunnisteet: Intian PAN, Aadhaar (12-numeroista biometristä ID:tä), Intian GSTIN (GST-tunnistus) ja äänestäjä-ID:llä on kukin erilliset muodot. Japanin My Number (12-numeroista kansallista ID:tä), Etelä-Korean asuinrekisterinumero ja Kiinan kansallinen ID (18-merkkinen tarkistusnumerolla) vaativat kaikki erilliset tunnistimet.

EU:n tunnisteet: Yleisempien tunnistemuotojen lisäksi kattava EU:n kattavuus vaatii IBAN-muotoja kaikilta 27 EU:n jäsenvaltioilta (kukin maakohtaisella pituudella ja muodolla), sekä kansallisia ID-muotoja jokaiselta jäsenvaltiolta (Saksan Steuer-ID, Ranskan NIR, Alankomaiden BSN, Puolan PESEL, Ruotsin Personnummer ja muita).

Mitä 260+ entiteettityyppiä todella kattaa

Kattava entiteettikirjasto, jossa on yli 260 tyyppiä, kattaa:

  • Kaikki 27 EU:n jäsenvaltion kansalliset tunnisteet (mukaan lukien vähemmän katetut: Slovenian EMŠO, Kroatian OIB, Bulgarian EGN, Romanian CNP)
  • Kaikki EU:n IBAN-muodot (27 maakohtaista muotoa validoinnilla)
  • Suurimmat Etelä-Amerikan tunnisteet (Brasilian CPF/CNPJ, Argentiinan CUIT, Kolumbian NIT)
  • Suurimmat Aasian tunnisteet (Intian PAN/Aadhaar/GSTIN, Japanin My Number, Korean RRN)
  • Yhdistyneen kuningaskunnan erityiset post-Brexit-tunnisteet (UK NI Number, NHS Number, NINO-muunnelmat)
  • Lääketieteelliset tunnisteet eri lainkäyttöalueilla (Yhdysvaltain NPI, DEA-numerot, NHS-numerot, sairaalan MRN-muodot)
  • Rahoitustunnisteet (SWIFT-koodit, BIC-muodot, erilaiset tilinumeroiden kaavat)

Lontoolaiselle markkinapaikalle, joka palvelee myyjiä 45 maasta, 260+ entiteettikattavuus tarkoittaa, että yksi käyttöönotto käsittelee myyjien henkilötietojen tunnistamisen ja suojaamisen kaikilla lainkäyttöalueilla — ilman erillisten alueellisten työkalujen, erillisten käsittelyputkien tai manuaalisen rikastamisen vaatimusta kansallisten tunnistetyyppien osalta, joita 40-tunnistimen työkalu ei huomaa.

Yhteensopivuusasenne muuttuu "me suojaamme yleisiä tunnisteita" muotoon "me suojaamme tunnisteita, jotka ovat läsnä todellisissa tiedoissamme." Globaalissa toiminnassa tämä ero on ero osittaisen yhteensopivuuden ja todellisen suojan välillä.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.