Yksi työkalu, 45 maata: 260+ entiteettiä
Globaaleilla alustoilla käsitellään samanaikaisesti useiden maiden henkilötietoja. Jokaisella maalla on omat tunnisteformaattinsa. Jokaisella formaatilla on omat sääntönsä. Yhden tunnistustyökalun täytyy hallita kaikki nämä. Useimmat työkalut eivät pysty siihen.
Tunnisteiden hajanaisuusongelma
Markkinapaikka, jossa on myyjiä 45 maasta, saa varsin erilaisia rekisteröitymisasiakirjoja. Brasilialainen myyjä toimittaa CPF:n. Siinä on 11 numeroa, joista kaksi on tarkistusnumeroita. Ne käyttävät tiettyä painotuskaavaa. Intialainen myyjä toimittaa PAN-numeron. Siinä on 10 merkkiä. Kirjaimet ja numerot esiintyvät kiinteissä asemissa. Saksalainen myyjä toimittaa Steuer-ID:n. Siinä on 11 numeroa ja Luhn-tarkistussumma. Hollantilainen myyjä toimittaa BSN:n. Siinä on 9 numeroa ja se käyttää mod-11-vahvistusta.
Jokaisella formaatilla on eri pituus ja rakenne. Yhtä formaattia varten rakennettu regex ei vastaa muita. Laaja "10–12 numeron" kuvio nappaa liikaa — se merkitsee hinnat, päivämäärät ja viitenumerot. Väärät positiiviset kasvavat nopeasti suuressa mittakaavassa.
40-tunnisteen puute
Useimmat yritystason henkilötietotyökalut toimittavat noin 40 tunnistustyyppiä. Yleisiä ovat:
- Yhdysvaltain sosiaaliturvatunnus
- Yhdysvaltain passimuoto
- Yhdysvaltain ajokortti
- Yleiset luottokorttiformaatit Luhn-vahvistuksella
- Sähköpostiosoitteet
- Puhelinnumerot NANP-muodossa
- IP-osoitteet
Nämä kattavat Pohjois-Amerikan vaatimustenmukaisuuden hyvin. Ne eivät kata globaalia toimintaa.
Miltä puute näyttää alueittain
Etelä-Amerikka: Brasilian CPF ja CNPJ käyttävät Brasilian veroviranomaisen tarkistusalgoritmeja. Argentiinan CUIT käyttää erilaista painotetun summan kaavaa. Kolumbian NIT:llä on oma vahvistusmenetelmänsä. Mikään näistä ei vastaa yhdysvaltalaisia malleja.
Aasia: Intian PAN, Aadhaar, GSTIN ja äänestäjäkortti ovat kukin erillisessä muodossa. Japanin My Number on 12-numeroinen. Etelä-Korean henkilötunnus ja Kiinan kansallinen tunniste vaativat kukin oman tunnistajansa.
EU:n jäsenvaltiot: Kattava EU-kattavuus edellyttää IBAN-muotoja kaikille 27 jäsenvaltiolle. Jokaisella on maakohtainen pituus ja muoto. Tarvitaan myös jokainen kansallinen tunnitemuoto — mukaan lukien Saksan Steuer-ID, Ranskan NIR, Hollannin BSN, Puolan PESEL ja Ruotsin Personnummer, sekä Slovenian EMŠO, Kroatian OIB, Bulgarian EGN ja Romanian CNP.
Mitä 260+ entiteettiä kattaa
Yli 260 entiteetin kirjasto kattaa kaikkien 27 EU:n jäsenvaltion kansalliset tunnisteet. Se vahvistaa kaikki EU:n IBAN-muodot. Se kattaa Etelä-Amerikan tunnisteet: Brasilian CPF ja CNPJ, Argentiinan CUIT, Kolumbian NIT. Se kattaa aasialaiset tunnisteet: Intian PAN, Aadhaar, GSTIN, Japanin My Number, Korean RRN. Se kattaa brittiläiset tunnisteet: NI-numero, NHS-numero, NINO-variantit. Se kattaa lääketieteelliset tunnisteet: Yhdysvaltain NPI, DEA-numerot, sairaaloidenMRN-muodot. Se kattaa taloudelliset tunnisteet: SWIFT-koodit, BIC-muodot, tilinumerokuviot.
Miksi tunnistuskattavuus on vaatimustenmukaisuuskysymys
Jokainen kehys edellyttää, että sen tunnisteet löydetään ja suojataan. GDPR kattaa EU:n myyjätiedot. LGPD kattaa brasilialaisten myyjien tiedot. Intian DPDP Act kattaa intialaisten myyjien tiedot.
"Asianmukainen suojaus" tarkoittaa, että työkalu löysi tunnisteen. Puuttuva Aadhaar ei ole konfigurointivirhe. Se on kattavuusvirhe. Globaaleille alustoille se ero tarkoittaa osittaisen vaatimustenmukaisuuden ja todellisen suojauksen välistä eroa.
Yksi käyttöönotto, jossa on 260+ entiteettikattavuus, hoitaa kaikki nämä lainkäyttöalueet — ei erillisiä alueellisia työkaluja, ei erillisiä käsittelyputkia eikä manuaalista rikastamista formaateille, jotka 40-tunnistajan työkalu jättää huomaamatta.
Lisätietoja siitä, miten kattavuus vastaa GDPR-velvoitteita, löytyy GDPR-vaatimustenmukaisuusresursseistamme. Auditointipolusta ja päivityskäytännöistä löydät tietoa tietoturva- ja vaatimustenmukaisuussivulta.