Yhdysvaltalainen PII-työkalujen ongelma
Useimmat PII-havaitsemistyökalut on rakennettu Yhdysvalloissa Yhdysvaltojen tietomuotoja varten. Sosiaaliturvatunnus — 9 numeroa muodossa AAA-BB-CCCC, asiakirjoissa dokumentoidut alue- ja ryhmänumerot sekä sarjanumerot — oli pääasiallinen suunnittelutavoite. SSN-havaitsemiseen perustetut työkalut havaitsevat luotettavasti SSN:itä. Ne voivat myös havaita puhelinnumeroita, sähköpostiosoitteita ja Yhdysvaltojen ajokorttimuotoja. Ne jättävät systemaattisesti huomiotta muiden maiden käyttämät tunnistemuodot.
GDPR ei tunnusta Yhdysvaltojen keskeisyyttä vaatimustenmukaisuuden poikkeuksena. Saksalainen Steuer-ID (Steuerliche Identifikationsnummer) on 11-numeroinen verotunnus, jonka myöntää Bundeszentralamt für Steuern, ja siinä on erityinen tarkistusalgo, joka on validoitu tarkistussarakkeen mukaan. Se tunnistaa saksalaiset asukkaat yhtä henkilökohtaisesti kuin SSN tunnistaa amerikkalaiset. GDPR:n artikla 4 määrittelee henkilötiedot "miksi tahansa tiedoksi, joka liittyy tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön" — Steuer-ID on henkilötieto GDPR:n mukaan riippumatta siitä, tietääkö PII-työkalusi muodon.
GDPR-sakkoja on määrätty EU-maakohtaisesta PII-altistumisesta tietojärjestelmissä, jotka käsittelivät EU-asukkaiden tietoja työkaluilla, jotka oli konfiguroitu vain Yhdysvaltojen muotoja varten. Vaatimustenmukaisuuden aukko ei ole teoreettinen — se on johtanut täytäntöönpanotoimiin.
Euroopan tunnistelaajuisuus
Euroopan tunnistuskattavuuden aukon laajuus:
Saksa: Steuer-ID (11-numeroa, tarkistus), Sozialversicherungsnummer (12-numeroa, rakenteellinen muoto), Reisepass (10-numeroista passia, jossa on erityiset myöntäjäkoodit)
Ranska: NIR/Numero de Securite Sociale (15 numeroa, jotka koodaa sukupuolen [1], syntymävuoden [2], syntymäkuukauden [2], osaston [2], kunnan [3], rekisterinumeron [3], tarkistuskoodin [2]), Carte Vitale (15-numeroisen NIR:n kortti), SIRET (14-numeroista liiketunnistetta), SIREN (9-numeroista)
Ruotsi: Personnummer (10-numeroista, muoto YYMMDD-XXXX, jossa viimeiset kaksi numeroa tunnistavat syntymämaakunnan vanhemmissa numeroissa), Samordningsnummer (koordinaatinumero ei-asukkaille, samanlainen muoto, jossa päivä + 60)
Norja: Fodselsnummer (11-numeroista, muoto DDMMYYNNNKK, jossa sukupuoli keskimmäisissä numeroissa), D-nummer (koordinaatinumero, päivä + 40)
Brasilia: CPF (Cadastro de Pessoas Fisicas, 11-numeroista, jossa on kaksi tarkistusnumeroa), CNPJ (14-numeroista liiketunnistetta)
Intia: Aadhaar (12-numeroista biometrinen henkilöllisyys, jossa on Verhoeff-algoritmin tarkistusnumero), PAN (10-merkkinen alfanumeerinen tuloveroa varten)
UAE: Emirates ID (15-numeroista: 784-syntymävuosi-sekvenssi-tarkistus)
Globaali HR-päällikkö, joka käsittelee palkkatietoja työntekijöille 12 maassa, tarvitsee työkalun, joka havaitsee kaikkien 12 maan kansalliset ID-muodot yhdellä kertaa — ilman, että tarvitsee konfiguroida 12 erillistä maakohtaista työkalua tai ylläpitää 12 erillistä regex-kirjastoa.
285+ Entiteettityypin arkkitehtuuri
285+ entiteettityyppikirjasto kattaa koko EU:n jäsenvaltioiden tunnistussarjan, tärkeimmät APAC-tunnistimet (Aadhaar, PAN, CPF, CNPJ, Emirates ID, thaimaalainen kansalais-ID) ja Yhdysvaltojen tunnistimet (SSN, EIN, ajokortti osavaltiokohtaisesti) yhdessä havaitsemismootorissa. Kirjastoa ylläpidetään ja päivitetään, kun maakohtaiset muodot kehittyvät.
Lähteet: