Takaisin BlogiinGDPR & Vaatimustenmukaisuus

Miksi PII-työkalusi havaitsee SSN:itä mutta ei...

GDPR koskee saksalaisia Steuer-ID:itä, ranskalaisia NIR:itä, ruotsalaisia Personnummer:ita ja yli 260 muuta tunnistetyyppiä...

April 19, 20268 min lukuaika
global PII coverageEU identifier detectionSteuer-ID French NIRBrazilian CPF285+ entity types GDPR

Yhdysvaltalainen PII-työkalujen ongelma

Useimmat PII-havaitsemistyökalut on rakennettu Yhdysvalloissa Yhdysvaltojen tietomuotoja varten. Sosiaaliturvatunnus — 9 numeroa muodossa AAA-BB-CCCC, asiakirjoissa dokumentoidut alue- ja ryhmänumerot sekä sarjanumerot — oli pääasiallinen suunnittelutavoite. SSN-havaitsemiseen perustetut työkalut havaitsevat luotettavasti SSN:itä. Ne voivat myös havaita puhelinnumeroita, sähköpostiosoitteita ja Yhdysvaltojen ajokorttimuotoja. Ne jättävät systemaattisesti huomiotta muiden maiden käyttämät tunnistemuodot.

GDPR ei tunnusta Yhdysvaltojen keskeisyyttä vaatimustenmukaisuuden poikkeuksena. Saksalainen Steuer-ID (Steuerliche Identifikationsnummer) on 11-numeroinen verotunnus, jonka myöntää Bundeszentralamt für Steuern, ja siinä on erityinen tarkistusalgo, joka on validoitu tarkistussarakkeen mukaan. Se tunnistaa saksalaiset asukkaat yhtä henkilökohtaisesti kuin SSN tunnistaa amerikkalaiset. GDPR:n artikla 4 määrittelee henkilötiedot "miksi tahansa tiedoksi, joka liittyy tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön" — Steuer-ID on henkilötieto GDPR:n mukaan riippumatta siitä, tietääkö PII-työkalusi muodon.

GDPR-sakkoja on määrätty EU-maakohtaisesta PII-altistumisesta tietojärjestelmissä, jotka käsittelivät EU-asukkaiden tietoja työkaluilla, jotka oli konfiguroitu vain Yhdysvaltojen muotoja varten. Vaatimustenmukaisuuden aukko ei ole teoreettinen — se on johtanut täytäntöönpanotoimiin.

Euroopan tunnistelaajuisuus

Euroopan tunnistuskattavuuden aukon laajuus:

Saksa: Steuer-ID (11-numeroa, tarkistus), Sozialversicherungsnummer (12-numeroa, rakenteellinen muoto), Reisepass (10-numeroista passia, jossa on erityiset myöntäjäkoodit)

Ranska: NIR/Numero de Securite Sociale (15 numeroa, jotka koodaa sukupuolen [1], syntymävuoden [2], syntymäkuukauden [2], osaston [2], kunnan [3], rekisterinumeron [3], tarkistuskoodin [2]), Carte Vitale (15-numeroisen NIR:n kortti), SIRET (14-numeroista liiketunnistetta), SIREN (9-numeroista)

Ruotsi: Personnummer (10-numeroista, muoto YYMMDD-XXXX, jossa viimeiset kaksi numeroa tunnistavat syntymämaakunnan vanhemmissa numeroissa), Samordningsnummer (koordinaatinumero ei-asukkaille, samanlainen muoto, jossa päivä + 60)

Norja: Fodselsnummer (11-numeroista, muoto DDMMYYNNNKK, jossa sukupuoli keskimmäisissä numeroissa), D-nummer (koordinaatinumero, päivä + 40)

Brasilia: CPF (Cadastro de Pessoas Fisicas, 11-numeroista, jossa on kaksi tarkistusnumeroa), CNPJ (14-numeroista liiketunnistetta)

Intia: Aadhaar (12-numeroista biometrinen henkilöllisyys, jossa on Verhoeff-algoritmin tarkistusnumero), PAN (10-merkkinen alfanumeerinen tuloveroa varten)

UAE: Emirates ID (15-numeroista: 784-syntymävuosi-sekvenssi-tarkistus)

Globaali HR-päällikkö, joka käsittelee palkkatietoja työntekijöille 12 maassa, tarvitsee työkalun, joka havaitsee kaikkien 12 maan kansalliset ID-muodot yhdellä kertaa — ilman, että tarvitsee konfiguroida 12 erillistä maakohtaista työkalua tai ylläpitää 12 erillistä regex-kirjastoa.

285+ Entiteettityypin arkkitehtuuri

285+ entiteettityyppikirjasto kattaa koko EU:n jäsenvaltioiden tunnistussarjan, tärkeimmät APAC-tunnistimet (Aadhaar, PAN, CPF, CNPJ, Emirates ID, thaimaalainen kansalais-ID) ja Yhdysvaltojen tunnistimet (SSN, EIN, ajokortti osavaltiokohtaisesti) yhdessä havaitsemismootorissa. Kirjastoa ylläpidetään ja päivitetään, kun maakohtaiset muodot kehittyvät.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.