Takaisin BlogiinGDPR & Vaatimustenmukaisuus

EU-tunnistusaukko: Miksi Yhdysvalloissa rakennetut...

Yleiset PII-työkalut on rakennettu Yhdysvaltojen tunnisteiden ympärille. Saksalainen Steuer-ID, ranskalainen NIR...

April 19, 20268 min lukuaika
EU identifier gapSteuer-ID detectionFrench NIR anonymizationSwedish PersonnummerNordic identifier GDPR

Miksi eurooppalaiset tunnisteet ovat rakenteellisesti erilaisia

Yhdysvalloissa rakennetut PII-työkalut olettavat tunnisteen rakenteen perustuvan amerikkalaisiin muotoihin: sosiaaliturvatunnukset (AAA-BB-CCCC), Yhdysvaltain puhelinnumerot (XXX-XXX-XXXX), osavaltion mukaan vaihteleva ajokorttimuoto ja Yhdysvaltain postinumerot (XXXXX tai XXXXX-XXXX). Nämä työkalut eivät ole suunniteltu eurooppalaisille tunnistemuille — ja eurooppalaiset muodot eivät ole vain pieniä muunnelmia Yhdysvaltojen muodoista. Ne ovat rakenteellisesti erilaisia, kulttuurisesti erilaisia ja laillisesti määriteltyjä kansallisessa lainsäädännössä, jolla ei ole Yhdysvaltojen vastaavuutta.

Saksalainen Steuer-ID havainnollistaa rakenteellista eroa. 11-numeroisessa tunnuksessa käytetään erityistä tarkistussumman algoritmia — ensimmäinen numero ei voi olla 0, mikään numero ei voi esiintyä peräkkäin yli kolmea kertaa, ja matemaattinen kaava, joka liittyy numeroiden sijainteihin, tuottaa lopullisen tarkistussumman. Vahvistusalgoritmi julkaistaan Bundeszentralamt für Steuern -virastossa. Yhdysvaltain SSN regex ei vastaa Steuer-ID:tä. SSN:lle suunniteltu tarkistussumman vahvistuslogiikka ei vahvista Steuer-ID:tä.

Ranskalainen NIR (Numéro de Sécurité Sociale) on 15 numeroa. Rakenne on semanttisesti merkityksellinen: sijainti 1 koodaa sukupuolen (1 = mies, 2 = nainen), sijainnit 2–3 koodavat syntymävuoden viimeiset kaksi numeroa, sijainnit 4–5 koodavat syntymäkuukauden, sijainnit 6–7 koodavat syntymäosaston, sijainnit 8–10 koodavat kunnan, sijainnit 11–13 koodavat järjestyksen kunnassa, ja sijainnit 14–15 ovat tarkistuskoodi, joka saadaan jakamalla 13-numeroista lukua 97:llä. NIR:ää ei voida havaita millään Yhdysvaltain muotoisella tunnisteen regexillä. Se vaatii maakohtaisen toteutuksen.

Pan-Eurooppalainen vaatimustenmukaisuuden aukko

IBMin vuoden 2025 tietoturvaloukkauksen kustannusraportti havaitsi, että 10,22 miljoonaa dollaria on terveydenhuollon tietoturvaloukkauksen keskimääräinen kustannus — korkein kaikista sektoreista. Terveydenhuoltoalan korkea loukkauksen kustannus heijastaa sekä mukana olevan arkaluontoisen tiedon määrää että vaatimustenmukaisuuden vaatimusten monimutkaisuutta. Kun loukkaukset liittyvät riittämättömään jaotteluun jaettujen tutkimustietojen osalta — kuten ne tekevät 50 %:ssa terveydenhuollon loukkaustapauksista — riittämätön EU-tunnisteiden havaitseminen ja jaetut tutkimustiedot luovat systeemistä riskiä.

Pan-eurooppalainen HR-ohjelmistotoimittaja, joka käsittelee asiakirjoja 18 EU-maassa Yhdysvalloissa rakennetulla PII-työkalulla, ei havaitse 14:ää 18 maan kansallista tunnistetta. Aukko on systeeminen: jokainen kyseisellä työkalulla käsitelty asiakirja, joka sisältää Steuer-ID:n, NIR:n, henkilönumeron, Fodselsnumerin tai muun EU-spesifisen tunnisteen, altistaa kyseisen tunnisteen.

Täydelliset EU-kattovaatimukset

Minimaalinen EU-kattovaatimus GDPR-vaatimustenmukaisuudelle edellyttää:

DACH (Saksa, Itävalta, Sveitsi): Saksalainen Steuer-ID ja Reisepass; Itävaltalainen Sozialversicherungsnummer; Sveitsiläinen AHV-Nr (13-numeroista tarkistussummalla)

Ranska: NIR (15-numeroista sosiaaliturvatunnus), Carte Vitale, SIRET (14-numeroista), SIREN (9-numeroista)

Iso-Britannia (Brexitin jälkeinen GDPR-vastaavuus): NHS-numero (10-numeroista), kansallinen vakuutusnumero (AA-NN-NN-NN-A-muoto), UTR (10-numeroista)

Pohjoismaat: Ruotsalainen henkilönumero (YYMMDD-XXXX), norjalainen Fodselsnummer (11-numeroista), suomalainen Henkilotunnus (DDMMYY-XXXX), tanskalainen CPR (DDMMYY-XXXX)

Etelä-EU: Espanjalainen DNI/NIE, italialainen Codice Fiscale (16-merkkinen alfanumeerinen), puolalainen PESEL (11-numeroista), tšekkiläinen Rodne Cislo

Organisaatiot, jotka korvaavat Yhdysvalloissa rakennetut työkalut EU-laajuisella kattavuudella, huomaavat tyypillisesti, että heidän aikaisempi jaottelunsa saavutti 30–40 % EU-tunnisteiden kattavuuden — jättäen suurimman osan eurooppalaisista kansallisista tunnisteista heidän "de-identified"-aineistoihinsa.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.