Tillbaka till BloggenGDPR & Efterlevnad

EU-identifiergapet: Varför amerikanska PII-verktyg...

Generiska PII-verktyg är byggda kring amerikanska identifierare. Den tyska Steuer-ID, franska NIR...

April 20, 20268 min läsning
EU identifier gapSteuer-ID detectionFrench NIR anonymizationSwedish PersonnummerNordic identifier GDPR

Varför europeiska identifierare är strukturellt olika

Amerikanska PII-verktyg antar identifierarstruktur baserat på amerikanska format: Social Security Numbers (AAA-BB-CCCC), amerikanska telefonnummer (XXX-XXX-XXXX), amerikanska körkortformat per stat och amerikanska postnummer (XXXXX eller XXXXX-XXXX). Dessa verktyg var inte designade för europeiska identifierarformat — och europeiska format är inte mindre variationer av amerikanska format. De är strukturellt olika, kulturellt olika och juridiskt definierade under nationell lagstiftning som inte har någon amerikansk motsvarighet.

Den tyska Steuer-ID illustrerar den strukturella skillnaden. Det 11-siffriga numret använder en specifik checksum-algoritm — den första siffran kan inte vara 0, ingen siffra kan förekomma mer än tre gånger i rad, och en matematisk formel som involverar sifferpositioner producerar den slutliga kontrollsiffran. Valideringsalgoritmen publiceras av Bundeszentralamt für Steuern. En amerikansk SSN-regex kommer inte att matcha en Steuer-ID. Kontrollsummans valideringslogik för en SSN kommer inte att validera en Steuer-ID.

Den franska NIR (Numéro de Sécurité Sociale) är 15 siffror. Strukturen är semantiskt meningsfull: position 1 kodar kön (1 = man, 2 = kvinna), positioner 2–3 kodar de sista två siffrorna av födelseåret, positioner 4–5 kodar födelsemånaden, positioner 6–7 kodar födelsedepartementet, positioner 8–10 kodar kommunen, positioner 11–13 kodar ordningen inom kommunen, och positioner 14–15 är en kontrollnyckel härledd från att dela det 13-siffriga numret med 97. NIR är inte detekterbar av någon amerikansk formatidentifierar-regex. Det kräver landspecifik implementering.

Det pan-europeiska efterlevnadsgapet

IBMs rapport om kostnaden för dataintrång 2025 fann att 10,22 miljoner dollar är den genomsnittliga kostnaden för ett dataintrång inom vården — den högsta av alla sektorer. Vårdssektorns höga kostnad för intrång återspeglar både volymen av känslig data som är involverad och komplexiteten i efterlevnadskrav. När intrång involverar otillräcklig avidentifiering av delad forskningsdata — som de gör i 50% av fallen med dataintrång inom vården — skapar kombinationen av otillräcklig EU-identifierardetektion och delad forskningsdata systematiska risker.

En pan-europeisk HR-programvaruleverantör som behandlar onboarding-dokument för kunder i 18 EU-länder med ett amerikanskt PII-verktyg upptäcker inte 14 av 18 länders nationella identifierare. Gapet är systematiskt: varje dokument som behandlas av det verktyget som innehåller en Steuer-ID, NIR, personnummer, Fodselsnummer eller annan EU-specifik identifierare lämnar den identifieraren exponerad.

Fullständiga EU-täckningskrav

Minimi-EU-täckning för GDPR-efterlevnad kräver:

DACH (Tyskland, Österrike, Schweiz): Tysk Steuer-ID och Reisepass; Österrikisk Sozialversicherungsnummer; Schweizisk AHV-Nr (13-siffrig med kontrollsiffra)

Frankrike: NIR (15-siffrig socialförsäkringsnummer), Carte Vitale, SIRET (14-siffrig), SIREN (9-siffrig)

UK (post-Brexit GDPR-motsvarighet): NHS-nummer (10-siffrigt), National Insurance-nummer (AA-NN-NN-NN-A format), UTR (10-siffrigt)

Nordiska: Svenska personnummer (YYMMDD-XXXX), norska Fodselsnummer (11-siffrigt), finska Henkilotunnus (DDMMYY-XXXX), danska CPR (DDMMYY-XXXX)

Södra EU: Spanska DNI/NIE, italienska Codice Fiscale (16-teckens alfanumerisk), polska PESEL (11-siffrigt), tjeckiska Rodne Cislo

Organisationer som ersätter amerikanskt byggda verktyg med EU-omfattande täckning upptäcker vanligtvis att deras tidigare avidentifiering uppnådde 30–40% EU-identifierartäckning — vilket lämnar majoriteten av europeiska nationella ID:n i sina "avidentifierade" dataset.

Källor:

Redo att skydda din data?

Börja anonymisera PII med 285+ entitetstyper på 48 språk.