EU:s nationella ID:n som ditt PII-verktyg inte detekterar
Skatteidentifierare är mycket känsliga. De förekommer på lönebesked, skattedeklarationer och bankansökningar. Om de läcker möjliggör de bedrägeri och identitetsstöld.
GDPR behandlar dem som personuppgifter. Den konkreta risken är hög. Varje EU-land använder sitt eget format för nationell identifierare. De flesta PII-verktyg utvecklades för den amerikanska eller brittiska marknaden. De hittar enkelt SSN och NINO. De missar ofta Steueridentifikationsnummer, Codice Fiscale och BSN. Det är format som europeiska team bearbetar dagligen.
Landskapet för EU-skatteidentifierare
Varje EU-land har sitt eget format. Här är de vanligaste.
Tyskland — Steueridentifikationsnummer
Steuer-ID består av 11 siffror. Det tilldelas vid födseln. Den första siffran är 1–9 (aldrig 0). Tre identiska siffror förekommer aldrig i följd. Exempel: 12345678901. Steuernummer används också: 10–11 siffror, formatet varierar per delstat.
Frankrike — Numéro fiscal de référence
SPI består av 13 siffror. Det utfärdas av DGFiP, den franska skattemyndigheten. På skattedokument visas det som "Identifiant fiscal".
Italien — Codice Fiscale
Codice Fiscale består av 16 alfanumeriska tecken. Det kodar efternamn, förnamn, födelseår, födelsemånad, födelsedag och hemkommun. Exempel: RSSMRA85M01H501Z. Formatet är verifierbart via kontrollsumma.
Spanien — NIF och NIE
Spanska medborgare använder DNI-nummer plus en kontrollbokstav: 8 siffror + bokstav, t.ex. 12345678A. Utländska bosatta använder NIE: prefix X/Y/Z + 7 siffror + kontrollbokstav, t.ex. X1234567A. Juridiska personer använder CIF: bokstav + 8 siffror, t.ex. B12345678.
Nederländerna — BSN
BSN (Burgerservicenummer) består av 9 siffror. Det använder 11-proef-algoritmen för kontrollsiffra. Det är mycket vanligt i lönesedel- och socialbidragsdokument.
Polen — PESEL
PESEL består av 11 siffror. De första 6 kodar födelsedatumet. De sista siffrorna kodar kön och sekvensnummer.
Belgien — Numéro de registre national
RN består av 11 siffror. Det kodar födelsedatum, sekvens och kontrollsiffror.
Portugal — NIF
Det portugisiska NIF (Número de Identificação Fiscal) består av 9 siffror med en kontrollsiffra. Förkortningen är densamma som det spanska NIF men formatet skiljer sig.
Sverige — Personnummer
Personnummer består av 10 eller 12 siffror. Det kodar födelsedatum och ett sekvensnummer. Format: ÅÅÅÅMMDD-XXXX eller ÅÅMMDD-XXXX.
Finland — Henkilötunnus
HETU består av 11 tecken. Det kodar datum, ett avgränsartecken, en sekvens och ett kontrolltecken. Format: DDMMÅÅ-XXXC.
Vad standardverktyg missar
Verktyg för den amerikanska och brittiska marknaden inkluderar dessa mönster som standard:
- Amerikanskt SSN (XXX-XX-XXXX).
- Brittiskt NINO (XX 99 99 99 X).
- Amerikanska passnummer.
- Amerikanska körkortsmönster.
- Stora kreditkortsnummer.
EU:s nationella identifierare saknas ofta. Verktyg baserade på Presidios standarduppsättning av igenkänningsmoduler missar dem. Utan EU-specifika tillägg saknas europeisk täckning.
Ett verkligt efterlevnadsgap
Ett tyskt lönehanteringsföretag betjänar 500 kundföretag. Deras arbetsflöde tar bort namn, e-post, IBAN och telefonnummer. Men det missar tyska Steueridentifikationsnummern. Det formatet hade aldrig inkluderats i standardkonfigurationen.
En tillsynsmyndighetsrevision hittar ej redigerade Steuer-ID:n i lönesedels-PDF:er. Företaget möter saneringskostnader för tidigare dokument. De möter tillsynsmyndighetens tillämpning av Artikel 83 i GDPR. De möter avtalsenligt ansvar gentemot sina kunder.
Gapet hittades inte av företaget. Det hittades av regulatorn först.
Se vår GDPR-efterlevnadsguide för att genomföra din egen täckningskontroll.
Prioriteringsordning för EU-täckning
Lägg till identifierarmönster i denna ordning om du verkar i flera EU-länder.
Nivå 1 — Högst volym:
- Tyskland: Steueridentifikationsnummer.
- Frankrike: Numéro fiscal.
- Italien: Codice Fiscale.
- Spanien: NIF/NIE.
- Nederländerna: BSN.
Nivå 2 — Betydande men mindre marknader:
- Polen: PESEL.
- Belgien: RN.
- Sverige: Personnummer.
- Portugal: NIF.
- Österrike: Sozialversicherungsnummer.
Nivå 3 — Specifika användningsfall:
Återstående 17 EU-medlemsstater. Lägg till baserat på de länder där ditt team bearbetar data.
Lägga till Steueridentifikationsnummer
Tyskt Steuer-ID är det första mönstret att lägga till. Dess format är tydligt och väl dokumenterat.
Steuer-ID består av 11 siffror. Den första siffran är 1–9. Tre identiska siffror förekommer aldrig i följd. En anpassad algoritm validerar kontrollsiffran.
Beskrivning på vanligt språk för mönstergenerering: "Tyska skattenummer: 11 siffror. Den första siffran är 1–9. De övriga 10 siffrorna kan innehålla nollor."
Efter att ha genererat mönstret, testa det på tyska lönebesked och skattecertifikat. Verifiera detekteringsgraden och andelen falska positiva. Implementera bara efter att valideringen godkänts.
Lägg till mönstret i din tyskspråkiga preset. För flerspråkiga dokumentuppsättningar, para ihop det med språkdetektering. Det tillämpar rätt mönster på rätt dokument.
En preset eller flera?
Alternativ 1 — Landsspecifika presets:
Skapa en preset per land. Dirigera dokument efter ursprung. Det ger lägre andel falska positiva. Det kräver mer dirigeringslogik.
Alternativ 2 — Kombinerad EU-preset:
Skapa en enda preset med alla aktiva EU-identifierarmönster. Enklare att hantera. Högre risk för falska positiva på generell text. Fungerar bra när identifierare förväntas i hela dokumentet.
För lönesedeldokument: använd Alternativ 1 med ursprungsdirigering. För blandade dokumentuppsättningar: använd Alternativ 2 med tröskelinställning.
Se säkerhets- och efterlevnadsöversikten för hur presetkonfiguration passar in i ett komplett efterlevnadsarbetsflöde.
Täpp till gapet innan revisionen
GDPR gäller lika i alla EU-medlemsstater. Verktyg utvecklade för den amerikanska marknaden gör det ofta inte. Codice Fiscale, BSN och Steuer-ID bär samma risk som ett SSN. De förekommer lika ofta i delade dokument.
Anpassade entitetsmönster täpper till detekteringsgapet på några timmar. Lägg till ett Steuer-ID-mönster. Testa det på tyska exempellönebesked. Implementera det i alla arbetsflöden. Utan att vänta på verktygsleverantören. Utan att låta tillsynsmyndigheten hitta gapet.
anonym.legal låter dig lägga till anpassade entitetstyper via presetkonfigurationsgränssnittet. Mönster valideras mot dina exempeldokument innan implementering.