Presidio mangler 220+ GDPR-enheter: EU-dekninsggapet
Oppdatert for 2026
Microsoft Presidio leveres med omtrent 40 standard enhetsgjenkjennere. For US-distribusjoner fungerer dette. Det dekker SSN-er, amerikanske pass, forerkortnumre, kredittkort og e-postadresser.
For EU-distribusjoner er gapet stort. GDPR dekker alle EU-personopplysninger. Dette gjelder uavhengig av den registrertes nasjonalitet. EU-team trenger gjenkjennere som Presidio ikke leverer med.
Hva Presidio inkluderer
Presidios standarder faller inn i fire grupper.
US-sentrerte ID-er:
- US Social Security Number (SSN)
- US passnummer
- US forerkortnummer
- US bankkontonummer
- US ITIN
- US medisinsk lisensnummer
Universelle ID-er:
- E-postadresse
- Telefonnummer
- IP-adresse
- Kredittkortsnummer
- Kryptolommebok-adresse
- URL
Tekstenheter (NER-basert):
- PERSON
- STED
- ORGANISASJON
- DATO_TID
Begrenset internasjonal dekning:
- UK NHS-nummer
- UK National Insurance Number (NINO)
- Noen finansielle identifikatorer
Totalt: omtrent 40 gjenkjennere.
Hva EU-team trenger
Finansielle ID-er
IBAN dukker opp i de fleste EU-forretningsfiler. Det vises i betalinger, fakturaer og lonn. IBAN folger ISO 13616. Presidio har ingen IBAN-gjenkjenner.
Ta en tysk fintech. Hver betalingsfil har en IBAN. Uten IBAN-deteksjon ser verktoyets bare etter kredittkortsnumre. Den viktigste EU-betalings-ID-en er oversett. Det betyr at en nokkelkomponent av GDPR-dekket data aldri er funnet.
Nasjonale skatte-ID-er
Ingen av disse er i Presidios standarder:
- Tysk Steueridentifikationsnummer: 11 siffer
- Fransk NIR: 15 siffer med en kontrollnokkel
- Italiensk Codice Fiscale: 16 tegn med kontrollsum
- Spansk NIF/NIE: 9 tegn med en bokstav
- Nederlandsk BSN: 9 siffer med elfproef-validering
Et EU-lonnsteam håndterer filer fra mange medlemsstater. Uten disse mister det de mest sensitive ID-ene i disse postene.
Nasjonale helse-ID-er
UK NHS-nummeret er dekket. Disse er ikke:
- Fransk NIR (også en helse-ID)
- Tysk Krankenkassennummer
- Italiensk Codice Fiscale (også en helse-ID)
- Nederlandsk BSN (brukt til helseforsikring)
EU-helseteam trenger disse for GDPR-nivå databeskyttelse.
EU-forerkortnumre
EU-forerkortnumre faller under direktiv 2006/126/EC. Hvert medlemsland har sitt eget format. Den alfanumeriske strukturen varierer per land. Presidio har kun US-forerkortnumre. Det har ingen EU-stotte. Det betyr at EU-forerkortnummerdata passerer uoppdaget gjennom.
MVA-numre
EU MVA-numre vises i alle B2B-avtaler. Format: 2-bokstavers landkode pluss 8-12 siffer. Presidio har ingen MVA-gjenkjenner. MVA-numre er knyttet til selskaper og deres eiere. De er personopplysninger under GDPR.
For mer om GDPR-forpliktelser, se GDPR-compliance-ressurser.
Kostnaden for egendefinerte gjenkjennere
Når EU-team oppdager gapet, bygger de egendefinerte gjenkjennere. Dette tar reell tid.
Tid per gjenkjenner (grovt anslag):
- Undersok formatet: 1-2 timer
- Skriv Python-klassen: 2-4 timer
- Bygg regex og validering: 2-4 timer
- Legg til kontekstord: 1-2 timer
- Skriv tester: 2-3 timer
- Distribuer og sjekk: 1-2 timer
Det er 9-17 timer per gjenkjenner. Dette er bare grove anslag.
Eksempel: en tysk fintech trenger fire gjenkjennere.
IBAN, Steuer-ID, EU-forerkortnummer, tysk MVA.
- 4 gjenkjennere til 13 timer hver = 52 timers arbeid
- Til €100 per time: omtrent €5 200
Det dekker bare det forste bygget. Formater endres over tid. Nye kanttilfeller dukker opp. Presidio API-oppdateringer kan odelegge ting. Hver endring trenger en utvikler til å se gjennom og fikse det. Lopende arbeid legger til kostnader år etter år.
Det administrerte biblioteket
anonym.legal utvider Presidio med 285+ enhetstyper. Teamet holder biblioteket oppdatert. EU-identifikatorer er inkludert fra dag én.
Hva gar utover Presidios standarder:
- IBAN i alle EU-medlemsstaters formater
- Medlemsstats skatte-ID-er: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL og mer
- EU nasjonale helse-ID-er
- MVA-numre (EU-format)
- EU-forerkortnummerformater
- Europeiske passformater
- Enhetsvarianter på tvers av 48 stottede språk
Når Tyskland oppdaterer et skatte-ID-format, leveres oppdateringen med tjenesten. Ingen pull request nodvendig fra ditt team.
For ID-er som ikke er i biblioteket, lar den egendefinerte enhetsbyggeren deg legge til monstre. Ingen Python-kode er nodvendig.
Se sikkerhets- og compliance-detaljer for hvordan oppdateringer og revisjonslogger fungerer.
Tysk fintech-eksempel
En tysk fintech trenger å oppdage IBAN-er, BIC-er, Steuer-ID-er og Handelsregisternummern i kundefiler.
Presidios standard deteksjonsrate for disse fire typene: 0 %.
Ingen er i standardbiblioteket. Dette er ikke dårlig presisjon. Det er null deteksjoner. Verktoyets overser dem ikke delvis. Det ser dem ikke i det hele tatt.
Kostnadssammenligning:
| Tilnaerming | Forstekostnader |
|---|---|
| Egendefinerte gjenkjennere (4 × 13 timer til €100/t) | ~€5 200 pluss lopende vedlikehold |
| Administrert enhetsbibliotek (Pro-plan) | €180/år, alle fire dekket |
Gapet er omtrent 29x i år én. Hvert påfølgende år legger egendefinert vedlikehold til mer kostnad. Den administrerte tjenestens pris er stabil.
Konklusjon
Presidios standarder er godt egnet for US-brukstilfeller. For EU-distribusjoner under GDPR kommer de til kort. Gapet krever enten egendefinert gjenkjennerarbeid eller en administrert tjeneste.
For EU-team der compliance er nodvendig og ingeniortid er begrenset, fjerner et ferdygbygd EU-enhetsbibliotek et byggeprosjekt på 50+ timer. Filer kan behandles fra dag én. Ingen egendefinert kode er nodvendig forst.