By · Last updated 2026-06-05

Tilbake til BloggGDPR & Overholdelse

Presidio mangler 220+ GDPR-enheter

Presidio leveres med ~40 standard enhetsgjenkjennere fokusert på US-identifikatorer. Europeiske organisasjoner trenger IBAN, Codice Fiscale og mer.

June 5, 20267 min lesing
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio mangler 220+ GDPR-enheter: EU-dekninsggapet

Oppdatert for 2026

Microsoft Presidio leveres med omtrent 40 standard enhetsgjenkjennere. For US-distribusjoner fungerer dette. Det dekker SSN-er, amerikanske pass, forerkortnumre, kredittkort og e-postadresser.

For EU-distribusjoner er gapet stort. GDPR dekker alle EU-personopplysninger. Dette gjelder uavhengig av den registrertes nasjonalitet. EU-team trenger gjenkjennere som Presidio ikke leverer med.

Hva Presidio inkluderer

Presidios standarder faller inn i fire grupper.

US-sentrerte ID-er:

  • US Social Security Number (SSN)
  • US passnummer
  • US forerkortnummer
  • US bankkontonummer
  • US ITIN
  • US medisinsk lisensnummer

Universelle ID-er:

  • E-postadresse
  • Telefonnummer
  • IP-adresse
  • Kredittkortsnummer
  • Kryptolommebok-adresse
  • URL

Tekstenheter (NER-basert):

  • PERSON
  • STED
  • ORGANISASJON
  • DATO_TID

Begrenset internasjonal dekning:

  • UK NHS-nummer
  • UK National Insurance Number (NINO)
  • Noen finansielle identifikatorer

Totalt: omtrent 40 gjenkjennere.

Hva EU-team trenger

Finansielle ID-er

IBAN dukker opp i de fleste EU-forretningsfiler. Det vises i betalinger, fakturaer og lonn. IBAN folger ISO 13616. Presidio har ingen IBAN-gjenkjenner.

Ta en tysk fintech. Hver betalingsfil har en IBAN. Uten IBAN-deteksjon ser verktoyets bare etter kredittkortsnumre. Den viktigste EU-betalings-ID-en er oversett. Det betyr at en nokkelkomponent av GDPR-dekket data aldri er funnet.

Nasjonale skatte-ID-er

Ingen av disse er i Presidios standarder:

  • Tysk Steueridentifikationsnummer: 11 siffer
  • Fransk NIR: 15 siffer med en kontrollnokkel
  • Italiensk Codice Fiscale: 16 tegn med kontrollsum
  • Spansk NIF/NIE: 9 tegn med en bokstav
  • Nederlandsk BSN: 9 siffer med elfproef-validering

Et EU-lonnsteam håndterer filer fra mange medlemsstater. Uten disse mister det de mest sensitive ID-ene i disse postene.

Nasjonale helse-ID-er

UK NHS-nummeret er dekket. Disse er ikke:

  • Fransk NIR (også en helse-ID)
  • Tysk Krankenkassennummer
  • Italiensk Codice Fiscale (også en helse-ID)
  • Nederlandsk BSN (brukt til helseforsikring)

EU-helseteam trenger disse for GDPR-nivå databeskyttelse.

EU-forerkortnumre

EU-forerkortnumre faller under direktiv 2006/126/EC. Hvert medlemsland har sitt eget format. Den alfanumeriske strukturen varierer per land. Presidio har kun US-forerkortnumre. Det har ingen EU-stotte. Det betyr at EU-forerkortnummerdata passerer uoppdaget gjennom.

MVA-numre

EU MVA-numre vises i alle B2B-avtaler. Format: 2-bokstavers landkode pluss 8-12 siffer. Presidio har ingen MVA-gjenkjenner. MVA-numre er knyttet til selskaper og deres eiere. De er personopplysninger under GDPR.

For mer om GDPR-forpliktelser, se GDPR-compliance-ressurser.

Kostnaden for egendefinerte gjenkjennere

Når EU-team oppdager gapet, bygger de egendefinerte gjenkjennere. Dette tar reell tid.

Tid per gjenkjenner (grovt anslag):

  • Undersok formatet: 1-2 timer
  • Skriv Python-klassen: 2-4 timer
  • Bygg regex og validering: 2-4 timer
  • Legg til kontekstord: 1-2 timer
  • Skriv tester: 2-3 timer
  • Distribuer og sjekk: 1-2 timer

Det er 9-17 timer per gjenkjenner. Dette er bare grove anslag.

Eksempel: en tysk fintech trenger fire gjenkjennere.

IBAN, Steuer-ID, EU-forerkortnummer, tysk MVA.

  • 4 gjenkjennere til 13 timer hver = 52 timers arbeid
  • Til €100 per time: omtrent €5 200

Det dekker bare det forste bygget. Formater endres over tid. Nye kanttilfeller dukker opp. Presidio API-oppdateringer kan odelegge ting. Hver endring trenger en utvikler til å se gjennom og fikse det. Lopende arbeid legger til kostnader år etter år.

Det administrerte biblioteket

anonym.legal utvider Presidio med 285+ enhetstyper. Teamet holder biblioteket oppdatert. EU-identifikatorer er inkludert fra dag én.

Hva gar utover Presidios standarder:

  • IBAN i alle EU-medlemsstaters formater
  • Medlemsstats skatte-ID-er: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL og mer
  • EU nasjonale helse-ID-er
  • MVA-numre (EU-format)
  • EU-forerkortnummerformater
  • Europeiske passformater
  • Enhetsvarianter på tvers av 48 stottede språk

Når Tyskland oppdaterer et skatte-ID-format, leveres oppdateringen med tjenesten. Ingen pull request nodvendig fra ditt team.

For ID-er som ikke er i biblioteket, lar den egendefinerte enhetsbyggeren deg legge til monstre. Ingen Python-kode er nodvendig.

Se sikkerhets- og compliance-detaljer for hvordan oppdateringer og revisjonslogger fungerer.

Tysk fintech-eksempel

En tysk fintech trenger å oppdage IBAN-er, BIC-er, Steuer-ID-er og Handelsregisternummern i kundefiler.

Presidios standard deteksjonsrate for disse fire typene: 0 %.

Ingen er i standardbiblioteket. Dette er ikke dårlig presisjon. Det er null deteksjoner. Verktoyets overser dem ikke delvis. Det ser dem ikke i det hele tatt.

Kostnadssammenligning:

TilnaermingForstekostnader
Egendefinerte gjenkjennere (4 × 13 timer til €100/t)~€5 200 pluss lopende vedlikehold
Administrert enhetsbibliotek (Pro-plan)€180/år, alle fire dekket

Gapet er omtrent 29x i år én. Hvert påfølgende år legger egendefinert vedlikehold til mer kostnad. Den administrerte tjenestens pris er stabil.

Konklusjon

Presidios standarder er godt egnet for US-brukstilfeller. For EU-distribusjoner under GDPR kommer de til kort. Gapet krever enten egendefinert gjenkjennerarbeid eller en administrert tjeneste.

For EU-team der compliance er nodvendig og ingeniortid er begrenset, fjerner et ferdygbygd EU-enhetsbibliotek et byggeprosjekt på 50+ timer. Filer kan behandles fra dag én. Ingen egendefinert kode er nodvendig forst.

Kilder

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.