By · Last updated 2026-06-05

Tornar al BlogGDPR i Compliment

Presidio no detecta mes de 220 entitats del RGPD

Presidio inclou uns 40 reconeixedors d'entitats per defecte centrats en identificadors dels EUA. Les organitzacions europees necessiten IBAN, Codice Fiscale i molts mes.

June 5, 20267 min llegit
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio no detecta mes de 220 entitats del RGPD: la bretxa de cobertura a la UE

Actualitzat per al 2026

Microsoft Presidio inclou aproximadament 40 reconeixedors d'entitats per defecte. Per als desplegaments als EUA, aixo funciona. Cobreix SSN, passaports nord-americans, permisos de conduir, targetes de credit i correus electronics.

Per als desplegaments a la UE, la bretxa es gran. El RGPD cobreix totes les dades personals de la UE. Aixo s'aplica independentment de la nacionalitat de l'interessat. Els equips de la UE necessiten reconeixedors que Presidio no inclou.

Que inclou Presidio

Els valors per defecte de Presidio es divideixen en quatre grups.

Identificadors centrics als EUA:

  • Numero de la Seguretat Social dels EUA (SSN)
  • Numero de passaport dels EUA
  • Numero de permi de conduir dels EUA
  • Numero de compte bancari dels EUA
  • ITIN dels EUA
  • Numero de llicencia medica dels EUA

Identificadors universals:

  • Adreca de correu electronic
  • Numero de telefon
  • Adreca IP
  • Numero de targeta de credit
  • Adreca de moneder criptografic
  • URL

Entitats de text (basades en NER):

  • PERSONA
  • LLOC
  • ORGANITZACIO
  • DATA_HORA

Internacional limitat:

  • Numero NHS del Regne Unit
  • Numero de la Seguretat Nacional del Regne Unit (NINO)
  • Alguns identificadors financers

Total: uns 40 reconeixedors.

Que necessiten els equips de la UE

Identificadors financers

L'IBAN apareix a la majoria de fitxers empresarials de la UE. Apareix a pagaments, factures i nomines. L'IBAN segueix la norma ISO 13616. Presidio no te cap reconeixedor d'IBAN.

Poseu-vos en el lloc d'una fintech alemanya. Cada fitxer de pagament te un IBAN. Sense la deteccio d'IBAN, l'eina nomes cerca numeros de targetes de credit. El principal identificador de pagament de la UE no es detecta. Aixo significa que una dada coberta pel RGPD mai es troba.

Identificadors fiscals nacionals

Cap d'aquests esta als valors per defecte de Presidio:

  • Steueridentifikationsnummer alemany: 11 digits
  • NIR frances: 15 digits amb una clau de verificacio
  • Codice Fiscale italia: 16 caracters amb suma de comprovacio
  • NIF/NIE espanyol: 9 caracters amb una lletra
  • BSN holandes: 9 digits amb validacio elfproef

Un equip de nomines de la UE gestiona fitxers de diversos estats membres. Sense aquests, es perd els identificadors mes sensibles d'aquells registres.

Identificadors sanitaris nacionals

El numero NHS del Regne Unit esta cobert. Aquests no ho estan:

  • NIR frances (tambe es un identificador sanitari)
  • Krankenkassennummer alemany
  • Codice Fiscale italia (tambe es un identificador sanitari)
  • BSN holandes (utilitzat per a l'asseguranca de salut)

Els equips sanitaris de la UE necessiten aquests per a la proteccio de dades a nivell del RGPD.

Permisos de conduir de la UE

Els permisos de conduir de la UE estan subjectes a la Directiva 2006/126/CE. Cada estat membre te el seu propi format. L'estructura alfanumerica difereix per pais. Presidio te reconeixedors de permisos de conduir nomes per als EUA. No te cap suport per a permisos de conduir de la UE. Aixo significa que les dades de permisos de conduir de la UE passen sense detectar.

Numeros de VAT

Els numeros de VAT de la UE apareixen a cada operacio B2B. Format: codi de pais de 2 lletres mes 8-12 digits. Presidio no te cap reconeixedor de VAT. Els numeros de VAT estan vinculats a empreses i als seus propietaris. Son dades personals en virtut del RGPD.

Per a mes informacio sobre les obligacions del RGPD, vegeu els recursos de compliment del RGPD.

El cost dels reconeixedors personalitzats

Quan els equips de la UE descobreixen la bretxa, construeixen reconeixedors personalitzats. Aixo requereix temps real.

Temps per reconeixedor (estimacio aproximada):

  • Recerca del format: 1-2 hores
  • Escriure la classe Python: 2-4 hores
  • Construir el regex i la validacio: 2-4 hores
  • Afegir paraules de context: 1-2 hores
  • Escriure proves: 2-3 hores
  • Desplegar i comprovar: 1-2 hores

Aixo son 9-17 hores per reconeixedor. Son nomes estimacions aproximades.

Exemple: una fintech alemanya necessita quatre reconeixedors.

IBAN, Steuer-ID, permi de conduir de la UE, VAT alemany.

  • 4 reconeixedors a 13 hores cadascun = 52 hores de feina
  • A 100 EUR per hora: uns 5.200 EUR

Aixo nomes cobreix la primera construccio. Els formats canvien amb el temps. Apareixen nous casos. Les actualitzacions de l'API de Presidio poden trencar les coses. Cada canvi necessita que un desenvolupador el revisi i l'arregli. La feina continuada afegeix cost any rere any.

La biblioteca gestionada

anonym.legal amplia Presidio amb mes de 285 tipus d'entitats. L'equip mante la biblioteca actualitzada. Els identificadors de la UE s'inclouen des del primer dia.

Que va mes enlla dels valors per defecte de Presidio:

  • IBAN en tots els formats dels estats membres de la UE
  • Identificadors fiscals dels estats membres: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL i mes
  • Identificadors sanitaris nacionals de la UE
  • Numeros de VAT (format UE)
  • Formats de permisos de conduir de la UE
  • Formats de passaport europeus
  • Variants d'entitats en els 48 idiomes admesos

Quan Alemanya actualitza un format d'identificador fiscal, l'actualitzacio s'envia amb el servei. No cal cap sol·licitut de pull del vostre equip.

Per als identificadors que no estan a la biblioteca, el constructor d'entitats personalitzades us permet afegir patrons. No cal codi Python.

Vegeu els detalls de seguretat i compliment per saber com funcionen les actualitzacions i els rastres d'auditoria.

Exemple de fintech alemanya

Una fintech alemanya necessita detectar IBAN, BIC, Steuer-ID i Handelsregisternummern en fitxers de clients.

Taxa de deteccio per defecte de Presidio per a aquests quatre tipus: 0%.

Cap esta a la biblioteca per defecte. No es una precisio deficient. Son zero deteccions. L'eina no els detecta parcialment. No els veu en absolut.

Comparativa de costos:

EnfocamentCost del primer any
Reconeixedors personalitzats (4 x 13 h a 100 EUR/h)~5.200 EUR mes manteniment continuat
Biblioteca d'entitats gestionada (pla Pro)180 EUR/any, els quatre coberts

La diferencia es d'aproximadament 29 vegades el primer any. Cada any despres d'aixo, el manteniment personalitzat afegeix mes cost. El preu del servei gestionat es manté constant.

Conclusio

Els valors per defecte de Presidio serveixen be per als casos d'us als EUA. Per als desplegaments de la UE sota el RGPD, es queden curts. La bretxa requereix treball de reconeixedors personalitzats o un servei gestionat.

Per als equips de la UE on el compliment es obligatori i el temps d'enginyeria es limitat, una biblioteca d'entitats de la UE preconstruida elimina un projecte de construccio de mes de 50 hores. Els fitxers es poden processar des del primer dia. No cal codi personalitzat primer.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.