anonym.legal

By · Last updated 2026-06-05

Înapoi la BlogGDPR & Conformitate

Presidio ratează 220+ entități GDPR

Presidio vine cu aproximativ 40 de recunoaștoare implicite de entități concentrate pe identificatori SUA. Organizațiile europene au nevoie de IBAN, Codice Fiscale și altele.

June 5, 20267 min citire
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio ratează 220+ entități GDPR: Decalajul de acoperire UE

Actualizat pentru 2026

Microsoft Presidio vine cu aproximativ 40 de recunoaștoare implicite de entități. Pentru implementările SUA, aceasta funcționează. Acoperă SSN-uri, pașapoarte SUA, permise de conducere, carduri de credit și e-mailuri.

Pentru implementările UE, decalajul este mare. GDPR acoperă toate datele personale UE. Aceasta se aplică indiferent de naționalitatea subiectului datelor. Echipele UE au nevoie de recunoaștoare pe care Presidio nu le livrează.

Ce include Presidio

Implicitele Presidio se împart în patru grupe.

ID-uri centrate pe SUA:

  • Număr de Securitate Socială SUA (SSN)
  • Număr de pașaport SUA
  • Număr de permis de conducere SUA
  • Număr de cont bancar SUA
  • ITIN SUA
  • Număr de licență medicală SUA

ID-uri universale:

  • Adresă de e-mail
  • Număr de telefon
  • Adresă IP
  • Număr de card de credit
  • Adresă de portofel cripto
  • URL

Entități text (bazate pe NER):

  • PERSOANĂ
  • LOCAȚIE
  • ORGANIZAȚIE
  • DATĂ_ORĂ

Internațional limitat:

  • Numărul NHS din UK
  • Numărul Național de Asigurări din UK (NINO)
  • Unii identificatori financiari

Total: aproximativ 40 de recunoaștoare.

Ce au nevoie echipele UE

ID-uri financiare

IBAN apare în cele mai multe fișiere de afaceri UE. Apare în plăți, facturi și salarii. IBAN urmează ISO 13616. Presidio nu are niciun recunoaștoare IBAN.

Luați o fintech germană. Fiecare fișier de plată are un IBAN. Fără detecție IBAN, instrumentul caută doar numere de carduri de credit. Principalul ID de plată UE este ratat. Aceasta înseamnă că o piesă cheie a datelor acoperite de GDPR nu este niciodată găsită.

ID-uri fiscale naționale

Niciuna dintre acestea nu se află în implicitele Presidio:

  • Steueridentifikationsnummer german: 11 cifre
  • NIR francez: 15 cifre cu o cheie de control
  • Codice Fiscale italian: 16 caractere cu sumă de control
  • NIF/NIE spaniol: 9 caractere cu o literă
  • BSN olandez: 9 cifre cu validare elfproef

O echipă de salarii UE gestionează fișiere din mai multe state membre. Fără acestea, ratează cele mai sensibile ID-uri din acele înregistrări.

ID-uri naționale de sănătate

Numărul NHS din UK este acoperit. Acestea nu sunt:

  • NIR francez (și un ID de sănătate)
  • Krankenkassennummer german
  • Codice Fiscale italian (și un ID de sănătate)
  • BSN olandez (folosit pentru asigurări de sănătate)

Echipele de sănătate UE au nevoie de acestea pentru protecția datelor la nivel GDPR.

Permise de conducere UE

Permisele de conducere UE se încadrează sub Directiva 2006/126/CE. Fiecare stat membru are propriul format. Structura alfanumerică diferă pe țări. Presidio are recunoaștoare de permis de conducere numai pentru SUA. Nu are suport pentru permise de conducere UE. Aceasta înseamnă că datele permiselor de conducere UE trec nedetectate.

Numere TVA

Numere TVA UE apar în fiecare tranzacție B2B. Format: cod de țară de 2 litere plus 8–12 cifre. Presidio nu are niciun recunoaștoare TVA. Numerele TVA leagă companiile de proprietarii lor. Sunt date personale sub GDPR.

Pentru mai multe informații despre obligațiile GDPR, consultați resursele de conformitate GDPR.

Costul recunoaătoarelor personalizate

Când echipele UE descoperă decalajul, construiesc recunoaătoare personalizate. Aceasta ia timp real.

Timp per recunoaătoare (estimare aproximativă):

  • Cercetarea formatului: 1–2 ore
  • Scrierea clasei Python: 2–4 ore
  • Construirea regex și validării: 2–4 ore
  • Adăugarea cuvintelor de context: 1–2 ore
  • Scrierea testelor: 2–3 ore
  • Implementarea și verificarea: 1–2 ore

Aceasta înseamnă 9–17 ore per recunoaătoare. Acestea sunt doar estimări aproximative.

Exemplu: o fintech germană are nevoie de patru recunoaătoare.

IBAN, Steuer-ID, permis de conducere UE, TVA german.

  • 4 recunoaătoare la 13 ore fiecare = 52 de ore de muncă
  • La €100 pe oră: aproximativ €5.200

Aceasta acoperă doar prima construcție. Formatele se schimbă în timp. Apar noi cazuri limită. Actualizările API ale Presidio pot strica lucrurile. Fiecare schimbare necesită un dezvoltator să revizuiască și să repare. Munca continuă adaugă la cost an după an.

Biblioteca gestionată

anonym.legal extinde Presidio cu 285+ tipuri de entități. Echipa menține biblioteca actualizată. Identificatorii UE sunt incluși din prima zi.

Ce depășește implicitele Presidio:

  • IBAN în toate formatele statelor membre UE
  • ID-uri fiscale de stat: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL și altele
  • ID-uri naționale de sănătate UE
  • Numere TVA (format UE)
  • Formate de permise de conducere UE
  • Formate de pașapoarte europene
  • Variante de entități în 48 de limbi suportate

Când Germania actualizează un format de ID fiscal, actualizarea este livrată cu serviciul. Nu este necesară nicio cerere de tip pull request din echipa ta.

Pentru ID-urile care nu se află în bibliotecă, constructorul de entități personalizate îți permite să adaugi tipare. Nu este necesar cod Python.

Vedeți detalii de securitate și conformitate pentru cum funcționează actualizările și urmele de audit.

Exemplul fintech-ului german

O fintech germană trebuie să detecteze IBAN-uri, BIC-uri, Steuer-ID-uri și Handelsregisternummern în fișierele clienților.

Rata de detecție implicită Presidio pentru aceste patru tipuri: 0%.

Niciuna nu se află în biblioteca implicită. Aceasta nu este precizie slabă. Este zero detecții. Instrumentul nu le ratează parțial. Nu le vede deloc.

Comparație de costuri:

AbordareCost în primul an
Recunoaătoare personalizate (4 × 13 ore la €100/oră)~€5.200 plus mentenanță continuă
Bibliotecă de entități gestionată (plan Pro)€180/an, toate patru acoperite

Decalajul este de aproximativ 29x în primul an. În fiecare an următor, mentenanța personalizată adaugă mai mult cost. Prețul serviciului gestionat rămâne flat.

Concluzie

Implicitele Presidio servesc bine cazurile de utilizare din SUA. Pentru implementările UE sub GDPR, sunt insuficiente. Decalajul necesită fie muncă de recunoaătoare personalizate, fie un serviciu gestionat.

Pentru echipele UE unde conformitatea este necesară și timpul de inginerie este limitat, o bibliotecă de entități UE pre-construită elimină un proiect de construcție de 50+ de ore. Fișierele pot fi procesate din prima zi. Nu este necesar mai întâi cod personalizat.

Surse

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.