Presidio ratează 220+ entități GDPR: Decalajul de acoperire UE
Actualizat pentru 2026
Microsoft Presidio vine cu aproximativ 40 de recunoaștoare implicite de entități. Pentru implementările SUA, aceasta funcționează. Acoperă SSN-uri, pașapoarte SUA, permise de conducere, carduri de credit și e-mailuri.
Pentru implementările UE, decalajul este mare. GDPR acoperă toate datele personale UE. Aceasta se aplică indiferent de naționalitatea subiectului datelor. Echipele UE au nevoie de recunoaștoare pe care Presidio nu le livrează.
Ce include Presidio
Implicitele Presidio se împart în patru grupe.
ID-uri centrate pe SUA:
- Număr de Securitate Socială SUA (SSN)
- Număr de pașaport SUA
- Număr de permis de conducere SUA
- Număr de cont bancar SUA
- ITIN SUA
- Număr de licență medicală SUA
ID-uri universale:
- Adresă de e-mail
- Număr de telefon
- Adresă IP
- Număr de card de credit
- Adresă de portofel cripto
- URL
Entități text (bazate pe NER):
- PERSOANĂ
- LOCAȚIE
- ORGANIZAȚIE
- DATĂ_ORĂ
Internațional limitat:
- Numărul NHS din UK
- Numărul Național de Asigurări din UK (NINO)
- Unii identificatori financiari
Total: aproximativ 40 de recunoaștoare.
Ce au nevoie echipele UE
ID-uri financiare
IBAN apare în cele mai multe fișiere de afaceri UE. Apare în plăți, facturi și salarii. IBAN urmează ISO 13616. Presidio nu are niciun recunoaștoare IBAN.
Luați o fintech germană. Fiecare fișier de plată are un IBAN. Fără detecție IBAN, instrumentul caută doar numere de carduri de credit. Principalul ID de plată UE este ratat. Aceasta înseamnă că o piesă cheie a datelor acoperite de GDPR nu este niciodată găsită.
ID-uri fiscale naționale
Niciuna dintre acestea nu se află în implicitele Presidio:
- Steueridentifikationsnummer german: 11 cifre
- NIR francez: 15 cifre cu o cheie de control
- Codice Fiscale italian: 16 caractere cu sumă de control
- NIF/NIE spaniol: 9 caractere cu o literă
- BSN olandez: 9 cifre cu validare elfproef
O echipă de salarii UE gestionează fișiere din mai multe state membre. Fără acestea, ratează cele mai sensibile ID-uri din acele înregistrări.
ID-uri naționale de sănătate
Numărul NHS din UK este acoperit. Acestea nu sunt:
- NIR francez (și un ID de sănătate)
- Krankenkassennummer german
- Codice Fiscale italian (și un ID de sănătate)
- BSN olandez (folosit pentru asigurări de sănătate)
Echipele de sănătate UE au nevoie de acestea pentru protecția datelor la nivel GDPR.
Permise de conducere UE
Permisele de conducere UE se încadrează sub Directiva 2006/126/CE. Fiecare stat membru are propriul format. Structura alfanumerică diferă pe țări. Presidio are recunoaștoare de permis de conducere numai pentru SUA. Nu are suport pentru permise de conducere UE. Aceasta înseamnă că datele permiselor de conducere UE trec nedetectate.
Numere TVA
Numere TVA UE apar în fiecare tranzacție B2B. Format: cod de țară de 2 litere plus 8–12 cifre. Presidio nu are niciun recunoaștoare TVA. Numerele TVA leagă companiile de proprietarii lor. Sunt date personale sub GDPR.
Pentru mai multe informații despre obligațiile GDPR, consultați resursele de conformitate GDPR.
Costul recunoaătoarelor personalizate
Când echipele UE descoperă decalajul, construiesc recunoaătoare personalizate. Aceasta ia timp real.
Timp per recunoaătoare (estimare aproximativă):
- Cercetarea formatului: 1–2 ore
- Scrierea clasei Python: 2–4 ore
- Construirea regex și validării: 2–4 ore
- Adăugarea cuvintelor de context: 1–2 ore
- Scrierea testelor: 2–3 ore
- Implementarea și verificarea: 1–2 ore
Aceasta înseamnă 9–17 ore per recunoaătoare. Acestea sunt doar estimări aproximative.
Exemplu: o fintech germană are nevoie de patru recunoaătoare.
IBAN, Steuer-ID, permis de conducere UE, TVA german.
- 4 recunoaătoare la 13 ore fiecare = 52 de ore de muncă
- La €100 pe oră: aproximativ €5.200
Aceasta acoperă doar prima construcție. Formatele se schimbă în timp. Apar noi cazuri limită. Actualizările API ale Presidio pot strica lucrurile. Fiecare schimbare necesită un dezvoltator să revizuiască și să repare. Munca continuă adaugă la cost an după an.
Biblioteca gestionată
anonym.legal extinde Presidio cu 285+ tipuri de entități. Echipa menține biblioteca actualizată. Identificatorii UE sunt incluși din prima zi.
Ce depășește implicitele Presidio:
- IBAN în toate formatele statelor membre UE
- ID-uri fiscale de stat: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL și altele
- ID-uri naționale de sănătate UE
- Numere TVA (format UE)
- Formate de permise de conducere UE
- Formate de pașapoarte europene
- Variante de entități în 48 de limbi suportate
Când Germania actualizează un format de ID fiscal, actualizarea este livrată cu serviciul. Nu este necesară nicio cerere de tip pull request din echipa ta.
Pentru ID-urile care nu se află în bibliotecă, constructorul de entități personalizate îți permite să adaugi tipare. Nu este necesar cod Python.
Vedeți detalii de securitate și conformitate pentru cum funcționează actualizările și urmele de audit.
Exemplul fintech-ului german
O fintech germană trebuie să detecteze IBAN-uri, BIC-uri, Steuer-ID-uri și Handelsregisternummern în fișierele clienților.
Rata de detecție implicită Presidio pentru aceste patru tipuri: 0%.
Niciuna nu se află în biblioteca implicită. Aceasta nu este precizie slabă. Este zero detecții. Instrumentul nu le ratează parțial. Nu le vede deloc.
Comparație de costuri:
| Abordare | Cost în primul an |
|---|---|
| Recunoaătoare personalizate (4 × 13 ore la €100/oră) | ~€5.200 plus mentenanță continuă |
| Bibliotecă de entități gestionată (plan Pro) | €180/an, toate patru acoperite |
Decalajul este de aproximativ 29x în primul an. În fiecare an următor, mentenanța personalizată adaugă mai mult cost. Prețul serviciului gestionat rămâne flat.
Concluzie
Implicitele Presidio servesc bine cazurile de utilizare din SUA. Pentru implementările UE sub GDPR, sunt insuficiente. Decalajul necesită fie muncă de recunoaătoare personalizate, fie un serviciu gestionat.
Pentru echipele UE unde conformitatea este necesară și timpul de inginerie este limitat, o bibliotecă de entități UE pre-construită elimină un proiect de construcție de 50+ de ore. Fișierele pot fi procesate din prima zi. Nu este necesar mai întâi cod personalizat.