Presidio Non Rileva 220+ Entità GDPR: Il Divario nella Copertura UE
Aggiornato per il 2026
Microsoft Presidio viene fornito con circa 40 riconoscitori di entità predefiniti. Per i deployment negli USA, questo funziona. Copre SSN, passaporti USA, patenti di guida, carte di credito ed email.
Per i deployment nell'UE, il divario è ampio. Il GDPR copre tutti i dati personali UE. Questo si applica indipendentemente dalla nazionalità dell'interessato. I team europei necessitano di riconoscitori che Presidio non include.
Cosa Include Presidio
I valori predefiniti di Presidio rientrano in quattro gruppi.
ID incentrati sugli USA:
- Numero di Previdenza Sociale USA (SSN)
- Numero di Passaporto USA
- Numero di Patente di Guida USA
- Numero di Conto Bancario USA
- ITIN USA
- Numero di Licenza Medica USA
ID universali:
- Indirizzo Email
- Numero di Telefono
- Indirizzo IP
- Numero di Carta di Credito
- Indirizzo di Portafoglio Crypto
- URL
Entità testuali (basate su NER):
- PERSONA
- LUOGO
- ORGANIZZAZIONE
- DATA_ORA
Internazionali limitati:
- Numero NHS britannico
- Numero di Previdenza Sociale britannico (NINO)
- Alcuni identificatori finanziari
Totale: circa 40 riconoscitori.
Di Cosa Hanno Bisogno i Team UE
ID Finanziari
L'IBAN appare nella maggior parte dei file aziendali UE. Compare in pagamenti, fatture e buste paga. L'IBAN segue lo standard ISO 13616. Presidio non ha un riconoscitore IBAN.
Consideriamo una fintech tedesca. Ogni file di pagamento ha un IBAN. Senza il rilevamento IBAN, lo strumento cerca solo numeri di carta di credito. Il principale identificatore di pagamento UE viene ignorato. Questo significa che un dato fondamentale coperto dal GDPR non viene mai trovato.
Codici Fiscali Nazionali
Nessuno di questi è presente nei valori predefiniti di Presidio:
- Steueridentifikationsnummer tedesco: 11 cifre
- NIR francese: 15 cifre con chiave di controllo
- Codice Fiscale italiano: 16 caratteri con checksum
- NIF/NIE spagnolo: 9 caratteri con lettera
- BSN olandese: 9 cifre con validazione elfproef
Un team HR europeo gestisce file provenienti da molti Stati membri. Senza questi, perde gli identificatori più sensibili in quei registri.
ID Sanitari Nazionali
Il numero NHS britannico è coperto. Questi non lo sono:
- NIR francese (anche ID sanitario)
- Krankenversicherungsnummer tedesco
- Codice Fiscale italiano (anche ID sanitario)
- BSN olandese (usato per l'assicurazione sanitaria)
I team sanitari europei necessitano di questi per la protezione dei dati a livello GDPR.
Patenti di Guida UE
Le patenti di guida UE rientrano nella Direttiva 2006/126/CE. Ogni Stato membro ha il proprio formato. La struttura alfanumerica differisce per paese. Presidio ha riconoscitori di patenti solo per gli USA. Non ha supporto per le patenti di guida UE. Questo significa che i dati delle patenti UE passano inosservati.
Numeri IVA
I numeri IVA UE compaiono in ogni operazione B2B. Formato: codice paese a 2 lettere più 8-12 cifre. Presidio non ha un riconoscitore IVA. I numeri IVA sono collegati alle aziende e ai loro proprietari. Sono dati personali ai sensi del GDPR.
Per ulteriori informazioni sugli obblighi GDPR, si veda la documentazione sulla conformità GDPR.
Il Costo dei Riconoscitori Personalizzati
Quando i team UE scoprono il divario, costruiscono riconoscitori personalizzati. Questo richiede tempo reale.
Tempo per riconoscitore (stima approssimativa):
- Ricerca del formato: 1-2 ore
- Scrittura della classe Python: 2-4 ore
- Creazione di regex e validazione: 2-4 ore
- Aggiunta di parole di contesto: 1-2 ore
- Scrittura dei test: 2-3 ore
- Deployment e verifica: 1-2 ore
Sono 9-17 ore per riconoscitore. Si tratta di stime approssimative.
Esempio: una fintech tedesca necessita di quattro riconoscitori.
IBAN, Steuer-ID, patente di guida UE, IVA tedesca.
- 4 riconoscitori a 13 ore ciascuno = 52 ore di lavoro
- A €100 all'ora: circa €5.200
Questo copre solo la prima implementazione. I formati cambiano nel tempo. Emergono nuovi casi limite. Gli aggiornamenti API di Presidio possono rompere le cose. Ogni modifica richiede uno sviluppatore per revisionare e correggere. Il lavoro continuativo aggiunge costi anno dopo anno.
La Libreria Gestita
anonym.legal estende Presidio con 285+ tipi di entità. Il team mantiene la libreria aggiornata. Gli identificatori UE sono inclusi fin dal primo giorno.
Cosa va oltre i valori predefiniti di Presidio:
- IBAN in tutti i formati degli Stati membri UE
- Codici fiscali nazionali: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL e altri
- ID sanitari nazionali europei
- Numeri IVA (formato UE)
- Formati delle patenti di guida UE
- Formati dei passaporti europei
- Varianti delle entità in 48 lingue supportate
Quando la Germania aggiorna un formato di codice fiscale, l'aggiornamento viene distribuito con il servizio. Il tuo team non deve fare nessun pull request.
Per gli ID non presenti nella libreria, il costruttore di entità personalizzate permette di aggiungere pattern. Non è necessario codice Python.
Si veda la documentazione su sicurezza e conformità per come funzionano gli aggiornamenti e i log di audit.
Esempio di Fintech Tedesca
Una fintech tedesca deve rilevare IBAN, BIC, Steuer-ID e Handelsregisternummer nei file dei clienti.
Tasso di rilevamento predefinito di Presidio per questi quattro tipi: 0%.
Nessuno è nella libreria predefinita. Non si tratta di scarsa precisione. È zero rilevamenti. Lo strumento non li manca in parte. Non li vede affatto.
Confronto dei costi:
| Approccio | Costo del primo anno |
|---|---|
| Riconoscitori personalizzati (4 × 13 ore a €100/ora) | ~€5.200 più manutenzione continuativa |
| Libreria di entità gestita (piano Pro) | €180/anno, tutti e quattro coperti |
Il divario è di circa 29 volte nel primo anno. Ogni anno successivo, la manutenzione personalizzata aggiunge altri costi. Il prezzo del servizio gestito rimane invariato.
Conclusione
I valori predefiniti di Presidio servono bene i casi d'uso USA. Per i deployment UE ai sensi del GDPR, sono insufficienti. Il divario richiede o un lavoro di riconoscitore personalizzato o un servizio gestito.
Per i team UE in cui la conformità è obbligatoria e il tempo ingegneristico è limitato, una libreria di entità UE precostruita elimina un progetto di sviluppo da 50+ ore. I file possono essere elaborati dal primo giorno. Non è necessario codice personalizzato.