Presidio no detecta mes de 220 entitats del RGPD: la bretxa de cobertura a la UE
Actualitzat per al 2026
Microsoft Presidio inclou aproximadament 40 reconeixedors d'entitats per defecte. Per als desplegaments als EUA, aixo funciona. Cobreix SSN, passaports nord-americans, permisos de conduir, targetes de credit i correus electronics.
Per als desplegaments a la UE, la bretxa es gran. El RGPD cobreix totes les dades personals de la UE. Aixo s'aplica independentment de la nacionalitat de l'interessat. Els equips de la UE necessiten reconeixedors que Presidio no inclou.
Que inclou Presidio
Els valors per defecte de Presidio es divideixen en quatre grups.
Identificadors centrics als EUA:
- Numero de la Seguretat Social dels EUA (SSN)
- Numero de passaport dels EUA
- Numero de permi de conduir dels EUA
- Numero de compte bancari dels EUA
- ITIN dels EUA
- Numero de llicencia medica dels EUA
Identificadors universals:
- Adreca de correu electronic
- Numero de telefon
- Adreca IP
- Numero de targeta de credit
- Adreca de moneder criptografic
- URL
Entitats de text (basades en NER):
- PERSONA
- LLOC
- ORGANITZACIO
- DATA_HORA
Internacional limitat:
- Numero NHS del Regne Unit
- Numero de la Seguretat Nacional del Regne Unit (NINO)
- Alguns identificadors financers
Total: uns 40 reconeixedors.
Que necessiten els equips de la UE
Identificadors financers
L'IBAN apareix a la majoria de fitxers empresarials de la UE. Apareix a pagaments, factures i nomines. L'IBAN segueix la norma ISO 13616. Presidio no te cap reconeixedor d'IBAN.
Poseu-vos en el lloc d'una fintech alemanya. Cada fitxer de pagament te un IBAN. Sense la deteccio d'IBAN, l'eina nomes cerca numeros de targetes de credit. El principal identificador de pagament de la UE no es detecta. Aixo significa que una dada coberta pel RGPD mai es troba.
Identificadors fiscals nacionals
Cap d'aquests esta als valors per defecte de Presidio:
- Steueridentifikationsnummer alemany: 11 digits
- NIR frances: 15 digits amb una clau de verificacio
- Codice Fiscale italia: 16 caracters amb suma de comprovacio
- NIF/NIE espanyol: 9 caracters amb una lletra
- BSN holandes: 9 digits amb validacio elfproef
Un equip de nomines de la UE gestiona fitxers de diversos estats membres. Sense aquests, es perd els identificadors mes sensibles d'aquells registres.
Identificadors sanitaris nacionals
El numero NHS del Regne Unit esta cobert. Aquests no ho estan:
- NIR frances (tambe es un identificador sanitari)
- Krankenkassennummer alemany
- Codice Fiscale italia (tambe es un identificador sanitari)
- BSN holandes (utilitzat per a l'asseguranca de salut)
Els equips sanitaris de la UE necessiten aquests per a la proteccio de dades a nivell del RGPD.
Permisos de conduir de la UE
Els permisos de conduir de la UE estan subjectes a la Directiva 2006/126/CE. Cada estat membre te el seu propi format. L'estructura alfanumerica difereix per pais. Presidio te reconeixedors de permisos de conduir nomes per als EUA. No te cap suport per a permisos de conduir de la UE. Aixo significa que les dades de permisos de conduir de la UE passen sense detectar.
Numeros de VAT
Els numeros de VAT de la UE apareixen a cada operacio B2B. Format: codi de pais de 2 lletres mes 8-12 digits. Presidio no te cap reconeixedor de VAT. Els numeros de VAT estan vinculats a empreses i als seus propietaris. Son dades personals en virtut del RGPD.
Per a mes informacio sobre les obligacions del RGPD, vegeu els recursos de compliment del RGPD.
El cost dels reconeixedors personalitzats
Quan els equips de la UE descobreixen la bretxa, construeixen reconeixedors personalitzats. Aixo requereix temps real.
Temps per reconeixedor (estimacio aproximada):
- Recerca del format: 1-2 hores
- Escriure la classe Python: 2-4 hores
- Construir el regex i la validacio: 2-4 hores
- Afegir paraules de context: 1-2 hores
- Escriure proves: 2-3 hores
- Desplegar i comprovar: 1-2 hores
Aixo son 9-17 hores per reconeixedor. Son nomes estimacions aproximades.
Exemple: una fintech alemanya necessita quatre reconeixedors.
IBAN, Steuer-ID, permi de conduir de la UE, VAT alemany.
- 4 reconeixedors a 13 hores cadascun = 52 hores de feina
- A 100 EUR per hora: uns 5.200 EUR
Aixo nomes cobreix la primera construccio. Els formats canvien amb el temps. Apareixen nous casos. Les actualitzacions de l'API de Presidio poden trencar les coses. Cada canvi necessita que un desenvolupador el revisi i l'arregli. La feina continuada afegeix cost any rere any.
La biblioteca gestionada
anonym.legal amplia Presidio amb mes de 285 tipus d'entitats. L'equip mante la biblioteca actualitzada. Els identificadors de la UE s'inclouen des del primer dia.
Que va mes enlla dels valors per defecte de Presidio:
- IBAN en tots els formats dels estats membres de la UE
- Identificadors fiscals dels estats membres: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL i mes
- Identificadors sanitaris nacionals de la UE
- Numeros de VAT (format UE)
- Formats de permisos de conduir de la UE
- Formats de passaport europeus
- Variants d'entitats en els 48 idiomes admesos
Quan Alemanya actualitza un format d'identificador fiscal, l'actualitzacio s'envia amb el servei. No cal cap sol·licitut de pull del vostre equip.
Per als identificadors que no estan a la biblioteca, el constructor d'entitats personalitzades us permet afegir patrons. No cal codi Python.
Vegeu els detalls de seguretat i compliment per saber com funcionen les actualitzacions i els rastres d'auditoria.
Exemple de fintech alemanya
Una fintech alemanya necessita detectar IBAN, BIC, Steuer-ID i Handelsregisternummern en fitxers de clients.
Taxa de deteccio per defecte de Presidio per a aquests quatre tipus: 0%.
Cap esta a la biblioteca per defecte. No es una precisio deficient. Son zero deteccions. L'eina no els detecta parcialment. No els veu en absolut.
Comparativa de costos:
| Enfocament | Cost del primer any |
|---|---|
| Reconeixedors personalitzats (4 x 13 h a 100 EUR/h) | ~5.200 EUR mes manteniment continuat |
| Biblioteca d'entitats gestionada (pla Pro) | 180 EUR/any, els quatre coberts |
La diferencia es d'aproximadament 29 vegades el primer any. Cada any despres d'aixo, el manteniment personalitzat afegeix mes cost. El preu del servei gestionat es manté constant.
Conclusio
Els valors per defecte de Presidio serveixen be per als casos d'us als EUA. Per als desplegaments de la UE sota el RGPD, es queden curts. La bretxa requereix treball de reconeixedors personalitzats o un servei gestionat.
Per als equips de la UE on el compliment es obligatori i el temps d'enginyeria es limitat, una biblioteca d'entitats de la UE preconstruida elimina un projecte de construccio de mes de 50 hores. Els fitxers es poden processar des del primer dia. No cal codi personalitzat primer.