Tornar al BlogGDPR i Compliment

Per què les eines de PII auto-allotjades fallen...

spaCy 3.4.4 produeix resultats de NER diferents de spaCy 3.5.1. Una firma de serveis financers descobreix que el 3% dels documents van ser...

April 21, 20266 min llegit
compliance auditenvironment consistencyspaCy versionsself-hosted PIIreproducible anonymization

Per què les eines de PII auto-allotjades fallen auditories de conformitat: El problema de consistència d'entorn

El principi de responsabilitat de GDPR requereix demostrar mesures tècniques consistents i reproducibles. Els auditors de DPA examinen no només si va ocórrer l'anonimització sinó si va ocórrer consistentment entre totes les processades.

Una firma de serveis financers va sotmetre's a auditoria de conformitat de GDPR. Els auditors van preguntar: «Podeu demostrar que la mateixa detecció de PII es va aplicar de manera consistent a tots els documents?»

La firma va executar una mostra aleatòria de 100 documents a través de Presidio en estaging (spaCy 3.4.4) i de producció (spaCy 3.5.1 — actualitzat durant l'últim mes).

Resultat: El 3% dels documents van ser anonimitzats diferentment. Alguns PII fou detectat en un entorn però no en l'altre. La variació era deguda a les diferències de precisió en versions de spaCy.

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.