El Problema de la Precisió en Redacció de Documents
Els sistemes de redacció detecten "números de 9 dígits" com a SSN. Els documents fiscals contenen molts números de 9 dígits:
- Números de client
- Números de propietat
- ID de casa
- Números de seguretat social FISC
Els sistemes naïfs redacten tots, causant documents inutilitzables.
Solució
La detecció precisa requereix context:
- SSN va després de "SSN:", "Social Security:"
- Els números de client van dins de "Customer ID:"
- Els números de propietat van dins de "Property ID:"
anonym.legal ofereix detecció de context: les redaccions es fan només quan hi ha proves suficient que el número és PII, no només que sembla un número.