Ce Detectează Instrumentele PII Standard
Instrumentele standard de detecție PII — inclusiv configurațiile de bază Microsoft Presidio — sunt construite în jurul formatelor universale de identificatori:
Ce este acoperit:
- Numere de securitate socială (CNP-uri din SUA, NINO-uri din Marea Britanie, formate de ID național din UE)
- Adrese de email (format RFC 5322)
- Numere de telefon (formate E.164 și naționale)
- Numere de carduri de credit (validare algoritm Luhn)
- Nume (detecție bazată pe model NER)
- Numere de pașaport/permis de conducere (formate specifice țării)
Ce nu este acoperit:
- Formatul ID-ului dumneavoastră de angajat (EMP-XXXXX)
- Formatul numărului de cont al clientului dumneavoastră (ACC-XXXXXXXX-XX)
- Formatul ID-ului dumneavoastră de comandă (ORD-XXXXXXX)
- ID-ul utilizatorului intern (UUID sau format personalizat)
- Codurile de referință interne
- Identificatorii specifici partenerilor
Riscul de Re-Identificare în Practică
O firmă de servicii financiare procesează tichetele de suport pentru clienți pentru analiză. Exporturile sunt „anonimizate" cu un instrument standard: numele clienților înlocuite, adresele de email eliminate. Dar ID-urile conturilor clienților rămân în fiecare tichet.
Exportul ajunge la o echipă de analiză externă. Aceasta folosește exportul pentru a identifica modele în tematice de suport. Dar ID-urile de cont din exportul „anonim" pot fi încrucișate cu baza de date CRM — la care echipa externă de analiză nu ar trebui să aibă acces, dar la care baza de date a exportului le-a dat acces efectiv prin intermediul identificatorului.
Adăugarea de Entități Personalizate Fără Inginerie
Instrumente moderne de anonimizare permit configurarea entităților personalizate prin interfețe no-code:
- Definiți tiparele: Introduceți exemple de ID-uri ale organizației (EMP-EU-123456, ACC-XXXXX-XX)
- Generați detectorul: Instrumentul AI identifică tiparele comune și creează un recunoscător de regex
- Testați pe exemple: Validați că tiparele sunt detectate corect și că non-ID-urile nu sunt marcate fals
- Salvați ca preset: Configurați o dată, aplicați la toate documentele relevante
Surse: Orientări EDPB Articolul 4(5) privind Pseudonimizarea 2022; Ghidul Tehnic de Conformitate GDPR ICO