Ce văd auditorii când întreabă despre controalele datelor personale
În cadrul unui audit al autorității de supraveghere GDPR sau al unei evaluări ISO 27001, una dintre întrebările standard este: „Ce controale tehnice aveți pentru anonimizarea datelor personale?”
Auditorul caută un răspuns clar și defensibil: un control specific, aplicat consecvent, cu documentarea modului în care funcționează și dovezi ale eficacității sale.
Răspunsul care creează risc de conformitate: „Folosim instrumente diferite în funcție de context. Pentru navigarea web folosim extensia Chrome, pentru documentele Word folosim o macrocomandă, pentru fișierele în bulk echipa noastră de date are un script Python pe care l-au scris, și pentru solicitările urgente folosim aplicația web.”
Acest răspuns declanșează o întrebare de urmărire: „Care sunt diferențele de acoperire între aceste instrumente? Cum asigurați rezultate consecvente între instrumente? Unde este pista de audit care demonstrează aplicarea consecventă?”
Acestea sunt întrebări la care instrumentele fragmentate nu pot răspunde clar.
Problema consecvenței acoperirii
Instrumentele diferite de detectare a datelor personale folosesc abordări de detectare de bază diferite:
Instrumente doar cu regex: Caută tipare specifice (format SSN, format e-mail, format card de credit). Ratează entitățile bazate pe NER (nume de persoane, organizații care nu corespund unei liste cunoscute), identificatorii contextuali și formatele non-americane.
Instrumente doar cu NER: Detectează tipuri de entități folosind modele antrenate. Ratează entitățile bazate pe tipare (IBAN-uri, numere de cont cu formate specifice), identificatorii organizaționali personalizați și entitățile care nu sunt în datele de antrenare.
Instrumentul A vs. Instrumentul B vs. Instrumentul C: Fiecare are o acoperire diferită a tipurilor de entități, praguri de încredere diferite, gestionare diferită a cazurilor limită. Același document procesat prin Instrumentul A și Instrumentul C poate produce rezultate de detectare diferite.
Problema de conformitate: dacă Instrumentul A (folosit pentru PDF-uri) detectează datele de naștere, dar Instrumentul B (folosit pentru Excel) nu, atunci data de naștere a aceluiași subiect de date dintr-un PDF este anonimizată în timp ce data de naștere dintr-o foaie de calcul Excel nu este. Controlul sistematic de conformitate are un decalaj care depinde de formatul documentului.
Pentru investigațiile DPA, acest decalaj este detectabil. Dacă survine o breșă de date și investigația relevă că versiunea Excel a înregistrărilor unui subiect de date nu a fost anonimizată, în timp ce versiunea PDF a fost, inconsecvența între instrumente este un factor care contribuie la expunere.
Problema pistei de audit
Documentația de conformitate necesită dovezi că controalele sunt aplicate consecvent. Pentru anonimizarea datelor personale, dovada este pista de audit: ce a fost procesat, când, de cine, cu ce instrument și care a fost rezultatul.
Patru instrumente diferite produc patru formate diferite de pistă de audit — sau nicio pistă de audit. O macrocomandă Word nu produce niciun jurnal de audit. Un script Python poate scrie într-un fișier local care nu este integrat cu sistemul de gestionare a conformității. Extensia Chrome poate produce jurnale din partea browserului, inaccesibile pentru documentația de conformitate. Numai aplicația web poate produce o pistă de audit centralizată.
Pentru o investigație DPA care necesită dovezi ale pistei de audit, răspunsul „am procesat acest document într-o macrocomandă Word, acele jurnale se află pe mașina locală a dezvoltatorului” nu este satisfăcător. Răspunsul „iată jurnalul centralizat de audit care acoperă toată procesarea anonimizării pe toate platformele pentru perioada solicitată” este satisfăcător.
Procesarea pe o singură platformă permite acoperirea cu o singură pistă de audit. Instrumentele fragmentate fac imposibilă o pistă de audit centralizată.
Problema derivei de configurare
În timp, instrumentele diferite folosite de diferiți membri ai echipei dezvoltă configurații diferite:
- Extensia Chrome este configurată cu tipurile de entități personalizate ale organizației
- Scriptul Python nu a fost actualizat când au fost adăugate tipurile de entități personalizate
- Macrocomanda Word a fost configurată de un membru al echipei care a plecat de atunci, și nimeni nu cunoaște setările curente
- Presetarea aplicației web a fost actualizată luna trecută pentru a exclude numele contractorilor, dar această actualizare nu a fost propagată la celelalte instrumente
Derisa de configurare creează problema de inconsecvență în sens invers: chiar dacă toate instrumentele au produs inițial rezultate similare, activitatea de întreținere pe un instrument fără actualizarea celorlalte creează divergențe în timp.
Pentru controalele ISO 27001, cerința de documentare a configurației face aceasta deosebit de problematică. Un auditor ISO care întreabă „arătați-mi configurația pentru controalele de anonimizare a datelor personale” nu poate primi un răspuns satisfăcător cu „avem patru instrumente cu patru configurații diferite, și nu suntem siguri că toate sunt actuale.”
Constatarea ISO 27001
O echipă de 15 persoane dintr-o firmă de consultanță în conformitate folosea patru instrumente diferite: un instrument de web scraping pentru datele online, un instrument desktop Windows standalone pentru fișierele bulk, o macrocomandă Word pentru documentele juridice și o extensie Chrome pentru instrumentele AI.
Un audit ISO 27001 a produs o constatare: „Proceduri inconsecvente de anonimizare a datelor pe platforme. Instrumente diferite folosite pentru contexte diferite produc rezultate de detectare diferite și nicio pistă de audit centralizată. Aceasta creează un decalaj în controlul ISO/IEC 27001:2022 Anexa A 8.11 (Mascarea datelor) — controlul nu poate fi demonstrat ca aplicat consecvent.”
Constatarea auditului a necesitat un plan de acțiuni corective. Acțiunea corectivă implementată: consolidarea pe o singură platformă de anonimizare pentru toate cazurile de utilizare.
Rezultate după consolidare:
- Același motor de detectare pe toate platformele (Aplicație web, Aplicație desktop, Add-in Office, Extensie Chrome)
- Aceleași presetări aplicate pe contexte
- Pistă de audit centralizată pentru toată procesarea
- Constatarea ISO 27001 închisă la următorul audit de supraveghere
Proiectul de consolidare de 6 săptămâni a eliminat constatarea auditului care necesitase un răspuns de acțiuni corective de 12 pagini.
Testul narativei de conformitate
Un test util pentru evaluarea fragmentării instrumentelor de date personale: puteți răspunde clar la următoarele întrebări?
- Ce tipuri de entități sunt detectate pe toate platformele pe care echipa dumneavoastră le folosește pentru anonimizarea datelor personale?
- Care este pragul de detectare (nivelul de încredere) pentru fiecare tip de entitate, consecvent pe toate platformele?
- Unde este pista de audit centralizată pentru toată procesarea anonimizării din ultimele 12 luni?
- Cum asigurați că modificările de configurare sunt aplicate consecvent pe toate platformele?
Dacă oricare dintre aceste întrebări produce un răspuns ezitant, fragmentarea creează risc de conformitate. Răspunsul clar la toate patru întrebări este realizabil — dar numai cu un motor unificat pe platforme.
Surse: