anonym.legal

By · Last updated 2026-06-05

Înapoi la BlogGDPR & Conformitate

Fragmentarea instrumentelor de date personale duce la eșecul auditurilor de conformitate

Patru instrumente diferite pentru patru fluxuri de lucru diferite înseamnă patru seturi diferite de acoperire a entităților și patru piste de audit diferite.

June 5, 20267 min citire
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Ce văd auditorii când întreabă despre controalele datelor personale

În cadrul unui audit al autorității de supraveghere GDPR sau al unei evaluări ISO 27001, una dintre întrebările standard este: „Ce controale tehnice aveți pentru anonimizarea datelor personale?”

Auditorul caută un răspuns clar și defensibil: un control specific, aplicat consecvent, cu documentarea modului în care funcționează și dovezi ale eficacității sale.

Răspunsul care creează risc de conformitate: „Folosim instrumente diferite în funcție de context. Pentru navigarea web folosim extensia Chrome, pentru documentele Word folosim o macrocomandă, pentru fișierele în bulk echipa noastră de date are un script Python pe care l-au scris, și pentru solicitările urgente folosim aplicația web.”

Acest răspuns declanșează o întrebare de urmărire: „Care sunt diferențele de acoperire între aceste instrumente? Cum asigurați rezultate consecvente între instrumente? Unde este pista de audit care demonstrează aplicarea consecventă?”

Acestea sunt întrebări la care instrumentele fragmentate nu pot răspunde clar.

Problema consecvenței acoperirii

Instrumentele diferite de detectare a datelor personale folosesc abordări de detectare de bază diferite:

Instrumente doar cu regex: Caută tipare specifice (format SSN, format e-mail, format card de credit). Ratează entitățile bazate pe NER (nume de persoane, organizații care nu corespund unei liste cunoscute), identificatorii contextuali și formatele non-americane.

Instrumente doar cu NER: Detectează tipuri de entități folosind modele antrenate. Ratează entitățile bazate pe tipare (IBAN-uri, numere de cont cu formate specifice), identificatorii organizaționali personalizați și entitățile care nu sunt în datele de antrenare.

Instrumentul A vs. Instrumentul B vs. Instrumentul C: Fiecare are o acoperire diferită a tipurilor de entități, praguri de încredere diferite, gestionare diferită a cazurilor limită. Același document procesat prin Instrumentul A și Instrumentul C poate produce rezultate de detectare diferite.

Problema de conformitate: dacă Instrumentul A (folosit pentru PDF-uri) detectează datele de naștere, dar Instrumentul B (folosit pentru Excel) nu, atunci data de naștere a aceluiași subiect de date dintr-un PDF este anonimizată în timp ce data de naștere dintr-o foaie de calcul Excel nu este. Controlul sistematic de conformitate are un decalaj care depinde de formatul documentului.

Pentru investigațiile DPA, acest decalaj este detectabil. Dacă survine o breșă de date și investigația relevă că versiunea Excel a înregistrărilor unui subiect de date nu a fost anonimizată, în timp ce versiunea PDF a fost, inconsecvența între instrumente este un factor care contribuie la expunere.

Problema pistei de audit

Documentația de conformitate necesită dovezi că controalele sunt aplicate consecvent. Pentru anonimizarea datelor personale, dovada este pista de audit: ce a fost procesat, când, de cine, cu ce instrument și care a fost rezultatul.

Patru instrumente diferite produc patru formate diferite de pistă de audit — sau nicio pistă de audit. O macrocomandă Word nu produce niciun jurnal de audit. Un script Python poate scrie într-un fișier local care nu este integrat cu sistemul de gestionare a conformității. Extensia Chrome poate produce jurnale din partea browserului, inaccesibile pentru documentația de conformitate. Numai aplicația web poate produce o pistă de audit centralizată.

Pentru o investigație DPA care necesită dovezi ale pistei de audit, răspunsul „am procesat acest document într-o macrocomandă Word, acele jurnale se află pe mașina locală a dezvoltatorului” nu este satisfăcător. Răspunsul „iată jurnalul centralizat de audit care acoperă toată procesarea anonimizării pe toate platformele pentru perioada solicitată” este satisfăcător.

Procesarea pe o singură platformă permite acoperirea cu o singură pistă de audit. Instrumentele fragmentate fac imposibilă o pistă de audit centralizată.

Problema derivei de configurare

În timp, instrumentele diferite folosite de diferiți membri ai echipei dezvoltă configurații diferite:

  • Extensia Chrome este configurată cu tipurile de entități personalizate ale organizației
  • Scriptul Python nu a fost actualizat când au fost adăugate tipurile de entități personalizate
  • Macrocomanda Word a fost configurată de un membru al echipei care a plecat de atunci, și nimeni nu cunoaște setările curente
  • Presetarea aplicației web a fost actualizată luna trecută pentru a exclude numele contractorilor, dar această actualizare nu a fost propagată la celelalte instrumente

Derisa de configurare creează problema de inconsecvență în sens invers: chiar dacă toate instrumentele au produs inițial rezultate similare, activitatea de întreținere pe un instrument fără actualizarea celorlalte creează divergențe în timp.

Pentru controalele ISO 27001, cerința de documentare a configurației face aceasta deosebit de problematică. Un auditor ISO care întreabă „arătați-mi configurația pentru controalele de anonimizare a datelor personale” nu poate primi un răspuns satisfăcător cu „avem patru instrumente cu patru configurații diferite, și nu suntem siguri că toate sunt actuale.”

Constatarea ISO 27001

O echipă de 15 persoane dintr-o firmă de consultanță în conformitate folosea patru instrumente diferite: un instrument de web scraping pentru datele online, un instrument desktop Windows standalone pentru fișierele bulk, o macrocomandă Word pentru documentele juridice și o extensie Chrome pentru instrumentele AI.

Un audit ISO 27001 a produs o constatare: „Proceduri inconsecvente de anonimizare a datelor pe platforme. Instrumente diferite folosite pentru contexte diferite produc rezultate de detectare diferite și nicio pistă de audit centralizată. Aceasta creează un decalaj în controlul ISO/IEC 27001:2022 Anexa A 8.11 (Mascarea datelor) — controlul nu poate fi demonstrat ca aplicat consecvent.”

Constatarea auditului a necesitat un plan de acțiuni corective. Acțiunea corectivă implementată: consolidarea pe o singură platformă de anonimizare pentru toate cazurile de utilizare.

Rezultate după consolidare:

  • Același motor de detectare pe toate platformele (Aplicație web, Aplicație desktop, Add-in Office, Extensie Chrome)
  • Aceleași presetări aplicate pe contexte
  • Pistă de audit centralizată pentru toată procesarea
  • Constatarea ISO 27001 închisă la următorul audit de supraveghere

Proiectul de consolidare de 6 săptămâni a eliminat constatarea auditului care necesitase un răspuns de acțiuni corective de 12 pagini.

Testul narativei de conformitate

Un test util pentru evaluarea fragmentării instrumentelor de date personale: puteți răspunde clar la următoarele întrebări?

  1. Ce tipuri de entități sunt detectate pe toate platformele pe care echipa dumneavoastră le folosește pentru anonimizarea datelor personale?
  2. Care este pragul de detectare (nivelul de încredere) pentru fiecare tip de entitate, consecvent pe toate platformele?
  3. Unde este pista de audit centralizată pentru toată procesarea anonimizării din ultimele 12 luni?
  4. Cum asigurați că modificările de configurare sunt aplicate consecvent pe toate platformele?

Dacă oricare dintre aceste întrebări produce un răspuns ezitant, fragmentarea creează risc de conformitate. Răspunsul clar la toate patru întrebări este realizabil — dar numai cu un motor unificat pe platforme.

Surse:

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.