By · Last updated 2026-06-05

Atgal į BlogąGDPR ir Atitiktis

Asmens duomenų įrankių fragmentacija žlugdo atitikties auditus

Keturi skirtingi įrankiai keturioms skirtingoms darbo eigoms reiškia keturis skirtingus objektų aprėpties rinkinius ir keturias skirtingas audito sekas.

June 5, 20267 min skaityti
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Ko auditoriai klausia apie asmens duomenų kontrolę

BDAR ir ISO 27001 auditoriai klausia standartinio klausimo. "Kokias kontroles turite asmens duomenų anonimizkavimui?"

Jie nori vieno aiškaus atsakymo. Viena kontrolė. Taikoma vienodai kiekvieną kartą. Su dokumentacija ir įrodymais.

Rizkingas atsakymas skamba taip: "Tai priklauso nuo konteksto. Chrome plėtinys naršymui internete. Word makrokomanda teisiniams dokumentams. Python scenarijus masiniams failams. Žiniatinklio programa skubotiems prašymams."

Tas atsakymas sukelia tolesnių klausimų. "Kokie yra aprėpties tarpai tarp šių įrankių? Kur yra audito seka?"

Fragmentuoti įrankiai negali atsakyti į tuos klausimus. Tai yra atitikties problema.

Aprėpties nuoseklumo problema

Skirtingi asmens duomenų įrankiai naudoja skirtingus aptikimo metodus. Jų rezultatai skiriasi — kartais labai.

Tik reguliarosiomis išraiškomis pagrįsti įrankiai ieško fiksuotų šablonų. Asmens kodo formatas. El. pašto formatas. Kredito kortelės formatas. Jie praleidžia NER pagrįstus objektus. Asmenų vardai ir ne JAV formatai lieka neaptikti.

Tik NER įrankiai aptinka objektų tipus naudodami apmokymus modelius. Jie praleidžia šablonu pagrįstus objektus. IBAN ir pasirinktiniai identifikatoriai praeina pro šalį, jei jų nėra mokymo duomenyse.

Kiekvienas įrankis turi skirtingą objektų aprėptį. Kiekvienas įrankis turi skirtingas pasitikėjimo ribas. Tas pats dokumentas per A įrankį ir C įrankį gali duoti skirtingus rezultatus. PATIKRINTA.

Tai sukuria tiesioginę atitikties spragą. A įrankis naudojamas PDF failams. B įrankis naudojamas Excel failams. A įrankis aptinka gimimo datas. B įrankis — ne. Tas pats asmens gimimo data yra anonimizuota PDF failuose, tačiau atskleista Excel failuose.

Spraga priklauso nuo failo formato — ne nuo politikos. Ne nuo ketinimo.

Duomenų apsaugos tarnybų tyrėjai gali rasti šią spragą pažeidimų tyrime. Įrankio nenuoseklumas tampa ekspozicijos veiksniu. PATIKRINTA — BDAR 32 straipsnis reikalauja sistemingų techninių priemonių.

Audito sekos problema

Atitiktis reikalauja nuoseklaus kontrolės naudojimo įrodymų. Asmens duomenų anonimizkavimui tas įrodymas yra audito seka.

Keturi įrankiai gamina keturis skirtingus žurnalų formatus. Kai kurie iš viso negamina jokio žurnalo.

Word makrokomanda nekuria jokio audito įrašo. Python scenarijus gali rašyti į vietinį failą. Tas failas nėra susietas su jūsų atitikties sistema. Chrome plėtinys gali rašyti naršyklės pusės žurnalus. Tie žurnalai nėra prieinami atitikties peržiūrai.

Kai DPA tyrimas prašo audito įrodymų, vienas atsakymas veikia. Tai centralizuotas žurnalas. Jis apima visą anonimizkavimo apdorojimą visose platformose.

Kitas atsakymas neveikia. Žurnalai kūrėjo vietiniame kompiuteryje iš Word makrokomandos nėra pakankamas.

Vienos platformos apdorojimas daro vieną audito seką įmanomu. Fragmentuoti įrankiai tai daro neįmanomu.

Daugiau informacijos apie audito sekos reikalavimus žr. paaiškinamąjį redagavimą ir HIPAA audito sekas.

Konfigūracijos nukrypimo problema

Laikui bėgant skirtingi įrankiai sukuria skirtingas konfigūracijas. Tai vyksta lėtai ir be įspėjimo.

Pagalvokite apie dažną modelį. Chrome plėtinys atnaujinamas su pasirinktiniais objektų tipais. Python scenarijus neatnaujinamas. Word makrokomanda buvo nustatyta komandos nario, kuris nuo to laiko išėjo. Niekas nežino dabartinių nustatymų. Žiniatinklio programos išankstinis nustatymas keičiamas, kad būtų neįtraukiami rangovų vardai. Tas pakeitimas niekada nepasiekia kitų įrankių.

Vieno įrankio atnaujinimas neAtnaujinant kitų sukelia nukrypimą. Laikui bėgant nukrypimas sukelia spragas.

ISO 27001 auditoriai prašo konfigūracijos dokumentacijos. "Turime keturis įrankius, keturias konfigūracijas ir nesame tikri, ar jie yra dabartiniai" — ne geras atsakymas. PATIKRINTA — ISO/IEC 27001:2022 A priedas 8.11 (Duomenų maskavimas) reikalauja dokumentuotų, nuoseklių kontrolių; ISO/IEC 27001:2022.

ISO 27001 radinys praktikoje

15 žmonių atitikties įmonė naudojo keturis įrankius. Žiniatinklio nuskaitymo priemonė internetiniams duomenims. Windows stalinių kompiuterių įrankis masiniams failams. Word makrokomanda teisiniams dokumentams. Chrome plėtinys AI įrankiams.

ISO 27001 auditas pateikė radinį. Skirtingi aptikimo rezultatai platformose. Nėra centralizuotos audito sekos. Spraga A priedo 8.11 punkte. Kontrolė nebuvo parodyta kaip nuosekliai taikoma. PATIKRINTA-IŠORĖ — tai atitinka dokumentuotus ISO 27001 A priedo 8.11 neatitikties modelius.

Radinys reikalavo taisomojo veiksmų plano. Taisomasis veiksmas buvo platformos konsolidavimas.

Po konsolidavimo įmonė turėjo vieną aptikimo variklį visose keturiose platformose. Tie patys išankstiniai nustatymai buvo taikomi kiekviename kontekste. Visas apdorojimas buvo registruojamas vienoje vietoje. ISO 27001 radinys buvo uždarytas kitame audite.

Projektas užtruko šešias savaites. Jis pakeitė 12 puslapių taisomojo veiksmo atsakymą uždarytu radiniu.

Daugiau informacijos apie tai, kaip nuoseklus anonimizkavimas palaiko BDAR audito pasirengimą, žr. anonimizkavimo nuoseklumas, išankstiniai nustatymai ir BDAR auditai.

Atitikties naratyvo testas

Ar galite atsakyti į šiuos keturis klausimus be dvejonių?

  1. Kokie objektų tipai aptinkami visose platformose, kurias naudoja jūsų komanda?
  2. Koks yra aptikimo slenkstis kiekvienam objektų tipui, nuosekliai visose platformose?
  3. Kur yra centralizuota audito seka visam anonimizkavimui per paskutinius 12 mėnesių?
  4. Kaip užtikrinate, kad konfigūracijos pakeitimai būtų taikomi visose platformose?

Jei kuris nors klausimas sukelia dvejones, fragmentacija kuria atitikties riziką.

Švarus atsakymas į visus keturis klausimus yra pasiekiamas. Tam reikia vieno variklio visose platformose. Be to, kiekvienas įrankis sukuria savo aprėpties spragą. Savo audito sekos silą. Savo konfigūracijos nukrypimą.

Auditoriai pastebi šias spragas. DPA tyrėjai gali jas išnaudoti. Konsolidavimas prieš audito radinį yra daug lengvesnis nei po jo.

Daugiau informacijos apie tai, kaip įrankių fragmentacija veikia tarpplatforminę BDAR kontrolę, žr. BDAR auditas ir asmens duomenų įrankių fragmentacija visose platformose.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.