By · Last updated 2026-06-05

Vissza a BlograGDPR & Megfelelés

A személyesadat-eszközök szétaprózottsága kudarcot vall a megfelelőségi auditokon

Négy különböző eszköz négy különböző munkafolyamathoz négy különböző entitáslefedettséget és négy különböző auditnaplót jelent.

June 5, 20267 perc olvasás
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Mit kérdeznek az auditorok a személyesadat-ellenőrzésekről

A GDPR és az ISO 27001 auditorai szabványos kérdést tesznek fel. „Milyen ellenőrzésekkel rendelkezik a személyes adatok anonimizálásához?”

Egy egyértelmű választ várnak. Egy ellenőrzést. Minden alkalommal ugyanúgy alkalmazva. Dokumentációval és bizonyítékkal.

A kockázatos válasz így hangzik: „Kontextustól függ. Chrome Extension webböngészéshez. Word-makró jogi dokumentumokhoz. Python-szkript tömeges fájlokhoz. A webalkalmazás sürgős kérésekhez.”

Ez a válasz utókérdéseket vált ki. „Mik az entitáslefedettségi hiányosságok ezek között az eszközök között? Hol van az auditnapló?”

A szétaprózott eszközök nem tudnak válaszolni ezekre a kérdésekre. Ez a megfelelőségi probléma.

A lefedettség-konzisztencia problémája

A különböző személyesadat-eszközök különböző felismerési módszereket alkalmaznak. Eredményeik eltérnek — néha jelentősen.

Csak regex alapú eszközök rögzített mintákat keresnek. TAJ-szám formátuma. E-mail-cím formátuma. Hitelkártyaszám formátuma. Kihagyják az NER-alapú entitásokat. A személyneveket és a nem amerikai formátumokat nem észlelik.

Csak NER-alapú eszközök tanult modellek segítségével észlelik az entitástípusokat. Kihagyják a mintaalapú entitásokat. Az IBAN-ok és az egyéni azonosítók kiesnek, ha nincsenek a tanítási adatokban.

Minden eszköznek különböző entitáslefedettje van. Minden eszköznek különböző megbízhatósági küszöbei vannak. Ugyanaz a dokumentum az A és a C eszközön keresztül különböző eredményeket adhat. ELLENŐRZÖTT.

Ez közvetlen megfelelőségi hiányosságot teremt. A PDF-ekhez A eszközt használnak. Az Excel-fájlokhoz B eszközt. Az A eszköz észleli a születési dátumokat. A B eszköz nem. Ugyanannak a személynek a születési dátuma anonimizált a PDF-ekben, de nyilvánosságra kerül az Excel-fájlokban.

A hiányosság a fájlformátumtól függ — nem az irányelvtől. Nem a szándéktól.

Az adatvédelmi hatósági nyomozók megtalálhatják ezt a hiányosságot egy adatvédelmi incidens vizsgálatakor. Az eszközök következetlensége tényezővé válik az expozícióban. ELLENŐRZÖTT — a GDPR 32. cikke szisztematikus technikai intézkedéseket ír elő.

Az auditnapló problémája

A megfelelőség az ellenőrzés következetes alkalmazásának bizonyítékát igényli. A személyes adatok anonimizálásához ez a bizonyíték az auditnapló.

Négy eszköz négy különböző naplóformátumot állít elő. Némelyik egyáltalán nem állít elő naplót.

Egy Word-makró nem hoz létre auditnaplót. Egy Python-szkript helyi fájlba írhat. Ez a fájl nincs kapcsolatban a megfelelőségi rendszerrel. Egy Chrome Extension böngészőoldali naplókat írhat. Ezek a naplók nem érhetők el megfelelőségi ellenőrzéshez.

Ha egy adatvédelmi hatósági vizsgálat audit-bizonyítékot kér, egy válasz működik. Ez egy centralizált napló. Lefedi az összes anonimizálási feldolgozást az összes platformon.

A másik válasz nem működik. Egy Word-makró fejlesztő helyi gépén lévő naplói nem elegendők.

Az egyplatformos feldolgozás lehetővé teszi egy auditnaplót. A szétaprózott eszközök lehetetlenné teszik.

Az auditnaplóval kapcsolatos követelményekért lásd az érthető redakálást és a HIPAA audinaplókat.

A konfigurációs eltolódás problémája

Idővel a különböző eszközök különböző konfigurációkat fejlesztenek ki. Ez lassan és figyelmeztetés nélkül történik.

Vegyünk egy tipikus mintát. A Chrome Extension egyéni entitástípusokkal frissül. A Python-szkript nem frissül. A Word-makrót egy azóta eltávozott csapattag állította be. Senki sem ismeri a jelenlegi beállításokat. A webalkalmazás előbeállítása módosul a vállalkozói nevek kizárásával. Ez a változás soha nem jut el a többi eszközhöz.

Egy eszköz frissítése a többi nélkül eltolódást okoz. Az idő múlásával az eltolódás hiányosságokat okoz.

Az ISO 27001 auditorai konfigurációs dokumentációt kérnek. „Négy eszközünk van, négy konfigurációnk, és nem vagyunk biztosak abban, hogy aktuálisak” nem jó válasz. ELLENŐRZÖTT — az ISO/IEC 27001:2022 A. mellékletének 8.11. pontja (Adatok maszkolása) dokumentált, következetes ellenőrzéseket ír elő; ISO/IEC 27001:2022.

Egy ISO 27001-es megállapítás a gyakorlatban

Egy 15 fős megfelelőségi cég négy eszközt használt. Egy webkaparót az online adatokhoz. Egy Windows-os asztali eszközt tömeges fájlokhoz. Egy Word-makrót jogi dokumentumokhoz. Egy Chrome Extensiont az MI-eszközökhöz.

Egy ISO 27001-audit megállapítást hozott. Különböző felismerési eredmények platformonként. Nincs centralizált auditnapló. Hiányosság az A. melléklet 8.11. pontjában. Az ellenőrzés nem volt következetesen alkalmazottként bemutatva. ELLENŐRZÖTT-KÜLSŐ — ez megfelel a dokumentált ISO 27001 A. melléklet 8.11 nem-megfelelőségi mintáknak.

A megállapítás korrekciós intézkedési tervet igényelt. A korrekciós intézkedés a platformkonszolidáció volt.

A konszolidáció után a cégnek egy felismerési motorja volt az összes négy platformon. Ugyanazokat az előbeállításokat alkalmazták minden kontextusban. Az összes feldolgozást egy helyen naplózták. Az ISO 27001-es megállapítást a következő auditon lezárták.

A projekt hat hétig tartott. Egy 12 oldalas korrekciós intézkedési választ lezárt megállapításra cserélt.

A következetes anonimizálás, az előbeállítások és a GDPR-auditok közötti kapcsolatról bővebben lásd az anonimizálási konzisztencia, előbeállítások és GDPR-auditok bejegyzést.

A megfelelőségi narratíva teszt

Meg tud-e válaszolni habozás nélkül ezt a négy kérdést?

  1. Milyen entitástípusokat észlelnek a csapat által használt összes platformon?
  2. Mi az egyes entitástípusok felismerési küszöbe, következetesen az összes platformon?
  3. Hol van az összes anonimizálás centralizált auditnaplója az elmúlt 12 hónapban?
  4. Hogyan biztosítja, hogy a konfigurációs változások az összes platformon alkalmazásra kerülnek?

Ha bármelyik kérdés habozást okoz, a szétaprózottság megfelelőségi kockázatot teremt.

Mind a négy kérdés egyértelmű megválaszolása elérhető. Egy motort igényel az összes platformon. E nélkül minden eszköz saját lefedettségi hiányosságot teremt. Saját auditnaplót alkot. Saját konfigurációs eltolódást produkál.

Az auditorok észreveszik ezeket a hiányosságokat. Az adatvédelmi hatósági nyomozók kihasználhatják azokat. A konszolidáció egy audit-megállapítás előtt lényegesen könnyebb, mint utána.

Arról, hogyan befolyásolja az eszközszétaprózottság a platformok közötti GDPR-ellenőrzéseket, lásd a GDPR-audit és a személyesadat-eszköz szétaprózottsága a platformokon bejegyzést.

Források

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.