By · Last updated 2026-03-15

Vissza a BlograJogi Technológia

Visszafordíthatatlan anonimizálás: a bizonyíték-megsemmisítés kockázata

A ChatGPT-be bevitt adatok 34,8%-a érzékeny tartalmat tartalmaz (Cyberhaven). A megoldás – a végleges anonimizálás – saját jogi kockázatot teremt: a bizonyíték-megsemmisítést. GDPR 4. cikk (5) bekezdés.

March 15, 202610 perc olvasás
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

2026-ra frissítve

Egy megoldás, két új kockázat

Sok iroda ma már úgy védi az AI-kiszivárgásokat, hogy eltávolítja a neveket és azonosítókat, mielőtt a szöveg eléri az AI-szolgáltatót. Az egyirányú kivonatolás, a kemény kitakarás vagy a teljes eltávolítás mind biztonságosnak tűnik. Az AI tiszta szöveget kap. Az érzékeny részletek házon belül maradnak.

A logika megállja a helyét a biztonsági oldalon. A Cyberhaven 2025. negyedik negyedéves tanulmánya megállapította, hogy a ChatGPT-be küldött tartalom 34,8%-a érzékeny adatokat tartalmaz. A Ponemon 2024-es jelentése az átlagos AI-adatvédelmi incidens költségét 2,1 millió dollárra tette. A kockázat valós és a költség magas.

De a teljes eltávolítás az egyik kockázatot egy másikra cseréli: bizonyíték-megsemmisítésre.

Pereknek vagy hatósági vizsgálatoknak kitett irodák esetén az eredeti iratok visszaállíthatóságának megsemmisítése szövetségi és tagállami szabályok szerint bizonyíték-megsemmisítésnek minősülhet.

Az AI-megosztás mértéke

Az eSecurity Planet és a Cyberhaven kutatása megállapította, hogy az alkalmazottak 77%-a oszt meg érzékeny adatokat AI-eszközökkel hetente. Ez átfedi a jogi, egészségügyi, pénzügyi és technológiai szektort.

A megosztott tartalom gyakran magában foglalja:

  • Ügyfélleveleket és ügyjegyzeteket
  • Szerződéstervezeteket és üzleti feltételeket
  • Belső terveket és üzleti feljegyzéseket
  • Pénzügyi modelleket és előrejelzéseket
  • Jogi feljegyzéseket és ügyjegyzeteket
  • Betegnyilvántartásokat és klinikai feljegyzéseket
  • HR-fájlokat és alkalmazotti üzeneteket

Ha a teljes eltávolítás az AI-kontroll, minden átmenő dokumentum elveszítheti jogi értékét. Ha ezek a dokumentumok egy perben felszínre kerülnek – ami nagyon valószínű bármely, szabályozott területen tevékenykedő iroda esetén egy több éves időszakra vetítve – az iroda potenciálisan elvesztette a bizonyítékot.

Lásd a jogi megfelelőségi áttekintőnket arról, hogyan teljesíti az anonym.legal a feltárási kötelezettségeket. A tokenrendszer útmutatóban megtekintheti, hogyan működik a maszkolási folyamat a gyakorlatban.

GDPR: a visszafordíthatóság kötelező

A GDPR 4. cikk (5) bekezdése a pszeudoanonimizálást olyan személyes adatok feldolgozásaként határozza meg, amelyek révén ezek „anélkül nem tulajdoníthatók többé meghatározott érintettnek, hogy további információkat ne vennének igénybe, amennyiben e kiegészítő információkat külön tárolják”.

A kulcspont: a visszakapcsolást lehetővé tevő kiegészítő kulcsot meg kell őrizni. A tárolt kulcsokon keresztül visszakapcsolható nyilvántartások a GDPR értelmében pszeudoanonimizáltnak minősülnek.

Azok a nyilvántartások, amelyek egyáltalán nem kapcsolhatók vissza, nem pszeudoanonimizáltak. Anonimizáltak. A különbség lényeges:

  • A tokennel maszkolt nyilvántartások megőriznek bizonyos GDPR-kötelezettségeket, de jogi felhasználás céljából visszaállíthatók.
  • A teljesen törölt nyilvántartások kívül eshetnek a GDPR hatályán, de egyáltalán nem állíthatók vissza.

Az Európai Adatvédelmi Testület 05/2022-es iránymutatása megerősíti, hogy a visszafordíthatóság a fogalommeghatározás központi eleme. Az egyirányú eltávolítást alkalmazó irodák nem GDPR-pszeudoanonimizálást végeznek. Elvágják a nyilvántartások visszanyerhetőségét.

Többet megtudhat a megfelelőségi hubunkon és a védelmi áttekintőnkben.

Szövetségi szabályok: a bizonyíték-megsemmisítési teszt

A szövetségi polgári perrendtartási szabályok (FRCP) értelmében a felek kötelesek megőrizni azokat a nyilvántartásokat, amelyek várhatóan relevánsak lehetnek egy jogvitában. Ez a kötelezettség akkor kezdődik, amikor egy per ésszerűen előre látható – nem akkor, amikor azt benyújtják.

A 37(e) szabály lehetővé teszi a bíróságoknak, hogy szankciókat alkalmazzanak, ha egy fél nem őrzi meg a tárolt nyilvántartásokat. A szankciók magukban foglalhatják:

  • Kedvezőtlen következtetési utasításokat
  • Bizonyíték kizárását
  • Komoly esetekben az eljárást lezáró szankciókat

Így néz ki ez a gyakorlatban. Egy iroda olyan AI-munkafolyamatokat alkalmaz, amelyek normál üzletmenetben teljesen eltávolítják az érzékeny tartalmat. Ezek a nyilvántartások később relevánsak lesznek egy perben. Az iroda úgy módosította azokat, hogy az eredeti szöveg nem állítható vissza. Ha ez a megőrzési kötelezettség beállása után történt, bizonyíték-megsemmisítési kitettség következik.

Ez nem egy szélsőséges eset. A szabályozott területeken működő, ismétlődő jogi kitettséggel rendelkező irodák állandó, előre látható perekkel szembesülnek széles dokumentumtípusokban. A teljes eltávolítás valamennyi munkafolyamatra való alkalmazása – az érintett nyilvántartásokra vonatkozó kivételek nélkül – nagy bizonyíték-megsemmisítési kockázatot teremt.

Visszafordítható vs. visszafordíthatatlan: a kulcskülönbség

A visszafordítható és az egyirányú maszkolás közötti különbség a tervezésben rejlik.

Egyirányú: nincs visszaút

Egy név SHA-256-os kivonatolása rögzített kivonatot állít elő. A névből nem vezethető le a kivonat. A kemény kitakarás eltávolítja a szöveget, így az eredeti tartalom elvész.

Visszafordítható: a helyreállítás lehetséges

A kulcsmegőrzéssel járó tokenhelyettesítés és az AES-256-GCM titkosítás egyaránt olyan módon alakítja át a nyilvántartásokat, amely visszavonható. Egy tokennel helyettesített név visszaállítható egy keresési táblán keresztül. Az AES-256-GCM-tartalom a megfelelő kulccsal visszafejthető. Az eredeti szöveg elérhető marad.

Az AI-védelem szempontjából mindkét módszer azonosan működik. Az AI tokeneket dolgoz fel, és soha nem látja a valódi nyilvántartásokat.

A jogi kötelezettség szempontjából csak a visszafordítható token-maszkolás működik. Az egyirányú módszerek elvágják a visszanyerhetőséget, és létrehozzák a fentebb említett bizonyíték-megsemmisítési kockázatot.

Olvassa el, hogyan kezeli a tokenrendszerünk ezt végponttól végpontig. Mélyebb kontextusért lásd a szójegyzéket és a GYIK-et.

A kettős megfelelőségű tervezés

Egy olyan tervezés, amely megfelel mind az AI-biztonsági, mind a jogi közzétételi kötelezettségeknek, visszafordítható AES-256-GCM token-maszkolást alkalmaz:

  1. A nyilvántartásokat feldolgozzák, mielőtt bármely AI-eszközhöz jutnak.
  2. Az érzékeny elemeket – neveket, azonosítókat, PHI-t, kiváltságos tartalmat – strukturált tokenekkel helyettesítik.
  3. A tokentérképet egy különálló tárolóban őrzik az adattípusnak megfelelő hozzáférési kontrollokkal.
  4. Az AI-feldolgozás a token-másolaton fut. Az AI soha nem látja a valódi nyilvántartásokat.
  5. Az eredményeket a tokentérkép segítségével állítják vissza a normál üzleti felhasználáshoz.
  6. A tokentérképet jogi megőrzés alá helyezik, amikor a feltárási kötelezettségek beállnak.

E tervezés szerint egyetlen nyers tartalom sem vész el. Az AI-szolgáltató soha nem látja azt felhasználható formában. A tokentérkép lehetővé teszi a visszanyerést, amikor a jog megköveteli. A bizonyíték-megsemmisítési kockázat eltűnik – egyetlen nyilvántartás sem semmisül meg. Csupán olyan módon vannak maszkolva, amely visszavonható.

A GDPR 4. cikk (5) bekezdése teljesül: a kiegészítő kulcs (tokentérkép) megfelelő technikai és eljárásbeli biztosítékokkal külön van tárolva. A szövetségi szabályok megőrzési kötelezettsége teljesül: a nyers nyilvántartások visszaállíthatók, ha jogi megőrzés vonatkozik rájuk.

Ismerje meg az entitásfelismerési megközelítésünket, a védelmi áttekintőnket és a csomagokat és árakat a részletes tájékoztatásért.

A bináris választás

Az irodák egy egyértelmű elágazással szembesülnek:

  • Vélegesen eltávolítják az adatokat – megoldják az AI-kiszivárgás problémáját, de jogi kockázatot teremtenek.
  • Visszafordítható token-maszkolást alkalmaznak – egyszerre teljesítik a védelmi és a megfelelőségi szükségleteket.

A biztonsági döntést a 2,1 millió dolláros átlagos AI-adatvédelmi incidens-költség vezérli. De a bizonyíték-megsemmisítési szankciók sem olcsók. Nagy összegű pereknél a költségek ugyanolyan nagyságrendbe kerülhetnek. Mindkét kockázat megérdemel helyet a döntéshozatalban.

Egy megalapozott AI-politika mindkét véget lefedi. Megakadályozza, hogy érzékeny nyilvántartások felhasználható formában kerüljenek ki az irodából. Ugyanakkor ezeket a nyilvántartásokat elérhetővé teszi, amikor egy bíróság vagy szabályozó hatóság kéri azokat. A visszafordítható token-maszkolás az egyetlen módszer, amely egyszerre mindkettőt elvégzi.

Többi háttérinformációért lásd az alapítói nyilatkozatunkat és az esettanulmányainkat.

Források

  • Cyberhaven 2025. Q4: Adatkitettség az AI-eszközökben – link
  • IBM / Ponemon Institute: Az adatvédelmi incidensek költségéről szóló jelentés, 2024 – link
  • EDPB iránymutatások 05/2022 a pszeudoanonimizálásról – link
  • Szövetségi polgári perrendtartási szabályok, 37(e) szabály – link
  • E-Discovery LLC: Relevanciaalapú kitakarások és jogi szabványok – link

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.