By · Last updated 2026-03-15

Späť na blogPrávna Technológia

Trvalá anonymizácia: Riziko zničenia dôkazov

34,8 % vstupov do ChatGPT obsahuje citlivé údaje (Cyberhaven). Riešenie - trvalá anonymizácia - vytvára vlastné právne riziko: zničenie dôkazov. Článok 4(5) GDPR a Federálne pravidlo 37(e) vyžadujú, aby záznamy mohli byť obnovené.

March 15, 202610 min čítania
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Aktualizované pre rok 2026

Jedno riešenie, dve nové riziká

Mnoho firiem teraz blokuje úniky AI odstraňovaním mien a ID predtým, ako text dosiahne poskytovateľa AI. Jednosmerné hashovanie, tvrdé redigovanie alebo úplné odstránenie všetko vyzerá bezpečne. AI dostane čistý text. Citlivé detaily zostanú v dome.

Logika platí na bezpečnostnej strane. Štúdia Cyberhaven z Q4 2025 zistila, že 34,8 % obsahu posielaného do ChatGPT obsahuje citlivé dáta. Správa Ponemon z roku 2024 uviedla priemerné náklady na porušenie AI na 2,1 milióna USD. Riziko je reálne a náklady sú vysoké.

Ale úplné odstránenie zamieňa jedno riziko za iné: zničenie dôkazov.

Pre firmy podliehajúce súdnym sporom alebo auditom môže zničenie schopnosti obnoviť surové záznamy predstavovať zničenie dôkazov podľa federálnych a štátnych pravidiel.

Rozsah zdieľania AI

Výskum eSecurity Planet a Cyberhaven zistil, že 77 % zamestnancov zdieľa citlivé údaje s AI nástrojmi každý týždeň. Toto zahŕňa právnu, zdravotnícku, finančnú a technologickú oblasť.

Zdieľaný obsah často zahŕňa:

  • Klientske listy a zápisky z prípadov
  • Návrhy zmlúv a podmienky obchodov
  • Interné plány a obchodné záznamy
  • Finančné modely a projekcie
  • Právne memorandá a zápisky z prípadov
  • Záznamy pacientov a klinické poznámky
  • HR súbory a správy zamestnancov

Keď je úplné odstránenie kontrolou AI, každý dokument, ktorý ním prejde, môže stratiť svoju právnu hodnotu. Ak sa tieto dokumenty objavia v súdnom spore - veľmi pravdepodobné počas akéhokoľvek viac ročného obdobia pre firmy v regulovaných oblastiach - firma potenciálne stratila dôkazy.

Pozrite si náš prehľad právneho zosúladenia, kde sa dozviete, ako anonym.legal plní povinnosti pri objavovaní dôkazov. Môžete tiež skontrolovať sprievodcu tokenovým systémom, kde uvidíte, ako maskovací pipeline funguje v praxi.

GDPR: Reverzibilita je povinná

Článok 4(5) GDPR definuje pseudonymizáciu ako spracovanie osobných záznamov spôsobom, ktorý znamená, že "nemôžu byť priradené konkrétnej dotknutej osobe bez použitia dodatočných informácií, za predpokladu, že takéto dodatočné informácie sú uchovávané osobitne."

Kľúčový bod: ďalší kľúč, ktorý umožňuje opätovné prepojenie, musí byť uchovaný. Záznamy, ktoré možno opätovne prepojiť prostredníctvom uchovaných kľúčov, sa počítajú ako pseudonymizované podľa GDPR.

Záznamy, ktoré vôbec nemôžu byť opätovne prepojené, nie sú pseudonymizované. Sú anonymizované. Táto medzera záleží:

  • Záznamy maskované tokenmi si zachovávajú niektoré povinnosti GDPR, ale môžu byť obnovené na právne použitie.
  • Úplne vymazané záznamy môžu byť mimo pôsobnosti GDPR, ale vôbec nemôžu byť obnovené.

Pokyny 05/2022 Európskeho výboru pre ochranu údajov potvrdzujú, že reverzibilita je základnou súčasťou definície. Firmy používajúce jednosmerné odstránenie nevykonávajú pseudonymizáciu GDPR. Prerušujú schopnosť obnoviť záznamy.

Viac sa dozviete na našom centre zhody a prehľade ochrany.

Federálne pravidlá: Test zničenia dôkazov

Podľa Federálnych predpisov o občianskom konaní musia strany zachovať záznamy, ktoré môžu byť relevantné pre očakávanú právnu akciu. Táto povinnosť začína, keď je súdny spor rozumne predvídateľný - nie keď je podaný.

Pravidlo 37(e) umožňuje súdom ukladať sankcie, keď strana nedokáže zachovať uložené záznamy. Sankcie môžu zahŕňať:

  • Pokyny o nepriaznivom závere
  • Preclusion dôkazov
  • Sankcie ukončujúce prípad v závažných prípadoch

Tu je to, ako sa to vyvíja. Firma používa AI pracovné toky, ktoré v bežnom chode podnikania úplne odstránia citlivý obsah. Tieto záznamy sa neskôr stanú relevantnými pre súdny spor. Firma ich zmenila tak, že surový text nemožno obnoviť. Ak k tomu došlo po vzniku povinnosti zachovania, nasleduje riziko zničenia dôkazov.

Toto nie je okrajový prípad. Firmy v regulovaných oblastiach s opakujúcou sa právnou expozíciou čelia neustálym predvídateľným súdnym sporom naprieč širokými typmi dokumentov. Nasadenie úplného odstránenia naprieč všetkými pracovnými tokmi - bez výnimiek pre ohrozené záznamy - vytvára veľké riziko zničenia dôkazov.

Reverzibilné vs. nevratné: Kľúčový rozdiel

Rozdiel medzi reverzibilným a jednosmerným maskovaním spočíva v dizajne.

Jednosmerné: žiadna cesta späť

Hashovanie SHA-256 mena produkuje pevný hash. Meno z neho nemôže byť odvodené. Tvrdé redigovanie odstráni text, takže surový obsah je preč.

Reverzibilné: obnova je možná

Náhrada tokenov s retenciou kľúča a šifrovaním AES-256-GCM oba transformujú záznamy spôsobmi, ktoré môžu byť zrušené. Meno nahradené tokenom môže byť obnovené prostredníctvom vyhľadávacej tabuľky. Obsah šifrovaný AES-256-GCM môže byť dešifrovaný správnym kľúčom. Surový text zostáva dosiahnuteľný.

Pre ochranu AI obe metódy fungujú rovnako. AI spracúva tokeny a nikdy nevidí reálne záznamy.

Pre právnu povinnosť funguje iba reverzibilné maskovanie tokenov. Jednosmerné metódy prerušujú obnovu a vytvárajú vyššie uvedené riziko zničenia dôkazov.

Prečítajte si, ako náš tokenový systém toto rieši od začiatku do konca. Pre hlbší kontext si pozrite glosár a FAQ.

Dizajn s duálnym súladom

Dizajn, ktorý spĺňa tak bezpečnosť AI, ako aj povinnosti zverejnenia pri objavovaní dôkazov, používa reverzibilné maskovanie tokenov AES-256-GCM:

  1. Záznamy sú spracovávané predtým, ako dosiahnu akýkoľvek AI nástroj.
  2. Citlivé položky - mená, ID, PHI, privilegovaný obsah - sú vymenené za štruktúrované tokeny.
  3. Mapa tokenov je uchovaná v samostatnom úložisku s kontrolami prístupu, ktoré zodpovedajú typu údajov.
  4. Spracovanie AI beží na kópii tokenu. AI nikdy nevidí reálne záznamy.
  5. Výsledky sú obnovené pomocou mapy tokenov pre bežné obchodné použitie.
  6. Mapa tokenov je umiestnená pod právne zadržanie, keď sa pripojí povinnosť objavenia dôkazov.

Pod týmto dizajnom žiadny surový obsah nikdy nezmizne. Poskytovateľ AI ho nikdy nevidí v použiteľnej forme. Mapa tokenov uchováva obnovu možnou, keď to zákon vyžaduje. Riziko zničenia dôkazov je preč - žiadne záznamy nie sú zničené. Sú len maskované spôsobom, ktorý môže byť zrušený.

Článok 4(5) GDPR je splnený: ďalší kľúč (mapa tokenov) je uchovávaný osobitne s vhodnými technickými a procesmi zárukami. Povinnosť zachovania podľa Federálnych pravidiel je splnená: surové záznamy môžu byť obnovené, keď sa uplatní právne zadržanie.

Preskúmajte náš prístup k detekcii entít, prehľad ochrany a plány a sadzby pre úplné detaily.

Binárna voľba

Firmy čelia jasnému rozvetveniu:

  • Trvalo odstrániť dáta - vyriešiť problém úniku AI, ale vytvoriť právne riziko.
  • Použiť reverzibilné maskovanie tokenov - súčasne splniť potreby ochrany aj zhody.

Priemerné náklady na porušenie AI vo výške 2,1 milióna USD poháňajú bezpečnostné rozhodnutie. Ale sankcie za zničenie dôkazov tiež nie sú lacné. V prípadoch s vysokými peňažnými stávkami môžu náklady dosiahnuť rovnaký rád veľkosti. Obidve riziká si zaslúžia miesto v rozhodovaní.

Spoľahlivá politika AI pokrýva oba konce. Blokuje citlivé záznamy pred opustením firmy v použiteľnej forme. A udržiava tie isté záznamy dostupnými, keď si ich súd alebo regulátor vyžiada. Reverzibilné maskovanie tokenov je jedinou metódou, ktorá robí oboje naraz.

Pre viac kontextu pozrite naše vyhlásenie zakladateľa a prípadové štúdie.

Zdroje

  • Cyberhaven Q4 2025: Expozícia dát v AI nástrojoch - odkaz
  • IBM / Ponemon Institute: Správa o nákladoch narušenia dát 2024 - odkaz
  • Pokyny EDPB 05/2022 o pseudonymizácii - odkaz
  • Federálne predpisy o občianskom konaní Pravidlo 37(e) - odkaz
  • E-Discovery LLC: Redigovania na základe relevancie a právne normy - odkaz

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.