By · Last updated 2026-03-15

Tagasi BlogisseÕiguslik Tehnoloogia

Püsiv anonümiseerimine: sportatsioonirisk

34,8% ChatGPT sisenditest sisaldab tundlikke andmeid (Cyberhaven). Lahendus -- püsiv anonümiseerimine -- loob oma juriidilise riski: sportatsioon. GDPR-i art. 4(5) nõuab pöörduvust.

March 15, 202610 min lugemist
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Uuendatud 2026. aastaks

Üks lahendus, kaks uut riski

Paljud bürood blokeerivad nüüd AI-lekked, eemaldades nimed ja ID-d enne, kui tekst jõuab AI pakkujani. Ühesuunaline räsimine, kõva redaktsioon või täielik eemaldamine tunduvad kõik ohutud. AI saab puhta teksti. Tundlikud üksikasjad jäävad majasiseseks.

Loogika kehtib turvalisuse poolel. Cyberhaven'i Q4 2025. aasta uuring leidis, et 34,8% ChatGPT-le saadetud sisust sisaldab tundlikke andmeid. Ponemon'i 2024. aasta aruanne seadis keskmise AI turvarikkumise kulud 2,1 miljonile dollarile. Risk on reaalne ja kulu on kõrge.

Kuid täielik eemaldamine vahetab ühe riski teise vastu: tõendite sportatsioon.

Kohtuasjadele või auditeerimisele allutatud büroodele võib toorretseptide taastamise võimekuse hävitamine olla föderaalse ja osariigi eeskirjad alusel sportatsioon.

AI jagamise ulatus

eSecurity Planet'i ja Cyberhaven'i uurimused leidsid, et 77% töötajatest jagab tundlikke andmeid AI tööriistadega igal nädalal. See hõlmab juriidikat, tervishoidu, rahandust ja tehnoloogiat.

Jagatud sisu hõlmab sageli:

  • Kliendikirjad ja juhtumi märkmed
  • Lepingute mustandid ja tehingutingimused
  • Sisemised plaanid ja äridokumendid
  • Finantsmudelid ja prognoosid
  • Juriidilised memorandumid ja juhtumi märkmed
  • Patsiendiandmed ja kliinilised märkmed
  • HR-failid ja töötajate sõnumid

Kui AI kontrollimisel on täielik eemaldamine, võib iga dokument, mis sellest läbi käib, kaotada oma juriidilise väärtuse. Kui need dokumendid ilmuvad kohtuasjas -- mis on reguleeritud valdkondade büroode jaoks väga tõenäoline mitme aasta jooksul -- on büroo potentsiaalselt tõendid kaotanud.

Vaadake meie juriidilise vastavuse ülevaadet, et näha, kuidas anonym.legal vastab discovery kohustustele. Samuti saate vaadata tokenisüsteemi juhendit, et näha, kuidas maskeerimise konveier töötab praktikas.

GDPR: pöörduvus on nõutav

GDPR-i artikkel 4(5) määratleb pseudonümiseerimise isiklike kirjete töötlemisena viisil, mis tähendab, et neid "ei saa enam seostada konkreetse andmesubjektiga ilma lisateabe kasutamiseta, tingimusel et selline lisateave hoitakse eraldi."

Peamine punkt: lisavõti, mis võimaldab uuesti sidumist, tuleb hoida alles. Kirjeid, mida saab salvestatud võtmete kaudu uuesti siduda, loetakse GDPR-i alusel pseudonümiseerituks.

Kirjeid, mida ei saa üldse uuesti siduda, ei peeta pseudonümiseerituks. Need on anonümiseeritud. Vahe on oluline:

  • Tokeniga maskeeritud kirjed säilitavad mõned GDPR-i kohustused, kuid neid saab taastada juriidiliseks kasutuseks.
  • Täielikult kustutatud kirjed võivad jääda väljapoole GDPR-i ulatust, kuid neid ei saa üldse taastada.

Euroopa Andmekaitsenõukogu suunised 05/2022 kinnitavad, et pöörduvus on definitsiooni põhiosa. Ühesuunalist eemaldamist kasutavad bürood ei tee GDPR-i pseudonümiseerimist. Nad lõikavad kirjete taastamise võime ära.

Lisateabe saamiseks vaadake meie vastavuse keskust ja kaitse ülevaadet.

Föderaalreeglid: sportatsiooni test

Vastavalt föderaalsetele tsiviilmenetluse eeskirjadele peavad pooled säilitama kirjeid, mis võivad olla asjakohased eeldatavates kohtumenetlustes. See kohustus algab siis, kui kohtuasi on mõistlikult ettenähtav -- mitte siis, kui see esitatakse.

Reegel 37(e) lubab kohtutel määrata karistused, kui pool ei säilita salvestatud kirjeid. Karistused võivad hõlmata:

  • Ebasoodsa järelduse juhised
  • Tõendite välistamine
  • Juhtumit lõpetavad sanktsioonid tõsistel juhtudel

Siin on, kuidas see välja näeb. Büroo kasutab tavapärase äritegevuse käigus AI töövoogusid, mis eemaldavad tundliku sisu täielikult. Need kirjed muutuvad hiljem kohtuasja jaoks asjakohaseks. Büroo on neid muutnud nii, et töötlemata teksti ei saa taastada. Kui see toimus pärast säilitamiskohustuse täitmist, järgneb sportatsiooni avatus.

See ei ole servaline juhtum. Reguleeritud valdkondade bürood, kus on korduv õiguslik avatus, seisavad silmitsi pideva ettenähtava kohtuvaidlusega paljude dokumentide tüüpide puhul. Täieliku eemaldamise rakendamine kõikide töövoogude üle -- ilma ohustatud kirjete eraldamisteta -- loob suure sportatsiooniohtu.

Pöörduv vs. pöördumatu: peamine erinevus

Pöörduva ja ühesuunalise maskeerimise erinevus on disainis.

Ühesuunaline: tagasiteed pole

Nime SHA-256 räsimine toodab fikseeritud räsi. Nime ei saa sellest tuletada. Kõva redaktsioon eemaldab teksti nii, et töötlemata sisu on kadunud.

Pöörduv: taastamine on võimalik

Tokeni asendamine võtmete säilitamisega ja AES-256-GCM krüptimine teisendavad mõlemad kirjeid viisil, mida saab tagasi võtta. Tokeniga asendatud nime saab taastada otsingutabeli kaudu. AES-256-GCM sisu saab dekrüptida õige võtmega. Töötlemata tekst jääb kättesaadavaks.

AI kaitse jaoks toimivad mõlemad meetodid samal viisil. AI töötleb tokeneid ega näe kunagi tegelikke kirjeid.

Juriidilise kohustuse jaoks toimib ainult pöörduv tokeni maskeerimine. Ühesuunalised meetodid lõikavad taastamise ära ja loovad ülalmainitud sportatsiooniohtu.

Lugege, kuidas meie tokensüsteem seda lõpuni käsitleb. Sügavama konteksti saamiseks vaadake sõnastikku ja KKK-d.

Kahekordselt vastav disain

Disain, mis vastab nii AI turvalisuse kui ka juriidilise avalikustamise kohustusele, kasutab pöörduva AES-256-GCM tokeni maskeerimist:

  1. Kirjed töödeldakse enne, kui need jõuavad mis tahes AI tööriistani.
  2. Tundlikud üksused -- nimed, ID-d, PHI, privilegeeritud sisu -- vahetatakse struktureeritud tokenite vastu.
  3. Tokenide kaart hoitakse eraldi talletuskohas, mille juurdepääsu kontrollid vastavad andmetüübile.
  4. AI töötlemine käib tokeneeritud koopia peal. AI ei näe kunagi tegelikke kirjeid.
  5. Tulemused taastatakse tokenide kaardi abil normaalse äritegevuse jaoks.
  6. Tokenide kaart asetatakse juriidilise hoidmise alla, kui discovery kohustused lisanduvad.

Selle disaini korral ei lähe töötlemata sisu kunagi kaduma. AI pakkuja ei näe seda kunagi kasutataval kujul. Tokenide kaart hoiab taastamise võimalikuna, kui seadus seda nõuab. Sportatsoonirisk on kadunud -- kirjeid ei hävitata. Need on ainult maskeeritud viisil, mida saab tagasi võtta.

GDPR-i artikkel 4(5) on täidetud: lisavõti (tokenide kaart) hoitakse eraldi koos nõuetekohaste tehniliste ja protsessipõhiste kaitsemeetmetega. Föderaaleeskirjad säilitamiskohustus on täidetud: töötlemata kirjeid saab taastada, kui juriidiline hoidmine rakendub.

Uurake meie üksuse tuvastamise lähenemist, kaitse ülevaadet ja plaane ja hindasi täielike üksikasjade jaoks.

Kahene valik

Bürood seisavad silmitsi selge hargnemispunktiga:

  • Eemalda andmed püsivalt -- lahenda AI lekke probleem, kuid loo juriidiline risk.
  • Kasuta pöörduvat tokeni maskeerimist -- täida samaaegselt nii kaitse- kui ka vastavusvajadused.

2,1 miljoni dollari suurune keskmine AI turvarikkumise kulu juhib turvaotsust. Kuid sportatsiooni sanktsioonid ei ole ka odavad. Suurte rahasummadega juhtumites võivad kulud ulatuda samasse suurusjärku. Mõlemad riskid väärivad otsuses kohta.

Hea AI poliitika katab mõlemad otsad. See blokeerib tundlikud kirjed lahkumast büroo kasutataval kujul. Ja see hoiab samad kirjed kättesaadavana, kui kohus või regulaator neid küsib. Pöörduv tokeni maskeerimine on ainus meetod, mis mõlemat korraga teeb.

Lisatausta saamiseks vaadake meie asutaja avaldust ja juhtumiuuringuid.

Allikad

  • Cyberhaven Q4 2025: Andmete avalikustamine AI tööriistades -- link
  • IBM / Ponemon Institute: Andmete turvarikkumise kulu aruanne 2024 -- link
  • EDPB suunised 05/2022 pseudonümiseerimise kohta -- link
  • Föderaalsed tsiviilmenetluse eeskirjad, reegel 37(e) -- link
  • E-Discovery LLC: Asjakohased redaktsioonid ja õigusnormid -- link

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.