By · Last updated 2026-03-15

Powrót do blogaTechnologia prawna

Trwała anonimizacja: ryzyko zniszczenia dowodów

34,8% danych wprowadzanych do ChatGPT zawiera informacje wrażliwe (Cyberhaven). Rozwiązanie — trwała anonimizacja — samo w sobie rodzi ryzyko prawne: zniszczenie dowodów (spoliation). Art. 4 ust. 5 RODO.

March 15, 202610 min czytania
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

Zaktualizowano w 2026 r.

Jedno rozwiązanie, dwa nowe ryzyka

Wiele firm blokuje wycieki danych do AI, usuwając imiona i identyfikatory przed przesłaniem tekstu do dostawcy AI. Jednokierunkowe hashowanie, twarda redakcja lub całkowite usuwanie — wszystkie wydają się bezpieczne. AI otrzymuje czysty tekst. Wrażliwe dane pozostają w firmie.

Logika po stronie bezpieczeństwa jest słuszna. Badanie Cyberhaven z IV kwartału 2025 r. wykazało, że 34,8% treści przesyłanych do ChatGPT zawiera dane wrażliwe. Raport Ponemon z 2024 r. określił średni koszt naruszenia bezpieczeństwa AI na 2,1 mln dolarów. Ryzyko jest realne, a koszty wysokie.

Ale całkowite usunięcie wymienia jedno ryzyko na inne: zniszczenie dowodów (spoliation).

Dla firm objętych postępowaniami sądowymi lub audytami, zniszczenie możliwości przywrócenia oryginalnych zapisów może być traktowane jako spoliation zgodnie z przepisami federalnymi i stanowymi.

Skala udostępniania danych AI

Badania eSecurity Planet i Cyberhaven wykazały, że 77% pracowników udostępnia wrażliwe dane narzędziom AI każdego tygodnia. Dotyczy to sektorów: prawnego, opieki zdrowotnej, finansów i technologii.

Udostępniana treść często obejmuje:

  • Pisma klientów i notatki do sprawy
  • Projekty umów i warunki transakcji
  • Plany wewnętrzne i dokumenty biznesowe
  • Modele finansowe i prognozy
  • Memoranda prawne i notatki do spraw
  • Dokumentację medyczną i notatki kliniczne
  • Akta kadrowe i wiadomości pracownicze

Gdy całkowite usunięcie jest stosowaną kontrolą AI, każdy dokument, który przez nią przejdzie, może utracić swoją wartość prawną. Jeśli te dokumenty pojawią się w postępowaniu sądowym — co jest bardzo prawdopodobne w perspektywie kilku lat dla firm w sektorach regulowanych — firma może utracić dowody.

Zobacz nasz przegląd zgodności z prawem, aby dowiedzieć się, jak anonym.legal realizuje obowiązki związane z ujawnianiem dowodów. Możesz też zapoznać się z przewodnikiem po systemie tokenów, aby zobaczyć, jak działa w praktyce potok maskowania.

RODO: odwracalność jest wymagana

Artykuł 4 ust. 5 RODO definiuje pseudonimizację jako przetwarzanie danych osobowych w sposób, który sprawia, że „nie można ich już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji, pod warunkiem że takie dodatkowe informacje są przechowywane osobno."

Kluczowy punkt: dodatkowy klucz umożliwiający ponowne powiązanie musi być przechowywany. Zapisy, które można ponownie powiązać za pomocą przechowywanych kluczy, są traktowane jako pseudonimizowane w rozumieniu RODO.

Zapisy, których nie można ponownie powiązać w żaden sposób, nie są pseudonimizowane. Są zanonimizowane. Różnica jest istotna:

  • Zapisy maskowane tokenami zachowują niektóre obowiązki wynikające z RODO, ale można je przywrócić do użytku prawnego.
  • Zapisy całkowicie usunięte mogą wykraczać poza zakres RODO, ale nie mogą być w ogóle przywrócone.

Wytyczne 05/2022 Europejskiej Rady Ochrony Danych potwierdzają, że odwracalność jest kluczową częścią definicji. Firmy stosujące jednokierunkowe usuwanie nie realizują pseudonimizacji w rozumieniu RODO. Niszczą możliwość odzyskania zapisów.

Więcej informacji znajdziesz w naszym centrum zgodności oraz przeglądzie ochrony.

Federalne przepisy: test na zniszczenie dowodów

Zgodnie z Federalnymi Regułami Postępowania Cywilnego strony mają obowiązek zachowania dokumentów, które mogą być istotne dla spodziewanego postępowania sądowego. Ten obowiązek powstaje, gdy pozew jest rozsądnie przewidywalny — nie w chwili jego złożenia.

Reguła 37(e) pozwala sądom nakładać kary, gdy strona nie zachowa przechowywanych zapisów. Kary mogą obejmować:

  • Instrukcje dotyczące niekorzystnego wnioskowania
  • Wykluczenie dowodów
  • Sankcje kończące sprawę w poważnych przypadkach

Oto jak to się rozgrywa. Firma stosuje przepływy AI, które w normalnym toku działalności całkowicie usuwają wrażliwą treść. Te zapisy stają się później istotne dla postępowania sądowego. Firma zmodyfikowała je tak, że surowego tekstu nie można przywrócić. Jeśli nastąpiło to po powstaniu obowiązku zachowania, pojawia się ryzyko spoliation.

To nie jest przypadek marginalny. Firmy w sektorach regulowanych z powtarzającą się ekspozycją prawną stają w obliczu stałych przewidywalnych pozwów dotyczących szerokiego zakresu typów dokumentów. Wdrożenie całkowitego usuwania we wszystkich przepływach — bez wyłączeń dla dokumentów obarczonych ryzykiem — tworzy duże ryzyko spoliation.

Odwracalne a nieodwracalne: kluczowa różnica

Różnica między maskowaniem odwracalnym a jednokierunkowym tkwi w projekcie.

Jednokierunkowe: bez drogi powrotu

Hashowanie SHA-256 imienia generuje stały skrót. Imienia nie można z niego wywieść. Twarda redakcja usuwa tekst, więc oryginalna treść jest utracona.

Odwracalne: odzyskanie jest możliwe

Zamiana tokenów z zachowaniem klucza oraz szyfrowanie AES-256-GCM przekształcają zapisy w sposób, który można cofnąć. Imię zastąpione tokenem można przywrócić za pomocą tablicy przeglądowej. Treść zaszyfrowana AES-256-GCM można odszyfrować odpowiednim kluczem. Surowy tekst pozostaje dostępny.

Do celów ochrony AI obie metody działają tak samo. AI przetwarza tokeny i nigdy nie widzi rzeczywistych danych.

Do celów prawnych tylko odwracalne maskowanie tokenami działa. Metody jednokierunkowe uniemożliwiają odtworzenie i tworzą ryzyko spoliation opisane powyżej.

Przeczytaj, jak nasz system tokenów obsługuje to od początku do końca. Szerszy kontekst znajdziesz w słowniku i FAQ.

Projekt spełniający podwójne wymogi

Projekt spełniający zarówno wymogi bezpieczeństwa AI, jak i prawne obowiązki ujawniania, wykorzystuje odwracalne maskowanie tokenami AES-256-GCM:

  1. Zapisy są przetwarzane przed dotarciem do jakiegokolwiek narzędzia AI.
  2. Wrażliwe elementy — imiona, identyfikatory, PHI, chroniona treść — są zamieniane na ustrukturyzowane tokeny.
  3. Mapa tokenów jest przechowywana w osobnym magazynie z kontrolą dostępu odpowiednią do typu danych.
  4. Przetwarzanie AI odbywa się na kopii z tokenami. AI nigdy nie widzi rzeczywistych danych.
  5. Wyniki są przywracane za pomocą mapy tokenów do normalnego użytku biznesowego.
  6. Mapa tokenów jest objęta zabezpieczeniem prawnym (legal hold), gdy powstaje obowiązek ujawnienia.

W ramach tego projektu żadna surowa treść nigdy nie jest tracona. Dostawca AI nigdy nie widzi jej w użytecznej formie. Mapa tokenów zachowuje możliwość odtworzenia, gdy prawo tego wymaga. Ryzyko spoliation jest wyeliminowane — żadne zapisy nie są niszczone. Są jedynie maskowane w sposób, który można cofnąć.

Artykuł 4 ust. 5 RODO jest spełniony: dodatkowy klucz (mapa tokenów) jest przechowywany osobno z odpowiednimi zabezpieczeniami technicznymi i proceduralnymi. Obowiązek zachowania wynikający z Federalnych Reguł Postępowania Cywilnego jest spełniony: surowe zapisy można przywrócić, gdy obowiązuje zabezpieczenie prawne.

Zapoznaj się z naszym podejściem do wykrywania podmiotów, przeglądem ochrony i planami i cenami.

Dwie ścieżki

Firmy stają przed wyraźnym wyborem:

  • Trwałe usunięcie danych — rozwiązuje problem wycieku AI, ale tworzy ryzyko prawne.
  • Odwracalne maskowanie tokenami — spełnia zarówno wymogi ochrony, jak i zgodności jednocześnie.

Średni koszt naruszenia bezpieczeństwa AI wynoszący 2,1 mln dolarów napędza decyzję o bezpieczeństwie. Ale sankcje za spoliation też nie są tanie. W sprawach o dużą stawkę koszty mogą osiągnąć podobny rząd wielkości. Oba ryzyka zasługują na uwzględnienie w decyzji.

Rozsądna polityka AI obejmuje oba końce. Blokuje wrażliwe dane przed opuszczeniem firmy w użytecznej formie. I zachowuje te same zapisy dostępne, gdy sąd lub regulator o nie poprosi. Odwracalne maskowanie tokenami jest jedyną metodą, która jednocześnie realizuje oba cele.

Więcej informacji znajdziesz w naszym oświadczeniu założyciela i studiach przypadków.

Źródła

  • Cyberhaven IV kw. 2025: Ekspozycja danych w narzędziach AI — link
  • IBM / Ponemon Institute: Raport o kosztach naruszenia ochrony danych 2024 — link
  • Wytyczne EROD 05/2022 dotyczące pseudonimizacji — link
  • Federalne Reguły Postępowania Cywilnego, Reguła 37(e) — link
  • E-Discovery LLC: Redakcje dla zachowania prywatności a standardy prawne — link

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.