Zaktualizowano w 2026 r.

Jedno rozwiązanie, dwa nowe ryzyka

Wiele firm blokuje wycieki danych do AI, usuwając imiona i identyfikatory przed przesłaniem tekstu do dostawcy AI. Jednokierunkowe hashowanie, twarda redakcja lub całkowite usuwanie — wszystkie wydają się bezpieczne. AI otrzymuje czysty tekst. Wrażliwe dane pozostają w firmie.

Logika po stronie bezpieczeństwa jest słuszna. Badanie Cyberhaven z IV kwartału 2025 r. wykazało, że 34,8% treści przesyłanych do ChatGPT zawiera dane wrażliwe. Raport Ponemon z 2024 r. określił średni koszt naruszenia bezpieczeństwa AI na 2,1 mln dolarów. Ryzyko jest realne, a koszty wysokie.

Ale całkowite usunięcie wymienia jedno ryzyko na inne: zniszczenie dowodów (spoliation).

Dla firm objętych postępowaniami sądowymi lub audytami, zniszczenie możliwości przywrócenia oryginalnych zapisów może być traktowane jako spoliation zgodnie z przepisami federalnymi i stanowymi.

Skala udostępniania danych AI

Badania eSecurity Planet i Cyberhaven wykazały, że 77% pracowników udostępnia wrażliwe dane narzędziom AI każdego tygodnia. Dotyczy to sektorów: prawnego, opieki zdrowotnej, finansów i technologii.

Udostępniana treść często obejmuje:

Pisma klientów i notatki do sprawy
Projekty umów i warunki transakcji
Plany wewnętrzne i dokumenty biznesowe
Modele finansowe i prognozy
Memoranda prawne i notatki do spraw
Dokumentację medyczną i notatki kliniczne
Akta kadrowe i wiadomości pracownicze

Gdy całkowite usunięcie jest stosowaną kontrolą AI, każdy dokument, który przez nią przejdzie, może utracić swoją wartość prawną. Jeśli te dokumenty pojawią się w postępowaniu sądowym — co jest bardzo prawdopodobne w perspektywie kilku lat dla firm w sektorach regulowanych — firma może utracić dowody.

Zobacz nasz przegląd zgodności z prawem, aby dowiedzieć się, jak anonym.legal realizuje obowiązki związane z ujawnianiem dowodów. Możesz też zapoznać się z przewodnikiem po systemie tokenów, aby zobaczyć, jak działa w praktyce potok maskowania.

RODO: odwracalność jest wymagana

Artykuł 4 ust. 5 RODO definiuje pseudonimizację jako przetwarzanie danych osobowych w sposób, który sprawia, że „nie można ich już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji, pod warunkiem że takie dodatkowe informacje są przechowywane osobno."

Kluczowy punkt: dodatkowy klucz umożliwiający ponowne powiązanie musi być przechowywany. Zapisy, które można ponownie powiązać za pomocą przechowywanych kluczy, są traktowane jako pseudonimizowane w rozumieniu RODO.

Zapisy, których nie można ponownie powiązać w żaden sposób, nie są pseudonimizowane. Są zanonimizowane. Różnica jest istotna:

Zapisy maskowane tokenami zachowują niektóre obowiązki wynikające z RODO, ale można je przywrócić do użytku prawnego.
Zapisy całkowicie usunięte mogą wykraczać poza zakres RODO, ale nie mogą być w ogóle przywrócone.

Wytyczne 05/2022 Europejskiej Rady Ochrony Danych potwierdzają, że odwracalność jest kluczową częścią definicji. Firmy stosujące jednokierunkowe usuwanie nie realizują pseudonimizacji w rozumieniu RODO. Niszczą możliwość odzyskania zapisów.

Więcej informacji znajdziesz w naszym centrum zgodności oraz przeglądzie ochrony.

Federalne przepisy: test na zniszczenie dowodów

Zgodnie z Federalnymi Regułami Postępowania Cywilnego strony mają obowiązek zachowania dokumentów, które mogą być istotne dla spodziewanego postępowania sądowego. Ten obowiązek powstaje, gdy pozew jest rozsądnie przewidywalny — nie w chwili jego złożenia.

Reguła 37(e) pozwala sądom nakładać kary, gdy strona nie zachowa przechowywanych zapisów. Kary mogą obejmować:

Instrukcje dotyczące niekorzystnego wnioskowania
Wykluczenie dowodów
Sankcje kończące sprawę w poważnych przypadkach

Oto jak to się rozgrywa. Firma stosuje przepływy AI, które w normalnym toku działalności całkowicie usuwają wrażliwą treść. Te zapisy stają się później istotne dla postępowania sądowego. Firma zmodyfikowała je tak, że surowego tekstu nie można przywrócić. Jeśli nastąpiło to po powstaniu obowiązku zachowania, pojawia się ryzyko spoliation.

To nie jest przypadek marginalny. Firmy w sektorach regulowanych z powtarzającą się ekspozycją prawną stają w obliczu stałych przewidywalnych pozwów dotyczących szerokiego zakresu typów dokumentów. Wdrożenie całkowitego usuwania we wszystkich przepływach — bez wyłączeń dla dokumentów obarczonych ryzykiem — tworzy duże ryzyko spoliation.

Odwracalne a nieodwracalne: kluczowa różnica

Różnica między maskowaniem odwracalnym a jednokierunkowym tkwi w projekcie.

Jednokierunkowe: bez drogi powrotu

Hashowanie SHA-256 imienia generuje stały skrót. Imienia nie można z niego wywieść. Twarda redakcja usuwa tekst, więc oryginalna treść jest utracona.

Odwracalne: odzyskanie jest możliwe

Zamiana tokenów z zachowaniem klucza oraz szyfrowanie AES-256-GCM przekształcają zapisy w sposób, który można cofnąć. Imię zastąpione tokenem można przywrócić za pomocą tablicy przeglądowej. Treść zaszyfrowana AES-256-GCM można odszyfrować odpowiednim kluczem. Surowy tekst pozostaje dostępny.

Do celów ochrony AI obie metody działają tak samo. AI przetwarza tokeny i nigdy nie widzi rzeczywistych danych.

Do celów prawnych tylko odwracalne maskowanie tokenami działa. Metody jednokierunkowe uniemożliwiają odtworzenie i tworzą ryzyko spoliation opisane powyżej.

Przeczytaj, jak nasz system tokenów obsługuje to od początku do końca. Szerszy kontekst znajdziesz w słowniku i FAQ.

Projekt spełniający podwójne wymogi

Projekt spełniający zarówno wymogi bezpieczeństwa AI, jak i prawne obowiązki ujawniania, wykorzystuje odwracalne maskowanie tokenami AES-256-GCM:

Zapisy są przetwarzane przed dotarciem do jakiegokolwiek narzędzia AI.
Wrażliwe elementy — imiona, identyfikatory, PHI, chroniona treść — są zamieniane na ustrukturyzowane tokeny.
Mapa tokenów jest przechowywana w osobnym magazynie z kontrolą dostępu odpowiednią do typu danych.
Przetwarzanie AI odbywa się na kopii z tokenami. AI nigdy nie widzi rzeczywistych danych.
Wyniki są przywracane za pomocą mapy tokenów do normalnego użytku biznesowego.
Mapa tokenów jest objęta zabezpieczeniem prawnym (legal hold), gdy powstaje obowiązek ujawnienia.

W ramach tego projektu żadna surowa treść nigdy nie jest tracona. Dostawca AI nigdy nie widzi jej w użytecznej formie. Mapa tokenów zachowuje możliwość odtworzenia, gdy prawo tego wymaga. Ryzyko spoliation jest wyeliminowane — żadne zapisy nie są niszczone. Są jedynie maskowane w sposób, który można cofnąć.

Artykuł 4 ust. 5 RODO jest spełniony: dodatkowy klucz (mapa tokenów) jest przechowywany osobno z odpowiednimi zabezpieczeniami technicznymi i proceduralnymi. Obowiązek zachowania wynikający z Federalnych Reguł Postępowania Cywilnego jest spełniony: surowe zapisy można przywrócić, gdy obowiązuje zabezpieczenie prawne.

Zapoznaj się z naszym podejściem do wykrywania podmiotów, przeglądem ochrony i planami i cenami.

Dwie ścieżki

Firmy stają przed wyraźnym wyborem:

Trwałe usunięcie danych — rozwiązuje problem wycieku AI, ale tworzy ryzyko prawne.
Odwracalne maskowanie tokenami — spełnia zarówno wymogi ochrony, jak i zgodności jednocześnie.

Średni koszt naruszenia bezpieczeństwa AI wynoszący 2,1 mln dolarów napędza decyzję o bezpieczeństwie. Ale sankcje za spoliation też nie są tanie. W sprawach o dużą stawkę koszty mogą osiągnąć podobny rząd wielkości. Oba ryzyka zasługują na uwzględnienie w decyzji.

Rozsądna polityka AI obejmuje oba końce. Blokuje wrażliwe dane przed opuszczeniem firmy w użytecznej formie. I zachowuje te same zapisy dostępne, gdy sąd lub regulator o nie poprosi. Odwracalne maskowanie tokenami jest jedyną metodą, która jednocześnie realizuje oba cele.

Więcej informacji znajdziesz w naszym oświadczeniu założyciela i studiach przypadków.

Źródła

Cyberhaven IV kw. 2025: Ekspozycja danych w narzędziach AI — link
IBM / Ponemon Institute: Raport o kosztach naruszenia ochrony danych 2024 — link
Wytyczne EROD 05/2022 dotyczące pseudonimizacji — link
Federalne Reguły Postępowania Cywilnego, Reguła 37(e) — link
E-Discovery LLC: Redakcje dla zachowania prywatności a standardy prawne — link

Pokrewne artykuły

Technologia prawna

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

Rozpocznij bezpłatny okres próbny Zobacz funkcje

Trwała anonimizacja: ryzyko zniszczenia dowodów

Jedno rozwiązanie, dwa nowe ryzyka

Skala udostępniania danych AI

RODO: odwracalność jest wymagana

Federalne przepisy: test na zniszczenie dowodów

Odwracalne a nieodwracalne: kluczowa różnica

Jednokierunkowe: bez drogi powrotu

Odwracalne: odzyskanie jest możliwe

Projekt spełniający podwójne wymogi

Dwie ścieżki

Źródła

Pokrewne artykuły

Mixed Format E-Discovery: Compliance Gap

The PDF Redaction Trap: Data Exposed

Legal PII: Privilege Detection

Gotowy, aby chronić swoje dane?

Trwała anonimizacja: ryzyko zniszczenia dowodów

Jedno rozwiązanie, dwa nowe ryzyka

Skala udostępniania danych AI

RODO: odwracalność jest wymagana

Federalne przepisy: test na zniszczenie dowodów

Odwracalne a nieodwracalne: kluczowa różnica

Jednokierunkowe: bez drogi powrotu

Odwracalne: odzyskanie jest możliwe

Projekt spełniający podwójne wymogi

Dwie ścieżki

Źródła

Pokrewne artykuły

Mixed Format E-Discovery: Compliance Gap

The PDF Redaction Trap: Data Exposed

Legal PII: Privilege Detection

Gotowy, aby chronić swoje dane?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow