Zaktualizowano w 2026 r.
Jedno rozwiązanie, dwa nowe ryzyka
Wiele firm blokuje wycieki danych do AI, usuwając imiona i identyfikatory przed przesłaniem tekstu do dostawcy AI. Jednokierunkowe hashowanie, twarda redakcja lub całkowite usuwanie — wszystkie wydają się bezpieczne. AI otrzymuje czysty tekst. Wrażliwe dane pozostają w firmie.
Logika po stronie bezpieczeństwa jest słuszna. Badanie Cyberhaven z IV kwartału 2025 r. wykazało, że 34,8% treści przesyłanych do ChatGPT zawiera dane wrażliwe. Raport Ponemon z 2024 r. określił średni koszt naruszenia bezpieczeństwa AI na 2,1 mln dolarów. Ryzyko jest realne, a koszty wysokie.
Ale całkowite usunięcie wymienia jedno ryzyko na inne: zniszczenie dowodów (spoliation).
Dla firm objętych postępowaniami sądowymi lub audytami, zniszczenie możliwości przywrócenia oryginalnych zapisów może być traktowane jako spoliation zgodnie z przepisami federalnymi i stanowymi.
Skala udostępniania danych AI
Badania eSecurity Planet i Cyberhaven wykazały, że 77% pracowników udostępnia wrażliwe dane narzędziom AI każdego tygodnia. Dotyczy to sektorów: prawnego, opieki zdrowotnej, finansów i technologii.
Udostępniana treść często obejmuje:
- Pisma klientów i notatki do sprawy
- Projekty umów i warunki transakcji
- Plany wewnętrzne i dokumenty biznesowe
- Modele finansowe i prognozy
- Memoranda prawne i notatki do spraw
- Dokumentację medyczną i notatki kliniczne
- Akta kadrowe i wiadomości pracownicze
Gdy całkowite usunięcie jest stosowaną kontrolą AI, każdy dokument, który przez nią przejdzie, może utracić swoją wartość prawną. Jeśli te dokumenty pojawią się w postępowaniu sądowym — co jest bardzo prawdopodobne w perspektywie kilku lat dla firm w sektorach regulowanych — firma może utracić dowody.
Zobacz nasz przegląd zgodności z prawem, aby dowiedzieć się, jak anonym.legal realizuje obowiązki związane z ujawnianiem dowodów. Możesz też zapoznać się z przewodnikiem po systemie tokenów, aby zobaczyć, jak działa w praktyce potok maskowania.
RODO: odwracalność jest wymagana
Artykuł 4 ust. 5 RODO definiuje pseudonimizację jako przetwarzanie danych osobowych w sposób, który sprawia, że „nie można ich już przypisać konkretnej osobie, której dane dotyczą, bez użycia dodatkowych informacji, pod warunkiem że takie dodatkowe informacje są przechowywane osobno."
Kluczowy punkt: dodatkowy klucz umożliwiający ponowne powiązanie musi być przechowywany. Zapisy, które można ponownie powiązać za pomocą przechowywanych kluczy, są traktowane jako pseudonimizowane w rozumieniu RODO.
Zapisy, których nie można ponownie powiązać w żaden sposób, nie są pseudonimizowane. Są zanonimizowane. Różnica jest istotna:
- Zapisy maskowane tokenami zachowują niektóre obowiązki wynikające z RODO, ale można je przywrócić do użytku prawnego.
- Zapisy całkowicie usunięte mogą wykraczać poza zakres RODO, ale nie mogą być w ogóle przywrócone.
Wytyczne 05/2022 Europejskiej Rady Ochrony Danych potwierdzają, że odwracalność jest kluczową częścią definicji. Firmy stosujące jednokierunkowe usuwanie nie realizują pseudonimizacji w rozumieniu RODO. Niszczą możliwość odzyskania zapisów.
Więcej informacji znajdziesz w naszym centrum zgodności oraz przeglądzie ochrony.
Federalne przepisy: test na zniszczenie dowodów
Zgodnie z Federalnymi Regułami Postępowania Cywilnego strony mają obowiązek zachowania dokumentów, które mogą być istotne dla spodziewanego postępowania sądowego. Ten obowiązek powstaje, gdy pozew jest rozsądnie przewidywalny — nie w chwili jego złożenia.
Reguła 37(e) pozwala sądom nakładać kary, gdy strona nie zachowa przechowywanych zapisów. Kary mogą obejmować:
- Instrukcje dotyczące niekorzystnego wnioskowania
- Wykluczenie dowodów
- Sankcje kończące sprawę w poważnych przypadkach
Oto jak to się rozgrywa. Firma stosuje przepływy AI, które w normalnym toku działalności całkowicie usuwają wrażliwą treść. Te zapisy stają się później istotne dla postępowania sądowego. Firma zmodyfikowała je tak, że surowego tekstu nie można przywrócić. Jeśli nastąpiło to po powstaniu obowiązku zachowania, pojawia się ryzyko spoliation.
To nie jest przypadek marginalny. Firmy w sektorach regulowanych z powtarzającą się ekspozycją prawną stają w obliczu stałych przewidywalnych pozwów dotyczących szerokiego zakresu typów dokumentów. Wdrożenie całkowitego usuwania we wszystkich przepływach — bez wyłączeń dla dokumentów obarczonych ryzykiem — tworzy duże ryzyko spoliation.
Odwracalne a nieodwracalne: kluczowa różnica
Różnica między maskowaniem odwracalnym a jednokierunkowym tkwi w projekcie.
Jednokierunkowe: bez drogi powrotu
Hashowanie SHA-256 imienia generuje stały skrót. Imienia nie można z niego wywieść. Twarda redakcja usuwa tekst, więc oryginalna treść jest utracona.
Odwracalne: odzyskanie jest możliwe
Zamiana tokenów z zachowaniem klucza oraz szyfrowanie AES-256-GCM przekształcają zapisy w sposób, który można cofnąć. Imię zastąpione tokenem można przywrócić za pomocą tablicy przeglądowej. Treść zaszyfrowana AES-256-GCM można odszyfrować odpowiednim kluczem. Surowy tekst pozostaje dostępny.
Do celów ochrony AI obie metody działają tak samo. AI przetwarza tokeny i nigdy nie widzi rzeczywistych danych.
Do celów prawnych tylko odwracalne maskowanie tokenami działa. Metody jednokierunkowe uniemożliwiają odtworzenie i tworzą ryzyko spoliation opisane powyżej.
Przeczytaj, jak nasz system tokenów obsługuje to od początku do końca. Szerszy kontekst znajdziesz w słowniku i FAQ.
Projekt spełniający podwójne wymogi
Projekt spełniający zarówno wymogi bezpieczeństwa AI, jak i prawne obowiązki ujawniania, wykorzystuje odwracalne maskowanie tokenami AES-256-GCM:
- Zapisy są przetwarzane przed dotarciem do jakiegokolwiek narzędzia AI.
- Wrażliwe elementy — imiona, identyfikatory, PHI, chroniona treść — są zamieniane na ustrukturyzowane tokeny.
- Mapa tokenów jest przechowywana w osobnym magazynie z kontrolą dostępu odpowiednią do typu danych.
- Przetwarzanie AI odbywa się na kopii z tokenami. AI nigdy nie widzi rzeczywistych danych.
- Wyniki są przywracane za pomocą mapy tokenów do normalnego użytku biznesowego.
- Mapa tokenów jest objęta zabezpieczeniem prawnym (legal hold), gdy powstaje obowiązek ujawnienia.
W ramach tego projektu żadna surowa treść nigdy nie jest tracona. Dostawca AI nigdy nie widzi jej w użytecznej formie. Mapa tokenów zachowuje możliwość odtworzenia, gdy prawo tego wymaga. Ryzyko spoliation jest wyeliminowane — żadne zapisy nie są niszczone. Są jedynie maskowane w sposób, który można cofnąć.
Artykuł 4 ust. 5 RODO jest spełniony: dodatkowy klucz (mapa tokenów) jest przechowywany osobno z odpowiednimi zabezpieczeniami technicznymi i proceduralnymi. Obowiązek zachowania wynikający z Federalnych Reguł Postępowania Cywilnego jest spełniony: surowe zapisy można przywrócić, gdy obowiązuje zabezpieczenie prawne.
Zapoznaj się z naszym podejściem do wykrywania podmiotów, przeglądem ochrony i planami i cenami.
Dwie ścieżki
Firmy stają przed wyraźnym wyborem:
- Trwałe usunięcie danych — rozwiązuje problem wycieku AI, ale tworzy ryzyko prawne.
- Odwracalne maskowanie tokenami — spełnia zarówno wymogi ochrony, jak i zgodności jednocześnie.
Średni koszt naruszenia bezpieczeństwa AI wynoszący 2,1 mln dolarów napędza decyzję o bezpieczeństwie. Ale sankcje za spoliation też nie są tanie. W sprawach o dużą stawkę koszty mogą osiągnąć podobny rząd wielkości. Oba ryzyka zasługują na uwzględnienie w decyzji.
Rozsądna polityka AI obejmuje oba końce. Blokuje wrażliwe dane przed opuszczeniem firmy w użytecznej formie. I zachowuje te same zapisy dostępne, gdy sąd lub regulator o nie poprosi. Odwracalne maskowanie tokenami jest jedyną metodą, która jednocześnie realizuje oba cele.
Więcej informacji znajdziesz w naszym oświadczeniu założyciela i studiach przypadków.
Źródła
- Cyberhaven IV kw. 2025: Ekspozycja danych w narzędziach AI — link
- IBM / Ponemon Institute: Raport o kosztach naruszenia ochrony danych 2024 — link
- Wytyczne EROD 05/2022 dotyczące pseudonimizacji — link
- Federalne Reguły Postępowania Cywilnego, Reguła 37(e) — link
- E-Discovery LLC: Redakcje dla zachowania prywatności a standardy prawne — link