Zaktualizowano na 2026 rok
Pytanie audytowe, na które AI nie potrafi odpowiedzieć
Audytor HIPAA pyta: „Dlaczego ta notatka kliniczna została de-identyfikowana?”
„Algorytm to przetworzył” — to nie jest odpowiedź.
Metoda ekspercka HIPAA stawia wyraźną poprzeczkę. Wykwalifikowana osoba musi zastosować zasady statystyczne i naukowe. Musi wykazać, że ryzyko re-identyfikacji jest bardzo małe. Standard wymaga jasnej, udokumentowanej metodologii — nie wyjścia z czarnej skrzynki.
E-discovery stawia tę samą poprzeczkę. Specjalny mistrz pyta: „Dlaczego ten akapit został zredagowany?” Odpowiedź musi wskazać podstawę przywileju. Musi opisać wstrzymany materiał zgodnie z regułą 26(b)(5) FRCP. „Narzędzie to oznaczyło” nie spełnia tego wymogu.
Badania IAPP z 2025 r. wykazały, że 34% DPO zgłasza niewystarczające narzędzia do dokumentowania zgodności automatycznej anonimizacji. Luka nie leży w wykrywaniu — lecz w dokumentowaniu tego, co zostało znalezione i dlaczego.
Czego wymaga HIPAA
HIPAA przewiduje dwie ścieżki w 45 CFR 164.514.
Safe Harbor: Usuń wszystkie 18 określonych identyfikatorów PHI. Audytorzy sprawdzają, które typy encji narzędzie znalazło i jak każdy z nich był obsługiwany.
Metoda ekspercka: Wykwalifikowana osoba stosuje zasady statystyczne. Dokumentuje metodologię, analizę ryzyka i własne kwalifikacje.
Obie ścieżki mają jeden wspólny wymóg: audytorzy muszą rozumieć, co zostało zrobione — nie mogą jedynie otrzymać informację, że to nastąpiło. System, który dostarcza de-identyfikowane dane wyjściowe bez żadnych zapisów metodologicznych, zawodzi na obu ścieżkach.
Co dodaje RODO
Egzekwowanie RODO rośnie. EDPB wydało ponad 900 decyzji egzekucyjnych w 2024 r. Kary z tytułu RODO osiągnęły 1,2 miliarda euro w tym roku — rekord.
Art. 5(2) RODO ustanawia zasadę rozliczalności. Administratorzy muszą być w stanie wykazać zgodność — nie tylko ją osiągnąć. Obowiązek polega na aktywnym udowadnianiu, a nie biernym przestrzeganiu.
Dla zespołów korzystających z automatycznych narzędzi anonimizacji reguła ta obejmuje same narzędzia. DPO musi dokumentować środki techniczne: co narzędzie wykrywa, jak to robi, jaki poziom pewności jest wymagany i jakie działanie jest podejmowane. Narzędzie, które niczego z tego nie dostarcza, blokuje obowiązek audytowy.
Cztery pola budujące ścieżkę audytu
System wyjaśnialnej redakcji musi rejestrować cztery elementy dla każdej redakcji.
Typ encji: „PERSON”, „SSN” lub „DATE_OF_BIRTH” — klasa znalezionych danych. Każda klasa mapuje się na typ PHI z HIPAA lub typ danych osobowych z RODO.
Metoda wykrycia: Czy to było dopasowanie regex na stałym wzorcu? Czy dopasowanie modelu NLP oparte na kontekście? Dopasowania regex są w pełni odtwarzalne. Dopasowania NLP niosą poziomy pewności. Ta różnica ma znaczenie dla zapisów audytowych.
Wynik pewności: Dla dopasowań NLP to prawdopodobieństwo, że dany fragment to deklarowany typ encji. Wynik 0,94 dla imienia jest dokumentowalny. Binarne „oznaczone/nieoznaczone” — nie.
Zastosowany operator: Czy encja została zastąpiona tokenem, zahaszowana, zredagowana czy pominięta? Wskazanie operatora wspiera przegląd audytowy.
Te cztery pola tworzą ścieżkę audytu. Metoda ekspercka HIPAA jej potrzebuje. Dzienniki uprawnień w e-discovery jej potrzebują. Zapisy rozliczalności RODO jej potrzebują. Bez niej automatyczna redakcja nie może być obroniona przed audytorami, sądami ani organami nadzorczymi.
Zobacz, jak anonym.legal to rejestruje, na stronach przeglądu zgodności i praktyk bezpieczeństwa. Opis przetwarzania notatek klinicznych HIPAA Safe Harbor znajdziesz w przewodniku po wsadowym przetwarzaniu notatek klinicznych HIPAA.