Aktualizováno pro rok 2026
Auditní otázka, na kterou umělá inteligence nedokáže odpovědět
Auditor HIPAA se ptá: „Proč byla tato klinická poznámka de-identifikována?”
„Algoritmus ji zpracoval” není odpověď.
Metoda Expert Determination podle HIPAA stanoví jasnou laťku. Kvalifikovaná osoba musí aplikovat statistické a vědecké principy. Tato osoba musí prokázat, že riziko re-identifikace je velmi malé. Standard vyžaduje jasnou, zdokumentovanou metodiku — nikoli výstup černé skříňky.
Legální discovery klade stejné nároky. Zvláštní správce se ptá: „Proč byl tento odstavec redigován?” Odpověď musí uvést důvod ochrany privilegovaných informací. Musí popsat zadržený materiál podle pravidla FRCP Rule 26(b)(5). „Nástroj to označil” tomuto pravidlu nevyhovuje.
Výzkum IAPP z roku 2025 zjistil, že 34 % DPO hlásí nedostatečné nástroje pro dokumentaci souladu při automatizované anonymizaci. Problém nespočívá v detekci. Spočívá v dokumentování toho, co bylo nalezeno a proč.
Co HIPAA vyžaduje
HIPAA nabízí dvě cesty podle 45 CFR 164.514.
Safe Harbor: Odstranění všech 18 specifikovaných identifikátorů PHI. Auditoři kontrolují, jaké typy entit nástroj nalezl a jak s každým naložil.
Expert Determination: Kvalifikovaná osoba aplikuje statistické principy. Dokumentuje metodu, analýzu rizik a vlastní kvalifikaci.
Obě cesty sdílejí jeden klíčový požadavek. Auditoři musí rozumět tomu, co bylo provedeno. Nestačí jim pouze říci, že k tomu došlo. Systém, který poskytuje de-identifikovaný výstup bez záznamu metodiky, nesplňuje ani jednu cestu.
Co přidává GDPR
Vymáhání GDPR roste. EDPB vydala v roce 2024 více než 900 rozhodnutí o vymáhání. Pokuty podle GDPR dosáhly v tomto roce 1,2 miliardy EUR — rekordní výše.
Článek 5 odst. 2 GDPR stanoví pravidlo odpovědnosti. Správci musí být schopni prokázat soulad s předpisy — nestačí ho pouze dosáhnout. Jde o aktivní povinnost doložení, nikoli pasivní dodržování.
Pro týmy používající nástroje automatizované anonymizace se toto pravidlo vztahuje i na tyto nástroje. DPO musí dokumentovat technická opatření. Musí uvést, co nástroj nalézá. Musí uvést, jak to nalézá. Musí stanovit požadovanou míru spolehlivosti a přijímaná opatření. Nástroj, který žádné z těchto informací neposkytuje, znemožňuje plnění auditní povinnosti.
Čtyři pole, která tvoří auditní stopu
Vysvětlitelný systém redakce musí zaznamenat čtyři položky pro každou redakci.
Typ entity: „PERSON”, „SSN” nebo „DATE_OF_BIRTH” — třída nalezených dat. Každá třída odpovídá typu PHI podle HIPAA nebo typu osobních údajů podle GDPR.
Metoda detekce: Šlo o shodu regulárního výrazu s pevně daným vzorem? Nebo o shodu modelu NLP na základě kontextu? Shody regulárních výrazů jsou plně reprodukovatelné. Shody NLP nesou úrovně spolehlivosti. Tento rozdíl je pro auditní záznamy podstatný.
Skóre spolehlivosti: U shod NLP jde o pravděpodobnost, že daný úsek je deklarovaným typem entity. Skóre 0,94 pro jméno osoby je doložitelné. Binární „označeno/neoznačeno” nikoli.
Použitý operátor: Byla entita nahrazena tokenem, zahashována, začerněna nebo potlačena? Pojmenování operátoru podporuje přezkum při auditu.
Tato čtyři pole tvoří auditní stopu. Metoda Expert Determination podle HIPAA ji potřebuje. Protokoly o privilegovaných informacích v právním discovery ji potřebují. Záznamy o odpovědnosti podle GDPR ji potřebují. Bez ní nelze automatizovanou redakci obhájit před auditory, soudy ani dozorovými orgány.
Způsob, jakým anonym.legal toto zachycuje, si prohlédněte v přehledu souladu s předpisy a na stránce o bezpečnostních postupech. Průvodce zpracováním klinických poznámek podle Safe Harbor HIPAA najdete v průvodci dávkovým zpracováním klinických poznámek.