2026-ra frissítve
Az az auditkérdés, amelyre az AI nem tud válaszolni
Egy HIPAA-auditor megkérdezi: „Miért anonimizálták ezt a klinikai feljegyzést?”
„Az algoritmus feldolgozta” – ez nem válasz.
A HIPAA Expert Determination módszer egyértelmű mércét állít fel. Egy szakképzett személynek statisztikai és tudományos elveket kell alkalmaznia. Annak bizonyítania kell, hogy az újra-azonosítás kockázata igen csekély. A szabvány egyértelmű, dokumentált módszertant követel meg – nem fekete dobozos kimenetet.
A jogi discovery ugyanilyen mércét állít fel. Egy különleges megbízott megkérdezi: „Miért volt ez a bekezdés redaktálva?” A válaszban meg kell nevezni a jogosultsági alapot, és le kell írni a visszatartott anyagot az FRCP Rule 26(b)(5) szerint. „Az eszköz jelölte meg” – ez a szabálynak nem felel meg.
Az IAPP 2025-ös kutatása megállapította, hogy a DPO-k 34%-a jelent hiányos eszközöket az automatizált anonimizálás megfelelőségi dokumentációjához. A hiány nem a felderítésben van, hanem annak dokumentálásában, hogy mit és miért találtak.
Mit követel a HIPAA
A HIPAA két utat kínál a 45 CFR 164.514 alapján.
Safe Harbor: Távolítsa el mind a 18 meghatározott PHI-azonosítót. Az auditorok ellenőrzik, hogy az eszköz milyen entitástípusokat talált és hogyan kezelt minden egyes esetet.
Expert Determination: Egy szakképzett személy statisztikai elveket alkalmaz. Dokumentálja a módszert, a kockázatelemzést és a saját képesítését.
Mindkét út azonos kulcselváráson alapul. Az auditoroknak meg kell érteniük, mi történt – nem elég, ha csak közlik velük, hogy megtörtént. Egy olyan rendszer, amely de-azonosított kimenetet ad módszertani feljegyzések nélkül, mindkét úton megbukik.
Mit tesz hozzá a GDPR
A GDPR érvényesítése fokozódik. Az EDPB 2024-ben 900+ végrehajtási határozatot hozott. A GDPR-bírságok abban az évben 1,2 milliárd eurót értek el – ez rekord.
A GDPR 5. cikk (2) bekezdése rögzíti az elszámoltathatósági szabályt. Az adatkezelőknek bizonyítaniuk kell a megfelelőséget – nem csupán elérniük azt. A kötelezettség aktív bizonyítás, nem passzív megfelelés.
Az automatizált anonimizálási eszközöket használó csapatok esetén ez a szabály az eszközökre is kiterjed. Egy DPO-nak dokumentálnia kell a technikai intézkedéseket: meg kell neveznie, mit talál az eszköz, hogyan találja meg, milyen megbízhatósági szint szükséges és milyen művelet történik. Egy olyan eszköz, amely semmit sem közöl ebből, megakadályozza az auditkötelezettség teljesítését.
A négy mező, amely felépíti az auditnyomvonalat
Egy magyarázható redakciós rendszernek minden redakciónál négy adatot kell rögzítenie.
Entitástípus: „PERSON” vagy „SSN” vagy „DATE_OF_BIRTH” – a talált adat osztálya. Minden osztály megfelel egy HIPAA PHI-típusnak vagy GDPR személyes adattípusnak.
Felderítési módszer: Regex-egyezés volt egy rögzített mintán? Vagy NLP-modell-egyezés kontextus alapján? A regex-egyezések teljesen reprodukálhatók. Az NLP-egyezések megbízhatósági szinteket hordoznak. Ez a különbség lényeges az auditfeljegyzések szempontjából.
Megbízhatósági pontszám: NLP-egyezések esetén ez annak valószínűsége, hogy az adott szövegrész a megjelölt entitástípusba tartozik. Egy 0,94-es pontszám egy személynévhez dokumentálható. A bináris „jelölt/nem jelölt” nem az.
Alkalmazott operátor: Az entitást tokennel helyettesítették, kivonatolták, redaktálták vagy elnyomták? Az operátor megnevezése támogatja az auditfelülvizsgálatot.
Ez a négy mező alkotja az auditnyomvonalat. A HIPAA Expert Determination megköveteli. A jogi discovery-privilegium naplók igénylik. A GDPR elszámoltathatósági feljegyzések megkívánják. E nélkül az automatizált redakció nem védhető meg auditorok, bíróságok vagy felügyeleti hatóságok előtt.
Lásd, hogyan rögzíti ezt az anonym.legal a megfelelőségi áttekintőn és a biztonsági gyakorlatok oldalán. A HIPAA Safe Harbor feldolgozás bemutatójához lásd a HIPAA klinikai feljegyzések kötegelt feldolgozásának útmutatóját.