2026-ra frissítve
Egy megoldás, két új kockázat
Sok iroda ma már úgy védi az AI-kiszivárgásokat, hogy eltávolítja a neveket és azonosítókat, mielőtt a szöveg eléri az AI-szolgáltatót. Az egyirányú kivonatolás, a kemény kitakarás vagy a teljes eltávolítás mind biztonságosnak tűnik. Az AI tiszta szöveget kap. Az érzékeny részletek házon belül maradnak.
A logika megállja a helyét a biztonsági oldalon. A Cyberhaven 2025. negyedik negyedéves tanulmánya megállapította, hogy a ChatGPT-be küldött tartalom 34,8%-a érzékeny adatokat tartalmaz. A Ponemon 2024-es jelentése az átlagos AI-adatvédelmi incidens költségét 2,1 millió dollárra tette. A kockázat valós és a költség magas.
De a teljes eltávolítás az egyik kockázatot egy másikra cseréli: bizonyíték-megsemmisítésre.
Pereknek vagy hatósági vizsgálatoknak kitett irodák esetén az eredeti iratok visszaállíthatóságának megsemmisítése szövetségi és tagállami szabályok szerint bizonyíték-megsemmisítésnek minősülhet.
Az AI-megosztás mértéke
Az eSecurity Planet és a Cyberhaven kutatása megállapította, hogy az alkalmazottak 77%-a oszt meg érzékeny adatokat AI-eszközökkel hetente. Ez átfedi a jogi, egészségügyi, pénzügyi és technológiai szektort.
A megosztott tartalom gyakran magában foglalja:
- Ügyfélleveleket és ügyjegyzeteket
- Szerződéstervezeteket és üzleti feltételeket
- Belső terveket és üzleti feljegyzéseket
- Pénzügyi modelleket és előrejelzéseket
- Jogi feljegyzéseket és ügyjegyzeteket
- Betegnyilvántartásokat és klinikai feljegyzéseket
- HR-fájlokat és alkalmazotti üzeneteket
Ha a teljes eltávolítás az AI-kontroll, minden átmenő dokumentum elveszítheti jogi értékét. Ha ezek a dokumentumok egy perben felszínre kerülnek – ami nagyon valószínű bármely, szabályozott területen tevékenykedő iroda esetén egy több éves időszakra vetítve – az iroda potenciálisan elvesztette a bizonyítékot.
Lásd a jogi megfelelőségi áttekintőnket arról, hogyan teljesíti az anonym.legal a feltárási kötelezettségeket. A tokenrendszer útmutatóban megtekintheti, hogyan működik a maszkolási folyamat a gyakorlatban.
GDPR: a visszafordíthatóság kötelező
A GDPR 4. cikk (5) bekezdése a pszeudoanonimizálást olyan személyes adatok feldolgozásaként határozza meg, amelyek révén ezek „anélkül nem tulajdoníthatók többé meghatározott érintettnek, hogy további információkat ne vennének igénybe, amennyiben e kiegészítő információkat külön tárolják”.
A kulcspont: a visszakapcsolást lehetővé tevő kiegészítő kulcsot meg kell őrizni. A tárolt kulcsokon keresztül visszakapcsolható nyilvántartások a GDPR értelmében pszeudoanonimizáltnak minősülnek.
Azok a nyilvántartások, amelyek egyáltalán nem kapcsolhatók vissza, nem pszeudoanonimizáltak. Anonimizáltak. A különbség lényeges:
- A tokennel maszkolt nyilvántartások megőriznek bizonyos GDPR-kötelezettségeket, de jogi felhasználás céljából visszaállíthatók.
- A teljesen törölt nyilvántartások kívül eshetnek a GDPR hatályán, de egyáltalán nem állíthatók vissza.
Az Európai Adatvédelmi Testület 05/2022-es iránymutatása megerősíti, hogy a visszafordíthatóság a fogalommeghatározás központi eleme. Az egyirányú eltávolítást alkalmazó irodák nem GDPR-pszeudoanonimizálást végeznek. Elvágják a nyilvántartások visszanyerhetőségét.
Többet megtudhat a megfelelőségi hubunkon és a védelmi áttekintőnkben.
Szövetségi szabályok: a bizonyíték-megsemmisítési teszt
A szövetségi polgári perrendtartási szabályok (FRCP) értelmében a felek kötelesek megőrizni azokat a nyilvántartásokat, amelyek várhatóan relevánsak lehetnek egy jogvitában. Ez a kötelezettség akkor kezdődik, amikor egy per ésszerűen előre látható – nem akkor, amikor azt benyújtják.
A 37(e) szabály lehetővé teszi a bíróságoknak, hogy szankciókat alkalmazzanak, ha egy fél nem őrzi meg a tárolt nyilvántartásokat. A szankciók magukban foglalhatják:
- Kedvezőtlen következtetési utasításokat
- Bizonyíték kizárását
- Komoly esetekben az eljárást lezáró szankciókat
Így néz ki ez a gyakorlatban. Egy iroda olyan AI-munkafolyamatokat alkalmaz, amelyek normál üzletmenetben teljesen eltávolítják az érzékeny tartalmat. Ezek a nyilvántartások később relevánsak lesznek egy perben. Az iroda úgy módosította azokat, hogy az eredeti szöveg nem állítható vissza. Ha ez a megőrzési kötelezettség beállása után történt, bizonyíték-megsemmisítési kitettség következik.
Ez nem egy szélsőséges eset. A szabályozott területeken működő, ismétlődő jogi kitettséggel rendelkező irodák állandó, előre látható perekkel szembesülnek széles dokumentumtípusokban. A teljes eltávolítás valamennyi munkafolyamatra való alkalmazása – az érintett nyilvántartásokra vonatkozó kivételek nélkül – nagy bizonyíték-megsemmisítési kockázatot teremt.
Visszafordítható vs. visszafordíthatatlan: a kulcskülönbség
A visszafordítható és az egyirányú maszkolás közötti különbség a tervezésben rejlik.
Egyirányú: nincs visszaút
Egy név SHA-256-os kivonatolása rögzített kivonatot állít elő. A névből nem vezethető le a kivonat. A kemény kitakarás eltávolítja a szöveget, így az eredeti tartalom elvész.
Visszafordítható: a helyreállítás lehetséges
A kulcsmegőrzéssel járó tokenhelyettesítés és az AES-256-GCM titkosítás egyaránt olyan módon alakítja át a nyilvántartásokat, amely visszavonható. Egy tokennel helyettesített név visszaállítható egy keresési táblán keresztül. Az AES-256-GCM-tartalom a megfelelő kulccsal visszafejthető. Az eredeti szöveg elérhető marad.
Az AI-védelem szempontjából mindkét módszer azonosan működik. Az AI tokeneket dolgoz fel, és soha nem látja a valódi nyilvántartásokat.
A jogi kötelezettség szempontjából csak a visszafordítható token-maszkolás működik. Az egyirányú módszerek elvágják a visszanyerhetőséget, és létrehozzák a fentebb említett bizonyíték-megsemmisítési kockázatot.
Olvassa el, hogyan kezeli a tokenrendszerünk ezt végponttól végpontig. Mélyebb kontextusért lásd a szójegyzéket és a GYIK-et.
A kettős megfelelőségű tervezés
Egy olyan tervezés, amely megfelel mind az AI-biztonsági, mind a jogi közzétételi kötelezettségeknek, visszafordítható AES-256-GCM token-maszkolást alkalmaz:
- A nyilvántartásokat feldolgozzák, mielőtt bármely AI-eszközhöz jutnak.
- Az érzékeny elemeket – neveket, azonosítókat, PHI-t, kiváltságos tartalmat – strukturált tokenekkel helyettesítik.
- A tokentérképet egy különálló tárolóban őrzik az adattípusnak megfelelő hozzáférési kontrollokkal.
- Az AI-feldolgozás a token-másolaton fut. Az AI soha nem látja a valódi nyilvántartásokat.
- Az eredményeket a tokentérkép segítségével állítják vissza a normál üzleti felhasználáshoz.
- A tokentérképet jogi megőrzés alá helyezik, amikor a feltárási kötelezettségek beállnak.
E tervezés szerint egyetlen nyers tartalom sem vész el. Az AI-szolgáltató soha nem látja azt felhasználható formában. A tokentérkép lehetővé teszi a visszanyerést, amikor a jog megköveteli. A bizonyíték-megsemmisítési kockázat eltűnik – egyetlen nyilvántartás sem semmisül meg. Csupán olyan módon vannak maszkolva, amely visszavonható.
A GDPR 4. cikk (5) bekezdése teljesül: a kiegészítő kulcs (tokentérkép) megfelelő technikai és eljárásbeli biztosítékokkal külön van tárolva. A szövetségi szabályok megőrzési kötelezettsége teljesül: a nyers nyilvántartások visszaállíthatók, ha jogi megőrzés vonatkozik rájuk.
Ismerje meg az entitásfelismerési megközelítésünket, a védelmi áttekintőnket és a csomagokat és árakat a részletes tájékoztatásért.
A bináris választás
Az irodák egy egyértelmű elágazással szembesülnek:
- Vélegesen eltávolítják az adatokat – megoldják az AI-kiszivárgás problémáját, de jogi kockázatot teremtenek.
- Visszafordítható token-maszkolást alkalmaznak – egyszerre teljesítik a védelmi és a megfelelőségi szükségleteket.
A biztonsági döntést a 2,1 millió dolláros átlagos AI-adatvédelmi incidens-költség vezérli. De a bizonyíték-megsemmisítési szankciók sem olcsók. Nagy összegű pereknél a költségek ugyanolyan nagyságrendbe kerülhetnek. Mindkét kockázat megérdemel helyet a döntéshozatalban.
Egy megalapozott AI-politika mindkét véget lefedi. Megakadályozza, hogy érzékeny nyilvántartások felhasználható formában kerüljenek ki az irodából. Ugyanakkor ezeket a nyilvántartásokat elérhetővé teszi, amikor egy bíróság vagy szabályozó hatóság kéri azokat. A visszafordítható token-maszkolás az egyetlen módszer, amely egyszerre mindkettőt elvégzi.
Többi háttérinformációért lásd az alapítói nyilatkozatunkat és az esettanulmányainkat.
Források
- Cyberhaven 2025. Q4: Adatkitettség az AI-eszközökben – link
- IBM / Ponemon Institute: Az adatvédelmi incidensek költségéről szóló jelentés, 2024 – link
- EDPB iránymutatások 05/2022 a pszeudoanonimizálásról – link
- Szövetségi polgári perrendtartási szabályok, 37(e) szabály – link
- E-Discovery LLC: Relevanciaalapú kitakarások és jogi szabványok – link