2026-ra frissítve

Egy megoldás, két új kockázat

Sok iroda ma már úgy védi az AI-kiszivárgásokat, hogy eltávolítja a neveket és azonosítókat, mielőtt a szöveg eléri az AI-szolgáltatót. Az egyirányú kivonatolás, a kemény kitakarás vagy a teljes eltávolítás mind biztonságosnak tűnik. Az AI tiszta szöveget kap. Az érzékeny részletek házon belül maradnak.

A logika megállja a helyét a biztonsági oldalon. A Cyberhaven 2025. negyedik negyedéves tanulmánya megállapította, hogy a ChatGPT-be küldött tartalom 34,8%-a érzékeny adatokat tartalmaz. A Ponemon 2024-es jelentése az átlagos AI-adatvédelmi incidens költségét 2,1 millió dollárra tette. A kockázat valós és a költség magas.

De a teljes eltávolítás az egyik kockázatot egy másikra cseréli: bizonyíték-megsemmisítésre.

Pereknek vagy hatósági vizsgálatoknak kitett irodák esetén az eredeti iratok visszaállíthatóságának megsemmisítése szövetségi és tagállami szabályok szerint bizonyíték-megsemmisítésnek minősülhet.

Az AI-megosztás mértéke

Az eSecurity Planet és a Cyberhaven kutatása megállapította, hogy az alkalmazottak 77%-a oszt meg érzékeny adatokat AI-eszközökkel hetente. Ez átfedi a jogi, egészségügyi, pénzügyi és technológiai szektort.

A megosztott tartalom gyakran magában foglalja:

Ügyfélleveleket és ügyjegyzeteket
Szerződéstervezeteket és üzleti feltételeket
Belső terveket és üzleti feljegyzéseket
Pénzügyi modelleket és előrejelzéseket
Jogi feljegyzéseket és ügyjegyzeteket
Betegnyilvántartásokat és klinikai feljegyzéseket
HR-fájlokat és alkalmazotti üzeneteket

Ha a teljes eltávolítás az AI-kontroll, minden átmenő dokumentum elveszítheti jogi értékét. Ha ezek a dokumentumok egy perben felszínre kerülnek – ami nagyon valószínű bármely, szabályozott területen tevékenykedő iroda esetén egy több éves időszakra vetítve – az iroda potenciálisan elvesztette a bizonyítékot.

Lásd a jogi megfelelőségi áttekintőnket arról, hogyan teljesíti az anonym.legal a feltárási kötelezettségeket. A tokenrendszer útmutatóban megtekintheti, hogyan működik a maszkolási folyamat a gyakorlatban.

A GDPR 4. cikk (5) bekezdése a pszeudoanonimizálást olyan személyes adatok feldolgozásaként határozza meg, amelyek révén ezek „anélkül nem tulajdoníthatók többé meghatározott érintettnek, hogy további információkat ne vennének igénybe, amennyiben e kiegészítő információkat külön tárolják”.

A kulcspont: a visszakapcsolást lehetővé tevő kiegészítő kulcsot meg kell őrizni. A tárolt kulcsokon keresztül visszakapcsolható nyilvántartások a GDPR értelmében pszeudoanonimizáltnak minősülnek.

Azok a nyilvántartások, amelyek egyáltalán nem kapcsolhatók vissza, nem pszeudoanonimizáltak. Anonimizáltak. A különbség lényeges:

A tokennel maszkolt nyilvántartások megőriznek bizonyos GDPR-kötelezettségeket, de jogi felhasználás céljából visszaállíthatók.
A teljesen törölt nyilvántartások kívül eshetnek a GDPR hatályán, de egyáltalán nem állíthatók vissza.

Az Európai Adatvédelmi Testület 05/2022-es iránymutatása megerősíti, hogy a visszafordíthatóság a fogalommeghatározás központi eleme. Az egyirányú eltávolítást alkalmazó irodák nem GDPR-pszeudoanonimizálást végeznek. Elvágják a nyilvántartások visszanyerhetőségét.

Többet megtudhat a megfelelőségi hubunkon és a védelmi áttekintőnkben.

Szövetségi szabályok: a bizonyíték-megsemmisítési teszt

A szövetségi polgári perrendtartási szabályok (FRCP) értelmében a felek kötelesek megőrizni azokat a nyilvántartásokat, amelyek várhatóan relevánsak lehetnek egy jogvitában. Ez a kötelezettség akkor kezdődik, amikor egy per ésszerűen előre látható – nem akkor, amikor azt benyújtják.

A 37(e) szabály lehetővé teszi a bíróságoknak, hogy szankciókat alkalmazzanak, ha egy fél nem őrzi meg a tárolt nyilvántartásokat. A szankciók magukban foglalhatják:

Kedvezőtlen következtetési utasításokat
Bizonyíték kizárását
Komoly esetekben az eljárást lezáró szankciókat

Így néz ki ez a gyakorlatban. Egy iroda olyan AI-munkafolyamatokat alkalmaz, amelyek normál üzletmenetben teljesen eltávolítják az érzékeny tartalmat. Ezek a nyilvántartások később relevánsak lesznek egy perben. Az iroda úgy módosította azokat, hogy az eredeti szöveg nem állítható vissza. Ha ez a megőrzési kötelezettség beállása után történt, bizonyíték-megsemmisítési kitettség következik.

Ez nem egy szélsőséges eset. A szabályozott területeken működő, ismétlődő jogi kitettséggel rendelkező irodák állandó, előre látható perekkel szembesülnek széles dokumentumtípusokban. A teljes eltávolítás valamennyi munkafolyamatra való alkalmazása – az érintett nyilvántartásokra vonatkozó kivételek nélkül – nagy bizonyíték-megsemmisítési kockázatot teremt.

Visszafordítható vs. visszafordíthatatlan: a kulcskülönbség

A visszafordítható és az egyirányú maszkolás közötti különbség a tervezésben rejlik.

Egyirányú: nincs visszaút

Egy név SHA-256-os kivonatolása rögzített kivonatot állít elő. A névből nem vezethető le a kivonat. A kemény kitakarás eltávolítja a szöveget, így az eredeti tartalom elvész.

Visszafordítható: a helyreállítás lehetséges

A kulcsmegőrzéssel járó tokenhelyettesítés és az AES-256-GCM titkosítás egyaránt olyan módon alakítja át a nyilvántartásokat, amely visszavonható. Egy tokennel helyettesített név visszaállítható egy keresési táblán keresztül. Az AES-256-GCM-tartalom a megfelelő kulccsal visszafejthető. Az eredeti szöveg elérhető marad.

Az AI-védelem szempontjából mindkét módszer azonosan működik. Az AI tokeneket dolgoz fel, és soha nem látja a valódi nyilvántartásokat.

A jogi kötelezettség szempontjából csak a visszafordítható token-maszkolás működik. Az egyirányú módszerek elvágják a visszanyerhetőséget, és létrehozzák a fentebb említett bizonyíték-megsemmisítési kockázatot.

Olvassa el, hogyan kezeli a tokenrendszerünk ezt végponttól végpontig. Mélyebb kontextusért lásd a szójegyzéket és a GYIK-et.

A kettős megfelelőségű tervezés

Egy olyan tervezés, amely megfelel mind az AI-biztonsági, mind a jogi közzétételi kötelezettségeknek, visszafordítható AES-256-GCM token-maszkolást alkalmaz:

A nyilvántartásokat feldolgozzák, mielőtt bármely AI-eszközhöz jutnak.
Az érzékeny elemeket – neveket, azonosítókat, PHI-t, kiváltságos tartalmat – strukturált tokenekkel helyettesítik.
A tokentérképet egy különálló tárolóban őrzik az adattípusnak megfelelő hozzáférési kontrollokkal.
Az AI-feldolgozás a token-másolaton fut. Az AI soha nem látja a valódi nyilvántartásokat.
Az eredményeket a tokentérkép segítségével állítják vissza a normál üzleti felhasználáshoz.
A tokentérképet jogi megőrzés alá helyezik, amikor a feltárási kötelezettségek beállnak.

E tervezés szerint egyetlen nyers tartalom sem vész el. Az AI-szolgáltató soha nem látja azt felhasználható formában. A tokentérkép lehetővé teszi a visszanyerést, amikor a jog megköveteli. A bizonyíték-megsemmisítési kockázat eltűnik – egyetlen nyilvántartás sem semmisül meg. Csupán olyan módon vannak maszkolva, amely visszavonható.

A GDPR 4. cikk (5) bekezdése teljesül: a kiegészítő kulcs (tokentérkép) megfelelő technikai és eljárásbeli biztosítékokkal külön van tárolva. A szövetségi szabályok megőrzési kötelezettsége teljesül: a nyers nyilvántartások visszaállíthatók, ha jogi megőrzés vonatkozik rájuk.

Ismerje meg az entitásfelismerési megközelítésünket, a védelmi áttekintőnket és a csomagokat és árakat a részletes tájékoztatásért.

A bináris választás

Az irodák egy egyértelmű elágazással szembesülnek:

Vélegesen eltávolítják az adatokat – megoldják az AI-kiszivárgás problémáját, de jogi kockázatot teremtenek.
Visszafordítható token-maszkolást alkalmaznak – egyszerre teljesítik a védelmi és a megfelelőségi szükségleteket.

A biztonsági döntést a 2,1 millió dolláros átlagos AI-adatvédelmi incidens-költség vezérli. De a bizonyíték-megsemmisítési szankciók sem olcsók. Nagy összegű pereknél a költségek ugyanolyan nagyságrendbe kerülhetnek. Mindkét kockázat megérdemel helyet a döntéshozatalban.

Egy megalapozott AI-politika mindkét véget lefedi. Megakadályozza, hogy érzékeny nyilvántartások felhasználható formában kerüljenek ki az irodából. Ugyanakkor ezeket a nyilvántartásokat elérhetővé teszi, amikor egy bíróság vagy szabályozó hatóság kéri azokat. A visszafordítható token-maszkolás az egyetlen módszer, amely egyszerre mindkettőt elvégzi.

Többi háttérinformációért lásd az alapítói nyilatkozatunkat és az esettanulmányainkat.

Források

Cyberhaven 2025. Q4: Adatkitettség az AI-eszközökben – link
IBM / Ponemon Institute: Az adatvédelmi incidensek költségéről szóló jelentés, 2024 – link
EDPB iránymutatások 05/2022 a pszeudoanonimizálásról – link
Szövetségi polgári perrendtartási szabályok, 37(e) szabály – link
E-Discovery LLC: Relevanciaalapú kitakarások és jogi szabványok – link

Kapcsolódó Cikkek

Jogi Technológia

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

Ingyenes Próbát Kezd Funkciók Megtekintése

Visszafordíthatatlan anonimizálás: a bizonyíték-megsemmisítés kockázata

Egy megoldás, két új kockázat

Az AI-megosztás mértéke

Szövetségi szabályok: a bizonyíték-megsemmisítési teszt

Visszafordítható vs. visszafordíthatatlan: a kulcskülönbség

Egyirányú: nincs visszaút

Visszafordítható: a helyreállítás lehetséges

A kettős megfelelőségű tervezés

A bináris választás

Források

Kapcsolódó Cikkek

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

Készen áll az adatai védelmére?

Visszafordíthatatlan anonimizálás: a bizonyíték-megsemmisítés kockázata

Egy megoldás, két új kockázat

Az AI-megosztás mértéke

GDPR: a visszafordíthatóság kötelező

Szövetségi szabályok: a bizonyíték-megsemmisítési teszt

Visszafordítható vs. visszafordíthatatlan: a kulcskülönbség

Egyirányú: nincs visszaút

Visszafordítható: a helyreállítás lehetséges

A kettős megfelelőségű tervezés

A bináris választás

Források

Kapcsolódó Cikkek

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

Készen áll az adatai védelmére?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow