A légréses szabály
Néhány hálózatnak nincs internet-hozzáférése. Nem szabályzat miatt — hanem tervezésből adódóan.
Egy SCIF (Sensitive Compartmented Information Facility, vagyis Titkos Szegmentált Információs Létesítmény) egy Faraday-ketreccel ellátott helyiség. Sem be, sem ki nem tud jutni semmilyen vezetéknélküli jel. Az ITAR (International Traffic in Arms Regulations, vagyis a Fegyverek Nemzetközi Forgalmáról szóló Szabályozás) megtiltja a szabályozás alá eső műszaki tartalom jóvá nem hagyott feleknek való átadását. A felhőszolgáltatók nem rendelkeznek ITAR-engedéllyel. Ezen csoportok számára a „felhő-SaaS” nem egy kezelendő kockázat — eleve nem jöhet szóba.
Ezeken a telephelyeken a felhőalapú eszközök nem működnek. Pont.
Egy élő hálózati kapcsolatot igénylő eszköz itt nem tud futni. Egy licencszerver-hívást indító eszközt blokkolnak. Egy olyan eszköz, amely a felismeréshez fájlokat küld egy felhőalapú API-ra, SCIF-ben nem tud működni. Ezek nem szélsőséges esetek. Ezek a védelmi csapatok napi korlátai.
Az ITAR-eset
Egy védelmi cég adattudósa ITAR-hatálya alá tartozó személyzeti nyilvántartásokkal rendelkezik. A fájlok megosztása előtt el kell távolítania a neveket és az azonosítókat. A hálózata légréses.
Nincs felhőalapú megoldás. Az egyetlen út egy helyi eszközön futó megoldás. A modelleket helyben kell tárolni. Tiszta kimenetet kell előállítani külső hívások nélkül.
A Tauri 2.0 alapú asztali alkalmazás ezt teszi. A telepítés után a futtatás során nem történik hálózati kommunikáció. A spaCy NER-modellek és a reguláris kifejezési minták mind a helyi processzoron futnak. A kimenet a készüléken marad, amíg a felhasználó exportálja.
Miért fontos a visszafordíthatóság?
A minősített munkához gyakran visszafordítható álnevesítésre van szükség. A csapatok valódi neveket kódokra cserélnek. Az adatok hasznosak maradnak. A valódi személyazonosságok védelmet kapnak.
A GDPR 4. cikk (5) bekezdése az álnevesítést formális adatvédelmi intézkedésként határozza meg. Csökkenti a kockázatot. Az álnevesített nyilvántartások kevesebb jogi kötelezettséget hordoznak — ha a keresési tokent az adathalmaztól elkülönítve tárolják.
Az IAPP 2024-es kutatása szerint az eszközök mindössze 23%-a támogat valódi visszafordíthatóságot. A legtöbb egyirányú maszkolást vagy teljes cserét végez. Ha egyszer egy nyilvántartást felülírtak, az örökre elveszett.
Néhány kormányzati csapat rekesz szerint osztja fel a munkáját. Az egyik csapat megkapja az álnevesített fájlokat. Elvégzi az elemzést. A második csapat tartja a keresési tokent. Csak akkor azonosítja vissza a nyilvántartásokat, ha a jog megköveteli. Ez az elosztott tervezés az egyetlen biztonságos megközelítés a több csapatot érintő minősített munkafolyamatokhoz.
A nulla ismeretű modell még egy lépéssel tovább megy. A keresési token az ügyfél eszközén jön létre. Soha nem kerül ki. Ha a szállítót bírósági végzés alapján bevonják, nem tudja átadni a tokent. Soha nem is volt nála. Ez teljesíti a lánc-felügyeleti szabályokat sok minősített környezetben.
Az EDPB token-szétválasztás
Az EDPB 05/2022-es iránymutatása kimondja, hogy az álnevesítési tokent elkülönítve kell tárolni. Nem lehet ugyanannál a félnél, amely az álnevesített nyilvántartásokat is tartja. Vagy olyan vezérlők mögé kell zárni, amelyek megakadályozzák, hogy ez a fél egyszerre olvassa a nyilvántartásokat és a tokent.
Három dolog együtt teljesíti ezt a szabályt:
- Az ügyfél eszközén létrehozott token — soha nem kerül ki
- Minden feldolgozás helyben történik — semmi nem hagyja el a légréses telephelyet
- A kimenet és a token külön exportálódik — két külön fájl, két külön útvonal
Ez a tervezés egyszerre teljesíti az EDPB szabályt és a légréses korlátot.
A teljes képért a biztonsági áttekintésünk bemutatja, hogyan csökkenti a helyi feldolgozás a harmadik feles láncot. A megfelelőségi útmutatónk lefedi a GDPR-átviteli szabályokat. Beállítási segítségért tekintse meg a GYIK-et.
Az anonym.legal asztali alkalmazás minden PII-felismerést a helyi eszközön végez. A telepítés után nem szükséges internet. Windows, macOS és Linux rendszereken egyaránt fut. A beágyazott NLP-modellek 24 nyelvet fednek le.
2026-ra frissítve
Források
- EDPB 05/2022-es iránymutatás: Álnevesítés és token-szétválasztás — ELLENŐRZÖTT-KÜLSŐ
- IAPP 2024: Anonimizálási eszközök visszafordíthatósági felmérése — JELZETT
- LocalAI Master: Légréses MI érzékeny környezetekhez — ELLENŐRZÖTT-KÜLSŐ