A felhőeszközök által megoldhatatlan probléma
Egy adattudós egy védelmi vállalkozónál 3 000 személyzeti nyilvántartással rendelkezik. Anonimizálnia kell a neveket, Társadalombiztosítási számokat és biztonsági engedélyszinteket, mielőtt az adathalmazt egy egyetemi kutatópartnerrel megoszt egy ellenőrzött nem titkosított információ (CUI) megállapodás keretében.
Hálózata nem rendelkezik internet-hozzáféréssel. Szándékosan.
Minden webalapú anonimizálási eszköz, amelyet értékel, adatok küldését igényli egy külső API-hoz. Minden vállalati SaaS-platform fiókregisztrációt és felhőkapcsolatot igényel. Még az „on-premises" eszközök is gyakran olyan licencszervereket igényelnek, amelyek időszakos internet-hívásokat végeznek.
Ez a légréses telepítési probléma – és sokkal több szervezetet érint, mint az egyértelműen szűk „minősített kormányzat" értelmezés sugallja.
Kinek van szüksége offline-first feldolgozásra
Védelmi vállalkozók és kormányzati ügynökségek a legnyilvánvalóbb kategória. A DISA FedRAMP követelményei megkövetelik az adatfeldolgozást engedélyezett határokon belül. Az ITAR korlátozza a technikai adatok küldését az Egyesült Államokon kívülre, beleértve a felhő infrastruktúrát is, amely előfordulhat, hogy nem USA-n belüli csomópontokon dolgozza fel az adatokat.
Egészségügyi rendszerek szigorú CISO-politikákkal egyre inkább offline feldolgozást igényelnek a PHI esetén. Ahogy a 2024-es Change Healthcare incidens megmutatta – 3,1 milliárd dolláros kár, 192 millió érintett nyilvántartás –, a PHI hálózati kitettsége egzisztenciális vállalati kockázatot jelent.
Pénzügyi intézmények zárt hálózatokon – tőzsdei kereskedési padlók, kockázatkezelő rendszerek, titkosítási infrastruktúra – feldolgozzák a PII-t, amely soha nem hagyhatja el a belső hálózatot.
Szabályozott iparágak adatszuverenitási mandátumokkal európai, kínai és indiai keretrendszerekben előírhatják, hogy az adatfeldolgozás fizikailag azon a területen belül maradjon, ahol az adatok keletkeztek – ami elvileg kizárja az USA-ban tárolt felhőszolgáltatásokat.
Az offline-first anonimizálás technikai architektúrája
Az anonym.legal Asztali Alkalmazás a következő architektúrán alapul:
Helyi feldolgozó motor
- Python alapú Presidio motor lokálisan csomagolva
- spaCy modellek minden telepített nyelvhez helyi fájlrendszerből betöltve
- Internetkapcsolat nélkül futó regex minták
- Testreszabható entitásprofil az egyes szervezeti igényekhez
Nincs adatküldés
- A szöveg soha nem hagyja el az eszközt
- Az NER-feldolgozás helyi CPU-n/GPU-n fut
- A tokenizációs leképezés helyi memóriában marad
- A napló-bejegyzések csak a helyi fájlrendszerre kerülnek
Kötegelt feldolgozás offline
- Dolgozza fel a teljes dokumentumgyűjteményt
- Exportálja az anonimizált outputot helyi mappákba
- Generáljon ellenőrzési nyomvonalakat internet nélkül
- Több helyi felhasználó párhuzamos feldolgozása
A Vault-architektúra biztonsági modellje
Az anonym.legal asztali alkalmazás BIP39 titkosított vault-ot használ a titkosítási kulcsok helyi tárolásához:
Felhasználói jelszó → Argon2id kulcslevezetés → AES-256-GCM titkosítás
↓
Helyi vault
(nincs felhőszinkron)
Ez azt jelenti:
- A titkosítási kulcsok soha nem hagyják el az eszközt
- Nincs szállítói szerverszinkronizáció a kulcs-metaadatokhoz
- Az adatokhoz való hozzáférés az eszközbe ágyazott hardver-biztonságon múlik
- Nincs szállítói jelszó-visszaállítás (szándékos korlátozás)
Megfelelőségi keretrendszerek az offline feldolgozáshoz
ITAR (Fegyverkereskedelmi forgalmi szabályozás)
Az ITAR megakadályozza a „védelmi cikkek", beleértve a személyzeti adatokat és a technikai dokumentációt, exportálását engedély nélkül. A felhőalapú feldolgozás valójában exportálhat adatokat, ha a felhő infrastruktúra a határokon kívül van.
FedRAMP
A szövetségi felhőalapú autorizáció alapja megköveteli az USA FedRAMP High-nak megfelelő feldolgozást. Sok felhőszolgáltató nem rendelkezik ezzel az engedéllyel.
GDPR adatszuverenitás
Az adattovábbításra vonatkozó 44-49. cikkek az EU-on kívüli adatátvitelt korlátozhatják. A helyi feldolgozás strukturálisan eleget tesz ennek.
Következtetés
A légréses PII-anonimizálás nem szűk niche – ez az alapvető követelménye sok szervezetnek, amely a legérzékenyebb adatokat kezeli.
Az anonym.legal Asztali Alkalmazás ezt natívan valósítja meg: valódi helyi feldolgozás, nincs felhőfüggőség, vállalati szintű biztonsági modell.