Vissza a BlograTechnikai

Légréses PII-anonimizálás: Miért van szüksége a...

A vállalati biztonsági politikák 41%-a megtiltja a minősített dokumentumok felhőalapú feldolgozását.

March 3, 20268 perc olvasás
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

A felhőeszközök által megoldhatatlan probléma

Egy adattudós egy védelmi vállalkozónál 3 000 személyzeti nyilvántartással rendelkezik. Anonimizálnia kell a neveket, Társadalombiztosítási számokat és biztonsági engedélyszinteket, mielőtt az adathalmazt egy egyetemi kutatópartnerrel megoszt egy ellenőrzött nem titkosított információ (CUI) megállapodás keretében.

Hálózata nem rendelkezik internet-hozzáféréssel. Szándékosan.

Minden webalapú anonimizálási eszköz, amelyet értékel, adatok küldését igényli egy külső API-hoz. Minden vállalati SaaS-platform fiókregisztrációt és felhőkapcsolatot igényel. Még az „on-premises" eszközök is gyakran olyan licencszervereket igényelnek, amelyek időszakos internet-hívásokat végeznek.

Ez a légréses telepítési probléma – és sokkal több szervezetet érint, mint az egyértelműen szűk „minősített kormányzat" értelmezés sugallja.

Kinek van szüksége offline-first feldolgozásra

Védelmi vállalkozók és kormányzati ügynökségek a legnyilvánvalóbb kategória. A DISA FedRAMP követelményei megkövetelik az adatfeldolgozást engedélyezett határokon belül. Az ITAR korlátozza a technikai adatok küldését az Egyesült Államokon kívülre, beleértve a felhő infrastruktúrát is, amely előfordulhat, hogy nem USA-n belüli csomópontokon dolgozza fel az adatokat.

Egészségügyi rendszerek szigorú CISO-politikákkal egyre inkább offline feldolgozást igényelnek a PHI esetén. Ahogy a 2024-es Change Healthcare incidens megmutatta – 3,1 milliárd dolláros kár, 192 millió érintett nyilvántartás –, a PHI hálózati kitettsége egzisztenciális vállalati kockázatot jelent.

Pénzügyi intézmények zárt hálózatokon – tőzsdei kereskedési padlók, kockázatkezelő rendszerek, titkosítási infrastruktúra – feldolgozzák a PII-t, amely soha nem hagyhatja el a belső hálózatot.

Szabályozott iparágak adatszuverenitási mandátumokkal európai, kínai és indiai keretrendszerekben előírhatják, hogy az adatfeldolgozás fizikailag azon a területen belül maradjon, ahol az adatok keletkeztek – ami elvileg kizárja az USA-ban tárolt felhőszolgáltatásokat.

Az offline-first anonimizálás technikai architektúrája

Az anonym.legal Asztali Alkalmazás a következő architektúrán alapul:

Helyi feldolgozó motor

  • Python alapú Presidio motor lokálisan csomagolva
  • spaCy modellek minden telepített nyelvhez helyi fájlrendszerből betöltve
  • Internetkapcsolat nélkül futó regex minták
  • Testreszabható entitásprofil az egyes szervezeti igényekhez

Nincs adatküldés

  • A szöveg soha nem hagyja el az eszközt
  • Az NER-feldolgozás helyi CPU-n/GPU-n fut
  • A tokenizációs leképezés helyi memóriában marad
  • A napló-bejegyzések csak a helyi fájlrendszerre kerülnek

Kötegelt feldolgozás offline

  • Dolgozza fel a teljes dokumentumgyűjteményt
  • Exportálja az anonimizált outputot helyi mappákba
  • Generáljon ellenőrzési nyomvonalakat internet nélkül
  • Több helyi felhasználó párhuzamos feldolgozása

A Vault-architektúra biztonsági modellje

Az anonym.legal asztali alkalmazás BIP39 titkosított vault-ot használ a titkosítási kulcsok helyi tárolásához:

Felhasználói jelszó → Argon2id kulcslevezetés → AES-256-GCM titkosítás
                                                    ↓
                                               Helyi vault
                                           (nincs felhőszinkron)

Ez azt jelenti:

  • A titkosítási kulcsok soha nem hagyják el az eszközt
  • Nincs szállítói szerverszinkronizáció a kulcs-metaadatokhoz
  • Az adatokhoz való hozzáférés az eszközbe ágyazott hardver-biztonságon múlik
  • Nincs szállítói jelszó-visszaállítás (szándékos korlátozás)

Megfelelőségi keretrendszerek az offline feldolgozáshoz

ITAR (Fegyverkereskedelmi forgalmi szabályozás)

Az ITAR megakadályozza a „védelmi cikkek", beleértve a személyzeti adatokat és a technikai dokumentációt, exportálását engedély nélkül. A felhőalapú feldolgozás valójában exportálhat adatokat, ha a felhő infrastruktúra a határokon kívül van.

FedRAMP

A szövetségi felhőalapú autorizáció alapja megköveteli az USA FedRAMP High-nak megfelelő feldolgozást. Sok felhőszolgáltató nem rendelkezik ezzel az engedéllyel.

GDPR adatszuverenitás

Az adattovábbításra vonatkozó 44-49. cikkek az EU-on kívüli adatátvitelt korlátozhatják. A helyi feldolgozás strukturálisan eleget tesz ennek.

Következtetés

A légréses PII-anonimizálás nem szűk niche – ez az alapvető követelménye sok szervezetnek, amely a legérzékenyebb adatokat kezeli.

Az anonym.legal Asztali Alkalmazás ezt natívan valósítja meg: valódi helyi feldolgozás, nincs felhőfüggőség, vállalati szintű biztonsági modell.

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.