Ked siet nema vystup
Datava vedkynja pracuje v obrannej firme. Ma 3 000 personalnych zaznamov. Potrebuje odstranit mena, rodné cisla a stupne utajenia. Potom moze zdielajt data s vyskumnym partnerom v ramci dohody CUI.
Jej siet nema internet. Schvalne.
Testuje kazdy webovy nastroj, ktory moze najst. Kazdy posiela data na externy server. Kazda cloudova platforma potrebuje ucet a zive pripojenie. Dokonca aj nastroje "on-premises" casto volaju vzdialeny licencny server.
Toto je problem nasadenia air-gapped. Postihuje omnoho viac timov, ako vacsina ludi ocakáva.
Kto potrebuje offline odstranovanie PII
Obranne firmy a vladne agentury s nim stretavaju najcastejsie. Program FedRAMP agentury DISA vyzaduje, aby data zostali v schvalenych sietovych hraniciach. ITAR obmedzuje technicke data na systemy pod kontrolou USA. Siete ako JWICS a SIPRNet su fyzicky izolované dizajnom.
Ale potreba offline presahuje utajovane lokality:
Nemocnice so segmentovanymi sietami. PACS systemy pre zobrazovanie, platformy EHR a vyskumne databazy casto sedia na sietach bez internetu na zaklade politiky.
Obchodne podlahy a zúčtovacie domy. Propriétarne obchodné systemy a systémy pripojene cez SWIFT pouzivaju prisne sietove oddelenia.
Priemyselné kontrolné systemy. SCADA siete a kriticka infrastruktura funguju s air-gap ako zakladnym bezpecnostnym opatrenim. Harden post-Stuxnet z toho spravil normu.
Europske datové pravidla. Nemecke Landesdatenschutzgesetze a podobné zakony EU vyzaduju miestne spracovanie dat pre citlive vladne a zdravotné zaznamy. Pokuta TikTok vo vyske 530 milionov eur za GDPR prisla v maji 2025. Pokryvala prenosy dat do Číny. Tata pokuta dotlacila viac timov k lokalnym nastrojom. Pozrite si nas prehlad suladnosti pre pravidla prevodu GDPR, ktore platia.
Preco cloudove nastroje zlyhavaju v air-gapped sietach
Vacsina nastrojov na odstranovanie dat nasleduje model SaaS:
Uzivatelske zariadenie -> HTTPS -> API dodavatela -> NLP modely -> Odpoved -> Uzivatelske zariadenie
Tento dizajn potrebuje pristup na internet v spracuvajucom zariadení. Potrebuje doveru v servery dodavatela. Znamena to, ze data prekracuju externe siete.
V air-gapped sieti je krok prvý fyzickou nemoznostou. Pre regulovane prostredia moze kazdy z krokov druhého az stvrtého porušovat pravidla suladnosti.
Self-hosted Presidio je bezny nahradeník. Ale potrebuje zrucnosti Docker a setup Pythonu. Potrebuje tiez stiahnutia modelov spaCy, ktore vyzaduju pristup na internet. A potrebuje priebeznu IT podporu. Vacsine timov chybaju vsetko toto.
Medzera medzi pohodlim cloudu a zlozitostou self-hosted je presne to, co vypinaju lokalne desktopove nastroje.
Ako funguje lokalne odstranovanie PII
Dobry offline nastroj prichádza so vsetkym, co potrebuje:
Zbaleném NLP modely. Modely spaCy (40-80 MB kazdy) a transformerové modely pre detekciu pomenovaných entit su súcastou instalaatora. Pocas behu nie je potrebné ziadne stiahnutie.
Lokalny detekčný pipeline. Regex, NLP a ML vsetky bežia na lokalnom CPU -- alebo GPU, ak je k dispozicii. Engine zalozeny na Presidio v anonym.legal nerobi pocas behu žiadne sietové volania.
Zasifrovany lokalny trezor. Konfigurácie, prednastavenia a kluce su uložene lokálne. Trezor pouziva sifrovanie AES-256-GCM a odvodenie klúča Argon2id. Žiadna cloudová synchronizácia. Žiadna vzdiálená záloha. Trezor zostáva v zariadení.
Lokalné I/O subor. Vstupne subory prichadzaju z lokalneho uloziska. Vystupne subory idú spat do lokalneho uloziska. Ziadne data neprekracia žiadne sietové rozhranie.
Maly útočný povrch. Desktopová aplikácia pouziva Tauri 2.0 (zalozeny na Rust). Tauri má omnoho menší útočný povrch ako nastroje Electron (zalozené na Chromium). Jeho binary je priblizne desatinu veľkosti. Tiez volá menej OS API v predvolenom nastavení.
Tri skutocne scenare suladnosti
ITAR dokumenty -- 500 suborov
Obranná firma potrebuje zdieľat technické dokumenty s externym partnerom v ramci vynimky licencie. Subory obsahuju mena americkich osob a personálne data. Oboje musi byť najprv odstranene.
Klucove potreby: spracovanie iba na oistených pracovnych staniciach. Žiadne data odoslane mimo cistenu siet. Auditný zaznam ukazujúci, ze praca bola vykonana. Hromadná podpora pre 500+ suborov.
Desktopová aplikácia spracuje vsetkych 500+ DOCX subor lokálne v hromadnom reźime. Počas behu nie je vykonané žiadne sietové volanie. Auditný log zostáva v lokalnom trezore. Vystup spĺňa potreby vynimky licencie ITAR.
Nemecka federálna agentúra -- Sťažnostné záznamy
Nemecka federálna agentúra musí odstraniť osobné udaje zo záznamov sťažností občanov. Potom pošle záznamy výskumnému inštitútu. Usmernenie BfDI zakazuje spracovanie na nevládnych systémoch.
Desktopová aplikácia beži na agentúrnych pracovných staniciach Windows 11. Všetko spracovanie je lokálne. IT bezpecnostný tím to potvrdzuje monitorovaním prevádzky -- žiadne vonkajšie pripojenia počas behu.
Nemocničný výskum -- De-ID EHR
Nemocničný výskumný tím potrebuje odstrániť záznamy pacientov pre klinickú skúšku. HIPAA Safe Harbor vyžaduje odstránenie 18 typov identifikátorov. Klinická sieť nemá prístup na internet.
Desktopová aplikácia zvláda hromadné spracovanie exportov EHR vo formáte CSV a JSON. Referent pre ochranu súkromia preskúma výstup podľa pravidiel Safe Harbor pred odoslaním datasetu výskumným partnerom.
Na čo hľadieť v offline nástroji
| Schopnosť | Prečo je dôležitá |
|---|---|
| Plne offline po inštalácii | Žiadna závislosť na internete počas spracovania |
| Zbalené NLP modely | Nie je potrebný krok stiahnutia |
| Hromadné spracovanie | Zvládajte veľké objemy bez manuálnej práce |
| Lokálny zašifrovaný trezor | Bezpečné uloženie konfigurácií a kľúčov |
| Auditný log | Záznamy potrebné pre kontroly súladu |
| Podpora Windows, macOS, Linux | Pokrýva typy utajovaných pracovných staníc |
| Možnosť bez telemetrie | Zastavte odchod údajov cez telemetriu |
| Podpora formátov súborov | DOCX, PDF, TXT, CSV, JSON, Excel |
Dátové pravidlá tlačia tímy k lokálnym nástrojom
Pokuta TikTok vo výške 530 miliónov eur spustila širšiu vlnu pokút. Tímy EÚ, ktoré používali cloudové nástroje, sa teraz pýtajú novú otázku. Spĺňa spracovanie na serveroch dodávateľa GDPR kapitolu V a národné dátové zákony?
Najčistejšia odpoveď na otázku "Kam idú vaše dáta?" je táto: nikam -- nikdy neopúšťajú zariadenie. Lokálne spracovanie plne odstráni otázku prenosu GDPR.
Pre nemecké tímy robí prísne čítanie DSGVO článkov 44-46 lokálne spracovanie múdrym krokom. Platí to aj bez prísnych sieťových obmedzení. Náš bezpečnostný prehľad vysvetľuje, ako lokálne spracovanie eliminuje reťazec dát tretích strán.
Praktické poznámky k nasadeniu
Inštalácia na air-gapped systémy. Inštalátor -- Windows .exe alebo .msi, macOS .dmg, Linux .AppImage alebo .deb -- sa prenesie do air-gapped siete cez USB alebo bezpečný prenos súborov. Internet nie je po inštalácii potrebný.
Jazyková podpora. So aplikáciou sa dodáva 24 jazykovo špecifických modelov. Celá sada je dostupná offline bez ďalšieho stiahnutia.
Hardvérové požiadavky. Pipeline NLP beží na moderných pracovných staniciach bez GPU. Hromadné spracovanie 1 000 dokumentov zvyčajne trvá 5-15 minút. Rýchlosť závisí od veľkosti dokumentu a rýchlosti CPU.
Offline nastavenie licencie. Pre siete, kde je licenčný server nedostupný, je k dispozícii offline nastavenie licencie.
Kedy nie je air-gapping tou správnou voľbou
Air-gapped systémy riešia špecifické problémy. Tiež pridávajú reálnu záťaž.
Trenie s aktualizáciami. Udržiavanie modelov a softvéru v aktuálnom stave vyžaduje manuálne kroky. Tímy, ktoré zaostávajú, môžu prehliadnuť nové vzory PII.
Prepojovacie náklady. Air-gapped systémy sa nemôžu pripojiť ku cloudovým SIEM nástrojom alebo vzdialeným auditným dashboardom. Sú potrebné vlastné riešenia s dátovou diódou. To zvyšuje náklady.
Kompromisy v presnosti. Cloudové nástroje priebežne aktualizujú tréningové dáta. Offline modely sú snímka. Môžu zaostávať voči novým jazykovým vzorom v priebehu času.
Nie je potrebné pre každý model hrozby. Tímy bez vládnych, zdravotných alebo právnych mandátov môžu nájsť cloudové nástroje praktickejšími. Silné šifrovanie, audity SOC 2 Type II a dohody o spracovaní údajov pokrývajú väčšinu prípadov. Air-gapping sa oplatí iba vtedy, keď model hrozby skutočne zahŕňa sieťovú krádež dát skúseným protivníkom.
Pre väčšinu malých a stredných podnikov a štandardné podnikové tímy poskytuje silné šifrovanie počas prenosu a v pokoji primeranú ochranu. Pridajte pevné zmluvné kontroly a pokryjete väčšinu prípadov použitia -- bez záťaže úplného air-gappingu. Pozrite si náš FAQ pre viac o výbere správneho modelu nasadenia.
Desktopová aplikácia anonym.legal (Windows, macOS, Linux) spracováva PII úplne lokálne s balíčkovými NLP modelmi. Po inštalácii nie je potrebné internetové pripojenie. Hromadné spracovanie podporuje 1-5 000 súborov na beh v závislosti od úrovne plánu.