Když síť nemá žádný výstup
Datová vědkyně pracuje v obranné firmě. Má 3 000 personálních záznamů. Potřebuje z nich odstranit jména, čísla sociálního pojištění a bezpečnostní clearance. Poté může data sdílet s výzkumným partnerem v rámci dohody CUI.
Její síť nemá přístup k internetu. Záměrně.
Otestuje každý webový nástroj, který najde. Každý odesílá data na externí server. Každá cloudová platforma vyžaduje účet a živé připojení. I nástroje on-premises často volají vzdálený licenční server.
Toto je problém vzduchově izolovaných sítí. Zasahuje mnohem více týmů, než by většina lidí čekala.
Kdo potřebuje offline odstraňování PII
Obranné firmy a vládní agentury se s tím setkávají nejčastěji. Program FedRAMP DISA vyžaduje, aby data zůstávala v rámci schválených síťových hranic. ITAR omezuje technická data na systémy pod kontrolou USA. Sítě jako JWICS a SIPRNet jsou fyzicky odpojeny záměrně.
Potřeba offline zpracování však jde daleko za hranice utajovaných pracovišť:
Nemocnice se segmentovanými sítěmi. Zobrazovací systémy PACS, platformy EHR a výzkumné databáze často fungují v sítích bez internetu.
Obchodní parketová patra a clearinghouses. Proprietární obchodní systémy a systémy připojené k SWIFT používají přísná síťová oddělení.
Průmyslové řídicí systémy. Sítě SCADA a kritická infrastruktura fungují s vzduchovou izolací jako základním bezpečnostním opatřením. Post-Stuxnetové zpevnění z toho učinilo normu.
Evropská datová pravidla. Německé Landesdatenschutzgesetze a podobné zákony EU vyžadují lokální zpracování dat pro citlivé vládní a zdravotní záznamy. Pokuta TikTok 530 milionů eur (GDPR) přišla v květnu 2025. Pokrývala přenosy dat do Číny. Tato pokuta přiměla více týmů k přechodu na lokální nástroje. Viz náš přehled shody pro přenosová pravidla GDPR.
Proč cloudové nástroje selhávají ve vzduchově izolovaných sítích
Většina nástrojů pro odstranění dat funguje na modelu SaaS:
Uživatelské zařízení → HTTPS → API dodavatele → NLP modely → Odpověď → Uživatelské zařízení
Tento design vyžaduje přístup k internetu na zpracovávajícím zařízení. Vyžaduje důvěru v servery dodavatele. Data opouštějí interní sítě.
Ve vzduchově izolované síti je krok jedna fyzicky nemožný. V regulovaných prostředích mohou kroky dvě až čtyři každý porušit pravidla shody.
Self-hostovaný Presidio je běžnou záložní variantou. Vyžaduje ale znalosti Dockeru a nastavení Pythonu. Také potřebuje stahování modelů spaCy, které vyžaduje přístup k internetu. A potřebuje průběžnou IT podporu. Většina týmů tohle vše postrádá.
Mezera mezi snadností cloudu a složitostí self-hostovaných řešení je přesně to, co místní desktopové nástroje zaplňují.
Jak funguje lokální odstraňování PII
Dobrý offline nástroj dodává vše, co potřebuje:
Přibalené NLP modely. Modely spaCy (40–80 MB každý) a transformerové modely pro detekci pojmenovaných entit jsou součástí instalátoru. Při spuštění není potřeba žádné stahování.
Lokální pipeline pro detekci. Regex, NLP a ML běží na lokálním procesoru — nebo GPU, je-li k dispozici. Engine založený na Presidiu uvnitř anonym.legal neprovádí žádná síťová volání při běhu.
Lokálně šifrovaný trezor. Konfigurace, přednastavení a klíče jsou uloženy lokálně. Trezor používá šifrování AES-256-GCM a derivaci klíčů Argon2id. Žádná synchronizace s cloudem. Žádná vzdálená záloha. Trezor zůstává na zařízení.
Lokální vstup/výstup souborů. Vstupní soubory pocházejí z lokálního úložiště. Výstupní soubory se vracejí do lokálního úložiště. Žádná data nepřekračují žádné síťové rozhraní.
Malá útočná plocha. Desktopová aplikace používá Tauri 2.0 (na bázi Rust). Tauri má výrazně menší útočnou plochu než nástroje na bázi Electronu (Chromium). Jeho binární soubor je přibližně desetkrát menší. Také standardně volá méně OS API.
Tři reálné compliance scénáře
ITAR dokumenty — 500 souborů
Obranná firma potřebuje sdílet technické dokumenty se zahraničním partnerem na základě výjimky z licence. Soubory obsahují jména amerických osob a personální data. Oboje musí být nejprve odstraněno.
Klíčové požadavky: zpracování pouze na prověřených pracovních stanicích. Žádná data odeslaná mimo prověřenou síť. Auditní záznam prokazující provedení práce. Dávková podpora pro 500+ souborů.
Desktopová aplikace zpracuje všech 500+ souborů DOCX lokálně v dávkovém režimu. Během běhu není provedeno žádné síťové volání. Auditní log zůstává v lokálním trezoru. Výstup splňuje požadavky výjimky z licence ITAR.
Německá federální agentura — záznamy stížností
Německá federální agentura musí odstranit osobní údaje ze záznamů stížností občanů. Poté záznamy zasílá výzkumnému ústavu. Pokyny BfDI zakazují zpracování na systémech mimo vládu.
Desktopová aplikace funguje na pracovních stanicích agentury s Windows 11. Veškeré zpracování je lokální. IT bezpečnostní tým to potvrdí monitorováním provozu — během běhu není zaznamáno žádné vnější připojení.
Nemocniční výzkum — de-identifikace EHR
Výzkumný tým nemocnice potřebuje anonymizovat záznamy pacientů pro klinickou studii. HIPAA Safe Harbor vyžaduje odstranění 18 typů identifikátorů. Klinická síť nemá přístup k internetu.
Desktopová aplikace zpracovává dávkové exporty EHR ve formátech CSV a JSON. Správce ochrany soukromí zkontroluje výstup podle pravidel Safe Harbor před předáním datasetu výzkumným partnerům.
Co hledat v offline nástroji
| Schopnost | Proč je důležitá |
|---|---|
| Plně offline po instalaci | Žádná závislost na internetu při zpracování |
| Přibalené NLP modely | Žádný krok stahování |
| Dávkové zpracování | Zvládání velkých objemů bez ruční práce |
| Lokálně šifrovaný trezor | Bezpečné úložiště konfigurací a klíčů |
| Auditní log | Záznamy potřebné pro compliance přezkumy |
| Podpora Windows, macOS, Linux | Pokrývá typy prověřených pracovních stanic |
| Možnost bez telemetrie | Zabraňuje odchodu dat přes telemetrii |
| Podpora formátů souborů | DOCX, PDF, TXT, CSV, JSON, Excel |
Datová pravidla tlačí týmy k lokálním nástrojům
Pokuta TikTok 530 milionů eur spustila širší vlnu pokut. Týmy v EU, které používaly cloudové nástroje, si nyní kladou novou otázku: splňuje zpracování na serverech dodavatele kapitolu V GDPR a národní datové zákony?
Nejčistší odpovědí na otázku kde vaše data skončí je: nikde — nikdy neopustí zařízení. Lokální zpracování zcela eliminuje otázku přenosu GDPR.
Pro německé týmy dělá přísný výklad článků 44–46 DSGVO lokální zpracování rozumnou volbou. To platí i bez přísných síťových omezení. Náš přehled zabezpečení vysvětluje, jak lokální zpracování eliminuje řetězec dat třetích stran.
Praktické poznámky k nasazení
Instalace na vzduchově izolované systémy. Instalátor — Windows .exe nebo .msi, macOS .dmg, Linux .AppImage nebo .deb — se přenáší do vzduchově izolované sítě přes USB nebo zabezpečený přenos souborů. Po instalaci internet není potřeba.
Jazyková podpora. 24 jazykově specifických modelů je součástí aplikace. Kompletní sada je dostupná offline bez dalšího stahování.
Hardwarové požadavky. NLP pipeline běží na moderních pracovních stanicích bez GPU. Dávkové zpracování 1 000 dokumentů obvykle trvá 5–15 minut. Rychlost závisí na velikosti dokumentu a rychlosti procesoru.
Offline nastavení licence. Pro sítě, kde licenční server není dostupný, je k dispozici offline nastavení licence.
Kdy vzduchová izolace není správnou volbou
Vzduchově izolované systémy řeší konkrétní problémy. Také přinášejí reálnou zátěž.
Tření při aktualizacích. Udržování modelů a softwaru aktuálního vyžaduje manuální kroky. Týmy, které zaostávají, mohou přehlédnout nové vzory PII.
Overhead propojení. Vzduchově izolované systémy se nemohou připojit ke cloudovým nástrojům SIEM nebo vzdáleným auditním dashboardům. Jsou potřeba vlastní řešení s datovými diodami. To zvyšuje náklady.
Kompromisy v přesnosti. Cloudové nástroje průběžně aktualizují trénovací data. Offline modely jsou snímek v čase. Mohou časem zaostávat za novými jazykovými vzory.
Není potřeba pro každý model hrozby. Týmy bez vládních, zdravotních nebo právních mandátů mohou cloudové nástroje považovat za praktičtější. Silné šifrování, audity SOC 2 Type II a smlouvy o zpracování dat pokrývají většinu případů. Vzduchová izolace se vyplatí pouze tehdy, když model hrozby skutečně zahrnuje síťovou krádež dat kvalifikovaným protivníkem.
Pro většinu malých a středních podniků a standardní podnikové týmy poskytuje silné šifrování při přenosu i v klidu dostatečnou ochranu. Přidejte solidní smluvní kontroly a pokryjete většinu případů — bez overhead plné vzduchové izolace. Viz FAQ pro výběr správného modelu nasazení.
Desktopová aplikace anonym.legal (Windows, macOS, Linux) zpracovává PII zcela lokálně s přibalenými NLP modely. Po instalaci není vyžadováno žádné připojení k internetu. Dávkové zpracování podporuje 1–5 000 souborů za běh v závislosti na úrovni plánu.