By · Last updated 2026-03-03

Zpět na blogTechnické

Vzduchově izolované sítě: Offline-first anonymizace PII pro obranu

41 % podnikových bezpečnostních politik zakazuje cloudové zpracování utajovaných dokumentů. Zde je postup, jak zvládnout anonymizaci PII bez přístupu k internetu.

March 3, 20268 min čtení
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Když síť nemá žádný výstup

Datová vědkyně pracuje v obranné firmě. Má 3 000 personálních záznamů. Potřebuje z nich odstranit jména, čísla sociálního pojištění a bezpečnostní clearance. Poté může data sdílet s výzkumným partnerem v rámci dohody CUI.

Její síť nemá přístup k internetu. Záměrně.

Otestuje každý webový nástroj, který najde. Každý odesílá data na externí server. Každá cloudová platforma vyžaduje účet a živé připojení. I nástroje on-premises často volají vzdálený licenční server.

Toto je problém vzduchově izolovaných sítí. Zasahuje mnohem více týmů, než by většina lidí čekala.

Kdo potřebuje offline odstraňování PII

Obranné firmy a vládní agentury se s tím setkávají nejčastěji. Program FedRAMP DISA vyžaduje, aby data zůstávala v rámci schválených síťových hranic. ITAR omezuje technická data na systémy pod kontrolou USA. Sítě jako JWICS a SIPRNet jsou fyzicky odpojeny záměrně.

Potřeba offline zpracování však jde daleko za hranice utajovaných pracovišť:

Nemocnice se segmentovanými sítěmi. Zobrazovací systémy PACS, platformy EHR a výzkumné databáze často fungují v sítích bez internetu.

Obchodní parketová patra a clearinghouses. Proprietární obchodní systémy a systémy připojené k SWIFT používají přísná síťová oddělení.

Průmyslové řídicí systémy. Sítě SCADA a kritická infrastruktura fungují s vzduchovou izolací jako základním bezpečnostním opatřením. Post-Stuxnetové zpevnění z toho učinilo normu.

Evropská datová pravidla. Německé Landesdatenschutzgesetze a podobné zákony EU vyžadují lokální zpracování dat pro citlivé vládní a zdravotní záznamy. Pokuta TikTok 530 milionů eur (GDPR) přišla v květnu 2025. Pokrývala přenosy dat do Číny. Tato pokuta přiměla více týmů k přechodu na lokální nástroje. Viz náš přehled shody pro přenosová pravidla GDPR.

Proč cloudové nástroje selhávají ve vzduchově izolovaných sítích

Většina nástrojů pro odstranění dat funguje na modelu SaaS:

Uživatelské zařízení → HTTPS → API dodavatele → NLP modely → Odpověď → Uživatelské zařízení

Tento design vyžaduje přístup k internetu na zpracovávajícím zařízení. Vyžaduje důvěru v servery dodavatele. Data opouštějí interní sítě.

Ve vzduchově izolované síti je krok jedna fyzicky nemožný. V regulovaných prostředích mohou kroky dvě až čtyři každý porušit pravidla shody.

Self-hostovaný Presidio je běžnou záložní variantou. Vyžaduje ale znalosti Dockeru a nastavení Pythonu. Také potřebuje stahování modelů spaCy, které vyžaduje přístup k internetu. A potřebuje průběžnou IT podporu. Většina týmů tohle vše postrádá.

Mezera mezi snadností cloudu a složitostí self-hostovaných řešení je přesně to, co místní desktopové nástroje zaplňují.

Jak funguje lokální odstraňování PII

Dobrý offline nástroj dodává vše, co potřebuje:

Přibalené NLP modely. Modely spaCy (40–80 MB každý) a transformerové modely pro detekci pojmenovaných entit jsou součástí instalátoru. Při spuštění není potřeba žádné stahování.

Lokální pipeline pro detekci. Regex, NLP a ML běží na lokálním procesoru — nebo GPU, je-li k dispozici. Engine založený na Presidiu uvnitř anonym.legal neprovádí žádná síťová volání při běhu.

Lokálně šifrovaný trezor. Konfigurace, přednastavení a klíče jsou uloženy lokálně. Trezor používá šifrování AES-256-GCM a derivaci klíčů Argon2id. Žádná synchronizace s cloudem. Žádná vzdálená záloha. Trezor zůstává na zařízení.

Lokální vstup/výstup souborů. Vstupní soubory pocházejí z lokálního úložiště. Výstupní soubory se vracejí do lokálního úložiště. Žádná data nepřekračují žádné síťové rozhraní.

Malá útočná plocha. Desktopová aplikace používá Tauri 2.0 (na bázi Rust). Tauri má výrazně menší útočnou plochu než nástroje na bázi Electronu (Chromium). Jeho binární soubor je přibližně desetkrát menší. Také standardně volá méně OS API.

Tři reálné compliance scénáře

ITAR dokumenty — 500 souborů

Obranná firma potřebuje sdílet technické dokumenty se zahraničním partnerem na základě výjimky z licence. Soubory obsahují jména amerických osob a personální data. Oboje musí být nejprve odstraněno.

Klíčové požadavky: zpracování pouze na prověřených pracovních stanicích. Žádná data odeslaná mimo prověřenou síť. Auditní záznam prokazující provedení práce. Dávková podpora pro 500+ souborů.

Desktopová aplikace zpracuje všech 500+ souborů DOCX lokálně v dávkovém režimu. Během běhu není provedeno žádné síťové volání. Auditní log zůstává v lokálním trezoru. Výstup splňuje požadavky výjimky z licence ITAR.

Německá federální agentura — záznamy stížností

Německá federální agentura musí odstranit osobní údaje ze záznamů stížností občanů. Poté záznamy zasílá výzkumnému ústavu. Pokyny BfDI zakazují zpracování na systémech mimo vládu.

Desktopová aplikace funguje na pracovních stanicích agentury s Windows 11. Veškeré zpracování je lokální. IT bezpečnostní tým to potvrdí monitorováním provozu — během běhu není zaznamáno žádné vnější připojení.

Nemocniční výzkum — de-identifikace EHR

Výzkumný tým nemocnice potřebuje anonymizovat záznamy pacientů pro klinickou studii. HIPAA Safe Harbor vyžaduje odstranění 18 typů identifikátorů. Klinická síť nemá přístup k internetu.

Desktopová aplikace zpracovává dávkové exporty EHR ve formátech CSV a JSON. Správce ochrany soukromí zkontroluje výstup podle pravidel Safe Harbor před předáním datasetu výzkumným partnerům.

Co hledat v offline nástroji

SchopnostProč je důležitá
Plně offline po instalaciŽádná závislost na internetu při zpracování
Přibalené NLP modelyŽádný krok stahování
Dávkové zpracováníZvládání velkých objemů bez ruční práce
Lokálně šifrovaný trezorBezpečné úložiště konfigurací a klíčů
Auditní logZáznamy potřebné pro compliance přezkumy
Podpora Windows, macOS, LinuxPokrývá typy prověřených pracovních stanic
Možnost bez telemetrieZabraňuje odchodu dat přes telemetrii
Podpora formátů souborůDOCX, PDF, TXT, CSV, JSON, Excel

Datová pravidla tlačí týmy k lokálním nástrojům

Pokuta TikTok 530 milionů eur spustila širší vlnu pokut. Týmy v EU, které používaly cloudové nástroje, si nyní kladou novou otázku: splňuje zpracování na serverech dodavatele kapitolu V GDPR a národní datové zákony?

Nejčistší odpovědí na otázku kde vaše data skončí je: nikde — nikdy neopustí zařízení. Lokální zpracování zcela eliminuje otázku přenosu GDPR.

Pro německé týmy dělá přísný výklad článků 44–46 DSGVO lokální zpracování rozumnou volbou. To platí i bez přísných síťových omezení. Náš přehled zabezpečení vysvětluje, jak lokální zpracování eliminuje řetězec dat třetích stran.

Praktické poznámky k nasazení

Instalace na vzduchově izolované systémy. Instalátor — Windows .exe nebo .msi, macOS .dmg, Linux .AppImage nebo .deb — se přenáší do vzduchově izolované sítě přes USB nebo zabezpečený přenos souborů. Po instalaci internet není potřeba.

Jazyková podpora. 24 jazykově specifických modelů je součástí aplikace. Kompletní sada je dostupná offline bez dalšího stahování.

Hardwarové požadavky. NLP pipeline běží na moderních pracovních stanicích bez GPU. Dávkové zpracování 1 000 dokumentů obvykle trvá 5–15 minut. Rychlost závisí na velikosti dokumentu a rychlosti procesoru.

Offline nastavení licence. Pro sítě, kde licenční server není dostupný, je k dispozici offline nastavení licence.

Kdy vzduchová izolace není správnou volbou

Vzduchově izolované systémy řeší konkrétní problémy. Také přinášejí reálnou zátěž.

Tření při aktualizacích. Udržování modelů a softwaru aktuálního vyžaduje manuální kroky. Týmy, které zaostávají, mohou přehlédnout nové vzory PII.

Overhead propojení. Vzduchově izolované systémy se nemohou připojit ke cloudovým nástrojům SIEM nebo vzdáleným auditním dashboardům. Jsou potřeba vlastní řešení s datovými diodami. To zvyšuje náklady.

Kompromisy v přesnosti. Cloudové nástroje průběžně aktualizují trénovací data. Offline modely jsou snímek v čase. Mohou časem zaostávat za novými jazykovými vzory.

Není potřeba pro každý model hrozby. Týmy bez vládních, zdravotních nebo právních mandátů mohou cloudové nástroje považovat za praktičtější. Silné šifrování, audity SOC 2 Type II a smlouvy o zpracování dat pokrývají většinu případů. Vzduchová izolace se vyplatí pouze tehdy, když model hrozby skutečně zahrnuje síťovou krádež dat kvalifikovaným protivníkem.

Pro většinu malých a středních podniků a standardní podnikové týmy poskytuje silné šifrování při přenosu i v klidu dostatečnou ochranu. Přidejte solidní smluvní kontroly a pokryjete většinu případů — bez overhead plné vzduchové izolace. Viz FAQ pro výběr správného modelu nasazení.


Desktopová aplikace anonym.legal (Windows, macOS, Linux) zpracovává PII zcela lokálně s přibalenými NLP modely. Po instalaci není vyžadováno žádné připojení k internetu. Dávkové zpracování podporuje 1–5 000 souborů za běh v závislosti na úrovni plánu.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.