By · Last updated 2026-03-03

Späť na blogTechnické

Air-gapped PII: Offline-first pre obranu a suladnost

41 % podnikovych bezpecnostnych politik zakazuje cloudove spracovanie utajovanych dokumentov. Zistite, ako funguje offline anonymizacia PII pre obranné firmy, nemocnice a vladne agentury.

March 3, 20268 min čítania
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Ked siet nema vystup

Datava vedkynja pracuje v obrannej firme. Ma 3 000 personalnych zaznamov. Potrebuje odstranit mena, rodné cisla a stupne utajenia. Potom moze zdielajt data s vyskumnym partnerom v ramci dohody CUI.

Jej siet nema internet. Schvalne.

Testuje kazdy webovy nastroj, ktory moze najst. Kazdy posiela data na externy server. Kazda cloudova platforma potrebuje ucet a zive pripojenie. Dokonca aj nastroje "on-premises" casto volaju vzdialeny licencny server.

Toto je problem nasadenia air-gapped. Postihuje omnoho viac timov, ako vacsina ludi ocakáva.

Kto potrebuje offline odstranovanie PII

Obranne firmy a vladne agentury s nim stretavaju najcastejsie. Program FedRAMP agentury DISA vyzaduje, aby data zostali v schvalenych sietovych hraniciach. ITAR obmedzuje technicke data na systemy pod kontrolou USA. Siete ako JWICS a SIPRNet su fyzicky izolované dizajnom.

Ale potreba offline presahuje utajovane lokality:

Nemocnice so segmentovanymi sietami. PACS systemy pre zobrazovanie, platformy EHR a vyskumne databazy casto sedia na sietach bez internetu na zaklade politiky.

Obchodne podlahy a zúčtovacie domy. Propriétarne obchodné systemy a systémy pripojene cez SWIFT pouzivaju prisne sietove oddelenia.

Priemyselné kontrolné systemy. SCADA siete a kriticka infrastruktura funguju s air-gap ako zakladnym bezpecnostnym opatrenim. Harden post-Stuxnet z toho spravil normu.

Europske datové pravidla. Nemecke Landesdatenschutzgesetze a podobné zakony EU vyzaduju miestne spracovanie dat pre citlive vladne a zdravotné zaznamy. Pokuta TikTok vo vyske 530 milionov eur za GDPR prisla v maji 2025. Pokryvala prenosy dat do Číny. Tata pokuta dotlacila viac timov k lokalnym nastrojom. Pozrite si nas prehlad suladnosti pre pravidla prevodu GDPR, ktore platia.

Preco cloudove nastroje zlyhavaju v air-gapped sietach

Vacsina nastrojov na odstranovanie dat nasleduje model SaaS:

Uzivatelske zariadenie -> HTTPS -> API dodavatela -> NLP modely -> Odpoved -> Uzivatelske zariadenie

Tento dizajn potrebuje pristup na internet v spracuvajucom zariadení. Potrebuje doveru v servery dodavatela. Znamena to, ze data prekracuju externe siete.

V air-gapped sieti je krok prvý fyzickou nemoznostou. Pre regulovane prostredia moze kazdy z krokov druhého az stvrtého porušovat pravidla suladnosti.

Self-hosted Presidio je bezny nahradeník. Ale potrebuje zrucnosti Docker a setup Pythonu. Potrebuje tiez stiahnutia modelov spaCy, ktore vyzaduju pristup na internet. A potrebuje priebeznu IT podporu. Vacsine timov chybaju vsetko toto.

Medzera medzi pohodlim cloudu a zlozitostou self-hosted je presne to, co vypinaju lokalne desktopove nastroje.

Ako funguje lokalne odstranovanie PII

Dobry offline nastroj prichádza so vsetkym, co potrebuje:

Zbaleném NLP modely. Modely spaCy (40-80 MB kazdy) a transformerové modely pre detekciu pomenovaných entit su súcastou instalaatora. Pocas behu nie je potrebné ziadne stiahnutie.

Lokalny detekčný pipeline. Regex, NLP a ML vsetky bežia na lokalnom CPU -- alebo GPU, ak je k dispozicii. Engine zalozeny na Presidio v anonym.legal nerobi pocas behu žiadne sietové volania.

Zasifrovany lokalny trezor. Konfigurácie, prednastavenia a kluce su uložene lokálne. Trezor pouziva sifrovanie AES-256-GCM a odvodenie klúča Argon2id. Žiadna cloudová synchronizácia. Žiadna vzdiálená záloha. Trezor zostáva v zariadení.

Lokalné I/O subor. Vstupne subory prichadzaju z lokalneho uloziska. Vystupne subory idú spat do lokalneho uloziska. Ziadne data neprekracia žiadne sietové rozhranie.

Maly útočný povrch. Desktopová aplikácia pouziva Tauri 2.0 (zalozeny na Rust). Tauri má omnoho menší útočný povrch ako nastroje Electron (zalozené na Chromium). Jeho binary je priblizne desatinu veľkosti. Tiez volá menej OS API v predvolenom nastavení.

Tri skutocne scenare suladnosti

ITAR dokumenty -- 500 suborov

Obranná firma potrebuje zdieľat technické dokumenty s externym partnerom v ramci vynimky licencie. Subory obsahuju mena americkich osob a personálne data. Oboje musi byť najprv odstranene.

Klucove potreby: spracovanie iba na oistených pracovnych staniciach. Žiadne data odoslane mimo cistenu siet. Auditný zaznam ukazujúci, ze praca bola vykonana. Hromadná podpora pre 500+ suborov.

Desktopová aplikácia spracuje vsetkych 500+ DOCX subor lokálne v hromadnom reźime. Počas behu nie je vykonané žiadne sietové volanie. Auditný log zostáva v lokalnom trezore. Vystup spĺňa potreby vynimky licencie ITAR.

Nemecka federálna agentúra -- Sťažnostné záznamy

Nemecka federálna agentúra musí odstraniť osobné udaje zo záznamov sťažností občanov. Potom pošle záznamy výskumnému inštitútu. Usmernenie BfDI zakazuje spracovanie na nevládnych systémoch.

Desktopová aplikácia beži na agentúrnych pracovných staniciach Windows 11. Všetko spracovanie je lokálne. IT bezpecnostný tím to potvrdzuje monitorovaním prevádzky -- žiadne vonkajšie pripojenia počas behu.

Nemocničný výskum -- De-ID EHR

Nemocničný výskumný tím potrebuje odstrániť záznamy pacientov pre klinickú skúšku. HIPAA Safe Harbor vyžaduje odstránenie 18 typov identifikátorov. Klinická sieť nemá prístup na internet.

Desktopová aplikácia zvláda hromadné spracovanie exportov EHR vo formáte CSV a JSON. Referent pre ochranu súkromia preskúma výstup podľa pravidiel Safe Harbor pred odoslaním datasetu výskumným partnerom.

Na čo hľadieť v offline nástroji

SchopnosťPrečo je dôležitá
Plne offline po inštaláciiŽiadna závislosť na internete počas spracovania
Zbalené NLP modelyNie je potrebný krok stiahnutia
Hromadné spracovanieZvládajte veľké objemy bez manuálnej práce
Lokálny zašifrovaný trezorBezpečné uloženie konfigurácií a kľúčov
Auditný logZáznamy potrebné pre kontroly súladu
Podpora Windows, macOS, LinuxPokrýva typy utajovaných pracovných staníc
Možnosť bez telemetrieZastavte odchod údajov cez telemetriu
Podpora formátov súborovDOCX, PDF, TXT, CSV, JSON, Excel

Dátové pravidlá tlačia tímy k lokálnym nástrojom

Pokuta TikTok vo výške 530 miliónov eur spustila širšiu vlnu pokút. Tímy EÚ, ktoré používali cloudové nástroje, sa teraz pýtajú novú otázku. Spĺňa spracovanie na serveroch dodávateľa GDPR kapitolu V a národné dátové zákony?

Najčistejšia odpoveď na otázku "Kam idú vaše dáta?" je táto: nikam -- nikdy neopúšťajú zariadenie. Lokálne spracovanie plne odstráni otázku prenosu GDPR.

Pre nemecké tímy robí prísne čítanie DSGVO článkov 44-46 lokálne spracovanie múdrym krokom. Platí to aj bez prísnych sieťových obmedzení. Náš bezpečnostný prehľad vysvetľuje, ako lokálne spracovanie eliminuje reťazec dát tretích strán.

Praktické poznámky k nasadeniu

Inštalácia na air-gapped systémy. Inštalátor -- Windows .exe alebo .msi, macOS .dmg, Linux .AppImage alebo .deb -- sa prenesie do air-gapped siete cez USB alebo bezpečný prenos súborov. Internet nie je po inštalácii potrebný.

Jazyková podpora. So aplikáciou sa dodáva 24 jazykovo špecifických modelov. Celá sada je dostupná offline bez ďalšieho stiahnutia.

Hardvérové požiadavky. Pipeline NLP beží na moderných pracovných staniciach bez GPU. Hromadné spracovanie 1 000 dokumentov zvyčajne trvá 5-15 minút. Rýchlosť závisí od veľkosti dokumentu a rýchlosti CPU.

Offline nastavenie licencie. Pre siete, kde je licenčný server nedostupný, je k dispozícii offline nastavenie licencie.

Kedy nie je air-gapping tou správnou voľbou

Air-gapped systémy riešia špecifické problémy. Tiež pridávajú reálnu záťaž.

Trenie s aktualizáciami. Udržiavanie modelov a softvéru v aktuálnom stave vyžaduje manuálne kroky. Tímy, ktoré zaostávajú, môžu prehliadnuť nové vzory PII.

Prepojovacie náklady. Air-gapped systémy sa nemôžu pripojiť ku cloudovým SIEM nástrojom alebo vzdialeným auditným dashboardom. Sú potrebné vlastné riešenia s dátovou diódou. To zvyšuje náklady.

Kompromisy v presnosti. Cloudové nástroje priebežne aktualizujú tréningové dáta. Offline modely sú snímka. Môžu zaostávať voči novým jazykovým vzorom v priebehu času.

Nie je potrebné pre každý model hrozby. Tímy bez vládnych, zdravotných alebo právnych mandátov môžu nájsť cloudové nástroje praktickejšími. Silné šifrovanie, audity SOC 2 Type II a dohody o spracovaní údajov pokrývajú väčšinu prípadov. Air-gapping sa oplatí iba vtedy, keď model hrozby skutočne zahŕňa sieťovú krádež dát skúseným protivníkom.

Pre väčšinu malých a stredných podnikov a štandardné podnikové tímy poskytuje silné šifrovanie počas prenosu a v pokoji primeranú ochranu. Pridajte pevné zmluvné kontroly a pokryjete väčšinu prípadov použitia -- bez záťaže úplného air-gappingu. Pozrite si náš FAQ pre viac o výbere správneho modelu nasadenia.


Desktopová aplikácia anonym.legal (Windows, macOS, Linux) spracováva PII úplne lokálne s balíčkovými NLP modelmi. Po inštalácii nie je potrebné internetové pripojenie. Hromadné spracovanie podporuje 1-5 000 súborov na beh v závislosti od úrovne plánu.

Zdroje

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.