Zpět na blogTechnické

Air-gapped anonymizace PII: Offline-first přístup pro...

Obranné agentury, vládní SCIF a regulované instituce vyžadují offline PII anonymizaci.

March 3, 20268 min čtení
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Proč cloud nestačí pro nejcitlivější data

Pro většinu organizací cloudová anonymizace PII poskytuje správnou rovnováhu bezpečnosti, přístupu a ceny. Ale pro některá prostředí je cloud ze zásady nemožný.

Zvažte tato prostředí:

  • Vládní SCIF (Sensitive Compartmented Information Facilities): Fyzicky izolované místnosti kde nejsou povoleny žádné sítě
  • Obranné kontraktorské sítě: Classified sítě bez internetu
  • Regulované výzkumné instituce: Některé klinické protokoly zakázaly cloudové zpracování
  • Přísně regulované finanční instituce: Banky v určitých jurisdikcích s datovou lokalizací

V těchto prostředích musí PII anonymizace fungovat zcela offline – bez jakéhokoli cloud endpointu.

Architektura air-gapped nasazení

Vrstvový model offline-first

Vrstva 1: Lokální NLP engine Všechny AI modely jsou předtrénovány a bundlovány s aplikací:

  • spaCy modely pro 24 jazyků (ca, da, de, el, en, es, fi, fr, hr, it, ja, ko, lt, mk, nb, nl, pl, pt, ro, ru, sl, sv, uk, zh)
  • Vlastní rozpoznávače vzorů pro 285+ typů entit
  • Deterministické regex enginy pro strukturovaná PII

Vrstva 2: Správa klíčů na zařízení Šifrovací klíče jsou generovány a uloženy lokálně:

  • Generování BIP39 seed phrase
  • Argon2id derivace klíče (paměťově náročné)
  • AES-256-GCM šifrování
  • Klíče nikdy neopouštějí zařízení

Vrstva 3: Dávkové zpracování Pro velkoobjemové operace:

  • Zpracování souborů vybrána z lokálního disku
  • Výsledky exportovány zpět na lokální disk
  • Žádné přenesy sítě v žádném okamžiku

Desktop aplikace anonym.legal pro air-gapped prostředí

Desktop aplikace anonym.legal (Tauri 2.0 + React) je navržena pro offline nasazení:

Klíčové offline funkce

Kompletní NLP on-device: Detekce PII funguje bez internetového připojení. Všechny 24 spaCy jazykové modely jsou bundlovány přímo v aplikaci.

Offline správa klíčů: BIP39 vault je implementován v čistém Rustu – žádné cloudové API volání. Klíče jsou zabezpečeny Argon2id + AES-256-GCM lokálně.

Dávkové zpracování souborů: Zpracujte stovky dokumentů bez síťového přístupu.

Formáty dokumentů: Plná podpora offline pro Word (.docx), PDF, TXT, CSV, JSON, XML.

Nasazení v obranných a vládních kontextech

SCIF nasazení

V SCIF prostředí:

  1. Aplikace je přenesena na schválené médium (USB)
  2. Nainstalována na air-gapped systém
  3. Verifikována integritou hash
  4. Provozována zcela offline

Air-gapped síťové nasazení

Pro sítě bez internetu ale s interní sítí:

  1. Aplikace je nasazena přes vnitřní artifact repository
  2. Aktualizace se uskutečňují přes schválené interní procesy
  3. Klíčové zálohy mohou být centrálně spravovány (ale ne v cloud)

Offline ML inference

Klíčová technická výzva: ML modely pro NER jsou typicky stahované za runtime. Bundlujeme je proto staticky:

  • Komprimované modely v binárním balíčku aplikace
  • Lazy loading pro výkon
  • Paměťová stopa: ~400 MB pro všech 24 jazykových modelů

Srovnání: Cloud vs. Air-Gapped vs. Hybrid

VlastnostCloudAir-GappedHybrid
Internetové připojeníPovinnéZakázánoVolitelné
VýkonZávisí na sítiLokální CPU/GPUAdaptivní
Správa klíčůCloudové HSMLokální vaultLokální klíče, cloud sync
Dostupnost99,9% SLAZávislé na HWZáloha offline
NákladySpotřeba tokenyFixní HWHybridní
Regulační souladZávisí na jurisdikciVždy souladZávisí na konfiguraci

Případ použití: Obranný kontraktor

Americký obranný kontraktor pracující na klasifikovaných projektech potřeboval anonymizovat citlivé osobní soubory pro revize kontraktu. Síťové zásady zakazovaly přístup k jakémukoli cloudu.

Řešení:

  • Desktop aplikace anonym.legal nasazena na izolovaný pracovní systém
  • Vlastní entity nakonfigurované pro obranné identifikátory (CAGE kódy, smlouvy)
  • Dávkové zpracování 2 400 dokumentů za víkend
  • Žádné síťové volání za dobu provozu (verifikováno síťovým logováním)

Výsledky:

  • 94% snížení doby manuální redakce
  • Auditovatelná dokumentace anonymizace
  • Nulové narušení bezpečnostní politiky

Technické požadavky pro air-gapped nasazení

Hardware minimální

  • CPU: Intel Core i5 nebo AMD Ryzen 5 (8th gen+)
  • RAM: 8 GB (16 GB doporučeno pro vícejazyčné zpracování)
  • Storage: 2 GB pro instalaci + prostor pro dokumenty

Operační systémy

  • Windows 10/11 (x64)
  • Ubuntu 20.04+ (x64)
  • macOS 12+ (Universal – ARM + Intel)

Síťové požadavky

  • Žádné – aplikace funguje plně offline

Závěr

Air-gapped PII anonymizace není okrajový případ – je to reálná potřeba pro obranné kontraktorovy, vládní agentury, regulované výzkumné instituce a přísně kontrolované finanční organizace.

Desktop aplikace anonym.legal implementuje skutečně offline-first architekturu – všechny ML modely, všechny šifrovací nástroje a kompletní pracovní postup dokumentů bez internetu.

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.