By · Last updated 2026-03-03

Tilbage til BlogTeknisk

Air-Gapped PII: Offline-First for Defense

41% af enterprise-sikkerhedspolitikker forbyder cloudbehandling af klassificerede dokumenter. Lær, hvornår og hvorfor offline-first PII-anonymisering er den eneste løsning.

March 3, 20268 min læsning
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Det problem, cloudværktøjer ikke kan løse

En dataforsker hos en forsvarsvirksomhed har 3.000 personaleposter. De skal anonymisere navne, socialsikringsnumre og sikkerhedsgodkendelsesniveauer, inden datasættet deles med en universitetsforskningspartner under en CUI-aftale (Controlled Unclassified Information).

Deres netværk har ingen internetadgang. Det er tilsigtet.

Hvert webbaseret anonymiseringsværktøj, de evaluerer, kræver afsendelse af data til en ekstern API. Enhver enterprise SaaS-platform kræver kontoregistrering og skyforbindelser. Selv "on-premises"-løsninger kræver ofte licensservere, der med jævne mellemrum foretager internetopkald.

Dette er problemet med air-gapped implementering – og det berører langt flere organisationer end den snævre "klassificeret myndighed"-ramme antyder.

Hvem har brug for offline-first-behandling

Forsvarsvirksomheder og offentlige myndigheder er den mest oplagte kategori. DISA's FedRAMP-krav mandaterer databehandling inden for autoriserede grænser. ITAR begrænser håndtering af tekniske data til USA-kontrolleret infrastruktur. Efterretningsnetværk (JWICS, SIPRNet) er fysisk isoleret by design.

Men offline-first-kravet strækker sig langt ud over klassificerede miljøer:

Sundhedssystemer med netværkssegmentering: Hospitalnetværk isolerer kliniske systemer fra almennet adgangsnetværk. PACS-systemer (medicinsk billeddiagnostik), EPJ-systemer på segmenterede netværk og kliniske forskningsdatabaser kan have ingen internetforbindelse af politikmæssige årsager.

Finansielle tjenester med isolerede handelsgulve: Proprietære handelsmiljøer, visse clearinghuseenetværk og SWIFT-tilsluttet infrastruktur opererer med streng netværksisolation.

Industrielle kontrolsystemer: SCADA-netværk, produktionskontrolsystemer og kritisk infrastruktur opererer med air-gaps eller near-air-gaps som sikkerhedsforanstaltning (post-Stuxnet-hærdning).

Europæiske krav om datasoverænitet: Tysklands strenge Landesdatenschutzgesetze og sammenlignelige nationale love i EU kræver i stigende grad lokal behandling for følsomme offentlige og sundhedsdata. TikTok-bøden på €530 mio. (maj 2025) for EU-dataoverførsler til Kina har accelereret denne tendens.

Hvorfor cloudarkitektur fejler ved air-gapped implementeringer

De fleste enterprise-anonymiseringsværktøjer er arkitekteret som SaaS-platforme:

Brugerenhed → HTTPS → Leverandør-API → NLP-modeller → Svar → Brugerenhed

Denne arkitektur kræver:

  1. Internetforbindelse fra behandlingsenheden
  2. Tillid til leverandørens API-infrastruktur
  3. Accept af, at data krydser eksterne netværk
  4. Afhængighed af leverandørens tilgængelighed og prisændringer

For air-gapped miljøer er trin 1 en fysisk umulighed. For regulerede miljøer kan trin 2-4 hver især udgøre complianceovertrædelser.

Selvhostet Presidio er det almindelige alternativ, men det kræver:

  • Docker-ekspertise til implementering
  • Python-miljøhåndtering
  • spaCy-modeldownloads (internettet kræves)
  • Løbende vedligeholdelse, efterhånden som modeller og afhængigheder opdateres
  • DevOps-ressourcer, som de fleste teams ikke har

Dette gab – mellem SaaS-bekvemmelighed og selvhostet kompleksitet – er præcis, hvad desktop-first offline-værktøjer adresserer.

Den tekniske arkitektur i offline-first PII-anonymisering

Et ordentligt bygget offline PII-anonymiseringsværktøj indlejrer alt, der er nødvendigt for behandling:

1. Forhåndsbundtede NLP-modeller spaCy-sprogmodeller (gennemsnit 40-80 MB hver), transformermodeller til named entity recognition og sprogdetektionsmodeller er bundtet i applikationsinstallationsprogrammet. Ingen downloadtrin kræves under behandlingen.

2. Lokal behandlingspipeline Hele regex + NLP + ML-detektionspipelinen kører på lokal CPU (og eventuelt GPU). Den Presidio-baserede detektionsmotor, som anonym.legal bruger, kræver ingen netværksopkald under behandlingen.

3. Krypteret lokal boks Konfiguration, forudindstillinger og krypteringsnøgler opbevares i en lokal krypteret boks (AES-256-GCM + Argon2id). Ingen sky-synkronisering. Ingen fjernlageringskopi af nøgler. Boksen eksisterer kun på den lokale enhed.

4. Lokal fil-I/O Inputfiler læses fra lokal lagring; outputfiler skrives til lokal lagring. Ingen data krydser nogen netværksgrænseflade.

5. Minimalt angrebsflade Tauri 2.0 (Rust-baseret) giver en markant mindre angrebsflade end Electron (Chromium-baserede) alternativer. Tauri-applikationer har ~10 gange mindre binær størrelse og adgang til færre OS-API'er som standard.

Compliancebrugsscenarier

ITAR teknisk dataanonymisering

En forsvarsvirksomhed skal dele teknisk dokumentation med en udenlandsk partner under en licensundtagelse. Dokumenterne indeholder US-personers navne og personaldata, der skal anonymiseres, inden ITAR-licensundtagelsen finder anvendelse.

Krav:

  • Behandling på godkendte arbejdsstationer kun (ingen sky)
  • Ingen datatransmission uden for det godkendte miljø
  • Revisionsspor, der dokumenterer, at anonymisering blev anvendt
  • Batchbehandling af 500+ dokumenter

anonym.legal Desktop-appen behandler alle 500+ DOCX-filer lokalt ved hjælp af batchindstilling. Intet netværksopkald foretages under behandlingen. Revisionsloggen opbevares i den lokale krypterede boks. De anonymiserede dokumenter opfylder ITAR-licensundtagelseskravene.

Tysk føderalagentur datadeling

En tysk forbundsmyndighed (Bundesbehörde) skal anonymisere borgerklagedata, inden de deles med et eksternt forskningsinstitut. BfDI-vejledning forbyder behandling på ikke-statslig infrastruktur.

Desktop-appen kører på agenturets arbejdsstationer med Windows 11. Behandlingen sker lokalt uden eksterne netværksopkald. Agenturets IT-sikkerhedsteam validerer dette med netværkstrafikovervågning – nul eksterne forbindelser under behandlingen.

Klinisk hospitalsforskning

En hospitalforskningsafdeling skal de-identificere patientjournaler til et multicenter klinisk forsøg. HIPAA Safe Harbor de-identifikation fjerner 18 identifikatorkategorier. Det kliniske netværk har ingen internetadgang af politikmæssige årsager.

Desktop-appen håndterer batchbehandling af EPJ-eksporter i CSV- og JSON-format. Hospitalets privatlivsansvarlige validerer outputtet mod HIPAA Safe Harbor-kravene, inden datasættet transmitteres til forskningspartnere.

Nøglefunktioner til air-gapped implementering

Når du evaluerer offline PII-anonymiseringsværktøjer, bør du prioritere:

FunktionHvorfor det er vigtigt
Fuldt offline efter installationIngen internetafhængighed under behandling
Forhåndsbundtede NLP-modellerIngen downloadtrin, der kræver netværksadgang
BatchbehandlingHåndtér volumen uden gentagen manuel interaktion
Lokal krypteret boksSikker lokal lagring af konfigurationer og nøgler
RevisionslogDokumentation til compliancegennemgange
Windows/macOS/Linux-understøttelseDækker klassificerede arbejdsstationsmiljøer
Ingen telemetri-mulighedSikr, at ingen data eksfiltreres via telemetri
FilformatdækningDOCX, PDF, TXT, CSV, JSON, Excel

Fordelen ved datasoverænitet

TikTok-bøden på €530 mio. og den efterfølgende håndhævelsesbølge har skabt en sekundær drivkraft for offline-first-værktøjer: datasoverænitet.

EU-organisationer, der tidligere brugte cloudværktøjer af bekvemmelighed, genoverveje nu, om behandling på ekstern leverandørinfrastruktur opfylder GDPR kapitel V (internationale overførsler) og nationale databeskyttelseslove.

Det klareste svar på "hvor går dine data hen under behandlingen?" er "ingen steder – de forlader aldrig enheden". Offline-first-behandling eliminerer GDPR-overførselssspørgsmålet fuldstændigt.

For tyske organisationer specifikt gør kombinationen af DSGVO's strenge fortolkning af artikel 44-46 og den seneste håndhævelsestrend lokal behandling stadig mere attraktiv, selv for organisationer uden strenge forbindelseskrav.

Praktiske implementeringsovervejelser

Installation på air-gapped systemer: Installationspakken (Windows .exe/.msi, macOS .dmg, Linux .AppImage/.deb) overføres til det air-gappede miljø via USB eller sikker filoverførsel. Ingen internetadgang er nødvendig efter installation.

Sprogmodeldækning: 24 sprogspecifikke modeller er bundtet. For air-gapped miljøer er det fulde sprogset tilgængeligt offline uden yderligere download.

Hardwarekrav: NLP-pipelinen kører effektivt på moderne arbejdsstationer uden GPU-krav. Batchbehandling af 1.000 dokumenter afslutter typisk på 5-15 minutter afhængigt af dokumentstørrelse og CPU-ydelse.

Licensering i air-gapped miljøer: Offline-licensaktivering er tilgængelig for miljøer, hvor tilslutning til en licensserver ikke er mulig.

Hvornår air-gapping ikke er den rette tilgang

Air-gapped og offline-first-arkitekturer løser specifikke problemer, men introducerer betydelige driftsmæssige udfordringer:

Opdateringsfriktion: At holde AI-modeller, entitetsregistratorer og software opdateret i et air-gapped miljø kræver manuelle processer (USB-overførsler, manuelle downloads på isolerede netværk). Organisationer, der ikke opretholder en streng opdateringskadence, kan køre forældede modeller, der misser nye PII-mønstre.

Integrationsompleksitet: Air-gappede systemer kan ikke direkte integreres med cloudbaserede logningsplatforme, SIEM-platforme eller fjernrevisionsbedrøjter uden tilpassede datadiodeløsninger. Dette øger infrastrukturomkostningerne markant.

Nøjagtighedsafvejninger: Cloudbaserede PII-detektionssystemer kan udnytte løbende opdaterede træningsdata og ensemble-modeller på tværs af mange kunder. Offline-modeller er et snapshot, der forringes over tid i forhold til fremvoksende sprogmønstre, særligt for flersproget indhold.

Ikke nødvendigt for alle trusselsbilleder: Organisationer uden statslige, sundheds- eller juridiske mandater til dataisolation kan finde cloudbaserede løsninger med stærk kryptering, SOC 2 Type II-revisioner og databehandlingsaftaler mere praktiske. Overhead ved air-gapping leverer kun værdi, når trusselsbilledet reelt inkluderer netværksbaseret eksfiltrering af en dedikeret modstander.

For SMV'er og de fleste enterprise-brugsscenarier giver stærk kryptering under overførsel og lagring kombineret med kontraktmæssige databehandlingskontroller tilstrækkelig beskyttelse uden den driftsmæssige overhead ved fuld air-gapping.


anonym.legals Desktop-app (tilgængelig til Windows, macOS og Linux) behandler PII fuldt lokalt ved hjælp af forhåndsbundtede NLP-modeller. Ingen internetforbindelse er nødvendig efter installation. Batchbehandling understøtter 1-5.000 filer afhængigt af planniveau.

Kilder:

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.