By · Last updated 2026-03-03

Zurück zum BlogTechnisch

Air-Gapped PII-Anonymisierung: Warum Verteidigung und...

41 % der Sicherheitsrichtlinien von Unternehmen verbieten die Cloud-Verarbeitung von klassifizierten Dokumenten.

March 3, 20268 min Lesezeit
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Wenn das Netzwerk keinen Ausgang hat

Eine Datenwissenschaftlerin arbeitet bei einem Rüstungsunternehmen. Sie hat 3.000 Personaldaten. Sie muss Namen, Sozialversicherungsnummern und Sicherheitsstufen entfernen. Erst dann kann sie die Daten an einen Forschungspartner im Rahmen einer CUI-Vereinbarung weitergeben.

Ihr Netzwerk hat keinen Internetzugang. Absicht.

Sie testet jedes webbasierte Tool, das sie finden kann. Jedes sendet Daten an einen externen Server. Jede Cloud-Plattform braucht ein Konto und eine aktive Verbindung. Selbst „On-Premises"-Tools rufen oft einen Remote-Lizenzserver ab.

Das ist das Air-Gapped-Deployment-Problem. Es trifft weit mehr Teams als die meisten erwarten.

Wer Offline-PII-Entfernung braucht

Rüstungsunternehmen und Behörden sind am stärksten betroffen. Das FedRAMP-Programm der DISA verlangt, dass Daten innerhalb genehmigter Netzwerkgrenzen bleiben. ITAR beschränkt technische Daten auf US-kontrollierte Systeme. Netzwerke wie JWICS und SIPRNet sind physisch isoliert.

Aber der Offline-Bedarf geht weit über klassifizierte Umgebungen hinaus:

Krankenhäuser mit segmentierten Netzwerken. PACS-Bildgebungssysteme, EHR-Plattformen und Forschungsdatenbanken befinden sich oft in Netzwerken ohne Internet.

Handelsbörsen und Clearinghäuser. Proprietäre Handelssysteme und SWIFT-verbundene Systeme nutzen strenge Netzwerktrennung.

Industrielle Steuerungssysteme. SCADA-Netzwerke und kritische Infrastruktur betreiben Air Gaps als Sicherheitsmaßnahme. Post-Stuxnet-Härtung machte dies zur Norm.

Europäische Datenschutzregeln. Die deutschen Landesdatenschutzgesetze und ähnliche EU-Gesetze fordern lokale Datenverarbeitung für sensible Behörden- und Gesundheitsdaten. Das TikTok-DSGVO-Bußgeld von 530 Mio. € kam im Mai 2025. Es betraf Datenübertragungen nach China. Das Bußgeld bewog mehr Teams zu lokalen Tools. Unsere Compliance-Übersicht erklärt die geltenden DSGVO-Transferregeln.

Warum Cloud-Tools in Air-Gapped-Netzwerken versagen

Die meisten Datenentfernungs-Tools folgen einem SaaS-Modell:

Gerät → HTTPS → Anbieter-API → NLP-Modelle → Antwort → Gerät

Dieses Design braucht Internetzugang am verarbeitenden Gerät. Es braucht Vertrauen in die Anbieter-Server. Daten überqueren externe Netzwerke.

In einem Air-Gapped-Netzwerk ist Schritt eins physisch unmöglich. In regulierten Umgebungen kann jeder der Schritte zwei bis vier gegen Compliance-Regeln verstoßen.

Self-hosted Presidio ist die übliche Alternative. Aber es braucht Docker-Kenntnisse und Python-Setup. Es braucht auch spaCy-Modell-Downloads, die Internetzugang erfordern. Und es braucht laufenden IT-Support. Die meisten Teams haben das nicht.

Die Lücke zwischen Cloud-Einfachheit und Self-Hosted-Aufwand ist genau das, was lokale Desktop-Tools schließen.

Wie lokale PII-Entfernung funktioniert

Ein gutes Offline-Tool liefert alles mit, was es braucht:

Gebündelte NLP-Modelle. spaCy-Modelle (je 40–80 MB) und Transformer-Modelle zur Erkennung benannter Entitäten sind Teil des Installers. Kein Download beim Ausführen.

Lokale Erkennungs-Pipeline. Regex, NLP und ML laufen alle auf der lokalen CPU — oder GPU, falls vorhanden. Die Presidio-basierte Engine in anonym.legal macht während eines Laufs keine Netzwerkaufrufe.

Verschlüsselter lokaler Tresor. Konfigurationen, Voreinstellungen und Schlüssel werden lokal gespeichert. Der Tresor verwendet AES-256-GCM-Verschlüsselung und Argon2id-Schlüsselableitung. Keine Cloud-Synchronisation. Kein Remote-Backup. Der Tresor bleibt auf dem Gerät.

Lokales Datei-I/O. Eingabedateien kommen aus dem lokalen Speicher. Ausgabedateien gehen zurück in den lokalen Speicher. Keine Daten überqueren eine Netzwerkschnittstelle.

Kleine Angriffsfläche. Die Desktop-App verwendet Tauri 2.0 (Rust-basiert). Tauri hat eine viel kleinere Angriffsfläche als Electron (Chromium-basiert). Seine Binärdatei ist etwa zehnmal kleiner. Sie ruft auch weniger OS-APIs auf.

Drei reale Compliance-Szenarien

ITAR-Dokumente — 500 Dateien

Ein Rüstungsunternehmen muss technische Dokumente unter einer Lizenzausnahme mit einem ausländischen Partner teilen. Die Dateien enthalten US-Personennamen und Personaldaten. Beides muss zuerst entfernt werden.

Kernbedarf: Verarbeitung nur auf freigegebenen Workstations. Keine Daten außerhalb des freigegebenen Netzwerks. Ein Prüfpfad, der die Arbeit belegt. Batch-Unterstützung für 500+ Dateien.

Die Desktop-App verarbeitet alle 500+ DOCX-Dateien lokal im Batch-Modus. Während des Laufs wird kein Netzwerkaufruf gemacht. Das Prüfprotokoll bleibt im lokalen Tresor. Das Ergebnis erfüllt die ITAR-Lizenzausnahmeanforderungen.

Deutsche Bundesbehörde — Beschwerdedaten

Eine deutsche Bundesbehörde muss personenbezogene Daten aus Bürger-Beschwerdedaten entfernen. Dann sendet sie die Daten an ein Forschungsinstitut. Der BfDI verbietet die Verarbeitung auf nicht-staatlichen Systemen.

Die Desktop-App läuft auf behördlichen Windows-11-Workstations. Alle Verarbeitung ist lokal. Das IT-Sicherheitsteam bestätigt dies mit Traffic-Monitoring — null externe Verbindungen während des Laufs.

Klinische Forschung — EHR-De-Identifikation

Ein Krankenhausforschungsteam muss Patientendaten für eine klinische Studie entfernen. HIPAA Safe Harbor verlangt das Entfernen von 18 Identifikatortypen. Das klinische Netzwerk hat keinen Internetzugang.

Die Desktop-App verarbeitet EHR-Exporte im CSV- und JSON-Format als Batch. Der Datenschutzbeauftragte prüft die Ausgabe gegen Safe-Harbor-Regeln, bevor der Datensatz an Forschungspartner geht.

Worauf man bei einem Offline-Tool achten sollte

FähigkeitWarum wichtig
Vollständig offline nach InstallationKeine Internet-Abhängigkeit bei der Verarbeitung
Gebündelte NLP-ModelleKein Download-Schritt nötig
Batch-VerarbeitungGroße Mengen ohne manuelle Arbeit
Lokaler verschlüsselter TresorSichere Speicherung von Konfigurationen und Schlüsseln
PrüfprotokollNachweise für Compliance-Reviews
Windows-, macOS-, Linux-SupportDeckt klassifizierte Workstation-Typen ab
Keine Telemetrie-OptionVerhindert Datentransfer über Telemetrie
Dateiformat-UnterstützungDOCX, PDF, TXT, CSV, JSON, Excel

Datenschutzregeln treiben Teams zu lokalen Tools

Das TikTok-Bußgeld von 530 Mio. € löste eine breitere Bußgeldwelle aus. EU-Teams, die Cloud-Tools nutzten, stellen nun eine neue Frage. Erfüllt die Verarbeitung auf Anbieter-Servern DSGVO Kapitel V und nationale Datenschutzgesetze?

Die klarste Antwort auf „Wo gehen Ihre Daten hin?" lautet: nirgendwo — sie verlassen das Gerät nicht. Lokale Verarbeitung beseitigt die DSGVO-Transferfrage vollständig.

Für deutsche Teams macht die strenge Auslegung der DSGVO-Artikel 44–46 lokale Verarbeitung zur klugen Wahl. Das gilt auch ohne strenge Netzwerkbeschränkungen. Unsere Sicherheitsübersicht erklärt, wie lokale Verarbeitung die Drittanbieter-Datenkette unterbricht.

Praktische Deployment-Hinweise

Installation auf Air-Gapped-Systemen. Das Installationspaket — Windows .exe oder .msi, macOS .dmg, Linux .AppImage oder .deb — wird per USB oder sicherem Dateitransfer in das Air-Gapped-Netzwerk übertragen. Nach der Installation ist kein Internet nötig.

Sprachunterstützung. 24 sprachspezifische Modelle werden mit der App geliefert. Der vollständige Satz ist offline ohne zusätzlichen Download verfügbar.

Hardware-Anforderungen. Die NLP-Pipeline läuft auf modernen Workstations ohne GPU. Die Batch-Verarbeitung von 1.000 Dokumenten dauert in der Regel 5–15 Minuten. Die Geschwindigkeit hängt von der Dokumentgröße und CPU-Leistung ab.

Offline-Lizenz-Setup. Für Netzwerke, in denen kein Lizenzserver erreichbar ist, steht ein Offline-Lizenz-Setup zur Verfügung.

Wenn Air-Gapping nicht die richtige Wahl ist

Air-Gapped-Systeme lösen spezifische Probleme. Sie bringen auch echten Aufwand mit sich.

Update-Aufwand. Modelle und Software aktuell zu halten, erfordert manuelle Schritte. Teams, die zurückfallen, verpassen möglicherweise neue PII-Muster.

Integrations-Overhead. Air-Gapped-Systeme können nicht mit Cloud-SIEM-Tools oder Remote-Audit-Dashboards verbunden werden. Individuelle Data-Diode-Lösungen sind nötig. Das erhöht die Kosten.

Genauigkeitskompromisse. Cloud-Tools aktualisieren Trainingsdaten kontinuierlich. Offline-Modelle sind ein Schnappschuss. Sie können bei neuen Sprachmustern zurückfallen.

Nicht für jedes Bedrohungsmodell nötig. Teams ohne staatliche, gesundheitliche oder rechtliche Auflagen für Datenisolierung finden Cloud-Tools möglicherweise praktischer. Starke Verschlüsselung, SOC-2-Typ-II-Audits und Datenverarbeitungsverträge decken die meisten Fälle ab. Air-Gapping lohnt sich nur, wenn das Bedrohungsmodell wirklich netzwerkbasierten Datendiebstahl durch einen fähigen Angreifer einschließt.

Für die meisten KMUs und Standard-Enterprise-Teams bietet starke Verschlüsselung im Transit und im Ruhezustand ausreichenden Schutz. Solide vertragliche Kontrollen decken die meisten Fälle ab — ohne den Overhead von vollständigem Air-Gapping. Mehr zur Wahl des richtigen Deployment-Modells in unseren FAQ.


Die Desktop-App von anonym.legal (Windows, macOS, Linux) verarbeitet PII vollständig lokal mit gebündelten NLP-Modellen. Nach der Installation ist keine Internetverbindung erforderlich. Die Batch-Verarbeitung unterstützt je nach Plan-Tier 1–5.000 Dateien pro Lauf.

Quellen

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.