Wenn das Netzwerk keinen Ausgang hat
Eine Datenwissenschaftlerin arbeitet bei einem Rüstungsunternehmen. Sie hat 3.000 Personaldaten. Sie muss Namen, Sozialversicherungsnummern und Sicherheitsstufen entfernen. Erst dann kann sie die Daten an einen Forschungspartner im Rahmen einer CUI-Vereinbarung weitergeben.
Ihr Netzwerk hat keinen Internetzugang. Absicht.
Sie testet jedes webbasierte Tool, das sie finden kann. Jedes sendet Daten an einen externen Server. Jede Cloud-Plattform braucht ein Konto und eine aktive Verbindung. Selbst „On-Premises"-Tools rufen oft einen Remote-Lizenzserver ab.
Das ist das Air-Gapped-Deployment-Problem. Es trifft weit mehr Teams als die meisten erwarten.
Wer Offline-PII-Entfernung braucht
Rüstungsunternehmen und Behörden sind am stärksten betroffen. Das FedRAMP-Programm der DISA verlangt, dass Daten innerhalb genehmigter Netzwerkgrenzen bleiben. ITAR beschränkt technische Daten auf US-kontrollierte Systeme. Netzwerke wie JWICS und SIPRNet sind physisch isoliert.
Aber der Offline-Bedarf geht weit über klassifizierte Umgebungen hinaus:
Krankenhäuser mit segmentierten Netzwerken. PACS-Bildgebungssysteme, EHR-Plattformen und Forschungsdatenbanken befinden sich oft in Netzwerken ohne Internet.
Handelsbörsen und Clearinghäuser. Proprietäre Handelssysteme und SWIFT-verbundene Systeme nutzen strenge Netzwerktrennung.
Industrielle Steuerungssysteme. SCADA-Netzwerke und kritische Infrastruktur betreiben Air Gaps als Sicherheitsmaßnahme. Post-Stuxnet-Härtung machte dies zur Norm.
Europäische Datenschutzregeln. Die deutschen Landesdatenschutzgesetze und ähnliche EU-Gesetze fordern lokale Datenverarbeitung für sensible Behörden- und Gesundheitsdaten. Das TikTok-DSGVO-Bußgeld von 530 Mio. € kam im Mai 2025. Es betraf Datenübertragungen nach China. Das Bußgeld bewog mehr Teams zu lokalen Tools. Unsere Compliance-Übersicht erklärt die geltenden DSGVO-Transferregeln.
Warum Cloud-Tools in Air-Gapped-Netzwerken versagen
Die meisten Datenentfernungs-Tools folgen einem SaaS-Modell:
Gerät → HTTPS → Anbieter-API → NLP-Modelle → Antwort → Gerät
Dieses Design braucht Internetzugang am verarbeitenden Gerät. Es braucht Vertrauen in die Anbieter-Server. Daten überqueren externe Netzwerke.
In einem Air-Gapped-Netzwerk ist Schritt eins physisch unmöglich. In regulierten Umgebungen kann jeder der Schritte zwei bis vier gegen Compliance-Regeln verstoßen.
Self-hosted Presidio ist die übliche Alternative. Aber es braucht Docker-Kenntnisse und Python-Setup. Es braucht auch spaCy-Modell-Downloads, die Internetzugang erfordern. Und es braucht laufenden IT-Support. Die meisten Teams haben das nicht.
Die Lücke zwischen Cloud-Einfachheit und Self-Hosted-Aufwand ist genau das, was lokale Desktop-Tools schließen.
Wie lokale PII-Entfernung funktioniert
Ein gutes Offline-Tool liefert alles mit, was es braucht:
Gebündelte NLP-Modelle. spaCy-Modelle (je 40–80 MB) und Transformer-Modelle zur Erkennung benannter Entitäten sind Teil des Installers. Kein Download beim Ausführen.
Lokale Erkennungs-Pipeline. Regex, NLP und ML laufen alle auf der lokalen CPU — oder GPU, falls vorhanden. Die Presidio-basierte Engine in anonym.legal macht während eines Laufs keine Netzwerkaufrufe.
Verschlüsselter lokaler Tresor. Konfigurationen, Voreinstellungen und Schlüssel werden lokal gespeichert. Der Tresor verwendet AES-256-GCM-Verschlüsselung und Argon2id-Schlüsselableitung. Keine Cloud-Synchronisation. Kein Remote-Backup. Der Tresor bleibt auf dem Gerät.
Lokales Datei-I/O. Eingabedateien kommen aus dem lokalen Speicher. Ausgabedateien gehen zurück in den lokalen Speicher. Keine Daten überqueren eine Netzwerkschnittstelle.
Kleine Angriffsfläche. Die Desktop-App verwendet Tauri 2.0 (Rust-basiert). Tauri hat eine viel kleinere Angriffsfläche als Electron (Chromium-basiert). Seine Binärdatei ist etwa zehnmal kleiner. Sie ruft auch weniger OS-APIs auf.
Drei reale Compliance-Szenarien
ITAR-Dokumente — 500 Dateien
Ein Rüstungsunternehmen muss technische Dokumente unter einer Lizenzausnahme mit einem ausländischen Partner teilen. Die Dateien enthalten US-Personennamen und Personaldaten. Beides muss zuerst entfernt werden.
Kernbedarf: Verarbeitung nur auf freigegebenen Workstations. Keine Daten außerhalb des freigegebenen Netzwerks. Ein Prüfpfad, der die Arbeit belegt. Batch-Unterstützung für 500+ Dateien.
Die Desktop-App verarbeitet alle 500+ DOCX-Dateien lokal im Batch-Modus. Während des Laufs wird kein Netzwerkaufruf gemacht. Das Prüfprotokoll bleibt im lokalen Tresor. Das Ergebnis erfüllt die ITAR-Lizenzausnahmeanforderungen.
Deutsche Bundesbehörde — Beschwerdedaten
Eine deutsche Bundesbehörde muss personenbezogene Daten aus Bürger-Beschwerdedaten entfernen. Dann sendet sie die Daten an ein Forschungsinstitut. Der BfDI verbietet die Verarbeitung auf nicht-staatlichen Systemen.
Die Desktop-App läuft auf behördlichen Windows-11-Workstations. Alle Verarbeitung ist lokal. Das IT-Sicherheitsteam bestätigt dies mit Traffic-Monitoring — null externe Verbindungen während des Laufs.
Klinische Forschung — EHR-De-Identifikation
Ein Krankenhausforschungsteam muss Patientendaten für eine klinische Studie entfernen. HIPAA Safe Harbor verlangt das Entfernen von 18 Identifikatortypen. Das klinische Netzwerk hat keinen Internetzugang.
Die Desktop-App verarbeitet EHR-Exporte im CSV- und JSON-Format als Batch. Der Datenschutzbeauftragte prüft die Ausgabe gegen Safe-Harbor-Regeln, bevor der Datensatz an Forschungspartner geht.
Worauf man bei einem Offline-Tool achten sollte
| Fähigkeit | Warum wichtig |
|---|---|
| Vollständig offline nach Installation | Keine Internet-Abhängigkeit bei der Verarbeitung |
| Gebündelte NLP-Modelle | Kein Download-Schritt nötig |
| Batch-Verarbeitung | Große Mengen ohne manuelle Arbeit |
| Lokaler verschlüsselter Tresor | Sichere Speicherung von Konfigurationen und Schlüsseln |
| Prüfprotokoll | Nachweise für Compliance-Reviews |
| Windows-, macOS-, Linux-Support | Deckt klassifizierte Workstation-Typen ab |
| Keine Telemetrie-Option | Verhindert Datentransfer über Telemetrie |
| Dateiformat-Unterstützung | DOCX, PDF, TXT, CSV, JSON, Excel |
Datenschutzregeln treiben Teams zu lokalen Tools
Das TikTok-Bußgeld von 530 Mio. € löste eine breitere Bußgeldwelle aus. EU-Teams, die Cloud-Tools nutzten, stellen nun eine neue Frage. Erfüllt die Verarbeitung auf Anbieter-Servern DSGVO Kapitel V und nationale Datenschutzgesetze?
Die klarste Antwort auf „Wo gehen Ihre Daten hin?" lautet: nirgendwo — sie verlassen das Gerät nicht. Lokale Verarbeitung beseitigt die DSGVO-Transferfrage vollständig.
Für deutsche Teams macht die strenge Auslegung der DSGVO-Artikel 44–46 lokale Verarbeitung zur klugen Wahl. Das gilt auch ohne strenge Netzwerkbeschränkungen. Unsere Sicherheitsübersicht erklärt, wie lokale Verarbeitung die Drittanbieter-Datenkette unterbricht.
Praktische Deployment-Hinweise
Installation auf Air-Gapped-Systemen. Das Installationspaket — Windows .exe oder .msi, macOS .dmg, Linux .AppImage oder .deb — wird per USB oder sicherem Dateitransfer in das Air-Gapped-Netzwerk übertragen. Nach der Installation ist kein Internet nötig.
Sprachunterstützung. 24 sprachspezifische Modelle werden mit der App geliefert. Der vollständige Satz ist offline ohne zusätzlichen Download verfügbar.
Hardware-Anforderungen. Die NLP-Pipeline läuft auf modernen Workstations ohne GPU. Die Batch-Verarbeitung von 1.000 Dokumenten dauert in der Regel 5–15 Minuten. Die Geschwindigkeit hängt von der Dokumentgröße und CPU-Leistung ab.
Offline-Lizenz-Setup. Für Netzwerke, in denen kein Lizenzserver erreichbar ist, steht ein Offline-Lizenz-Setup zur Verfügung.
Wenn Air-Gapping nicht die richtige Wahl ist
Air-Gapped-Systeme lösen spezifische Probleme. Sie bringen auch echten Aufwand mit sich.
Update-Aufwand. Modelle und Software aktuell zu halten, erfordert manuelle Schritte. Teams, die zurückfallen, verpassen möglicherweise neue PII-Muster.
Integrations-Overhead. Air-Gapped-Systeme können nicht mit Cloud-SIEM-Tools oder Remote-Audit-Dashboards verbunden werden. Individuelle Data-Diode-Lösungen sind nötig. Das erhöht die Kosten.
Genauigkeitskompromisse. Cloud-Tools aktualisieren Trainingsdaten kontinuierlich. Offline-Modelle sind ein Schnappschuss. Sie können bei neuen Sprachmustern zurückfallen.
Nicht für jedes Bedrohungsmodell nötig. Teams ohne staatliche, gesundheitliche oder rechtliche Auflagen für Datenisolierung finden Cloud-Tools möglicherweise praktischer. Starke Verschlüsselung, SOC-2-Typ-II-Audits und Datenverarbeitungsverträge decken die meisten Fälle ab. Air-Gapping lohnt sich nur, wenn das Bedrohungsmodell wirklich netzwerkbasierten Datendiebstahl durch einen fähigen Angreifer einschließt.
Für die meisten KMUs und Standard-Enterprise-Teams bietet starke Verschlüsselung im Transit und im Ruhezustand ausreichenden Schutz. Solide vertragliche Kontrollen decken die meisten Fälle ab — ohne den Overhead von vollständigem Air-Gapping. Mehr zur Wahl des richtigen Deployment-Modells in unseren FAQ.
Die Desktop-App von anonym.legal (Windows, macOS, Linux) verarbeitet PII vollständig lokal mit gebündelten NLP-Modellen. Nach der Installation ist keine Internetverbindung erforderlich. Die Batch-Verarbeitung unterstützt je nach Plan-Tier 1–5.000 Dateien pro Lauf.
Quellen
- DISA FedRAMP vs. ITAR — Paramify-Übersicht — VERIFIED-EXTERNAL
- DSGVO Kapitel V — Internationale Übermittlungen — VERIFIED-EXTERNAL
- TikTok €530M DPC-Durchsetzungsmaßnahme (Mai 2025) — VERIFIED-EXTERNAL
- Tauri-Sicherheitsmodell — VERIFIED-EXTERNAL
- HIPAA Safe Harbor De-Identifikation — 45 CFR 164.514 — VERIFIED-EXTERNAL