By · Last updated 2026-06-05

Zurück zum BlogTechnisch

GDPR-konformes Log-Sharing: So anonymisieren Sie...

Anwendungsprotokolle sammeln stillschweigend Benutzer-E-Mails, IPs und Kontonummern.

June 5, 20267 min Lesezeit
JSON logsGDPR complianceDevOps privacylog anonymizationdata minimization

PII versteckt sich in Anwendungs-Logs

App-Logs sind eine der am häufigsten übersehenen DSGVO-Angriffsflächen in der Entwicklung. Nicht weil Entwickler das Gesetz ignorieren. Sondern weil Benutzerdaten versehentlich in Log-Dateien landen.

Ein einziger JSON-Request-Log kann vier PII-Felder enthalten:

{
  "timestamp": "2025-11-14T09:22:13Z",
  "level": "ERROR",
  "endpoint": "/api/users/profile",
  "user_email": "sarah.johnson@company.com",
  "client_ip": "82.123.45.67",
  "user_agent": "Mozilla/5.0",
  "error": "ValidationError: phone format",
  "input_value": "+49 176 1234 5678"
}

Dieser eine Eintrag enthält eine E-Mail-Adresse, eine IP und eine Telefonnummer. Multipliziert mit Millionen von täglichen API-Aufrufen ergibt das eine bedeutende PII-Verarbeitungsaktivität. Sie benötigt eine Rechtsgrundlage, Fristen und Kontrollen.

Weitergabe an Dritte erhöht das DSGVO-Risiko

Teams teilen Log-Dateien ständig mit externen Parteien:

  • Pen-Test-Firmen erhalten Aufzeichnungen zur Analyse des App-Verhaltens
  • Externe Berater nutzen Log-Stichproben zur Diagnose von Leistungsproblemen
  • Log-Plattformen (Elastic, Datadog, Splunk) empfangen vollständige Ausgabeströme
  • SRE-Auftragnehmer greifen während Vorfällen auf Aufzeichnungen zu
  • Entwicklungsteams in anderen Rechtspersönlichkeiten erhalten Dateien zum Debuggen

Jede Weitergabe wirft DSGVO-Artikel-28-Fragen auf. Ist der Empfänger ein Auftragsverarbeiter? Gibt es einen Auftragsverarbeitungsvertrag? Hat er eine Rechtsgrundlage, um Benutzerdaten in diesen Dateien einzusehen?

Log-Plattformen sind eine häufige Lücke. Das Senden von Ausgaben mit echten Benutzer-E-Mails und IPs an Elastic Cloud oder Datadog schafft eine Verarbeitungsbeziehung. Diese Beziehung erfordert einen AVV, Standardklauseln und ein Transferinstrument, wenn die Plattform außerhalb der EU sitzt. All das kostet Zeit und rechtliche Prüfung.

Der einfachere Weg: Benutzerdaten entfernen, bevor Dateien Ihr System verlassen. Lesen Sie unseren Compliance-Überblick für das vollständige Artikel-28-Rahmenwerk.

Warum JSON-Struktur die Erkennung erschwert

JSON-Log-Dateien variieren in ihrer Struktur. Generisches Text-Scanning reicht nicht aus.

Verschachtelungstiefe: Benutzerdaten können auf jeder Ebene erscheinen. Das Feld request.headers.x-forwarded-for enthält IP-Adressen. Das Feld response.body.errors[0].field_value kann Benutzereingaben aus Fehlern enthalten. Ein flaches Text-Scan übersieht Felder in verschachtelten Pfaden.

Inkonsistente Schemas: Jeder API-Endpunkt erzeugt eine eigene Ausgabeform. Auth-Dateien sehen anders aus als Zahlungsdateien. Profil-Update-Dateien sehen wieder anders aus. Ein fester Pfadansatz übersieht Benutzerdaten, die in Fehlerkontexten an unerwarteten Pfaden erscheinen.

Technische Werte gemischt mit PII: Stack-Traces, Fehlercodes und Zeitstempel müssen erhalten bleiben. Pauschales Entfernen löscht wichtige Felder und macht die Datei unbrauchbar.

Der richtige Ansatz ist die inhaltsbasierte Erkennung. Benutzerdaten anhand ihres Inhalts finden — E-Mail-Muster, IP-Format, benannte Entität — nicht anhand ihrer Position. Dies verarbeitet variable Schemas ohne Konfiguration pro Endpunkt.

Konsistentes Ersetzen hält Logs nutzbar

Die zentrale Anforderung ist referenzielle Integrität. Wenn sarah.johnson@company.com in 47 Einträgen einer Request-Kette erscheint, müssen alle 47 auf denselben Wert abgebildet werden.

Mapping-Regeln:

  • sarah.johnson@company.comuser1@example.com (gleicher Wert in der gesamten Datei)
  • 82.123.45.67192.0.2.1 (RFC-5737-Dokumentations-IP — eindeutig nicht real)
  • +49 176 1234 5678+49 XXX XXX XXXX (maskiert)

Mit diesem Mapping kann ein Entwickler user1@example.com durch 47 Einträge verfolgen, die Request-Kette rekonstruieren und den Fehler beheben — ohne echte Benutzerdaten zu sehen.

Diese Metadaten-Felder bleiben unverändert:

  • Zeitstempel (keine Benutzerdaten)
  • Fehlercodes und -typen (keine Benutzerdaten)
  • Stack-Traces (können Tech-IDs enthalten, keine Benutzerdaten)
  • HTTP-Methoden, Pfade, Statuscodes (keine Benutzerdaten)
  • Metrikwerte und Latenzwerte (keine Benutzerdaten)

Das Ergebnis ist eine Datei, die für Debug-Arbeit funktioniert. Sie enthält keine echten Benutzerdaten. Lesen Sie unser Glossar für den Unterschied zwischen Anonymisierung und Pseudonymisierung gemäß DSGVO.

Anwendungsfall: Pen-Test-Log-Weitergabe

Eine SaaS-Firma führte eine vierteljährliche Sicherheitsüberprüfung mit einem externen Pen-Test-Team durch. Der Umfang erforderte 90 Tage Produktions-API-Ausgabe zur Analyse von Auth-Flows und Fehlermustern.

Rohvolumen: 180 MB JSON-Dateien. PII-Anzahl: 4.200 eindeutige Benutzer-E-Mails, 1.800 eindeutige IPs, 340 partielle Kontonummern in Fehlerkontexten.

Ohne vorheriges Entfernen der Benutzerdaten würde die Weitergabe dieser Dateien erfordern:

  • Einen AVV mit der Pen-Test-Firma
  • Ein DSGVO-Artikel-46-Transferinstrument (die Firma saß außerhalb der EU)
  • Eine Benachrichtigungsprüfung für betroffene Personen

Jeder dieser Punkte bedeutet rechtlichen Aufwand und Zeit.

Mit PII-Entfernung angewendet:

  • Verarbeitungszeit: 25 Minuten für 180 MB
  • Ausgabe: 180 MB strukturidentische Dateien, alle E-Mails und IPs durch sichere Werte ersetzt
  • Ergebnis: Das Pen-Test-Team erhielt den vollen Kontext; keine echten Benutzerdaten gelangten zu ihnen
  • DSGVO-Ergebnis: Kein AVV erforderlich — bereinigte Ausgaben sind keine Benutzerdaten gemäß DSGVO

Lesen Sie unsere FAQ zu häufigen Fragen, was unter DSGVO als anonym gilt.

PII-Entfernung in CI/CD integrieren

Für Teams, die regelmäßig Ausgaben teilen, kann dieser Schritt in bestehende Pipelines integriert werden.

Log-Rotation:

  1. Rotationsskript läuft nächtlich
  2. Entfernungsschritt läuft vor der Archivierung oder dem Versand an Log-Plattformen
  3. Bereinigte Dateien gehen an externe Systeme
  4. Originaldateien verbleiben intern mit voller Aufbewahrung

Vor-Weitergabe-Skript:

  1. Entwickler muss ein Sample mit einem Auftragnehmer teilen
  2. Führt das Skript aus: input=raw-logs/ output=clean-logs/
  3. Teilt den clean-logs/-Ordner
  4. Keine manuelle PII-Prüfung nötig

Sidecar-Ansatz:

  1. Sidecar bereinigt den Ausgabestrom vor der Weiterleitung
  2. Echtzeit-Bereinigung erhält die Nützlichkeit für die Log-Analyse
  3. Die Plattform erhält keine echten Benutzerdaten

Aufbewahrungsrichtlinien-Integration

DSGVO-Artikel 5(1)(e) erfordert Speicherbegrenzung. PII-Entfernung passt in jede Aufbewahrungsrichtlinie.

  • Rohdaten 7 Tage aufbewahren (für tägliche Debug-Arbeit)
  • Bereinigte Versionen 90 Tage aufbewahren (für Trendanalyse und Vorfallsüberprüfung)
  • Entfernungsschritt läuft an Tag 7

Dies erfüllt die Speicherbegrenzung. Es beseitigt das Risiko, Rohdaten langfristig zu speichern.

Quellen

Bereit, Ihre Daten zu schützen?

Beginnen Sie mit der Anonymisierung von PII mit über 285 Entitätstypen in 48 Sprachen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.