Echtzeit-PII-Schutz: KI-Datenlecks stoppen, bevor sie entstehen.
Aktualisiert für 2026.
Im März 2023 kopierte ein Samsung-Ingenieur Quellcode in ChatGPT. Der Code verließ Samsungs Kontrolle sofort. Kein Tool hat ihn rechtzeitig erfasst. Nachträgliche Sicherheitskontrollen können KI-Datenlecks nicht stoppen. Dieses Ereignis hat es bewiesen.
Erkennungstools zeigen, was bereits passiert ist. Log-Prüfungen, Endpoint-DLP und Audit-Logs arbeiten alle so. Bei KI-Lecks ist das zu spät. Die Daten haben das KI-Modell bereits erreicht.
Das Ausmaß des Problems
Eine Cyberhaven-Studie aus dem Jahr 2025 untersuchte die KI-Nutzung in Unternehmen. Die Ergebnisse waren aufschlussreich.
- 11 % aller ChatGPT-Prompts enthalten private oder sensible Daten.
- Der durchschnittliche Mitarbeiter nutzt KI-Tools 14-mal täglich.
- Vielnutzer interagieren 30 bis 50 Mal täglich.
- Bei 11 % bedeutet das 3 bis 5 sensible Übertragungen pro Mitarbeiter und Tag.
Bei einem Unternehmen mit 500 Vielnutzern summiert sich das auf über 2.000 sensible Sends pro Tag. Jedes kann ein Verstoß gegen DSGVO-Artikel 83 sein. Das Risiko ist nicht nur rechtlicher Natur. Vertrauen und Ruf stehen ebenfalls auf dem Spiel.
Häufige Arten sensibler Inhalte in KI-Prompts:
- Kundennamen und Kontaktdaten.
- Kontonummern und Zahlungsunterlagen.
- Medizinische Notizen von Pflegepersonal.
- Falldetails von Anwälten.
- Mitarbeiterbewertungen aus der HR-Abteilung.
- Interne Umsatz- oder Verkaufsprognosen.
Die Studie trennt absichtliches von versehentlichem Teilen nicht. Beides schafft dasselbe rechtliche Risiko. Ein Mitarbeiter, der vergisst, einen Kundennamen zu entfernen, verursacht denselben Verstoß wie einer, der die Regel absichtlich ignoriert. Die Absicht ändert das Ergebnis nicht.
Warum Erkennung nicht ausreicht
Netzwerkprüfungen können HTTPS-Datenverkehr ohne TLS-Blockierung nicht lesen. TLS-Blockierung erzeugt Overhead und wirft Datenschutzbedenken auf. Moderne Browser lehnen sie oft ab.
Endpoint-DLP-Agenten überwachen Zwischenablage und Tastatureingaben. Doch sie haben Verzögerungen. Wenn ein Agent ein Muster erkennt, ist der Prompt möglicherweise bereits gesendet.
Audit-Protokolle des Anbieters erfassen, was geteilt wurde – nachdem es geteilt wurde. Sie helfen bei der Reaktion. Sie stoppen keine Lecks.
Mitarbeiterschulungen sind Richtlinien, keine Kontrollen. Die Cyberhaven-Studie zeigt, dass 11 % der Prompts sensible Inhalte enthalten – selbst bei klaren Richtlinien. Schulungen stoppen keine versehentlichen Fehler.
Blockieren von KI-Tools kostet Produktivität. Mitarbeiter nutzen dann private Geräte oder Konten. Das entzieht alle Aktivitäten jeder Kontrolle.
Keine dieser Methoden stoppt sensible Inhalte in Echtzeit.
Prävention am Eingabepunkt
Die einzige sichere Verteidigung ist Maskierung vor dem Senden. Ein Kundenname, der mit [PERSON_1] ersetzt wird, bevor er den Browser verlässt, wird vom KI-Modell nie gesehen.
So funktioniert Inline-Maskierung:
- Ein Mitarbeiter tippt eine Kunden-E-Mail in Claude oder ChatGPT.
- Das Browser-Add-on erkennt persönliche Daten in Echtzeit.
- Entitäten werden mit Typbezeichnungen markiert: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- Der Mitarbeiter prüft die markierten Elemente.
- Ein Klick ersetzt alle Entitäten durch Token.
- Der maskierte Prompt wird gesendet.
Die KI erhält einen Prompt wie: „Kunde [PERSON_1] bei [EMAIL_1] hat Konto [ACCOUNT_1]."
Die KI bearbeitet die Anfrage. Sie sieht keine echten Namen oder Nummern. Der Mitarbeiter kennt den Kunden aus dem Kontext.
Dieser Ansatz bringt klare Vorteile:
- Personenbezogene Daten bleiben außerhalb externer KI-Systeme.
- Kundendaten werden nicht in KI-Trainingsdaten aufgenommen.
- Mitarbeiter behalten Zugang zu KI-Tools. Die Produktivität bleibt hoch.
Er stoppt keine absichtliche Freigabe, wenn ein Mitarbeiter das Tool umgeht. Datei-Uploads brauchen einen eigenen Workflow. Keine Kontrolle ist perfekt. Aber Inline-Maskierung beseitigt die versehentliche Gruppe. Das ist der größte Teil der Vorfälle. Das Ergebnis ist ein großer Rückgang des Risikos ohne Änderung des täglichen Workflows.
Kanzlei-Fallstudie
Anwälte einer Kanzlei nutzten Claude zum Erstellen von Vertragsnotizen. Ihr Ablauf: Vertragsabschnitte kopieren, in Claude einfügen, Zusammenfassung anfordern.
Vor dem Einsatz der Chrome-Erweiterung – erste 6 Monate:
- 3 Datenschutzvorfälle bei der Compliance-Prüfung festgestellt.
- Jeder Vorfall: Ein Kundenname und eine Auftragsnummer erschienen im Prompt.
- Alle 3 waren versehentlich.
Nach dem Einsatz der Chrome-Erweiterung – nächste 6 Monate:
- Null Datenschutzvorfälle.
- Anwälte erhielten Echtzeit-Warnungen beim Einfügen von Abschnitten mit Kundennamen.
- Ein Klick ersetzte „Johnson Controls Auftrag 2024-0347" durch „[PERSON_1] Auftrag [REFERENCE_1]."
- Der Ablauf blieb unverändert.
Der Geschäftsführer sagte: „Unsere Mitarbeiter kannten die Richtlinie vor dem Add-on. Das Add-on machte Compliance zum einfachen Weg."
Lesen Sie, wie andere Firmen damit umgegangen sind, in unseren Fallstudien. Überprüfen Sie Kontrollen in der Sicherheitsübersicht.
DSGVO-Dokumentation für Compliance-Teams
Firmen, die browserbasierte KI-Maskierung nutzen, müssen sie als technische Maßnahme dokumentieren.
Verzeichnis der Verarbeitungstätigkeiten (VVT): Geben Sie an, dass KI-Prompts vor der Übermittlung an Anbieter clientseitig maskiert werden. Listen Sie Entitätstypen, Engine-Version und Deploy-Protokolle als Nachweis auf.
Auftragsverarbeiterverträge: Wenn keine personenbezogenen Daten den KI-Anbieter erreichen, vereinfachen sich AVV-Pflichten. Die von Ihnen verwalteten Daten verlassen Ihr System nicht.
Audit-Protokolle: Add-on-Protokolle erfassen Entitätszahl pro Sitzung, Maskierungsrate und Entitätstypen nach Volumen. Diese Daten fließen direkt in Compliance-Berichte ein.
Prüfen Sie DSGVO-Anforderungen für KI in unserem Leitfaden zur Rechtskonformität und Glossar. Häufige Fragen beantwortet unser FAQ.
Fazit
Der Samsung-Vorfall zeigte, dass KI-Lecks schneller entstehen, als eine nachträgliche Kontrolle reagieren kann. Die Cyberhaven-Studie beziffert das: 11 % der Prompts, viele Male pro Mitarbeiter, jeden Tag.
Echtzeit-Maskierung vor dem Senden behebt die Ursache. Wenn personenbezogene Daten das KI-Modell nie erreichen, gibt es nichts zu erkennen, zu protokollieren oder zu bereinigen. Mitarbeiter behalten ihre KI-Tools. Unternehmen behalten ihren Compliance-Status.
Erkennung zeigt, wann Prävention versagt hat. Bei KI-Datenlecks rechtfertigen die Kosten eines Versagens – Bußgelder, Reputationsschaden, Vertrauensverlust – Prävention als erste Wahl.
Entdecken Sie Preise für Ihr Unternehmen. Lesen Sie unser Gründerstatement darüber, warum Prävention unser Kernprinzip ist.
Quellen
- Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
- Samsung-ChatGPT-Datenleck, März 2023 — Bloomberg.
- DSGVO-Artikel 4 und 32: Personenbezogene Daten und technische Maßnahmen — gdpr-info.eu.