Docs/Glossary

Glossar Datenschutz & Technologie

Definitionen aller Begriffe, Akronyme und Konzepte rund um PII-Anonymisierung und Datenschutz.

Zurück zu den Dokumenten

94 Begriffe

2

2FA

Zwei-Faktor-Authentifizierung

Verschlüsselung & Sicherheit

Authentifizierung, die zwei unterschiedliche Verifizierungsfaktoren erfordert: etwas, das der Nutzer weiß (Passwort), und etwas, das der Nutzer besitzt (TOTP-App, Hardware-Schlüssel) oder ist (biometrisch). Wird in anonym.legal als zusätzliche Sicherheitsebene über ZK Auth hinaus unterstützt.

#twofa

A

AES-256-GCM

Advanced Encryption Standard 256-bit Galois/Counter Mode

Verschlüsselung & Sicherheit

Ein authentifizierter Verschlüsselungsalgorithmus, der AES-256 (256-Bit-Schlüssel) mit Galois/Counter Mode für Vertraulichkeit und Integrität kombiniert. Wird in der reversiblen Anonymisierung von anonym.legal verwendet, um ersetzte Entitäten zu verschlüsseln. Bietet sowohl Geheimhaltung als auch Manipulationserkennung.

#aes256gcm

Anonymization

Datenanonymisierung

Datenschutz & PII

Der irreversible Prozess des Entfernens oder Umwandelns identifizierender Informationen, sodass Personen nicht mehr direkt oder indirekt identifiziert werden können. Nach der DSGVO fallen wirklich anonymisierte Daten nicht mehr in den Anwendungsbereich der Verordnung.

#anonymization

Anwaltsgeheimnis

Schutz des Anwaltsgeheimnisses

Recht & Audit

Rechtlicher Schutz für vertrauliche Kommunikation zwischen Anwälten und Mandanten. Bei Dokumentenprüfung und e-Discovery müssen privilegierte Inhalte identifiziert und zurückgehalten oder geschwärzt werden. Benutzerdefinierte Entitätstypen in anonym.legal können zur Markierung privilegierter Inhalte konfiguriert werden.

#attorneyclientprivilege

Argon2id

Argon2id-Schlüsselableitungsfunktion

Verschlüsselung & Sicherheit

Der Gewinner des Password Hashing Competition 2015. Argon2id kombiniert den Seitenkanalwiderstand von Argon2i mit der GPU-Resistenz von Argon2d. Wird in anonym.legal und dem Desktop-App-Tresor verwendet, um Verschlüsselungsschlüssel aus Nutzerpassphrasen abzuleiten.

#argon2id

Audit-Trail

Unveränderlicher Audit-Trail

Recht & Audit

Eine sequenzielle, manipulationssichere Protokollierung, die aufzeichnet, wer wann auf Daten zugegriffen, diese verändert oder verarbeitet hat. Erforderlich nach ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)) und e-Discovery-Regeln. anonym.legal protokolliert alle Anonymisierungsvorgänge mit Zeitstempeln, Entitätsanzahl und Operator-IDs.

#audittrail

B

Batch Processing

Stapel-Dateianonymisierung

Plattform & Produkte

Gleichzeitige Verarbeitung mehrerer Dateien in einem einzigen Vorgang. Der Stapelmodus von anonym.legal unterstützt PDF-, DOCX- und TXT-Dateien mit individueller Entitätskonfiguration, Vertrauensschwellen und Auswahl des Ausgabeformats pro Datei.

#batchprocessing

Behördliche Ausweise

Entitätstypen für behördliche Identifikatoren

Entitätstypen

Entitätstypen für nationale und behördlich ausgestellte Identifikatoren: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE und über 50 weitere länderspezifische ID-Formate. Erkennung mittels länderspezifischer Regex- und Prüfziffernmuster.

#governmentid

Beweisvereitelung

Beweisvernichtung/-veränderung

Recht & Audit

Die Zerstörung, Veränderung oder das Versäumnis, für ein Verfahren relevante Beweise zu erhalten. Zu starke Schwärzung, die Dokumente unlesbar macht, kann als Beweisvereitelung gewertet werden. Die präzise Kalibrierung der Anonymisierung (Vertrauensschwellen, Entitätsauswahl) ist für rechtssichere Schwärzung entscheidend.

#spoliation

BIP39

Bitcoin Improvement Proposal 39 — Mnemonic Phrases

Verschlüsselung & Sicherheit

Ein Standard zur Generierung von menschenlesbaren mnemonischen Seed-Phrasen (12–24 Wörter) aus einem kryptografischen Seed. Wird im Desktop-App-Tresor von anonym.legal als benutzerfreundliches Backup für den aus Argon2id abgeleiteten Verschlüsselungsschlüssel verwendet.

#bip39

C

CCPA

California Consumer Privacy Act

Compliance & Vorschriften

Kalifornisches Datenschutzgesetz, das Einwohnern das Recht auf Auskunft, Löschung und Widerspruch gegen den Verkauf ihrer personenbezogenen Daten gewährt. Gilt für Unternehmen, die bestimmte Umsatz-, Datenmengen- oder Datenverkaufs-Schwellenwerte erreichen. Wesentlich geändert durch die CPRA (verabschiedet im November 2020, in Kraft seit Januar 2023).

#ccpa

Chrome Extension

anonym.legal Chrome-Erweiterung

Plattform & Produkte

Browser-Erweiterung (Manifest V3), die Text abfängt, bevor er an KI-Chatbots (ChatGPT, Claude, Gemini, Perplexity, DeepSeek) gesendet wird. Anonymisiert in Echtzeit und entschlüsselt optional KI-Antworten mit gespeicherten Schlüsseln.

#chromeextension

CLOUD Act

Clarifying Lawful Overseas Use of Data Act

Compliance & Vorschriften

US-Bundesgesetz (2018), das US-Strafverfolgungsbehörden befugt, US-basierte Cloud-Anbieter zur Herausgabe von im Ausland gespeicherten Daten zu zwingen. Steht im Konflikt mit den GDPR-Vorschriften zu Datenübermittlungen von EU-Bürgern. Die Anonymisierung von Daten vor dem Cloud-Upload ist eine gängige Gegenmaßnahme.

#cloudact

Code-Switching

Multilingual Code-Switching

Erkennungstechnologie

Das Phänomen, bei dem innerhalb eines Textes oder Gesprächs zwei oder mehr Sprachen gemischt werden. Häufig in mehrsprachigen Dokumenten (z. B. deutsche Rechtsdokumente mit englischen Fachbegriffen). Die hybride Erkennung von anonym.legal verarbeitet Code-Switching, indem mehrere Sprachmodelle gleichzeitig angewendet werden.

#codeswitching

Confidence Scoring

Entity Detection Confidence Score

Erkennungstechnologie

Ein Wert von 0–1, der angibt, wie sicher das Erkennungsmodell ist, dass eine Textstelle eine PII-Entität darstellt. anonym.legal bietet konfigurierbare Confidence-Thresholds, sodass Nutzer das Verhältnis von Präzision zu Recall für ihren Anwendungsfall anpassen können.

#confidencescoring

CSP

Content Security Policy

Verschlüsselung & Sicherheit

Ein HTTP-Response-Header und Meta-Tag-Mechanismus, der einschränkt, welche Ressourcen (Skripte, Styles, Bilder) ein Browser laden darf. Die CSP von anonym.legal umfasst object-src 'none', script-src mit Nonces und upgrade-insecure-requests, um XSS-Angriffe zu verhindern.

#csp

Custom Entities

Benutzerdefinierte Entitätserkenner

Plattform & Produkte

Vom Nutzer definierte PII-Muster, die zusätzlich zu den über 285 integrierten Entitätstypen von anonym.legal hinzugefügt werden können. Unterstützt Regex-Muster, Wortlisten und Negativlisten. Nützlich für organisationsspezifische Kennungen wie Mitarbeiter-IDs, interne Projektcodes oder proprietäre Produktnamen.

#customentities

D

Data Minimization

DSGVO-Datenminimierungsprinzip

Datenschutz & PII

Das in DSGVO Artikel 5(1)(c) festgelegte Prinzip, dass nur Daten erhoben und verarbeitet werden dürfen, die für den angegebenen Zweck angemessen, relevant und notwendig sind. Ein zentrales Gestaltungsprinzip für datenschutzkonforme Systeme.

#dataminimization

Data Residency

Data Residency Requirements

Compliance & Vorschriften

Gesetzliche oder vertragliche Anforderungen, die festlegen, in welchem geografischen Gebiet Daten gespeichert und verarbeitet werden müssen. Relevant für die GDPR (Datenübermittlungen außerhalb des EWR), das deutsche BDSG und branchenspezifische Vorschriften im Gesundheits- und Finanzwesen.

#dataresidency

Data Sovereignty

Digitale Datensouveränität

Compliance & Vorschriften

Das Prinzip, dass Daten den Gesetzen und Governance-Strukturen des Landes unterliegen, in dem sie erhoben werden. Geht über Data Residency hinaus und umfasst die Kontrolle darüber, wer auf Daten zugreifen darf und unter welchem rechtlichen Rahmen.

#datasovereignty

DDoS-Schutz

Distributed Denial of Service Schutz

Infrastruktur

Infrastrukturelle Schutzmaßnahmen gegen verteilte Denial-of-Service-Angriffe. Die Serverinfrastruktur von anonym.legal umfasst Firewall-Regeln (UFW), nginx-Verbindungslimits und Cloudflare-äquivalente Upstream-Schutzmechanismen zur Sicherstellung der Verfügbarkeit.

#ddosprotection

De-anonymization

Re-Identifizierungsangriff

Datenschutz & PII

Der Prozess der Re-Identifizierung von Personen aus vermeintlich anonymisierten Datensätzen durch Abgleich mit Zusatzinformationen. Ein zentrales Risiko beim Teilen von Daten mit unzureichender Anonymisierungstiefe.

#deanonymization

Desktop App

anonym.legal Desktop-Anwendung

Plattform & Produkte

Plattformübergreifende Anwendung (Windows, macOS, Linux) entwickelt mit Tauri 2.0 und React 18. Bietet lokale Dateiverarbeitung, BIP39-Tresor für Offline-ZK Auth, Stapel-Export und API-Synchronisation. Unterstützt Air-Gap-Deployments ohne Internetzugang.

#desktopapp

Differential Privacy

Differential Privacy (DP)

Datenschutz & PII

Ein mathematisches Rahmenwerk zur Veröffentlichung statistischer Informationen über Datensätze, das nachweisbare Garantien bietet, dass die Daten einzelner Personen nicht unterscheidbar sind. Wird in aggregierten Analysen eingesetzt, um Re-Identifizierung auch bei Abfragen aggregierter Ergebnisse zu verhindern.

#differentialprivacy

Digitale Identifikatoren

Digitale Identitäts-Entitätstypen

Entitätstypen

Entitätstypen für Online- und digitale Identifikatoren: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 und IPv6), URL, DOMAIN_NAME, CRYPTO (Bitcoin/Ethereum-Adressen) sowie plattformspezifische Identifikatoren.

#digitalidentifiers

DLP

Data Loss Prevention

Plattform & Produkte

Eine Sicherheitsdisziplin und Kategorie von Softwaretools, die die unbefugte Übertragung sensibler Daten außerhalb einer Organisation erkennen und verhindern. anonym.legal fungiert als DLP-Lösung auf Browser- und KI-Ebene für PII.

#dlp

DPA

Data Processing Agreement

Compliance & Vorschriften

Ein rechtlich bindender Vertrag zwischen Verantwortlichem und Auftragsverarbeiter, vorgeschrieben durch GDPR Article 28. Legt Gegenstand, Dauer, Art, Zweck und Art der Verarbeitung personenbezogener Daten sowie die Rechte und Pflichten beider Parteien fest.

#dpa

DPIA

Data Protection Impact Assessment

Compliance & Vorschriften

Ein Risikobewertungsprozess, der gemäß GDPR Article 35 für Verarbeitungstätigkeiten erforderlich ist, die voraussichtlich ein hohes Risiko für die Rechte und Freiheiten von Personen darstellen. Obligatorisch bei systematischem Profiling, großflächiger PHI-Verarbeitung und Überwachung öffentlicher Bereiche.

#dpia

E

e-Discovery

Elektronische Beweismittelfindung

Recht & Audit

Der Prozess der Identifizierung, Sammlung und Bereitstellung elektronisch gespeicherter Informationen in Gerichtsverfahren. Erfordert das Schwärzen von PII und privilegierten Informationen in bereitgestellten Dokumenten. Ein zentrales Einsatzszenario für Rechtsabteilungen, die anonym.legal nutzen.

#ediscovery

E2EE

Ende-zu-Ende-Verschlüsselung

Verschlüsselung & Sicherheit

Verschlüsselung, bei der nur die kommunizierenden Parteien die Nachrichten lesen können; der Dienstanbieter hat keinen Zugriff auf den Klartext. Im ZK Auth-Modus von anonym.legal verlassen die Verschlüsselungsschlüssel niemals das Client-Gerät, wodurch E2EE für die Speicherung anonymisierter Ausgaben erreicht wird.

#e2ee

Entitätstyp

PII-Entitätstyp

Entitätstypen

Eine Kategorie personenbezogener Informationen, die von der Erkennungs-Engine erkannt und anonymisiert werden kann. Beispiele: PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal unterstützt über 285 Entitätstypen in 48 Sprachen.

#entitytype

EU-Datenresidenz

Datenresidenz in der Europäischen Union

Infrastruktur

Die Garantie, dass Daten ausschließlich innerhalb des EU/EWR-Gebiets gespeichert und verarbeitet werden. Die Produktionsserver von anonym.legal stehen in Deutschland (Hetzner Frankfurt), sodass alle Verarbeitungen unter DSGVO-Recht ohne grenzüberschreitende Datenübertragung erfolgen.

#eudataresidency

F

Fahrzeug-Identifikatoren

Fahrzeug-Entitätstypen

Entitätstypen

Entitätstypen für fahrzeugbezogene Identifikatoren: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Fahrzeug-Identifikationsnummer) und länderspezifische Kfz-Kennzeichenformate.

#vehicleidentifiers

Finanzielle Entitäten

Finanzielle PII-Entitätstypen

Entitätstypen

Entitätstypen für finanzielle Identifikatoren: CREDIT_CARD (Luhn-Prüfziffer), IBAN_CODE (ISO 13616 Prüfziffer), SWIFT_CODE (BIC-Format), US_BANK_NUMBER, NRP (spanische Steuer-ID). Erkennung mit Prüfziffernvalidierung zur Minimierung von Fehlalarmen.

#financialentities

FOIA

Freedom of Information Act

Compliance & Vorschriften

US-Bundesgesetz (und entsprechende Gesetze in anderen Rechtsordnungen), das der Öffentlichkeit Zugang zu Regierungsunterlagen gewährt. Erfordert die Schwärzung von PII und anderen ausgenommenen Informationen vor der Offenlegung – ein zentrales Anwendungsfeld für juristische und behördliche Anonymisierungsprozesse.

#foia

G

GDPR

Datenschutz-Grundverordnung

Compliance & Vorschriften

EU-Verordnung 2016/679, das zentrale Datenschutzrahmenwerk der Europäischen Union. Gilt für jede Organisation, die personenbezogene Daten von EU-Bürgern verarbeitet. Bußgelder bis zu 20 Mio. € oder 4 % des weltweiten Jahresumsatzes. Wichtige Rechte: Auskunft, Löschung, Übertragbarkeit, Einschränkung, Widerspruch.

#gdpr

GDPR Article 25

GDPR Article 25 — Datenschutz durch Technikgestaltung und durch datenschutzfreundliche Voreinstellungen

Compliance & Vorschriften

Verpflichtet Verantwortliche, geeignete technische und organisatorische Maßnahmen (wie Pseudonymisierung und Datenminimierung) sowohl bei der Systemgestaltung als auch standardmäßig während der Verarbeitung umzusetzen.

#gdprarticle25

GDPR Article 32

GDPR Article 32 — Sicherheit der Verarbeitung

Compliance & Vorschriften

Verpflichtet Verantwortliche und Auftragsverarbeiter, geeignete technische und organisatorische Maßnahmen zu ergreifen, um ein dem Risiko angemessenes Sicherheitsniveau zu gewährleisten, einschließlich Verschlüsselung, Pseudonymisierung, Vertraulichkeit, Integrität, Verfügbarkeit und Belastbarkeit der Verarbeitungssysteme.

#gdprarticle32

GenAI DLP

Generative AI Data Loss Prevention

Plattform & Produkte

Eine spezialisierte DLP-Kategorie, die darauf abzielt, zu verhindern, dass PII und vertrauliche Daten in Prompts an generative KI-Modelle (ChatGPT, Claude, Gemini) gelangen. Die Chrome-Erweiterung und der MCP Server von anonym.legal adressieren dieses Risiko direkt bei der Eingabe.

#genaidlp

Gesundheitswesen-Entitäten

PII-Entitätstypen im Gesundheitswesen

Entitätstypen

Entitätstypen für die 18 HIPAA Safe Harbor Identifikatoren sowie weitere gesundheitsbezogene PII: US_MRN (medizinische Fallnummern), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY und Entitäten im Diagnose-/Behandlungskontext.

#healthcareentities

H

Hashing

Kryptografisches Hashing

Datenschutz & PII

Eine Einwegtransformation von Daten in einen Digest fester Länge mittels Algorithmen wie SHA-256. Wird für konsistente Pseudonymisierung, Duplikaterkennung und Integritätsprüfung eingesetzt. Hashwerte können nicht zurückgerechnet werden, sind jedoch ohne Salt anfällig für Rainbow-Table-Angriffe.

#hashing

Hetzner

Hetzner Online GmbH

Infrastruktur

Deutscher Cloud- und Hosting-Anbieter, auf dessen Infrastruktur anonym.legal produktiv betrieben wird. Standort: Falkenstein, Sachsen (Rechenzentrum fsn1) mit ISO 27001-Zertifizierung. Gewählt für EU-Datenresidenz, Compliance und eine DSGVO-freundliche Rechtslage nach deutschem Recht.

#hetzner

HIPAA

Health Insurance Portability and Accountability Act

Compliance & Vorschriften

US-Bundesgesetz, das Standards zum Schutz sensibler Patientendaten festlegt. Die Privacy Rule regelt die Nutzung von PHI; die Security Rule verlangt administrative, physische und technische Schutzmaßnahmen für elektronische PHI (ePHI). Verstöße werden mit bis zu 1,9 Mio. $ pro Kategorie und Jahr geahndet.

#hipaa

HIPAA Safe Harbor

HIPAA Safe Harbor De-identification Method

Compliance & Vorschriften

Eine von zwei von HIPAA zugelassenen Methoden zur De-Identifizierung, bei der alle 18 festgelegten Patientenidentifikatoren (Name, Adresse, Daten, Telefonnummern, SSN, E-Mail, IP-Adresse, biometrische Daten usw.) entfernt werden müssen, um Gesundheitsdaten nicht mehr einer Person zuordnen zu können.

#hipaasafeharbor

HSTS

HTTP Strict Transport Security

Verschlüsselung & Sicherheit

Ein Web-Sicherheitsmechanismus, der Browser dazu zwingt, ausschließlich HTTPS-Verbindungen zu verwenden. anonym.legal setzt Strict-Transport-Security: max-age=31536000; includeSubDomains, um Protokoll-Down-Grade-Angriffe und Cookie-Diebstahl zu verhindern.

#hsts

Hybrid Detection

Hybrid NLP + Regex + ML Detection

Erkennungstechnologie

Das dreistufige Verfahren von anonym.legal: Regex-Muster für strukturierte PII (Telefonnummern, IBANs, Kreditkarten), NLP/NER-Modelle für kontextabhängige Entitäten (Namen, Organisationen, Orte) und ML-Klassifikatoren für mehrdeutige Fälle. Reduziert sowohl False Positives als auch False Negatives.

#hybriddetection

I

Image Redactor

Presidio Image Redactor Service

Infrastruktur

Ein spezialisierter Backend-Service (Port 8013), der PII in Bilddateien (PNG, JPEG) mittels OCR und Presidio-Analyse erkennt und schwärzt. Über erkannte PII-Bereiche wird im Originalbild eine schwarze Balkenschwärzung gelegt.

#presidioimageredactor

ISO 27001

ISO/IEC 27001 Informationssicherheitsmanagement

Compliance & Vorschriften

Internationaler Standard für Informationssicherheits-Managementsysteme (ISMS). Die Zertifizierung erfordert dokumentierte Richtlinien, Risikobewertungen und Kontrollen. Die EU-Server von anonym.legal sind ISO 27001-zertifiziert und gewährleisten eine strukturierte Sicherheitssteuerung.

#iso27001

ISO 27001 SoA

Statement of Applicability

Compliance & Vorschriften

Ein verpflichtendes ISO 27001-Dokument, das alle Annex A-Kontrollen auflistet, angibt, welche für die Organisation gelten, und die Begründung für Ein- und Ausschlüsse liefert. Für die Zertifizierung und Audits erforderlich.

#iso27001soa

J

JWT

JSON Web Token

Verschlüsselung & Sicherheit

Ein kompaktes, URL-sicheres Token-Format zur Übertragung von Claims zwischen Parteien. anonym.legal verwendet mit HS256 signierte JWTs für die interne Authentifizierung zwischen Diensten (z. B. Frontend → Presidio API). Tokens sind kurzlebig und werden serverseitig validiert.

#jwt

K

KEK

Key Encryption Key

Verschlüsselung & Sicherheit

Ein Schlüssel, der zur Verschlüsselung anderer Schlüssel und nicht direkt von Daten verwendet wird. Im ZK-Architekturmodell von anonym.legal dient der aus der Nutzerpassphrase abgeleitete Schlüssel als KEK zum Schutz der pro Dokument gespeicherten Verschlüsselungsschlüssel im verschlüsselten Tresor.

#kek

L

Language Detection

Automatic Language Detection

Erkennungstechnologie

Die automatische Erkennung der Sprache eines Eingangstextes vor der PII-Analyse. anonym.legal erkennt die Sprache auf Anfrageebene und leitet an die passende NER-Modellpipeline weiter, wobei Englisch als Fallback für nicht unterstützte Sprachen dient.

#languagedetection

M

Masking

Datenmaskierung

Datenschutz & PII

Ersetzung sensibler Werte durch realistisch wirkende, aber fiktive Daten, die Format und Struktur beibehalten. Wird für Testumgebungen, Analysen und das Teilen von Datensätzen ohne Offenlegung echter PII verwendet.

#masking

MCP

Model Context Protocol

Plattform & Produkte

Ein offenes Protokoll von Anthropic, das es KI-Modellen ermöglicht, in standardisierter Weise mit externen Tools und Datenquellen zu interagieren. anonym.legal implementiert einen MCP Server, sodass KI-Coding-Tools Anonymisierung direkt im Workflow aufrufen können.

#mcp

MCP Server

Model Context Protocol Server

Plattform & Produkte

Die MCP Server-Integration von anonym.legal ermöglicht es KI-Coding-Assistenten (Claude Desktop, Cursor, VS Code Copilot), die Anonymisierungs-API direkt als Tool aufzurufen. PII wird aus Code, Prompts und Kontext entfernt, bevor sie an das KI-Modell gesendet werden.

#mcpserver

ML Models

Machine Learning Models for PII Detection

Erkennungstechnologie

Statistische Modelle, die auf annotierten Textkorpora trainiert wurden, um PII im Kontext zu erkennen. anonym.legal verwendet sowohl spaCy-Transformer-Pipelines als auch feinabgestimmte XLM-RoBERTa-Modelle für mehrsprachige Entitätenerkennung im Produktivbetrieb.

#mlmodels

N

NER

Named Entity Recognition

Erkennungstechnologie

Eine Aufgabe der Verarbeitung natürlicher Sprache, bei der benannte Entitäten im Text erkannt und in vordefinierte Kategorien wie Personen, Organisationen, Orte, Daten und medizinische Kennungen klassifiziert werden. Die zentrale ML-Technik für die PII-Erkennung in anonym.legal.

#ner

NIS2

Network and Information Security Directive 2

Compliance & Vorschriften

EU-Richtlinie 2022/2555, die die ursprüngliche NIS-Richtlinie auf weitere Sektoren (Gesundheitswesen, Energie, Verkehr, digitale Infrastruktur) ausweitet und die Anforderungen an die Cybersicherheit verschärft. Die Umsetzungsfrist war der 17. Oktober 2024; die meisten EU-Mitgliedstaaten haben diese verpasst, woraufhin die Europäische Kommission Vertragsverletzungsverfahren gegen nicht konforme Staaten eingeleitet hat.

#nis2

NLP

Natural Language Processing

Erkennungstechnologie

Ein Teilgebiet der künstlichen Intelligenz, das sich mit der Interaktion zwischen Computern und menschlicher Sprache befasst. Bei der PII-Erkennung ermöglichen NLP-Modelle das Verständnis von Kontext, Grammatik und Semantik, um Entitäten zu identifizieren, die reine Regex-Muster nicht erfassen würden.

#nlp

O

Office Add-in

anonym.legal Microsoft Office Add-in

Plattform & Produkte

Microsoft Office-Erweiterung, die PII-Anonymisierung direkt in Word, Excel und PowerPoint integriert. Unterstützt Schwärzung im Dokument, Preset-Verwaltung, ZK Auth und Synchronisation über Geräte hinweg. Verfügbar über Microsoft AppSource.

#officeaddin

Operators

Anonymisierungs-Operatoren

Plattform & Produkte

Die Ersetzungsstrategie, die auf erkannte PII angewendet wird. anonym.legal unterstützt REPLACE (Platzhaltertext), REDACT (leerer String), MASK (Sternchen), HASH (SHA-256-Digest), ENCRYPT (reversible AES-256-GCM) und CUSTOM (benutzerdefinierter Ersatz).

#operators

P

PCI DSS

Payment Card Industry Data Security Standard

Compliance & Vorschriften

Sicherheitsstandard für Organisationen, die Zahlungs­kartendaten verarbeiten, herausgegeben vom PCI Security Standards Council. Erfordert Verschlüsselung, Zugriffskontrollen, Protokollierung und regelmäßige Tests. Nicht-Einhaltung kann zu Bußgeldern und Verlust der Kartenakzeptanz führen.

#pcidss

PHI

Geschützte Gesundheitsinformationen

Datenschutz & PII

Alle gesundheitsbezogenen Informationen, die mit einer identifizierbaren Person verknüpft sind und in den USA unter HIPAA reguliert werden. Umfasst Diagnosen, Behandlungsunterlagen, Versicherungsdaten und alle der 18 HIPAA Safe Harbor-Kennungen.

#phi

PII

Personenbezogene Daten

Datenschutz & PII

Alle Daten, die eine bestimmte Person direkt oder in Kombination mit anderen Daten identifizieren können. Beispiele: Namen, E-Mail-Adressen, Sozialversicherungsnummern, IP-Adressen, biometrische Aufzeichnungen.

#pii

Presets

Anonymisierungs-Presets

Plattform & Produkte

Gespeicherte Konfigurationen ausgewählter Entitätstypen, Vertrauensschwellen und Ausgabeoptionen, die mit einem Klick angewendet werden können. Presets werden über Web App, Office Add-in und Desktop App hinweg per verschlüsseltem Cloud-Speicher synchronisiert.

#presets

Presidio

Microsoft Presidio

Erkennungstechnologie

Ein Open-Source-SDK für Datenschutz und Anonymisierung von Microsoft. Die Erkennungs-Engine von anonym.legal basiert auf den Analyzer- und Anonymizer-Services von Presidio und wurde um über 285 benutzerdefinierte Entitätenerkenner für 48 Sprachen erweitert.

#presidio

Presidio Analyzer

Microsoft Presidio Analyzer Service

Infrastruktur

Die Erkennungskomponente im Backend von anonym.legal (Port 8011). Nimmt Text entgegen und gibt eine Liste erkannter PII-Entitäten mit deren Positionen, Typen und Vertrauenswerten zurück. Erweitert um über 285 benutzerdefinierte Erkenner in 48 Sprachen.

#presidioanalyzer

Presidio Anonymizer

Microsoft Presidio Anonymizer Service

Infrastruktur

Die Transformationskomponente im Backend von anonym.legal (Port 8012). Nimmt Text und Analyzer-Ergebnisse als Eingabe, wendet den gewählten Operator (REPLACE, REDACT, MASK, HASH, ENCRYPT) auf jede erkannte Entität an und gibt den anonymisierten Text zurück.

#presidioanonymizer

Privacy by Design

Privacy by Design und Default

Datenschutz & PII

Das durch DSGVO Artikel 25 vorgeschriebene Prinzip, dass Datenschutzmaßnahmen von Anfang an in Systeme integriert werden und nicht nachträglich ergänzt werden. Umfasst Datenminimierung, Zugriffskontrollen, Verschlüsselung und Pseudonymisierung auf Architekturebene.

#privacybydesign

Pseudonymization

Datenpseudonymisierung

Datenschutz & PII

Ersetzung direkter Identifikatoren durch künstliche Werte (Pseudonyme), wobei die Möglichkeit zur Re-Identifizierung über einen separaten Schlüssel erhalten bleibt. Die DSGVO Artikel 4(5) erkennt dies als datenschutzfördernde Technik an, befreit pseudonymisierte Daten jedoch nicht von der Regulierung.

#pseudonymization

R

Rate Limiting

API-Rate-Limiting

Infrastruktur

Kontrolle über die Anzahl der API-Anfragen, die ein Client innerhalb eines Zeitfensters stellen darf. Verhindert Missbrauch und stellt eine faire Ressourcenzuteilung sicher. anonym.legal setzt nutzerbasierte Ratenlimits je nach Tarifstufe ein; für Wiederholungsversuche wird exponentielles Backoff empfohlen.

#ratelimiting

Rechtssicherheit

Rechtssichere Anonymisierung

Recht & Audit

Die Fähigkeit, gegenüber Aufsichtsbehörden, Gerichten oder Prüfern nachzuweisen, dass die Anonymisierung nach einer dokumentierten, konsistenten und technisch fundierten Methodik durchgeführt wurde. Die Audit-Logs, Vertrauenswerte und Operator-Einstellungen von anonym.legal unterstützen rechtssichere Anonymisierungsprozesse.

#defensibility

Redaction

Datenredaktion

Datenschutz & PII

Das dauerhafte Entfernen oder Unkenntlichmachen sensibler Informationen in Dokumenten, wobei diese durch einen visuellen Marker wie [REDACTED] oder einen schwarzen Balken ersetzt werden. Im Gegensatz zur Verschlüsselung ist Redaktion ein Einwegprozess und die Originaldaten können nicht wiederhergestellt werden.

#redaction

Regex

Regular Expression Pattern Matching

Erkennungstechnologie

Musterbasiertes Text-Matching unter Verwendung formaler Sprachsyntax. Bei der PII-Erkennung werden mit Regex strukturell vorhersehbare Kennungen (Telefonnummern, Kreditkarten, IBANs, E-Mail-Adressen) inklusive Prüfziffernvalidierung erkannt. Ergänzt NER für hybride Erkennung.

#regex

REST API

RESTful API

Infrastruktur

anonym.legal stellt eine RESTful HTTP API für die programmatische Integration bereit. Endpunkte umfassen /api/analyze, /api/anonymize, /api/image und /api/structured. Authentifizierung erfolgt über JWT-Bearer-Tokens. Vollständige OpenAPI-Dokumentation im API Reference verfügbar.

#restapi

Rule 26

Federal Rules of Civil Procedure Rule 26

Recht & Audit

US-amerikanische Zivilprozessregel zur Regelung der Offenlegungspflichten. Rule 26(g) verlangt von Anwälten die Bestätigung, dass Offenlegungsanfragen und -mitteilungen nicht zu unzulässigen Zwecken erfolgen – einschließlich der ordnungsgemäßen Schwärzung von PII in bereitgestellten Dokumenten.

#rule26

S

SCCs

Standard Contractual Clauses

Compliance & Vorschriften

Vorab genehmigte, GDPR-konforme Vertragsklauseln für die Übermittlung personenbezogener Daten aus der EU/dem EWR in Drittländer. 2021 von der Europäischen Kommission (2021/914/EU) aktualisiert, um die Anforderungen aus Schrems II zu erfüllen, einschließlich einer Transfer Impact Assessment.

#sccs

Schrems II

Schrems II Urteil (C-311/18)

Compliance & Vorschriften

Urteil des Europäischen Gerichtshofs von 2020, das das EU-US Privacy Shield für transatlantische Datenübermittlungen für ungültig erklärte, da der US-Überwachungsschutz unzureichend sei. Erfordert ergänzende Maßnahmen (Verschlüsselung, Anonymisierung) bei Verwendung von Standardvertragsklauseln.

#schremsii

SHA-256

Secure Hash Algorithm 256-bit

Verschlüsselung & Sicherheit

Eine kryptografische Hashfunktion, die einen 256-Bit-Hashwert erzeugt. Wird in anonym.legal für HMAC-Authentifizierung von API-Anfragen, ZK-Auth-Nachweise und konsistente Entitätspseudonymisierung verwendet (Hashing mit Salt erzeugt für denselben Originalwert immer denselben Ersatzwert).

#sha256

spaCy

spaCy NLP Library

Erkennungstechnologie

Leistungsstarke Open-Source-NLP-Bibliothek in Python. anonym.legal nutzt spaCy's transformerbasierte Modelle für 24 Sprachen (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko und weitere) zur Erkennung benannter Entitäten in der Presidio-Pipeline.

#spacy

Stanza

Stanza NLP Library (Stanford NLP)

Erkennungstechnologie

Das Python-NLP-Toolkit der Stanford NLP Group unterstützt über 70 Sprachen mit modernen neuronalen Modellen. Wird in anonym.legal als ergänzender NER-Backend für Sprachen eingesetzt, die von spaCy-Modellen nicht abgedeckt werden.

#stanza

T

TLS

Transport Layer Security

Verschlüsselung & Sicherheit

Das kryptografische Protokoll zur Sicherung von Daten während der Übertragung. anonym.legal erzwingt mindestens TLS 1.2 mit bevorzugtem TLS 1.3, HSTS mit einer maximalen Gültigkeit von einem Jahr und HTTP/2. Sämtlicher Datenverkehr zwischen Clients und Server wird während der Übertragung verschlüsselt.

#tls

Token System

anonym.legal Credit Token System

Plattform & Produkte

Nutzungsbasierte Abrechnung, bei der API-Aufrufe Token verbrauchen, die anhand der Textlänge, Entitätsanzahl und des Verarbeitungsmodus (Analyse vs. Anonymisierung) berechnet werden. Token-Kosten sind in der Datenbank konfigurierbar und werden vor der Verarbeitung in Echtzeit angezeigt.

#tokensystem

Tokenization

Datentokenisierung

Datenschutz & PII

Ersetzung sensibler Daten durch einen nicht-sensiblen Platzhalter (Token), der in einem sicheren Tresor auf das Original abgebildet wird. Im Gegensatz zur Verschlüsselung besteht zwischen Token und Originaldaten keine mathematische Beziehung.

#tokenization

Ü

Überschwärzung

Überschwärzung (False Positives)

Recht & Audit

Entfernung von mehr Informationen als notwendig, wodurch der Nutzen des Dokuments sinkt und dies im Rechtskontext als Beweisvereitelung gewertet werden kann. Verursacht durch niedrige Vertrauensschwellen oder zu breite Entitätsauswahl. Anpassbar über die Schwellen- und Entitätssteuerung von anonym.legal.

#overredaction

U

Universelle Entitäten

Sprachunabhängige Entitätstypen

Entitätstypen

Entitätstypen, die unabhängig von der Textsprache erkannt werden, typischerweise durch formatbasierte Regex mit Prüfziffernvalidierung. Beispiele: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO-Adresse.

#universalentities

Unterschwärzung

Unterschwärzung (False Negatives)

Recht & Audit

Nicht alle PII werden entfernt, wodurch Personen in geteilten Dokumenten exponiert bleiben. Das häufigere Compliance-Risiko. Verursacht durch zu hohe Vertrauensschwellen, fehlende Entitätstypen oder neue PII-Formate. Abgemildert durch die hybride Erkennung und Unterstützung benutzerdefinierter Entitäten von anonym.legal.

#underredaction

V

Vault

Verschlüsselungs-Schlüsseltresor

Plattform & Produkte

Sichere lokale Speicherung für Verschlüsselungsschlüssel in der Desktop App, geschützt durch Argon2id-Schlüsselableitung aus einer Master-Passphrase. Schlüssel werden verschlüsselt mit AES-256-GCM gespeichert und über BIP39-Mnemonik gesichert.

#vault

Versicherungs-Identifikatoren

Versicherungs-Entitätstypen

Entitätstypen

Entitätstypen für versicherungsbezogene Identifikatoren: US_NPI (National Provider Identifier für Leistungserbringer im Gesundheitswesen), HEALTHCARE_PLAN_BENEFICIARY und länderspezifische Krankenversicherungsnummern (z. B. DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

W

Web App

anonym.legal Webanwendung

Plattform & Produkte

Browserbasierte Oberfläche bei anonym.legal zur Analyse, Anonymisierung und Entschlüsselung von PII. Unterstützt Texteingabe, Datei-Upload (PDF, DOCX, TXT), Stapelverarbeitung, ZK Auth, 48 Sprachen und über 285 Entitätstypen. Keine Installation erforderlich.

#webapp

X

XChaCha20

XChaCha20-Poly1305

Verschlüsselung & Sicherheit

Ein authentifizierter Verschlüsselungsalgorithmus mit hoher Performance auf Systemen ohne AES-Hardwarebeschleunigung. Verwendet einen 192-Bit-Nonce (erweitert vom 96-Bit-Nonce des IETF-ChaCha20-Standards gemäß RFC 8439) und eliminiert so Risiken von Nonce-Kollisionen. Wird als alternative Chiffre in der Verschlüsselungsschicht von anonym.legal eingesetzt.

#xchacha20

XLM-RoBERTa

Cross-Lingual RoBERTa

Erkennungstechnologie

Ein mehrsprachiges Transformer-Sprachmodell, das auf 100 Sprachen trainiert wurde und von Meta AI entwickelt wurde. Wird in anonym.legal für sprachübergreifende NER-Aufgaben eingesetzt, insbesondere für Entitätstypen und Sprachen, für die keine monolingualen Modelle verfügbar sind.

#xlmroberta

Z

Zero-Knowledge

Zero-Knowledge-Architektur

Verschlüsselung & Sicherheit

Ein Systemdesign, bei dem der Dienstanbieter keinerlei Zugriff auf die Klartextdaten oder Verschlüsselungsschlüssel der Nutzer hat. Die gesamte Ver- und Entschlüsselung erfolgt clientseitig; der Server sieht niemals den Originalinhalt. Verhindert Insider-Bedrohungen und erzwungene Offenlegung.

#zeroknowledge

ZK Auth

Zero-Knowledge-Authentifizierung

Verschlüsselung & Sicherheit

Das Authentifizierungssystem von anonym.legal, bei dem Verschlüsselungsschlüssel clientseitig aus der Passphrase des Nutzers mittels Argon2id abgeleitet werden und niemals an den Server übertragen oder dort gespeichert werden. Der Server speichert lediglich einen kryptografischen Nachweis, nicht jedoch den Schlüssel oder die Passphrase.

#zkauth