Glossar Datenschutz & Technologie
Definitionen aller Begriffe, Akronyme und Konzepte rund um PII-Anonymisierung und Datenschutz.
Zurück zu den Dokumenten94 Begriffe
2
2FA
Zwei-Faktor-Authentifizierung
Authentifizierung, die zwei unterschiedliche Verifizierungsfaktoren erfordert: etwas, das der Nutzer weiß (Passwort), und etwas, das der Nutzer besitzt (TOTP-App, Hardware-Schlüssel) oder ist (biometrisch). Wird in anonym.legal als zusätzliche Sicherheitsebene über ZK Auth hinaus unterstützt.
#twofaA
AES-256-GCM
Advanced Encryption Standard 256-bit Galois/Counter Mode
Ein authentifizierter Verschlüsselungsalgorithmus, der AES-256 (256-Bit-Schlüssel) mit Galois/Counter Mode für Vertraulichkeit und Integrität kombiniert. Wird in der reversiblen Anonymisierung von anonym.legal verwendet, um ersetzte Entitäten zu verschlüsseln. Bietet sowohl Geheimhaltung als auch Manipulationserkennung.
#aes256gcmAnonymization
Datenanonymisierung
Der irreversible Prozess des Entfernens oder Umwandelns identifizierender Informationen, sodass Personen nicht mehr direkt oder indirekt identifiziert werden können. Nach der DSGVO fallen wirklich anonymisierte Daten nicht mehr in den Anwendungsbereich der Verordnung.
#anonymizationAnwaltsgeheimnis
Schutz des Anwaltsgeheimnisses
Rechtlicher Schutz für vertrauliche Kommunikation zwischen Anwälten und Mandanten. Bei Dokumentenprüfung und e-Discovery müssen privilegierte Inhalte identifiziert und zurückgehalten oder geschwärzt werden. Benutzerdefinierte Entitätstypen in anonym.legal können zur Markierung privilegierter Inhalte konfiguriert werden.
#attorneyclientprivilegeArgon2id
Argon2id-Schlüsselableitungsfunktion
Der Gewinner des Password Hashing Competition 2015. Argon2id kombiniert den Seitenkanalwiderstand von Argon2i mit der GPU-Resistenz von Argon2d. Wird in anonym.legal und dem Desktop-App-Tresor verwendet, um Verschlüsselungsschlüssel aus Nutzerpassphrasen abzuleiten.
#argon2idAudit-Trail
Unveränderlicher Audit-Trail
Eine sequenzielle, manipulationssichere Protokollierung, die aufzeichnet, wer wann auf Daten zugegriffen, diese verändert oder verarbeitet hat. Erforderlich nach ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)) und e-Discovery-Regeln. anonym.legal protokolliert alle Anonymisierungsvorgänge mit Zeitstempeln, Entitätsanzahl und Operator-IDs.
#audittrailB
Batch Processing
Stapel-Dateianonymisierung
Gleichzeitige Verarbeitung mehrerer Dateien in einem einzigen Vorgang. Der Stapelmodus von anonym.legal unterstützt PDF-, DOCX- und TXT-Dateien mit individueller Entitätskonfiguration, Vertrauensschwellen und Auswahl des Ausgabeformats pro Datei.
#batchprocessingBehördliche Ausweise
Entitätstypen für behördliche Identifikatoren
Entitätstypen für nationale und behördlich ausgestellte Identifikatoren: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE und über 50 weitere länderspezifische ID-Formate. Erkennung mittels länderspezifischer Regex- und Prüfziffernmuster.
#governmentidBeweisvereitelung
Beweisvernichtung/-veränderung
Die Zerstörung, Veränderung oder das Versäumnis, für ein Verfahren relevante Beweise zu erhalten. Zu starke Schwärzung, die Dokumente unlesbar macht, kann als Beweisvereitelung gewertet werden. Die präzise Kalibrierung der Anonymisierung (Vertrauensschwellen, Entitätsauswahl) ist für rechtssichere Schwärzung entscheidend.
#spoliationBIP39
Bitcoin Improvement Proposal 39 — Mnemonic Phrases
Ein Standard zur Generierung von menschenlesbaren mnemonischen Seed-Phrasen (12–24 Wörter) aus einem kryptografischen Seed. Wird im Desktop-App-Tresor von anonym.legal als benutzerfreundliches Backup für den aus Argon2id abgeleiteten Verschlüsselungsschlüssel verwendet.
#bip39C
CCPA
California Consumer Privacy Act
Kalifornisches Datenschutzgesetz, das Einwohnern das Recht auf Auskunft, Löschung und Widerspruch gegen den Verkauf ihrer personenbezogenen Daten gewährt. Gilt für Unternehmen, die bestimmte Umsatz-, Datenmengen- oder Datenverkaufs-Schwellenwerte erreichen. Wesentlich geändert durch die CPRA (verabschiedet im November 2020, in Kraft seit Januar 2023).
#ccpaChrome Extension
anonym.legal Chrome-Erweiterung
Browser-Erweiterung (Manifest V3), die Text abfängt, bevor er an KI-Chatbots (ChatGPT, Claude, Gemini, Perplexity, DeepSeek) gesendet wird. Anonymisiert in Echtzeit und entschlüsselt optional KI-Antworten mit gespeicherten Schlüsseln.
#chromeextensionCLOUD Act
Clarifying Lawful Overseas Use of Data Act
US-Bundesgesetz (2018), das US-Strafverfolgungsbehörden befugt, US-basierte Cloud-Anbieter zur Herausgabe von im Ausland gespeicherten Daten zu zwingen. Steht im Konflikt mit den GDPR-Vorschriften zu Datenübermittlungen von EU-Bürgern. Die Anonymisierung von Daten vor dem Cloud-Upload ist eine gängige Gegenmaßnahme.
#cloudactCode-Switching
Multilingual Code-Switching
Das Phänomen, bei dem innerhalb eines Textes oder Gesprächs zwei oder mehr Sprachen gemischt werden. Häufig in mehrsprachigen Dokumenten (z. B. deutsche Rechtsdokumente mit englischen Fachbegriffen). Die hybride Erkennung von anonym.legal verarbeitet Code-Switching, indem mehrere Sprachmodelle gleichzeitig angewendet werden.
#codeswitchingConfidence Scoring
Entity Detection Confidence Score
Ein Wert von 0–1, der angibt, wie sicher das Erkennungsmodell ist, dass eine Textstelle eine PII-Entität darstellt. anonym.legal bietet konfigurierbare Confidence-Thresholds, sodass Nutzer das Verhältnis von Präzision zu Recall für ihren Anwendungsfall anpassen können.
#confidencescoringCSP
Content Security Policy
Ein HTTP-Response-Header und Meta-Tag-Mechanismus, der einschränkt, welche Ressourcen (Skripte, Styles, Bilder) ein Browser laden darf. Die CSP von anonym.legal umfasst object-src 'none', script-src mit Nonces und upgrade-insecure-requests, um XSS-Angriffe zu verhindern.
#cspCustom Entities
Benutzerdefinierte Entitätserkenner
Vom Nutzer definierte PII-Muster, die zusätzlich zu den über 285 integrierten Entitätstypen von anonym.legal hinzugefügt werden können. Unterstützt Regex-Muster, Wortlisten und Negativlisten. Nützlich für organisationsspezifische Kennungen wie Mitarbeiter-IDs, interne Projektcodes oder proprietäre Produktnamen.
#customentitiesD
Data Minimization
DSGVO-Datenminimierungsprinzip
Das in DSGVO Artikel 5(1)(c) festgelegte Prinzip, dass nur Daten erhoben und verarbeitet werden dürfen, die für den angegebenen Zweck angemessen, relevant und notwendig sind. Ein zentrales Gestaltungsprinzip für datenschutzkonforme Systeme.
#dataminimizationData Residency
Data Residency Requirements
Gesetzliche oder vertragliche Anforderungen, die festlegen, in welchem geografischen Gebiet Daten gespeichert und verarbeitet werden müssen. Relevant für die GDPR (Datenübermittlungen außerhalb des EWR), das deutsche BDSG und branchenspezifische Vorschriften im Gesundheits- und Finanzwesen.
#dataresidencyData Sovereignty
Digitale Datensouveränität
Das Prinzip, dass Daten den Gesetzen und Governance-Strukturen des Landes unterliegen, in dem sie erhoben werden. Geht über Data Residency hinaus und umfasst die Kontrolle darüber, wer auf Daten zugreifen darf und unter welchem rechtlichen Rahmen.
#datasovereigntyDDoS-Schutz
Distributed Denial of Service Schutz
Infrastrukturelle Schutzmaßnahmen gegen verteilte Denial-of-Service-Angriffe. Die Serverinfrastruktur von anonym.legal umfasst Firewall-Regeln (UFW), nginx-Verbindungslimits und Cloudflare-äquivalente Upstream-Schutzmechanismen zur Sicherstellung der Verfügbarkeit.
#ddosprotectionDe-anonymization
Re-Identifizierungsangriff
Der Prozess der Re-Identifizierung von Personen aus vermeintlich anonymisierten Datensätzen durch Abgleich mit Zusatzinformationen. Ein zentrales Risiko beim Teilen von Daten mit unzureichender Anonymisierungstiefe.
#deanonymizationDesktop App
anonym.legal Desktop-Anwendung
Plattformübergreifende Anwendung (Windows, macOS, Linux) entwickelt mit Tauri 2.0 und React 18. Bietet lokale Dateiverarbeitung, BIP39-Tresor für Offline-ZK Auth, Stapel-Export und API-Synchronisation. Unterstützt Air-Gap-Deployments ohne Internetzugang.
#desktopappDifferential Privacy
Differential Privacy (DP)
Ein mathematisches Rahmenwerk zur Veröffentlichung statistischer Informationen über Datensätze, das nachweisbare Garantien bietet, dass die Daten einzelner Personen nicht unterscheidbar sind. Wird in aggregierten Analysen eingesetzt, um Re-Identifizierung auch bei Abfragen aggregierter Ergebnisse zu verhindern.
#differentialprivacyDigitale Identifikatoren
Digitale Identitäts-Entitätstypen
Entitätstypen für Online- und digitale Identifikatoren: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 und IPv6), URL, DOMAIN_NAME, CRYPTO (Bitcoin/Ethereum-Adressen) sowie plattformspezifische Identifikatoren.
#digitalidentifiersDLP
Data Loss Prevention
Eine Sicherheitsdisziplin und Kategorie von Softwaretools, die die unbefugte Übertragung sensibler Daten außerhalb einer Organisation erkennen und verhindern. anonym.legal fungiert als DLP-Lösung auf Browser- und KI-Ebene für PII.
#dlpDPA
Data Processing Agreement
Ein rechtlich bindender Vertrag zwischen Verantwortlichem und Auftragsverarbeiter, vorgeschrieben durch GDPR Article 28. Legt Gegenstand, Dauer, Art, Zweck und Art der Verarbeitung personenbezogener Daten sowie die Rechte und Pflichten beider Parteien fest.
#dpaDPIA
Data Protection Impact Assessment
Ein Risikobewertungsprozess, der gemäß GDPR Article 35 für Verarbeitungstätigkeiten erforderlich ist, die voraussichtlich ein hohes Risiko für die Rechte und Freiheiten von Personen darstellen. Obligatorisch bei systematischem Profiling, großflächiger PHI-Verarbeitung und Überwachung öffentlicher Bereiche.
#dpiaE
e-Discovery
Elektronische Beweismittelfindung
Der Prozess der Identifizierung, Sammlung und Bereitstellung elektronisch gespeicherter Informationen in Gerichtsverfahren. Erfordert das Schwärzen von PII und privilegierten Informationen in bereitgestellten Dokumenten. Ein zentrales Einsatzszenario für Rechtsabteilungen, die anonym.legal nutzen.
#ediscoveryE2EE
Ende-zu-Ende-Verschlüsselung
Verschlüsselung, bei der nur die kommunizierenden Parteien die Nachrichten lesen können; der Dienstanbieter hat keinen Zugriff auf den Klartext. Im ZK Auth-Modus von anonym.legal verlassen die Verschlüsselungsschlüssel niemals das Client-Gerät, wodurch E2EE für die Speicherung anonymisierter Ausgaben erreicht wird.
#e2eeEntitätstyp
PII-Entitätstyp
Eine Kategorie personenbezogener Informationen, die von der Erkennungs-Engine erkannt und anonymisiert werden kann. Beispiele: PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal unterstützt über 285 Entitätstypen in 48 Sprachen.
#entitytypeEU-Datenresidenz
Datenresidenz in der Europäischen Union
Die Garantie, dass Daten ausschließlich innerhalb des EU/EWR-Gebiets gespeichert und verarbeitet werden. Die Produktionsserver von anonym.legal stehen in Deutschland (Hetzner Frankfurt), sodass alle Verarbeitungen unter DSGVO-Recht ohne grenzüberschreitende Datenübertragung erfolgen.
#eudataresidencyF
Fahrzeug-Identifikatoren
Fahrzeug-Entitätstypen
Entitätstypen für fahrzeugbezogene Identifikatoren: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Fahrzeug-Identifikationsnummer) und länderspezifische Kfz-Kennzeichenformate.
#vehicleidentifiersFinanzielle Entitäten
Finanzielle PII-Entitätstypen
Entitätstypen für finanzielle Identifikatoren: CREDIT_CARD (Luhn-Prüfziffer), IBAN_CODE (ISO 13616 Prüfziffer), SWIFT_CODE (BIC-Format), US_BANK_NUMBER, NRP (spanische Steuer-ID). Erkennung mit Prüfziffernvalidierung zur Minimierung von Fehlalarmen.
#financialentitiesFOIA
Freedom of Information Act
US-Bundesgesetz (und entsprechende Gesetze in anderen Rechtsordnungen), das der Öffentlichkeit Zugang zu Regierungsunterlagen gewährt. Erfordert die Schwärzung von PII und anderen ausgenommenen Informationen vor der Offenlegung – ein zentrales Anwendungsfeld für juristische und behördliche Anonymisierungsprozesse.
#foiaG
GDPR
Datenschutz-Grundverordnung
EU-Verordnung 2016/679, das zentrale Datenschutzrahmenwerk der Europäischen Union. Gilt für jede Organisation, die personenbezogene Daten von EU-Bürgern verarbeitet. Bußgelder bis zu 20 Mio. € oder 4 % des weltweiten Jahresumsatzes. Wichtige Rechte: Auskunft, Löschung, Übertragbarkeit, Einschränkung, Widerspruch.
#gdprGDPR Article 25
GDPR Article 25 — Datenschutz durch Technikgestaltung und durch datenschutzfreundliche Voreinstellungen
Verpflichtet Verantwortliche, geeignete technische und organisatorische Maßnahmen (wie Pseudonymisierung und Datenminimierung) sowohl bei der Systemgestaltung als auch standardmäßig während der Verarbeitung umzusetzen.
#gdprarticle25GDPR Article 32
GDPR Article 32 — Sicherheit der Verarbeitung
Verpflichtet Verantwortliche und Auftragsverarbeiter, geeignete technische und organisatorische Maßnahmen zu ergreifen, um ein dem Risiko angemessenes Sicherheitsniveau zu gewährleisten, einschließlich Verschlüsselung, Pseudonymisierung, Vertraulichkeit, Integrität, Verfügbarkeit und Belastbarkeit der Verarbeitungssysteme.
#gdprarticle32GenAI DLP
Generative AI Data Loss Prevention
Eine spezialisierte DLP-Kategorie, die darauf abzielt, zu verhindern, dass PII und vertrauliche Daten in Prompts an generative KI-Modelle (ChatGPT, Claude, Gemini) gelangen. Die Chrome-Erweiterung und der MCP Server von anonym.legal adressieren dieses Risiko direkt bei der Eingabe.
#genaidlpGesundheitswesen-Entitäten
PII-Entitätstypen im Gesundheitswesen
Entitätstypen für die 18 HIPAA Safe Harbor Identifikatoren sowie weitere gesundheitsbezogene PII: US_MRN (medizinische Fallnummern), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY und Entitäten im Diagnose-/Behandlungskontext.
#healthcareentitiesH
Hashing
Kryptografisches Hashing
Eine Einwegtransformation von Daten in einen Digest fester Länge mittels Algorithmen wie SHA-256. Wird für konsistente Pseudonymisierung, Duplikaterkennung und Integritätsprüfung eingesetzt. Hashwerte können nicht zurückgerechnet werden, sind jedoch ohne Salt anfällig für Rainbow-Table-Angriffe.
#hashingHetzner
Hetzner Online GmbH
Deutscher Cloud- und Hosting-Anbieter, auf dessen Infrastruktur anonym.legal produktiv betrieben wird. Standort: Falkenstein, Sachsen (Rechenzentrum fsn1) mit ISO 27001-Zertifizierung. Gewählt für EU-Datenresidenz, Compliance und eine DSGVO-freundliche Rechtslage nach deutschem Recht.
#hetznerHIPAA
Health Insurance Portability and Accountability Act
US-Bundesgesetz, das Standards zum Schutz sensibler Patientendaten festlegt. Die Privacy Rule regelt die Nutzung von PHI; die Security Rule verlangt administrative, physische und technische Schutzmaßnahmen für elektronische PHI (ePHI). Verstöße werden mit bis zu 1,9 Mio. $ pro Kategorie und Jahr geahndet.
#hipaaHIPAA Safe Harbor
HIPAA Safe Harbor De-identification Method
Eine von zwei von HIPAA zugelassenen Methoden zur De-Identifizierung, bei der alle 18 festgelegten Patientenidentifikatoren (Name, Adresse, Daten, Telefonnummern, SSN, E-Mail, IP-Adresse, biometrische Daten usw.) entfernt werden müssen, um Gesundheitsdaten nicht mehr einer Person zuordnen zu können.
#hipaasafeharborHSTS
HTTP Strict Transport Security
Ein Web-Sicherheitsmechanismus, der Browser dazu zwingt, ausschließlich HTTPS-Verbindungen zu verwenden. anonym.legal setzt Strict-Transport-Security: max-age=31536000; includeSubDomains, um Protokoll-Down-Grade-Angriffe und Cookie-Diebstahl zu verhindern.
#hstsHybrid Detection
Hybrid NLP + Regex + ML Detection
Das dreistufige Verfahren von anonym.legal: Regex-Muster für strukturierte PII (Telefonnummern, IBANs, Kreditkarten), NLP/NER-Modelle für kontextabhängige Entitäten (Namen, Organisationen, Orte) und ML-Klassifikatoren für mehrdeutige Fälle. Reduziert sowohl False Positives als auch False Negatives.
#hybriddetectionI
Image Redactor
Presidio Image Redactor Service
Ein spezialisierter Backend-Service (Port 8013), der PII in Bilddateien (PNG, JPEG) mittels OCR und Presidio-Analyse erkennt und schwärzt. Über erkannte PII-Bereiche wird im Originalbild eine schwarze Balkenschwärzung gelegt.
#presidioimageredactorISO 27001
ISO/IEC 27001 Informationssicherheitsmanagement
Internationaler Standard für Informationssicherheits-Managementsysteme (ISMS). Die Zertifizierung erfordert dokumentierte Richtlinien, Risikobewertungen und Kontrollen. Die EU-Server von anonym.legal sind ISO 27001-zertifiziert und gewährleisten eine strukturierte Sicherheitssteuerung.
#iso27001ISO 27001 SoA
Statement of Applicability
Ein verpflichtendes ISO 27001-Dokument, das alle Annex A-Kontrollen auflistet, angibt, welche für die Organisation gelten, und die Begründung für Ein- und Ausschlüsse liefert. Für die Zertifizierung und Audits erforderlich.
#iso27001soaJ
JWT
JSON Web Token
Ein kompaktes, URL-sicheres Token-Format zur Übertragung von Claims zwischen Parteien. anonym.legal verwendet mit HS256 signierte JWTs für die interne Authentifizierung zwischen Diensten (z. B. Frontend → Presidio API). Tokens sind kurzlebig und werden serverseitig validiert.
#jwtK
KEK
Key Encryption Key
Ein Schlüssel, der zur Verschlüsselung anderer Schlüssel und nicht direkt von Daten verwendet wird. Im ZK-Architekturmodell von anonym.legal dient der aus der Nutzerpassphrase abgeleitete Schlüssel als KEK zum Schutz der pro Dokument gespeicherten Verschlüsselungsschlüssel im verschlüsselten Tresor.
#kekL
Language Detection
Automatic Language Detection
Die automatische Erkennung der Sprache eines Eingangstextes vor der PII-Analyse. anonym.legal erkennt die Sprache auf Anfrageebene und leitet an die passende NER-Modellpipeline weiter, wobei Englisch als Fallback für nicht unterstützte Sprachen dient.
#languagedetectionM
Masking
Datenmaskierung
Ersetzung sensibler Werte durch realistisch wirkende, aber fiktive Daten, die Format und Struktur beibehalten. Wird für Testumgebungen, Analysen und das Teilen von Datensätzen ohne Offenlegung echter PII verwendet.
#maskingMCP
Model Context Protocol
Ein offenes Protokoll von Anthropic, das es KI-Modellen ermöglicht, in standardisierter Weise mit externen Tools und Datenquellen zu interagieren. anonym.legal implementiert einen MCP Server, sodass KI-Coding-Tools Anonymisierung direkt im Workflow aufrufen können.
#mcpMCP Server
Model Context Protocol Server
Die MCP Server-Integration von anonym.legal ermöglicht es KI-Coding-Assistenten (Claude Desktop, Cursor, VS Code Copilot), die Anonymisierungs-API direkt als Tool aufzurufen. PII wird aus Code, Prompts und Kontext entfernt, bevor sie an das KI-Modell gesendet werden.
#mcpserverML Models
Machine Learning Models for PII Detection
Statistische Modelle, die auf annotierten Textkorpora trainiert wurden, um PII im Kontext zu erkennen. anonym.legal verwendet sowohl spaCy-Transformer-Pipelines als auch feinabgestimmte XLM-RoBERTa-Modelle für mehrsprachige Entitätenerkennung im Produktivbetrieb.
#mlmodelsN
NER
Named Entity Recognition
Eine Aufgabe der Verarbeitung natürlicher Sprache, bei der benannte Entitäten im Text erkannt und in vordefinierte Kategorien wie Personen, Organisationen, Orte, Daten und medizinische Kennungen klassifiziert werden. Die zentrale ML-Technik für die PII-Erkennung in anonym.legal.
#nerNIS2
Network and Information Security Directive 2
EU-Richtlinie 2022/2555, die die ursprüngliche NIS-Richtlinie auf weitere Sektoren (Gesundheitswesen, Energie, Verkehr, digitale Infrastruktur) ausweitet und die Anforderungen an die Cybersicherheit verschärft. Die Umsetzungsfrist war der 17. Oktober 2024; die meisten EU-Mitgliedstaaten haben diese verpasst, woraufhin die Europäische Kommission Vertragsverletzungsverfahren gegen nicht konforme Staaten eingeleitet hat.
#nis2NLP
Natural Language Processing
Ein Teilgebiet der künstlichen Intelligenz, das sich mit der Interaktion zwischen Computern und menschlicher Sprache befasst. Bei der PII-Erkennung ermöglichen NLP-Modelle das Verständnis von Kontext, Grammatik und Semantik, um Entitäten zu identifizieren, die reine Regex-Muster nicht erfassen würden.
#nlpO
Office Add-in
anonym.legal Microsoft Office Add-in
Microsoft Office-Erweiterung, die PII-Anonymisierung direkt in Word, Excel und PowerPoint integriert. Unterstützt Schwärzung im Dokument, Preset-Verwaltung, ZK Auth und Synchronisation über Geräte hinweg. Verfügbar über Microsoft AppSource.
#officeaddinOperators
Anonymisierungs-Operatoren
Die Ersetzungsstrategie, die auf erkannte PII angewendet wird. anonym.legal unterstützt REPLACE (Platzhaltertext), REDACT (leerer String), MASK (Sternchen), HASH (SHA-256-Digest), ENCRYPT (reversible AES-256-GCM) und CUSTOM (benutzerdefinierter Ersatz).
#operatorsP
PCI DSS
Payment Card Industry Data Security Standard
Sicherheitsstandard für Organisationen, die Zahlungskartendaten verarbeiten, herausgegeben vom PCI Security Standards Council. Erfordert Verschlüsselung, Zugriffskontrollen, Protokollierung und regelmäßige Tests. Nicht-Einhaltung kann zu Bußgeldern und Verlust der Kartenakzeptanz führen.
#pcidssPHI
Geschützte Gesundheitsinformationen
Alle gesundheitsbezogenen Informationen, die mit einer identifizierbaren Person verknüpft sind und in den USA unter HIPAA reguliert werden. Umfasst Diagnosen, Behandlungsunterlagen, Versicherungsdaten und alle der 18 HIPAA Safe Harbor-Kennungen.
#phiPII
Personenbezogene Daten
Alle Daten, die eine bestimmte Person direkt oder in Kombination mit anderen Daten identifizieren können. Beispiele: Namen, E-Mail-Adressen, Sozialversicherungsnummern, IP-Adressen, biometrische Aufzeichnungen.
#piiPresets
Anonymisierungs-Presets
Gespeicherte Konfigurationen ausgewählter Entitätstypen, Vertrauensschwellen und Ausgabeoptionen, die mit einem Klick angewendet werden können. Presets werden über Web App, Office Add-in und Desktop App hinweg per verschlüsseltem Cloud-Speicher synchronisiert.
#presetsPresidio
Microsoft Presidio
Ein Open-Source-SDK für Datenschutz und Anonymisierung von Microsoft. Die Erkennungs-Engine von anonym.legal basiert auf den Analyzer- und Anonymizer-Services von Presidio und wurde um über 285 benutzerdefinierte Entitätenerkenner für 48 Sprachen erweitert.
#presidioPresidio Analyzer
Microsoft Presidio Analyzer Service
Die Erkennungskomponente im Backend von anonym.legal (Port 8011). Nimmt Text entgegen und gibt eine Liste erkannter PII-Entitäten mit deren Positionen, Typen und Vertrauenswerten zurück. Erweitert um über 285 benutzerdefinierte Erkenner in 48 Sprachen.
#presidioanalyzerPresidio Anonymizer
Microsoft Presidio Anonymizer Service
Die Transformationskomponente im Backend von anonym.legal (Port 8012). Nimmt Text und Analyzer-Ergebnisse als Eingabe, wendet den gewählten Operator (REPLACE, REDACT, MASK, HASH, ENCRYPT) auf jede erkannte Entität an und gibt den anonymisierten Text zurück.
#presidioanonymizerPrivacy by Design
Privacy by Design und Default
Das durch DSGVO Artikel 25 vorgeschriebene Prinzip, dass Datenschutzmaßnahmen von Anfang an in Systeme integriert werden und nicht nachträglich ergänzt werden. Umfasst Datenminimierung, Zugriffskontrollen, Verschlüsselung und Pseudonymisierung auf Architekturebene.
#privacybydesignPseudonymization
Datenpseudonymisierung
Ersetzung direkter Identifikatoren durch künstliche Werte (Pseudonyme), wobei die Möglichkeit zur Re-Identifizierung über einen separaten Schlüssel erhalten bleibt. Die DSGVO Artikel 4(5) erkennt dies als datenschutzfördernde Technik an, befreit pseudonymisierte Daten jedoch nicht von der Regulierung.
#pseudonymizationR
Rate Limiting
API-Rate-Limiting
Kontrolle über die Anzahl der API-Anfragen, die ein Client innerhalb eines Zeitfensters stellen darf. Verhindert Missbrauch und stellt eine faire Ressourcenzuteilung sicher. anonym.legal setzt nutzerbasierte Ratenlimits je nach Tarifstufe ein; für Wiederholungsversuche wird exponentielles Backoff empfohlen.
#ratelimitingRechtssicherheit
Rechtssichere Anonymisierung
Die Fähigkeit, gegenüber Aufsichtsbehörden, Gerichten oder Prüfern nachzuweisen, dass die Anonymisierung nach einer dokumentierten, konsistenten und technisch fundierten Methodik durchgeführt wurde. Die Audit-Logs, Vertrauenswerte und Operator-Einstellungen von anonym.legal unterstützen rechtssichere Anonymisierungsprozesse.
#defensibilityRedaction
Datenredaktion
Das dauerhafte Entfernen oder Unkenntlichmachen sensibler Informationen in Dokumenten, wobei diese durch einen visuellen Marker wie [REDACTED] oder einen schwarzen Balken ersetzt werden. Im Gegensatz zur Verschlüsselung ist Redaktion ein Einwegprozess und die Originaldaten können nicht wiederhergestellt werden.
#redactionRegex
Regular Expression Pattern Matching
Musterbasiertes Text-Matching unter Verwendung formaler Sprachsyntax. Bei der PII-Erkennung werden mit Regex strukturell vorhersehbare Kennungen (Telefonnummern, Kreditkarten, IBANs, E-Mail-Adressen) inklusive Prüfziffernvalidierung erkannt. Ergänzt NER für hybride Erkennung.
#regexREST API
RESTful API
anonym.legal stellt eine RESTful HTTP API für die programmatische Integration bereit. Endpunkte umfassen /api/analyze, /api/anonymize, /api/image und /api/structured. Authentifizierung erfolgt über JWT-Bearer-Tokens. Vollständige OpenAPI-Dokumentation im API Reference verfügbar.
#restapiRule 26
Federal Rules of Civil Procedure Rule 26
US-amerikanische Zivilprozessregel zur Regelung der Offenlegungspflichten. Rule 26(g) verlangt von Anwälten die Bestätigung, dass Offenlegungsanfragen und -mitteilungen nicht zu unzulässigen Zwecken erfolgen – einschließlich der ordnungsgemäßen Schwärzung von PII in bereitgestellten Dokumenten.
#rule26S
SCCs
Standard Contractual Clauses
Vorab genehmigte, GDPR-konforme Vertragsklauseln für die Übermittlung personenbezogener Daten aus der EU/dem EWR in Drittländer. 2021 von der Europäischen Kommission (2021/914/EU) aktualisiert, um die Anforderungen aus Schrems II zu erfüllen, einschließlich einer Transfer Impact Assessment.
#sccsSchrems II
Schrems II Urteil (C-311/18)
Urteil des Europäischen Gerichtshofs von 2020, das das EU-US Privacy Shield für transatlantische Datenübermittlungen für ungültig erklärte, da der US-Überwachungsschutz unzureichend sei. Erfordert ergänzende Maßnahmen (Verschlüsselung, Anonymisierung) bei Verwendung von Standardvertragsklauseln.
#schremsiiSHA-256
Secure Hash Algorithm 256-bit
Eine kryptografische Hashfunktion, die einen 256-Bit-Hashwert erzeugt. Wird in anonym.legal für HMAC-Authentifizierung von API-Anfragen, ZK-Auth-Nachweise und konsistente Entitätspseudonymisierung verwendet (Hashing mit Salt erzeugt für denselben Originalwert immer denselben Ersatzwert).
#sha256spaCy
spaCy NLP Library
Leistungsstarke Open-Source-NLP-Bibliothek in Python. anonym.legal nutzt spaCy's transformerbasierte Modelle für 24 Sprachen (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko und weitere) zur Erkennung benannter Entitäten in der Presidio-Pipeline.
#spacyStanza
Stanza NLP Library (Stanford NLP)
Das Python-NLP-Toolkit der Stanford NLP Group unterstützt über 70 Sprachen mit modernen neuronalen Modellen. Wird in anonym.legal als ergänzender NER-Backend für Sprachen eingesetzt, die von spaCy-Modellen nicht abgedeckt werden.
#stanzaT
TLS
Transport Layer Security
Das kryptografische Protokoll zur Sicherung von Daten während der Übertragung. anonym.legal erzwingt mindestens TLS 1.2 mit bevorzugtem TLS 1.3, HSTS mit einer maximalen Gültigkeit von einem Jahr und HTTP/2. Sämtlicher Datenverkehr zwischen Clients und Server wird während der Übertragung verschlüsselt.
#tlsToken System
anonym.legal Credit Token System
Nutzungsbasierte Abrechnung, bei der API-Aufrufe Token verbrauchen, die anhand der Textlänge, Entitätsanzahl und des Verarbeitungsmodus (Analyse vs. Anonymisierung) berechnet werden. Token-Kosten sind in der Datenbank konfigurierbar und werden vor der Verarbeitung in Echtzeit angezeigt.
#tokensystemTokenization
Datentokenisierung
Ersetzung sensibler Daten durch einen nicht-sensiblen Platzhalter (Token), der in einem sicheren Tresor auf das Original abgebildet wird. Im Gegensatz zur Verschlüsselung besteht zwischen Token und Originaldaten keine mathematische Beziehung.
#tokenizationÜ
Überschwärzung
Überschwärzung (False Positives)
Entfernung von mehr Informationen als notwendig, wodurch der Nutzen des Dokuments sinkt und dies im Rechtskontext als Beweisvereitelung gewertet werden kann. Verursacht durch niedrige Vertrauensschwellen oder zu breite Entitätsauswahl. Anpassbar über die Schwellen- und Entitätssteuerung von anonym.legal.
#overredactionU
Universelle Entitäten
Sprachunabhängige Entitätstypen
Entitätstypen, die unabhängig von der Textsprache erkannt werden, typischerweise durch formatbasierte Regex mit Prüfziffernvalidierung. Beispiele: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO-Adresse.
#universalentitiesUnterschwärzung
Unterschwärzung (False Negatives)
Nicht alle PII werden entfernt, wodurch Personen in geteilten Dokumenten exponiert bleiben. Das häufigere Compliance-Risiko. Verursacht durch zu hohe Vertrauensschwellen, fehlende Entitätstypen oder neue PII-Formate. Abgemildert durch die hybride Erkennung und Unterstützung benutzerdefinierter Entitäten von anonym.legal.
#underredactionV
Vault
Verschlüsselungs-Schlüsseltresor
Sichere lokale Speicherung für Verschlüsselungsschlüssel in der Desktop App, geschützt durch Argon2id-Schlüsselableitung aus einer Master-Passphrase. Schlüssel werden verschlüsselt mit AES-256-GCM gespeichert und über BIP39-Mnemonik gesichert.
#vaultVersicherungs-Identifikatoren
Versicherungs-Entitätstypen
Entitätstypen für versicherungsbezogene Identifikatoren: US_NPI (National Provider Identifier für Leistungserbringer im Gesundheitswesen), HEALTHCARE_PLAN_BENEFICIARY und länderspezifische Krankenversicherungsnummern (z. B. DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersW
Web App
anonym.legal Webanwendung
Browserbasierte Oberfläche bei anonym.legal zur Analyse, Anonymisierung und Entschlüsselung von PII. Unterstützt Texteingabe, Datei-Upload (PDF, DOCX, TXT), Stapelverarbeitung, ZK Auth, 48 Sprachen und über 285 Entitätstypen. Keine Installation erforderlich.
#webappX
XChaCha20
XChaCha20-Poly1305
Ein authentifizierter Verschlüsselungsalgorithmus mit hoher Performance auf Systemen ohne AES-Hardwarebeschleunigung. Verwendet einen 192-Bit-Nonce (erweitert vom 96-Bit-Nonce des IETF-ChaCha20-Standards gemäß RFC 8439) und eliminiert so Risiken von Nonce-Kollisionen. Wird als alternative Chiffre in der Verschlüsselungsschicht von anonym.legal eingesetzt.
#xchacha20XLM-RoBERTa
Cross-Lingual RoBERTa
Ein mehrsprachiges Transformer-Sprachmodell, das auf 100 Sprachen trainiert wurde und von Meta AI entwickelt wurde. Wird in anonym.legal für sprachübergreifende NER-Aufgaben eingesetzt, insbesondere für Entitätstypen und Sprachen, für die keine monolingualen Modelle verfügbar sind.
#xlmrobertaZ
Zero-Knowledge
Zero-Knowledge-Architektur
Ein Systemdesign, bei dem der Dienstanbieter keinerlei Zugriff auf die Klartextdaten oder Verschlüsselungsschlüssel der Nutzer hat. Die gesamte Ver- und Entschlüsselung erfolgt clientseitig; der Server sieht niemals den Originalinhalt. Verhindert Insider-Bedrohungen und erzwungene Offenlegung.
#zeroknowledgeZK Auth
Zero-Knowledge-Authentifizierung
Das Authentifizierungssystem von anonym.legal, bei dem Verschlüsselungsschlüssel clientseitig aus der Passphrase des Nutzers mittels Argon2id abgeleitet werden und niemals an den Server übertragen oder dort gespeichert werden. Der Server speichert lediglich einen kryptografischen Nachweis, nicht jedoch den Schlüssel oder die Passphrase.
#zkauth