Het multi-formaatprobleem bij PII-compliance
Bijgewerkt voor 2026
Vraag een compliance-officer welke formaten ze anonimiseren voor DSAR-responsen. De lijst is altijd hetzelfde: Word-contracten, PDF-facturen, Excel-klantdata, CSV-exports en JSON-logs.
Vraag dan welke tools ze gebruiken. Het antwoord is doorgaans drie tot vijf. Elke tool heeft andere entiteitsdekking. Elke heeft andere instellingen. Elke produceert een ander auditlogboek-formaat.
Wat fragmentatie voor compliance betekent
Een DSAR-respons vereist dat u alle persoonsgegevens over de aanvrager verzamelt en produceert, ongeacht het bestandsformaat. Als u vijf tools gebruikt:
-
Inconsistente entiteitsdekking: Tool A detecteert telefoonnummers in Word. Tool B detecteert ze niet in Excel. Hetzelfde telefoonnummer wordt in het ene document geredacteerd, in het andere niet.
-
Inconsistente auditlogboeken: Elke tool heeft een ander logboekformaat. Er is geen centrale audit die alle documenten in de DSAR-respons omvat.
-
Operationele overhead: Medewerkers moeten voor elk documenttype van tool wisselen. Dit vergroot de foutenkans en vertraagt de verwerking.
Eén tool voor alle formaten
Anonym.legal verwerkt alle veelvoorkomende documentformaten:
- PDF: inclusief gescande PDF's via OCR-pijplijn
- Word (.docx): tekst in alinea's, tabellen, kop- en voetteksten
- Excel (.xlsx): structurele kolomdetectie plus vrije-tekstveld analyse
- CSV: kolom- en vrije-tekstveldverwerking
- JSON: geneste velddoorloop met sleutel-context-bewust detectie
- Platte tekst: standaard NLP-pipeline
Dezelfde entiteitsdekking en hetzelfde auditlogboekformaat over alle formaten. Eén DSAR-productie heeft één consistent audittrail, ongeacht hoeveel documentformaten zijn betrokken.