anonym.legal
Terug naar BlogJuridische Technologie

Excel en GDPR: De Verborgen Gegevensblootstellingsrisi...

GDPR Recht op Toegang verzoeken zijn met 180% gestegen van 2021 tot 2024 (EDPB). Gemiddelde verwerking van DSAR's kost handmatig 12 uur.

April 7, 20268 min lezen
Excel GDPR anonymizationspreadsheet redactionDSAR processingEDPB right of accessHR data compliance

De Compliance Kloof in Spreadsheets

PDF-redactietools kunnen geen Excel-spreadsheets verwerken. Dit enkele feit creëert een systematische compliance-kloof voor organisaties die persoonlijke gegevens in Excel-formaat opslaan — wat in bedrijfsomgevingen betekent dat bijna elke HR-afdeling, financiële team en operationele afdeling dit probleem heeft.

De gegevens uit het Jaarverslag van de EDPB tonen aan dat de GDPR Recht op Toegang verzoeken met 180% zijn gestegen van 2021 tot 2024. Organisaties die DSAR's ontvangen, moeten de persoonlijke gegevens van de verzoeker in een draagbaar formaat verstrekken, terwijl ze ervoor zorgen dat de gegevens van derden die in dezelfde dataset zijn opgenomen, op de juiste manier worden beschermd. Voor een werknemersdataset die in Excel is opgeslagen, is de standaardreactie — specifieke rijen exporteren — nog steeds blootstelling van de gegevens van andere werknemers in hetzelfde bestand. Juiste DSAR-compliance vereist per-record anonimisatie van niet-verzoeker gegevens.

De gemiddelde verwerking van een DSAR kost 12 uur handmatig. Voor een organisatie die 200 DSAR's per maand ontvangt — een bescheiden volume voor een middelgroot bedrijf — vertegenwoordigt dit 2.400 personeelsuren per maand aan compliance-overhead. De handmatige aanpak schaalt niet naar het volume van verzoeken dat de EDPB-gegevens voor de rest van dit decennium projecteren.

Wat Excel Anonimisering Eigenlijk Vereist

Spreadsheet-anonimisering presenteert uitdagingen die PDF-redactietools niet zijn ontworpen om aan te pakken.

Verborgen rijen en kolommen: Excel-bestanden bevatten vaak verborgen rijen (conceptgegevens, gefilterde records) en verborgen kolommen (interimcalculaties, oorspronkelijke waarden voor transformatie). Een redactietool die alleen zichtbare cellen verwerkt, laat verborgen PII intact. Een compliance-grade Excel-anonimizer moet alle bladen verwerken, inclusief verborgen.

Ingebedde formules: Cellen met formules die naar PII in andere cellen verwijzen, kunnen afgeleide waarden weergeven terwijl de formule zelf naar de oorspronkelijke gegevens verwijst. Het anonimiseren van de weergegeven waarde zonder de formuleverwijzing bij te werken, laat de oorspronkelijke PII toegankelijk voor iedereen die de formule inspecteert.

Draaitabelcache: Excel-draaitabellen cachen de onderliggende gegevens die zijn gebruikt om de draaitabel te genereren. Het anonimiseren van het brongegevensblad wist de draaitabelcache niet automatisch. Een vijandige gebruiker die een "geanonimiseerd" Excel-bestand ontvangt, kan de draaitabelcache inspecteren om de oorspronkelijke gegevens te herstellen.

Cross-sheet verwijzingen: Enterprise Excel-bestanden bevatten routinematig cross-sheet celverwijzingen. De naam van een werknemer kan op Blad 1 verschijnen en worden verwezen in berekeningen op Blad 3. Het anonimiseren van Blad 1 zonder de verwijzingen op Blad 3 bij te werken, laat een verwijzing naar de geanonimiseerde gegevens die de oorspronkelijke waarde kan onthullen via formule-inspectie.

Het HR-afdeling Gebruiksscenario

Een Duits productiebedrijf moet 50.000 werknemersrecords delen met een externe compensatieconsultant voor een benchmarkproject. GDPR Artikel 28 vereist dat het delen van persoonlijke gegevens met een verwerker (de externe consultant) gepaste technische controles omvat. Het Excel-bestand bevat 37 kolommen, waaronder namen, persoonlijke e-mailadressen, huisadressen, salarissen, prestatiebeoordelingen en medische verlofrecords.

Handmatige anonimisatie van 50.000 rijen over 37 kolommen is niet haalbaar binnen enige compliance-tijdlijn. De Word en Excel Add-in verwerkt de spreadsheet op een native manier — binnen Microsoft Excel, zonder export of conversie. PII-detectie op celniveau identificeert persoonlijke gegevens over alle zichtbare en verborgen bladen. Namen worden vervangen door pseudoniemen; adressen door type-geschikte plaatsaanduidingen; salarissen behouden (niet PII) terwijl gerelateerde persoonlijke identificatoren worden verwijderd. De anonimisatie verwerkt 50.000 rijen in minuten in plaats van dagen.

Per-entiteit configuratie staat verschillende behandeling voor verschillende gegevenstypen toe: namen worden vervangen door consistente pseudoniemen (dezelfde naam in verschillende cellen krijgt hetzelfde pseudoniem, waardoor analytische bruikbaarheid behouden blijft); SSN's worden vervangen door gemaskeerde strings; adressen worden vervangen door alleen stad-approximaties; persoonlijke e-mailadressen worden vervangen door rolgebaseerde plaatsaanduidingen.

Bronnen:

Klaar om uw gegevens te beschermen?

Begin met het anonimiseren van PII met 285+ entiteitstypen in 48 talen.