Tilbage til BlogJuridisk Teknologi

GDPR og dine Excel-filer: Hvorfor anonymisering af...

Excel-formler refererer til celler, der indeholder kundenavne. Pivottabeller cacher følsomme data.

April 10, 20268 min læsning
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

Hvorfor regneark ikke er dokumenter

Et Word-dokument er en sekventiel tekststrøm med formateringsmetadata. Et Excel-regneark er en relationel datastruktur: celler refererer til andre celler, formler opererer på celleområder, pivottabeller aggregerer navngivne dataområder, og makroer gennemgår regnearksobjektmodellen. At behandle en Excel-fil som et tekstdokument, der skal behandles for PII-mønstre — hvilket er, hvordan de fleste dokumentredigeringsværktøjer nærmer sig regneark — overser de datarelationer, der definerer regnearkets faktiske indhold.

Overvej et kundeanalyse-regneark. Kolonne A indeholder kundenavne. Kolonne D indeholder en formel: =VLOOKUP(A2, CustomerTable, 5, FALSE) — et opslag, der returnerer kundens kontobalance baseret på deres navn. Hvis anonymiseringsværktøjet erstatter navnet i kolonne A, men ikke opdaterer formelreferencen eller opslagstabellen, fortsætter formlen med at returnere den faktiske kontobalance for det oprindelige navn. Det "anonymiserede" dokument udsætter stadig den oprindelige kundes identitet gennem datarelationen.

Dette er ikke et hypotetisk kanttilfælde. Virksomhedens Excel-filer er bygget omkring datarelationer. Anonymisering af individuelle celleværdier uden at forstå den relationelle struktur producerer dokumenter, der ser anonymiserede ud, men bevarer de oprindelige data gennem formelreferencer, pivottabeller caches og tværsheetsopslag.

GDPR's krav om deling med tredjeparter

GDPR Artikel 28 regulerer datadeling med behandlere: organisationer, der deler persondata med eksterne parter (konsulenter, analyseleverandører, revisorer), skal sikre passende tekniske sikkerhedsforanstaltninger. Det praktiske spørgsmål: hvad er en passende sikkerhedsforanstaltning, når man deler et Excel-datasæt, der indeholder 50.000 kundeposter, med en ekstern analyseleverandør?

PDF-eksport fjerner formler og producerer et snapshot — men PDF-eksporter af store Excel-filer beskadiger ofte kompleks formatering og er ikke egnet til analytisk brug. Konvertering til CSV fjerner formler, pivottabeller og det meste af den analytiske struktur. Ingen af mulighederne giver den eksterne leverandør et brugbart datasæt til deres analytiske formål.

Celle-niveau anonymisering inden for det native Excel-format — erstatte identificerende værdier, mens den analytiske struktur bevares — er den eneste tilgang, der samtidig opfylder både GDPR's krav om sikkerhedsforanstaltninger og forretningsnyttekrav.

Luftgapsbehandling for forsvarsregneark

67% af offentlige og forsvarsindkøb RFP'er nævner krav om luftgapsmiljøer (DISA 2024). Forsvarsleverandører, der arbejder med personaleoplysninger, logistikinformation eller indkøbsoptegnelser i Excel-format, kan ikke bruge cloud-baserede anonymiseringsværktøjer af de samme grunde, der forbyder cloud-baseret dokumentbehandling: dataene må ikke forlade det kontrollerede netværk.

Kombinationen af Excel-specifik anonymiseringskapacitet og lokal behandling skaber den tekniske profil, der kræves for overholdelse af offentlige kontrakter. Desktop-appen behandler Excel-filer lokalt uden netværksopkald under behandlingen; anonymiseringsresultaterne forlader aldrig luftgapsmiljøet; de behandlede filer er tilgængelige for intern deling inden for det kontrollerede netværk.

Celle-Niveau Intelligens

Effektiv Excel-anonymisering opererer på tre niveauer samtidig:

Værdi-niveau: Detektering og erstatning af PII-værdier i individuelle celler. Kundenavne, e-mailadresser, telefonnumre og nationale ID-numre identificeres gennem den samme hybride detektionsmotor, der bruges til dokumentbehandling.

Formel-niveau: Identificering af celler, hvis formler refererer til PII-indholdende celler, og opdatering af disse referencer til at pege på de anonymiserede værdier eller erstatte formlen med dens beregnede resultat for at forhindre formelbaseret PII-eksponering.

Struktur-niveau: Rydning af pivottabeldata caches, behandling af skjulte rækker og kolonner, og håndtering af VBA-makrokode, der refererer til specifikke celleadresser eller værdier.

Kilder:

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.