Tilbake til BloggJuridisk Teknologi

GDPR og Excel-filene dine: Hvorfor anonymisering av...

Excel-formler refererer til celler som inneholder kundenavn. Pivot-tabeller cacher sensitive data.

April 10, 20268 min lesing
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

Hvorfor regneark ikke er dokumenter

Et Word-dokument er en sekvensiell tekststrøm med formateringsmetadata. Et Excel-regneark er en relasjonell datastruktur: celler refererer til andre celler, formler opererer på celleområder, pivot-tabeller aggregerer navngitte dataområder, og makroer traverserer regnearkets objektmodell. Å behandle en Excel-fil som et tekstdokument for å bli behandlet for PII-mønstre — som er hvordan de fleste dokumentredigeringsverktøy nærmer seg regneark — overser datatilknytningene som definerer regnearkets faktiske innhold.

Tenk på et kundeanalyse-regneark. Kolonne A inneholder kundenavn. Kolonne D inneholder en formel: =VLOOKUP(A2, CustomerTable, 5, FALSE) — et oppslag som returnerer kundens kontobalanse basert på navnet deres. Hvis anonymiseringsverktøyet erstatter navnet i kolonne A, men ikke oppdaterer formelreferansen eller oppslagstabellen, fortsetter formelen å returnere den faktiske kontobalansen for det opprinnelige navnet. Det "anonymiserte" dokumentet eksponerer fortsatt den opprinnelige kundeidentiteten gjennom datatilknytningen.

Dette er ikke et hypotetisk grensecase. Bedrifts-Excel-filer er bygget rundt datatilknytninger. Anonymisering av individuelle celleverdier uten å forstå den relasjonelle strukturen produserer dokumenter som ser anonymiserte ut, men beholder de opprinnelige dataene gjennom formelreferanser, pivot-tabellcacher og kryssark-oppslag.

GDPRs krav til deling med tredjeparter

GDPR Artikkel 28 regulerer datadeling med behandlere: organisasjoner som deler personopplysninger med eksterne parter (konsulenter, analyseleverandører, revisorer) må sikre passende tekniske sikkerhetstiltak. Det praktiske spørsmålet: hva er et passende sikkerhetstiltak når man deler et Excel-datasett som inneholder 50 000 kundeposter med en ekstern analyseleverandør?

PDF-eksport fjerner formler og produserer et øyeblikksbilde — men PDF-eksporter av store Excel-filer korrumperer ofte kompleks formatering og er ikke egnet for analytisk bruk. Konvertering til CSV fjerner formler, pivot-tabeller og det meste av den analytiske strukturen. Ingen av alternativene gir den eksterne leverandøren et brukbart datasett for deres analytiske formål.

Celle-nivå anonymisering innen det native Excel-formatet — erstatte identifiserende verdier samtidig som den analytiske strukturen bevares — er den eneste tilnærmingen som tilfredsstiller både GDPRs krav til sikkerhetstiltak og forretningsnytte samtidig.

Luftgapet behandling for forsvarsregneark

67% av offentlige og forsvarsanskaffelses-RFP-er nevner krav til luftgapte miljøer (DISA 2024). Forsvarsentreprenører som arbeider med persondata, logistikkinformasjon eller anskaffelsesposter i Excel-format kan ikke bruke skybaserte anonymiseringsverktøy av de samme grunnene som forbyr skybasert dokumentbehandling: dataene kan ikke forlate det kontrollerte nettverket.

Kombinasjonen av Excel-spesifik anonymiseringskapasitet og lokal behandling skaper den tekniske profilen som kreves for overholdelse av offentlige kontrakter. Desktop-appen behandler Excel-filer lokalt uten nettverksanrop under behandlingen; anonymiseringsresultatene forlater aldri det luftgapte miljøet; de behandlede filene er tilgjengelige for intern deling innen det kontrollerte nettverket.

Celle-nivå intelligens

Effektiv Excel-anonymisering opererer på tre nivåer samtidig:

Verdi-nivå: Oppdage og erstatte PII-verdier i individuelle celler. Kundenavn, e-postadresser, telefonnumre og nasjonale ID-numre identifiseres gjennom den samme hybride deteksjonsmotoren som brukes for dokumentbehandling.

Formel-nivå: Identifisere celler hvis formler refererer til PII-inneholdende celler, og oppdatere disse referansene til å peke på de anonymiserte verdiene eller erstatte formelen med dens beregnede resultat for å forhindre formelbasert PII-eksponering.

Struktur-nivå: Tømme pivot-tabellens datacacher, behandle skjulte rader og kolonner, og håndtere VBA-makrokode som refererer til spesifikke celleadresser eller verdier.

Kilder:

Klar til å beskytte dataene dine?

Begynn å anonymisere PII med 285+ enhetstyper på 48 språk.