Takaisin BlogiinOikeusteknologia

GDPR ja Excel-tiedostosi: Miksi taulukkolaskennan...

Excel-kaavat viittaavat asiakastietosoluihin. Pivot-taulukot välimuistittavat arkaluontoisia tietoja.

April 10, 20268 min lukuaika
Excel anonymizationspreadsheet GDPRpivot table redactioncell-level PII detectionformula preservation

Miksi taulukkolaskennat eivät ole asiakirjoja

Word-asiakirja on sekventiaalinen tekstivirta, jossa on muotoilumetatietoja. Excel-taulukkolaskenta on relaatiorakenne: solut viittaavat toisiin soluihin, kaavat toimivat solujoukoilla, pivot-taulukot aggregoivat nimettyjä tietojoukkoja ja makrot kulkevat taulukkolaskentamallin läpi. Excel-tiedoston käsitteleminen tekstiasiakirjana PII-mallien osalta — mikä on tapa, jolla useimmat asiakirjojen punakynäystyökalut lähestyvät taulukkolaskentoja — ohittaa tiedon suhteet, jotka määrittävät taulukkolaskennan todellisen sisällön.

Kuvittele asiakasanalyysitaulukko. Sarake A sisältää asiakastietoja. Sarake D sisältää kaavan: =VLOOKUP(A2, CustomerTable, 5, FALSE) — haku, joka palauttaa asiakkaan tilin saldon heidän nimensä perusteella. Jos anonymisointityökalu korvasi nimen sarakkeessa A, mutta ei päivittänyt kaavan viitettä tai hakutaulukkoa, kaava jatkaa alkuperäisen nimen todellisen tilin saldon palauttamista. "Anonymisoitu" asiakirja paljastaa edelleen alkuperäisen asiakastunnuksen tiedon suhteen kautta.

Tämä ei ole hypoteettinen äärimmäinen tapaus. Yrityksen Excel-tiedostot on rakennettu tiedon suhteiden ympärille. Yksittäisten soluarvojen anonymisoiminen ilman relaatiorakenteen ymmärtämistä tuottaa asiakirjoja, jotka näyttävät olevan anonymisoituja, mutta säilyttävät alkuperäiset tiedot kaavaviitteiden, pivot-taulukon välimuistien ja ristiinviittausten kautta.

GDPR:n kolmannen osapuolen jakamisvaatimus

GDPR:n artikla 28 säätelee tietojen jakamista käsittelijöiden kanssa: organisaatioiden, jotka jakavat henkilötietoja ulkoisten osapuolten (konsultit, analytiikkatoimittajat, tarkastajat) kanssa, on varmistettava asianmukaiset tekniset suojatoimet. Käytännön kysymys: mikä on asianmukainen suojaus, kun jaetaan Excel-tietojoukko, joka sisältää 50 000 asiakastietoa ulkoiselle analytiikkatoimittajalle?

PDF-vienti poistaa kaavat ja tuottaa tilannekuvan — mutta suurten Excel-tiedostojen PDF-viennit korruptoivat usein monimutkaista muotoilua ja eivät sovellu analyyttiseen käyttöön. Muuntaminen CSV-muotoon poistaa kaavat, pivot-taulukot ja suurimman osan analyyttisestä rakenteesta. Kumpikaan vaihtoehto ei anna ulkoiselle toimittajalle käyttökelpoista tietojoukkoa heidän analyyttisiin tarkoituksiinsa.

Solutason anonymisointi alkuperäisessä Excel-muodossa — tunnistavien arvojen korvaaminen säilyttäen analyyttinen rakenne — on ainoa lähestymistapa, joka täyttää sekä GDPR:n suojausvaatimuksen että liiketoiminnan hyötyvaatimuksen samanaikaisesti.

Ilma-aukkoista käsittelyä puolustuksen taulukkolaskentaan

67 % hallituksen ja puolustuksen hankintaprosesseista mainitsee ilma-aukkoisen ympäristön vaatimukset (DISA 2024). Puolustuksen urakoitsijat, jotka työskentelevät henkilötietojen, logistiikkatietojen tai hankintatietojen kanssa Excel-muodossa, eivät voi käyttää pilvipohjaisia anonymisointityökaluja samoista syistä, jotka estävät pilvipohjaisen asiakirjakäsittelyn: tiedot eivät voi poistua hallitusta verkosta.

Excel-spesifisen anonymisointikyvyn ja paikallisen käsittelyn yhdistelmä luo teknisen profiilin, joka vaaditaan hallituksen sopimusvaatimusten täyttämiseksi. Työpöytäsovellus käsittelee Excel-tiedostoja paikallisesti ilman verkkokutsuja käsittelyn aikana; anonymisointitulokset eivät koskaan poistu ilma-aukkoisesta ympäristöstä; käsitellyt tiedostot ovat saatavilla sisäiseen jakamiseen hallitussa verkossa.

Solutason älykkyys

Tehokas Excel-anonymisointi toimii kolmella tasolla samanaikaisesti:

Arvotaso: Henkilötietojen arvojen havaitseminen ja korvaaminen yksittäisissä soluissa. Asiakkaiden nimet, sähköpostiosoitteet, puhelinnumerot ja kansalliset henkilötunnukset tunnistetaan samalla hybridihavaitsemismekanismilla, jota käytetään asiakirjakäsittelyssä.

Kaavatason: Solujen tunnistaminen, joiden kaavat viittaavat PII:tä sisältäviin soluihin, ja näiden viitteiden päivittäminen osoittamaan anonymisoituja arvoja tai kaavan korvaaminen sen lasketulla tuloksella estääkseen kaavapohjaisen PII-altistuksen.

Rakennetasolla: Pivot-taulukon välimuistien tyhjentäminen, piilotettujen rivien ja sarakkeiden käsittely ja VBA-makrokoodin käsittely, joka viittaa tiettyihin solujen osoitteisiin tai arvoihin.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.