Arkusze kalkulacyjne to nie dokumenty
Plik Word to strumień tekstu. Plik Excel to coś zupełnie innego. Komórki wskazują na inne komórki. Formuły działają na zakresach. Tabele przestawne grupują nazwane dane. Makra przemieszczają się po całym skoroszycie. Większość narzędzi do redakcji traktuje Excel jak dokument tekstowy. To błędne podejście.
Proszę o prosty przykład. Kolumna A zawiera nazwiska klientów. Kolumna D ma następującą formułę: =WYSZUKAJ.PIONOWO(A2; TabelaKlientów; 5; FAŁSZ). Formuła ta wyszukuje saldo rachunku na podstawie nazwiska. Zastępujesz nazwisko w kolumnie A. Nie aktualizujesz formuły ani tabeli wyszukiwania. Formuła nadal zwraca prawdziwe saldo dla oryginalnego nazwiska. Plik wygląda na czysty. Nie jest.
Ten problem jest powszechny w firmowych plikach Excel. Dane żyją w relacjach – nie tylko w komórkach. Zastępowanie wartości komórek bez śledzenia tych relacji pozostawia dane osobowe w widocznym miejscu.
RODO Artykuł 28 i udostępnianie zewnętrzne
Artykuł 28 RODO reguluje udostępnianie danych podmiotom przetwarzającym. Jeśli przesyłasz dane osobowe do konsultanta, dostawcy lub audytora, musisz wdrożyć techniczne zabezpieczenia.
Załóżmy, że musisz udostępnić plik z 50 000 rekordami klientów dostawcy usług analitycznych. Eksport do PDF usuwa formuły, a przy dużych plikach z rozbudowanym formatowaniem może je uszkodzić. Eksport do CSV również usuwa formuły i tabele przestawne. Żaden z tych formatów nie daje dostawcy użytecznego zestawu danych.
Jedyna metoda, która działa: anonimizacja w natywnym formacie Excel. Zastępujesz wartości identyfikujące. Zachowujesz strukturę. Dostawca otrzymuje działający plik. Ty spełniasz wymóg zabezpieczenia wynikający z RODO.
Środowiska z izolacją sieciową (air-gap)
67% specyfikacji zamówień rządowych i obronnych zawiera wymóg środowiska z izolacją sieciową (DISA 2024). Wykonawcy wojskowi przetwarzają dane kadrowe, rejestry logistyczne i pliki zamówień w Excelu. Nie mogą korzystać z narzędzi chmurowych. Dane nie mogą opuścić kontrolowanej sieci.
Aplikacja desktopowa rozwiązuje ten problem. Przetwarza pliki Excel lokalnie na urządzeniu. Podczas przetwarzania nie są wykonywane żadne wywołania sieciowe. Wynikowy plik nigdy nie opuszcza środowiska z izolacją sieciową. Wewnętrzne zespoły mogą wymieniać czyste pliki w obrębie kontrolowanej sieci.
Spełnia to profil techniczny wymagany do zachowania zgodności z kontraktami rządowymi.
Trzy poziomy inteligencji komórkowej
Dobra anonimizacja Excela działa jednocześnie na trzech poziomach.
Poziom wartości: Wykrywanie i zastępowanie danych osobowych w poszczególnych komórkach. Imiona i nazwiska, adresy e-mail, numery telefonów i numery identyfikacji narodowej są oznaczane przy użyciu tego samego mechanizmu wykrywania co w przypadku przetwarzania dokumentów.
Poziom formuł: Wykrywanie komórek, których formuły odwołują się do komórek z danymi osobowymi. Aktualizacja tych odwołań tak, by wskazywały na zanonimizowane wartości. Ewentualnie zastępowanie formuły jej wynikiem, aby wyeliminować ujawnianie danych osobowych przez formuły.
Poziom struktury: Czyszczenie pamięci podręcznych danych tabel przestawnych. Przetwarzanie ukrytych wierszy i kolumn. Obsługa kodu makr VBA odwołującego się do konkretnych adresów lub wartości komórek.
Wszystkie trzy poziomy muszą działać jednocześnie. Naprawianie wartości bez poprawiania formuł pozostawia dane osobowe w pliku. Poprawianie formuł bez czyszczenia pamięci podręcznych daje ten sam efekt.
Wyzwanie to dotyczy każdego formatu pliku. Przeczytaj artykuł jak fragmentacja formatów wpływa na wykrywanie danych osobowych, by zobaczyć szerszy obraz.
Dla zespołów pracujących z danymi strukturalnymi na poziomie API zapoznaj się z artykułem Minimalizacja danych RODO w API czasu rzeczywistego.
Jeśli Twój zespół przetwarza duże eksporty DSAR, zapoznaj się z Masowym przetwarzaniem wniosków DSAR zgodnie z RODO, gdzie znajdziesz wzorce przepływów pracy mające zastosowanie również tutaj.