By · Last updated 2026-04-07

Powrót do blogaTechnologia prawna

Excel i RODO: Ryzyko danych w arkuszach kalkulacyjnych

Liczba wniosków o dostęp do danych osobowych (DSAR) wzrosła o 180% w latach 2021–2024 (EDPB). Ręczne rozpatrywanie jednego wniosku zajmuje średnio 12 godzin. Działy HR zarządzają.

April 7, 20268 min czytania
Excel GDPR anonymizationspreadsheet redactionDSAR processingEDPB right of accessHR data compliance

Luka zgodności Excela z RODO

Narzędzia do redakcji plików PDF nie działają na plikach Excel. Tworzy to lukę w zgodności z przepisami. W środowiskach korporacyjnych problem ten dotyka każdego działu HR, finansów i operacji.

Liczba wniosków o dostęp do danych osobowych (DSAR) wzrosła o 180% między 2021 a 2024 rokiem (Roczny Raport EDPB). Gdy wpływa wniosek DSAR, musisz udostępnić dane osobowe wnioskodawcy. Musisz też chronić dane wszystkich innych osób zawarte w tym samym pliku. Wyeksportowanie wybranych wierszy to za mało – pozostałe rekordy nadal są widoczne. Właściwa obsługa DSAR wymaga zanonimizowania wszystkich danych nienależących do wnioskodawcy.

Ręczne rozpatrzenie jednego wniosku DSAR zajmuje średnio 12 godzin. Przy 200 wnioskach miesięcznie daje to 2400 roboczogodzin. Ręczne przetwarzanie nie skaluje się.

Co musi obejmować anonimizacja plików Excel

Arkusze kalkulacyjne mają specyficzne problemy, z którymi narzędzia tekstowe nie są zaprojektowane, by sobie radzić.

Ukryte wiersze i kolumny. Pliki Excel często zawierają ukryte wiersze i kolumny. Mogą w nich znajdować się wersje robocze rekordów lub oryginalne wartości. Narzędzie odczytujące tylko widoczne komórki pominie dane osobowe w ukrytych obszarach.

Odwołania do formuł. Komórka może wyświetlać wartość zbudowaną na podstawie innych komórek. Wyczyszczenie komórek źródłowych nie aktualizuje wyniku formuły. Oryginalne dane osobowe pozostają widoczne w wynikach formuł.

Pamięć podręczna tabeli przestawnej. Tabele przestawne Excela przechowują kopię danych źródłowych. Wyczyszczenie arkusza źródłowego nie czyści pamięci podręcznej. Każda osoba mająca dostęp do pliku może odczytać zbuforowane dane.

Łącza między arkuszami. Nazwisko na Arkuszu 1 może pojawić się w formule na Arkuszu 3. Wyczyszczenie Arkusza 1 bez aktualizacji Arkusza 3 może ujawnić oryginalną wartość przez formułę.

Narzędzie spełniające standardy zgodności musi przetwarzać wszystkie arkusze – łącznie z ukrytymi – i aktualizować wszystkie odwołania do formuł.

Przykład HR: udostępnianie 50 000 rekordów pracowniczych

Niemiecki producent musi udostępnić 50 000 rekordów pracowniczych zewnętrznemu konsultantowi. Artykuł 28 RODO wymaga stosowania środków technicznych przy udostępnianiu danych podmiotowi przetwarzającemu. Plik zawiera 37 kolumn: imiona i nazwiska, adresy domowe, wynagrodzenia, oceny oraz dane o zwolnieniach lekarskich.

Ręczna anonimizacja 50 000 wierszy nie jest możliwa do wykonania w żadnym oknie czasowym zgodnym z przepisami.

Dodatek do programów Word i Excel działa bezpośrednio w programie Microsoft Excel – bez konieczności eksportu. Wykrywanie danych osobowych obejmuje wszystkie widoczne i ukryte arkusze. Imiona i nazwiska są zastępowane spójnymi pseudonimami – to samo imię i nazwisko w dwóch komórkach otrzymuje ten sam token. Powiązania analityczne zostają zachowane. Adresy są zastępowane ogólnymi wartościami odpowiadającymi typowi danych. Wynagrodzenia pozostają bez zmian. Wszystkie 50 000 wierszy jest przetwarzanych w ciągu kilku minut.

Reguły dla poszczególnych encji pozwalają traktować każdy typ danych inaczej. Numery PESEL stają się zamaskowanymi ciągami. Adresy są redukowane do poziomu miejscowości. Prywatne adresy e-mail są zastępowane wzorcowymi adresami funkcyjnymi.

Problem ten nie dotyczy wyłącznie Excela. Każdy format pliku ma własne podatności. Przeczytaj jak fragmentacja formatów wpływa na wykrywanie danych osobowych w różnych typach plików.

Trzy zasady RODO spełnione w jednym przebiegu

Anonimizacja arkuszy kalkulacyjnych pozwala jednocześnie spełnić trzy zasady wynikające z artykułu 5 RODO.

Minimalizacja danych (art. 5 ust. 1 lit. c). Udostępniane są wyłącznie kolumny niezbędne odbiorcy. Kolumny identyfikujące zostają usunięte.

Ograniczenie przechowywania (art. 5 ust. 1 lit. e). Oryginalny plik jest przechowywany dla celów prawnych. Czysta kopia jest udostępniana z krótszym okresem retencji.

Integralność i poufność (art. 5 ust. 1 lit. f). Żadne dane identyfikujące nie opuszczają strefy kontrolowanej. Na zewnątrz trafia wyłącznie czysta kopia.

Dziennik audytu generowany przy każdym przebiegu stanowi jednocześnie Twój zapis zgodny z art. 5 ust. 2. Pokazuje, która reguła została zastosowana do każdego pliku i każdej komórki.

Dla zespołów obsługujących dużą liczbę wniosków DSAR w napiętych terminach zapoznaj się z artykułem Masowe przetwarzanie wniosków DSAR zgodnie z RODO.

Źródła

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.