Zpět na blogPrávní technologie

Excel a GDPR: Rizika dat v tabulkách

Počet žádostí o přístup k osobním údajům vzrostl o 180 % mezi lety 2021 a 2024 (EDPB). Průměrné ruční zpracování DSAR trvá 12 hodin. HR oddělení spravující tisíce záznamů.

George CurtaApril 7, 20268 min čtení

Excel GDPR anonymizationspreadsheet redactionDSAR processingEDPB right of accessHR data compliance

Nástroje pro redigování PDF nefungují na soubory Excel. To vytváří mezeru v souladu s předpisy. V podnikovém prostředí se týká každého HR, finančního a provozního týmu.

Počet žádostí o přístup k osobním údajům podle GDPR vzrostl o 180 % mezi lety 2021 a 2024 (výroční zpráva EDPB). Když dorazí DSAR, musíte sdílet osobní údaje žadatele. Zároveň musíte chránit údaje všech ostatních ve stejném souboru. Exportovat konkrétní řádky nestačí. Ostatní záznamy zůstávají viditelné. Řádný soulad s DSAR znamená anonymizovat všechna data, která žadateli nepatří.

Průměrné ruční zpracování jednoho DSAR trvá 12 hodin. Při 200 DSAR měsíčně to představuje 2 400 pracovních hodin. Ruční zpracování se nedá škálovat.

Co musí anonymizace Excelu pokrývat

Tabulky mají problémy, pro které textové nástroje nejsou konstruovány.

Skryté řádky a sloupce. Soubory Excel často skrývají řádky a sloupce. Mohou obsahovat konceptní záznamy nebo původní hodnoty. Nástroj čtoucí pouze viditelné buňky přehlédne OÚ ve skrytých oblastech.

Odkazy vzorců. Buňka může zobrazovat hodnotu sestavenou z jiných buněk. Vymazání zdrojových buněk neaktualizuje výstup vzorce. Původní OÚ zůstávají ve výsledku vzorce.

Mezipaměť kontingenční tabulky. Kontingenční tabulky Excelu ukládají kopii zdrojových dat. Vymazání zdrojového listu mezipaměť nevymaže. Kdokoli s přístupem k souboru může uložená data přečíst.

Mezisešitové vazby. Jméno na Listu 1 se může vyskytovat ve vzorci na Listu 3. Vymazání Listu 1 bez aktualizace Listu 3 může původní hodnotu prostřednictvím vzorce odhalit.

Nástroj splňující požadavky souladu musí zpracovat všechny listy — včetně skrytých — a aktualizovat všechny odkazy vzorců.

HR případ: sdílení 50 000 záznamů zaměstnanců

Německý výrobce musí sdílet 50 000 záznamů zaměstnanců s externím poradcem. Článek 28 GDPR vyžaduje technické kontroly při sdílení dat se zpracovatelem. Soubor má 37 sloupců: jména, adresy bydliště, platy, hodnocení a data pracovní neschopnosti.

Ruční anonymizace 50 000 řádků není v jakémkoli lhůtě souladu proveditelná.

Doplněk pro Word a Excel funguje přímo v Microsoft Excelu — bez nutnosti exportu. Detekce OÚ probíhá napříč všemi viditelnými i skrytými listy. Jména se stávají konzistentními pseudonymy. Stejné jméno ve dvou buňkách dostane stejný token. Analytické vazby zůstávají zachovány. Adresy jsou nahrazeny typově odpovídajícími zástupnými hodnotami. Platy zůstávají beze změny. Všech 50 000 řádků je zpracováno během minut.

Pravidla pro každou entitu umožňují zacházet s každým typem dat odlišně. Rodná čísla se stávají maskovanými řetězci. Adresy jsou nahrazeny hodnotami na úrovni města. Osobní e-mailové adresy se stávají funkčními zástupnými adresami.

Tato výzva není výhradně problémem Excelu. Každý formát souborů má své vlastní způsoby selhání. Přečtěte si, jak fragmentace formátů ovlivňuje detekci OÚ napříč typy souborů.

Anonymizace tabulek splňuje tři pravidla článku 5 najednou.

Minimalizace dat (čl. 5 odst. 1 písm. c)). Příjemci jsou sdíleny pouze sloupce, které potřebuje. Identifikující sloupce jsou vymazány.

Omezení uložení (čl. 5 odst. 1 písm. e)). Původní soubor je uchován pro zákonné účely. Čistá kopie je sdílena s kratší dobou uchování.

Integrita a důvěrnost (čl. 5 odst. 1 písm. f)). Žádné identifikující údaje neopouštějí kontrolovanou zónu. Vychází pouze čistá kopie.

Auditní protokol z každého průběhu je zároveň vaším záznamem podle článku 5 odst. 2. Ukazuje, které pravidlo bylo aplikováno na každý soubor a každou buňku.

Pro týmy zpracovávající velké objemy DSAR v přísných termínech viz dávkové zpracování DSAR GDPR ve velkém měřítku.

Zdroje

Související články

Právní technologie

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

Začít bezplatnou zkušební verzi Zobrazit funkce

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

We follow these rules

GDPR (EU 2016/679).
ISO/IEC 27001:2022.
NIS2 (EU 2022/2555).
HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our company HQ is in Saarbrücken, Germany. Our servers run in Hetzner's Falkenstein datacenter.

Hetzner holds ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

We never sell your information to third parties.
We never train models on what you upload.
We never keep your work after you delete it.
We never share keys with any outside firm.
We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.

Excel a GDPR: Rizika dat v tabulkách

Co musí anonymizace Excelu pokrývat

HR případ: sdílení 50 000 záznamů zaměstnanců

Zdroje

Související články

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

Připraveni chránit svá data?

Excel a GDPR: Rizika dat v tabulkách

Mezera Excelu v oblasti GDPR

Co musí anonymizace Excelu pokrývat

HR případ: sdílení 50 000 záznamů zaměstnanců

Tři pravidla GDPR v jednom průchodu

Zdroje

Související články

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

Připraveni chránit svá data?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow