The Excel Problem
Excel je najčastejšie miesto na uchovávanie a zdieľanie citlivých údajov v podnikoch — finančného, zdravotníckych, právnych. McKinsey analýza 2024 naznačujú:
- 80% podnikov mať tabuľky s osobami údajami (meno, adresa, SSN, bank)
- 40% zdieľať tieto tabuľky bez zašifrovania
- 15% posielajú e-mailom bez hesla alebo ochrany
Excel nie je dizajnovaný na ochranu údajov — je to generický "sheet" software. GDPR, HIPAA, CCPA nech si to nepovedali.
GDPR Požiadavky pre Tabulkové Údaje
GDPR článok 32 vyžaduje:
- Pseudonymizácia: Nahradenie identifikátorov (meno → "User_001", SSN → "*--1234")
- Šifrovanie: Tabuľka je zašifrovaná (AES-256) alebo minimálne heslo-chránené
- Audit logovanie: Kto pristúpil k tabuľke a kedy
- Bezpečnosť prístupu: Len autorizovaný personál má prístup
Excel natívne nepodporuje pseudonymizáciu, šifrovanie alebo audit logy. Administratívna manuálna práca alebo tretej strany nástroje sú potrebné.
Anonymizačné Techniky na Excel
1. Redakcia (Redaction)
Smazanie alebo čiernenie citlivých údajov. V Exceli:
- Ručne: Vyberte bunky, stlačte Delete alebo Ctrl+X
- Vzorečiek: =IF(COLUMN()>5, "[REDACTED]", A1) — všetko po 5. stĺpci je čiernené
- Vzorečiek: =CONCATENATE(LEFT(A1,1),"***") — zatajenie všetkého okrem prvého charakteru
Úkon: Redakcia je nevratná — nemôžete obnovu. Všeobecne pre papier/vytlačené záznamy.
2. Maskovanie (Masking)
Nahradenie identifikátorov s generovanými hodnotami. V Exceli:
- SSN: "123-45-6789" → "*--6789" (Vzorečiek:
=CONCATENATE("***-**-",RIGHT(A1,4))) - Meno: "John Smith" → "John S." alebo "User_001"
- Email: "john.smith@company.com" → "j***@company.com"
- Dátum narodenia: "1980-01-15" → "1980-01-**" alebo "1980")
Úkon: Maskový údaj je čitateľný a často spätne prevoditeľný — oveľa slabší ako redakcia.
3. Šifrovanie (Encryption)
Všeobecný Excel je chránený heslom — ale slabé heslo brúsené silou. Lepšie:
- Vlastné súbor: Otvorte Excel → File → Info → Protect Workbook → Encrypt with Password. Heslo 12+ znakov (kombinácia veľké, malé, čísla, symboly). Keď je otvárať, Excel vyžaduje heslo.
- Tretej strany: 7-Zip (
.xlsxako.zip, pridajte heslo) alebo VeraCrypt (šifruje celú zložku) - Cloud: Microsoft OneDrive Desktop alebo Google Drive — obidva sú AES-256 šifrovaní na serveri a pri prenose
- Vlastný: anonym.legal Anonymizácia API — načítajte Excel, anonymizujte identifikátor, stiahnite nový Excel
4. Permutácia (Permutation) / Shuffle
Zamešajte poradie riadkov tak, aby sa znepredviditeľný výsledok. V Exceli:
- Vyberte všetky riadky
- Pridajte pomocný stĺpec s =RAND() na každý riadok
- Triediť podľa pomocného stĺpca
- Vymažte pomocný stĺpec
Na to praxi: Permutácia neposkytuje ochranu sám — je to len zmiešavanie poradia.
Bezpečný Excel Pracovný Postup
- Identifikujte citlivé stĺpce: Meno, SSN, email, telefón, adresa, banková konta, medicínske čísla
- Zvolte stratégiu: Redakcia (nevratná), Maskovanie (reverzibilná), Šifrovanie (obidve)
- Testovacie údaje prvý: Vytvoriť kópiu tabuľky, anonymizovať kópiu, überproof
- Produkt anonymizácia: Keď je kópia overená, anonymizovať originál
- Zmazať pôvodný: Ak sa má anonymizovaný formát použiť, zmazať alebo archivovať pôvodný v bezpečnom umiestnení
- Audit log: Záznam - kto anonymizoval, kedy, ako
Nástroje
- Microsoft Excel: Natívne Protect Workbook, Encrypt with Password
- anonym.legal: API
/api/structuredpodporuje XLSX anonymizácie - Presidio (open-source, no API key): PII detektor pre Excel — detekuje bez anonymizácie, podľa potreby ručne
- OpenRefine: Open-source tabuľkový software so vzorčí anonymizácie