Strukturirani podatki
Excel datoteke so drugačne od pisnih dokumentov. Vsebujejo:
- Stolpce (imena, e-poštni naslove, naslove)
- Vrste (vsak zapises)
- Formule (katere se nanašajo na osebne podatke)
- Metapodatke (avtorja, datuma)
REDACTION je slab pristop. Razlog? Zajednice osebnih podatkov.
Primer
Marketing datoteka:
| ID | Ime | Email | Telefon | Nakup |
|----|-----|-------|---------|--------|
| 1 | Marie | marie@example.com | +33 6 1234 | €150 |
| 2 | Jean | jean@example.com | +33 7 5678 | €200 |
GDPR zahteva: Izbriši vrstico 1 (Marie).
NAPAČNA redakcija: Obriši samo Marie ime
| ID | Ime | Email | Telefon | Nakup |
|----|-----|-------|---------|--------|
| 1 | [REDACTED] | marie@example.com | +33 6 1234 | €150 |
Problem: e-poštni naslov je še vedno Marie.
PRAVILNA anonimizacija: Izbriši vso vrstico ALI zaměnj vse vrednosti
| ID | Ime | Email | Telefon | Nakup |
|----|-----|-------|---------|--------|
| 1 | John Doe | john@example.com | +33 8 9999 | €175 |
OB Ali obriši vrstico povsem.
GDPR in Anonimizacija
Člank 4(1) GDPR: "osebni podatek" je podatek, ki se nanaša na osebo.
Članak 29. Delovna skupin: Anonimizacija je "nepovratni proces", kaj pomeni:
- Nemoguče je povezati podatke s osebo
- Celo kot kombinacija (email + ID) = povezava
Pristopi
1. Izbris (DELETE)
DELETE FROM customers WHERE id = 1;
Prednosti: Preprosto, 100% skladno Slabost: Nemogoče je analiza
2. Generalizacija (GENERALIZE)
Naslove: "123 Main St, NY" → "New York, USA"
Nakup: "€150" → "€100-€200"
Prednosti: Ohrani analizo Slabost: Še vedno se lahko povezuje
3. Zamenjava (REPLACE)
Naslove: "123 Main St, NY" → "456 Oak Ave, LA"
Telefon: "+33 6 1234" → "+33 7 9876"
Prednosti: Ohrani strukturo Slabost: Laž—ki je temu nasploh?
4. Šumni podatki (NOISE)
Nakup: €150 → €150 + random(-10, +10)
Nakup: €200 → €200 + random(-10, +10)
Prednosti: Analiza je točna Slabost: Tehnično ne kot anonimizacija
CCPA in Anonimizacija
CCPA (California) zahteva "anonimizacija":
- California Civil Code 1798.100 (b)
- Permanentna brisanja je potrebna
- Tudi metadata
EU in USA: Različna pravila.
EU: Člen 4(1) = "pravi" anonimizacija USA: CCPA = praktična brisanja
Rešitev
Avtomatska
- Naloži Excel datoteko
- Zazna osebne podatke (e-poštni naslove, telefone, SSN)
- Obriši cele vrste (ne samo polja)
- Ali zamenjaj s sintetičnimi podatki
- Eksportiraj nove Excel
Preverka
Nakon anonimizacija, preverj:
- Ali je še vedno mogoče identificirati osebo? (Ne)
- Ali so podatki še polезni? (Da)
- Ali je skladno s GDPR? (Da)
Zaključek
Excel anonimizacija ni redakcija. Avtomatska zamenjava je edino.