The Data Residency Problem
GDPR (Európa) a LGPD (Brazília) a ostatne lokálne privacy zákony vyžadujú, aby osobní údaje zostali lokálne — bez prekladu na inému krajinu.
- GDPR Článok 5: EÚ údaje musí byť "spracovateľný v EÚ" — posielať do USA (cloud) je porušení
- LGPD Článok 32: Brazílský údaje musí byť "spracovateľný v Brazílii" — bez výjimkami
- China: Všetky údaje o čínských občanoch musí byť spracovateľný v Číně
- Rusko: Všetky údaje o ruských občanoch musí byť spracovateľný v Rusku
- India: DPDPA nemá nárok lokalizácia, ale fakticky vlády natlakuje lokálne spracovanie
Problém: Väčšina cloud anonymizácia (AWS, Azure, Google) sú americké — nie lokálne.
Lokálne Anonymizácia Prístupy
1. Desktop App (Air-gapped)
anonym.legal Desktop App — VŠETKO lokálne, bez cloud:
- Windows/macOS/Linux
- Presidio (PII detektor) — lokálne prevedenie
- Offline — bez internetu, bez cloud
- Anonymizované (redakcia, maskovanie, šifrovanie) — všetko lokálne
- Dáta ostanú na počítači — nikdy sa nepošle na cloud
Výhody:
- Úplné dáta suverenita
- GDPR/LGPD/China compliant — žiadne dáta opusťuje krajinu
- Bez internetu — maximálna bezpečnosť
- Rýchly — žádny network latency
Nevýhody:
- Jeden počítač len — nemožné na dávkovú spracovanie na tisícky dokumentov
- Žiadna škálovateľnosť — manuálne uploading na desktop
2. On-premise Server (Lokálny server vo firme)
Presidio + Custom Server — Spustit vlastný PII server v dátovom centre:
# Deploy Presidio lokálne
docker run -d -p 8011:8011 mcr.microsoft.com/presidio/analyzer
Aplikácia posielá dáta na lokálny server — nikdy na cloud:
import requests
def anonymize_local(text):
response = requests.post(
"http://localhost:8011/api/analyze",
json={"text": text, "language": "en"}
)
# Process response, redact entities
return redacted_text
Výhody:
- Úplné dáta suverenita
- Škálovateľný — môžete spustit viaceré servery
- GDPR/LGPD/China compliant
- Vlastný kontrole — môžete audit all logs
Nevýhody:
- Infraštruktúra náklady — server, sieť, údržba
- Technický tím potrebný
- Chyb Handling — žádna tretej strany support
3. Hybrid: Local Processing + Cloud Storage
Anonymizácia lokálne, potom upload na cloud — najčastejšie riešenie:
- Spustit Presidio/Desktop App lokálne → anonymizovať dáta
- Anonymizované (bez PII) → uploadnúť na cloud (AWS, Azure, atď.)
- Cloud nespracúva PII — iba anonymizovanej — žiadne porušení
Príklad Workflow:
1. User loads CSV s PII lokálne (Desktop App)
2. Desktop App anonymizuje — [REDACTED-PERSON], atď.
3. Anonymizované CSV uploadnúť na AWS S3
4. AWS S3 nespracúva PII — len anonymizovanej — GDPR compliant
5. Dáta analýza, tréning, atď. — všetko na anonymizovanej dátach
Výhody:
- Dáta suverenita — PII ostane lokálne
- Škálovateľnosť — Cloud spracovanie anonymizovanej dátach
- Bezpečnosť — Cloud dostane len "bezpečný" dáta
- Náklady — Cloud nižšie (bez PII processing overhead)
Regulačné Mapa
| Jurisdikcia | Zákon | Požiadavka | Riešenie |
|---|---|---|---|
| Európa | GDPR | EÚ lokálne | Lokálne app alebo on-premise server |
| Brazília | LGPD | Brazília lokálne | Presidio server v Brazílii |
| Čína | PIPL | Čína lokálne | Prezidio server v Číne (nový 2025) |
| Rusko | PDPL | Rusko lokálne | Lokálne app bez internet |
| India | DPDPA | Bez požiadavky, ale tlak | On-premise server |
| Kanada | PIPEDA | Bez lokalizácie, ale bezpečnosť | Hybrid: lokálne anonymizácia |
| USA | CCPA/CPRA | Bez lokalizácie, ale bezpečnosť | Hybrid: lokálne anonymizácia |
Best Practices
- Valifikácia: Zistite, ktoré zákony sa vzťahujú na vašu dáta — GDPR? LGPD? PIPL?
- Lokalizácia: Keď je lokalizácia vyžadovaná, vyberte lokálne riešenie — Desktop App alebo on-premise
- Hybrid: Keď je možný, hybridný — lokálne anonymizácia, potom cloud storage
- Audit: Zaznamenaní všetko — lokálne server logs, cloud upload logs