Docs/Glossary

Slovník soukromí a technologií

Definice všech termínů, zkratek a konceptů používaných v anonymizaci PII a ochraně údajů.

Zpět k dokumentům

94 termíny

2

2FA

Dvoufaktorová autentizace

Šifrování a bezpečnost

Autentizace vyžadující dva odlišné ověřovací faktory: něco, co uživatel zná (heslo) a něco, co uživatel má (TOTP aplikace, hardwarový klíč) nebo je (biometrické). Podporováno v anonym.legal jako další vrstva nad ZK Auth.

#twofa
A

AES-256-GCM

Pokročilý šifrovací standard 256-bit Galois/Counter mód

Šifrování a bezpečnost

Algoritmus autentizované šifrování kombinující AES-256 (256-bit klíč) s Galois/Counter módem pro zajištění důvěrnosti a integrity. Používá se v reverzibilní anonymizaci anonym.legal k šifrování nahrazených entit. Zajišťuje jak tajnost, tak detekci manipulace.

#aes256gcm

Anonymizace

Anonymizace dat

Ochrana údajů a PII

Nevratný proces odstraňování nebo transformace identifikačních informací tak, aby jednotlivci již nemohli být identifikováni, přímo nebo nepřímo. Podle GDPR skutečně anonymizovaná data spadají mimo rámec regulace.

#anonymization

Argon2id

Funkce pro odvození klíče Argon2id

Šifrování a bezpečnost

Vítěz soutěže o hashování hesel 2015. Argon2id kombinuje odolnost proti bočním kanálům Argon2i a odolnost vůči GPU Argon2d. Používá se v anonym.legal a v trezoru Desktop App pro odvozování šifrovacích klíčů z uživatelských frází.

#argon2id

Auditní stopa

Neměnná auditní stopa

Právní a audit

Sekvenční, důkazně odolný záznam, který zaznamenává, kdo přistupoval, měnil nebo zpracovával data a kdy. Vyžadováno normou ISO 27001 (A.8.15), HIPAA bezpečnostní pravidlo (§164.312(b)) a pravidly e-discovery. anonym.legal zaznamenává všechny operace anonymizace s časovými razítky, počty entit a ID operátorů.

#audittrail
B

BIP39

Bitcoin Improvement Proposal 39 — Mnemotechnické fráze

Šifrování a bezpečnost

Standard pro generování lidsky čitelných mnemotechnických seed frází (12–24 slov) z kryptografického seedu. Používá se v trezoru Desktop App anonym.legal jako uživatelsky přívětivá záloha pro šifrovací klíč odvozený z Argon2id.

#bip39
C

CCPA

Zákon o ochraně soukromí spotřebitelů v Kalifornii

Soulad a předpisy

Kalifornský zákon o ochraně soukromí, který dává obyvatelům právo vědět, mazat a odhlásit se z prodeje svých osobních údajů. Platí pro podniky splňující příjmové, objemové nebo prahové hodnoty pro prodej údajů. Významně novelizováno CPRA (přijato v listopadu 2020, účinné od ledna 2023).

#ccpa

CLOUD Act

Zákon o objasnění zákonného používání dat v zahraničí

Soulad a předpisy

Federální zákon USA (2018), který umožňuje americkým orgánům činným v trestním řízení přinutit poskytovatele cloudových služeb se sídlem v USA, aby poskytli data uložená v zahraničí. Konflikty s pravidly GDPR o přenosu dat pro obyvatele EU. Anonymizace dat před nahráním do cloudu je běžným zmírňujícím opatřením.

#cloudact

Code-Switching

Vícejazyčné code-switching

Technologie detekce

Fenomen smíšení dvou nebo více jazyků v rámci jednoho textu nebo konverzace. Běžné v vícejazyčných dokumentech (např. německé právní dokumenty s anglickými technickými termíny). Hybridní detekce anonym.legal zpracovává texty s code-switchingem aplikováním více jazykových modelů současně.

#codeswitching

CSP

Politika zabezpečení obsahu

Šifrování a bezpečnost

Mechanismus HTTP odpovědního hlavičky a meta tagu, který omezuje, které zdroje (skripty, styly, obrázky) může prohlížeč načíst. CSP anonym.legal zahrnuje object-src 'none', script-src s nonce a upgrade-insecure-requests, aby zabránil útokům XSS.

#csp

Chrome rozšíření

anonym.legal Chrome rozšíření

Platforma a produkty

Prohlížečové rozšíření (Manifest V3), které zachycuje text před jeho odesláním do AI chatbotů (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymizuje v reálném čase a volitelně dešifruje odpovědi AI pomocí uložených šifrovacích klíčů.

#chromeextension
D

Data Residency

Požadavky na umístění dat

Soulad a předpisy

Právní nebo smluvní požadavky specifikující, v jaké geografické lokalitě musí být data uložena a zpracovávána. Relevantní pro GDPR (přenos dat mimo EHP), německý BDSG a sektorové regulace ve zdravotnictví a financích.

#dataresidency

Data Sovereignty

Digitální suverenita dat

Soulad a předpisy

Princip, že data podléhají zákonům a řídícím strukturám země, ve které byla shromážděna. Širší než umístění dat, zahrnuje kontrolu nad tím, kdo může k datům přistupovat a podle jakého právního rámce.

#datasovereignty

De-anonymizace

Útok na znovu identifikaci

Ochrana údajů a PII

Proces znovu identifikace jednotlivců z údajně anonymizovaných datových sad pomocí křížového odkazování s pomocnými informacemi. Klírové riziko při sdílení dat s nedostatečnou hloubkou anonymizace.

#deanonymization

Desktopová aplikace

anonym.legal Desktopová aplikace

Platforma a produkty

Křížová platforma (Windows, macOS, Linux) postavená na Tauri 2.0 a React 18. Obsahuje zpracování místních souborů, BIP39 trezor pro offline ZK Auth, hromadný export a API synchronizaci. Podporuje nasazení bez přístupu k internetu.

#desktopapp

Detekce jazyka

Automatická detekce jazyka

Technologie detekce

Automatická identifikace jazyka vstupního textu před analýzou PII. anonym.legal detekuje jazyk na úrovni požadavku a směruje k odpovídající pipeline modelu NER, s angličtinou jako záložním jazykem pro nepodporované jazyky.

#languagedetection

Differenční soukromí

Differenční soukromí (DP)

Ochrana údajů a PII

Matematický rámec pro uvolňování statistických informací o datových sadách při poskytování prokazatelných záruk, že data jakékoli jednotlivé osoby nelze rozlišit. Používá se v agregovaných analýzách k prevenci znovu identifikace, i když se dotazují agregované výstupy.

#differentialprivacy

Digitální identifikátory

Typy digitální identity

Typy entit

Typy entit pro online a digitální identifikátory: EMAILOVÁ_ADRESA, TELEFONNÍ_CÍSLO, IP_ADRESA (IPv4 a IPv6), URL, DOMÉNOVÉ_JMÉNO, CRYPTO (Bitcoin/Ethereum adresy) a identifikátory specifické pro platformu.

#digitalidentifiers

DLP

Prevence ztráty dat

Platforma a produkty

Bezpečnostní disciplína a kategorie softwarových nástrojů, které detekují a zabraňují neoprávněnému přenosu citlivých dat mimo organizaci. anonym.legal funguje jako DLP řešení na úrovni prohlížeče a AI pro PII.

#dlp

DPA

Smlouva o zpracování údajů

Soulad a předpisy

Právně závazná smlouva mezi správcem údajů a zpracovatelem údajů, vyžadovaná článkem 28 GDPR. Specifikuje předmět, dobu trvání, povahu, účel a typ zpracování osobních údajů a práva a povinnosti obou stran.

#dpa

DPIA

Hodnocení dopadu na ochranu údajů

Soulad a předpisy

Proces hodnocení rizik vyžadovaný článkem 35 GDPR pro zpracovatelské činnosti, které pravděpodobně povedou k vysokým rizikům pro práva a svobody jednotlivců. Povinné pro systematické profilování, zpracování PHI ve velkém měřítku a sledování veřejných prostor.

#dpia
E

e-Discovery

Elektronické zjištění

Právní a audit

Proces identifikace, shromažďování a produkce elektronicky uložených informací v právních řízeních. Vyžaduje redakci PII a privilegovaných informací z produkovaných dokumentů. Hlavní případ použití pro právní oddělení využívající anonym.legal.

#ediscovery

E2EE

Šifrování od konce k konci

Šifrování a bezpečnost

Šifrování, při kterém mohou zprávy číst pouze komunikující strany; poskytovatel služeb nemá přístup k prostému textu. V režimu ZK Auth anonym.legal šifrovací klíče nikdy neopouštějí zařízení klienta, čímž se dosahuje E2EE pro ukládání anonymizovaných výstupů.

#e2ee
F

Finanční entity

Typy finančních PII entit

Typy entit

Typy entit pokrývající finanční identifikátory: KREDITNÍ_KARTA (Luhnův kontrolní součet), IBAN_KÓD (ISO 13616 kontrolní součet), SWIFT_KÓD (BIC formát), US_BANK_NUMBER, NRP (španělské daňové ID). Detekováno s validací kontrolního součtu pro minimalizaci falešně pozitivních výsledků.

#financialentities

FOIA

Zákon o svobodě informací

Soulad a předpisy

Federální zákon USA (a ekvivalentní právní předpisy v jiných jurisdikcích), který zaručuje veřejný přístup k vládním záznamům. Vyžaduje redakci PII a dalších výjimečných informací před zveřejněním — primární případ použití pro anonymizační pracovní postupy v právní a vládní sféře.

#foia
G

GDPR

Obecné nařízení o ochraně osobních údajů

Soulad a předpisy

Nařízení EU 2016/679, primární rámec ochrany údajů pro Evropskou unii. Platí pro jakoukoli organizaci zpracovávající osobní údaje obyvatel EU. Pokuty až do výše 20 milionů EUR nebo 4 % celosvětového ročního obratu. Klíčová práva: přístup, výmaz, přenositelnost, omezení, námitka.

#gdpr

GDPR Článek 25

GDPR Článek 25 — Ochrana údajů již při návrhu a ve výchozím nastavení

Soulad a předpisy

Vyžaduje, aby správci zavedli vhodná technická a organizační opatření (například pseudonymizaci a minimalizaci údajů) jak v době návrhu systému, tak ve výchozím nastavení během zpracování.

#gdprarticle25

GDPR Článek 32

GDPR Článek 32 — Bezpečnost zpracování

Soulad a předpisy

Vyžaduje, aby správci a zpracovatelé zavedli vhodná technická a organizační opatření k zajištění úrovně bezpečnosti přiměřené riziku, včetně šifrování, pseudonymizace, důvěrnosti, integrity, dostupnosti a odolnosti zpracovatelských systémů.

#gdprarticle32

GenAI DLP

Prevence ztráty dat generativní AI

Platforma a produkty

Specializovaná kategorie DLP zaměřená na prevenci zahrnutí PII a důvěrných dat do výzev odesílaných generativním AI modelům (ChatGPT, Claude, Gemini). Chrome rozšíření anonym.legal a MCP server řeší toto riziko v okamžiku vstupu.

#genaidlp
H

Hashování

Kryptografické hashování

Ochrana údajů a PII

Jednosměrná transformace dat na fixní délku pomocí algoritmů, jako je SHA-256. Používá se pro konzistentní pseudonymizaci, deduplikaci a ověřování integrity. Hash hodnoty nelze obrátit, ale mohou být zranitelné vůči útokům pomocí rainbow tabulek, pokud nejsou osolené.

#hashing

Hetzner

Hetzner Online GmbH

Infrastruktura

Německý poskytovatel cloudu a hostingu, na kterém běží produkční infrastruktura anonym.legal. Nachází se ve Falkensteinu, Sasko (datové centrum fsn1) s certifikací ISO 27001. Zvolen pro rezidenci dat v EU, dodržování předpisů a jurisdikci přátelskou k GDPR podle německého práva.

#hetzner

HIPAA

Zákon o přenositelnosti a odpovědnosti zdravotního pojištění

Soulad a předpisy

Federální zákon USA, který stanovuje standardy pro ochranu citlivých zdravotních informací pacientů. Pravidlo o ochraně soukromí upravuje používání PHI; Pravidlo o zabezpečení vyžaduje administrativní, fyzické a technické ochranné opatření pro elektronické PHI (ePHI). Porušení může vést k pokutám až do výše 1,9 milionu USD za kategorii za rok.

#hipaa

HIPAA Safe Harbor

Metoda de-identifikace HIPAA Safe Harbor

Soulad a předpisy

Jedna ze dvou metod de-identifikace schválených HIPAA, která vyžaduje odstranění všech 18 specifikovaných identifikátorů pacientů (jméno, adresa, data, telefonní čísla, SSN, e-mail, IP adresa, biometrické údaje atd.), aby se zdravotní údaje staly neidentifikovatelnými.

#hipaasafeharbor

Hodnocení důvěry

Skóre důvěry při detekci entit

Technologie detekce

Skóre od 0 do 1, které ukazuje, jak si je detekční model jistý, že textový úsek je entitou PII. anonym.legal poskytuje konfigurovatelné prahové hodnoty důvěry, aby uživatelé mohli ladit vyvážení mezi přesností a odvoláním pro svůj konkrétní případ použití.

#confidencescoring

Hromadné zpracování

Hromadná anonymizace souborů

Platforma a produkty

Zpracování více souborů současně v jedné operaci. Hromadný režim anonym.legal podporuje soubory PDF, DOCX a TXT s konfigurací entit pro každý soubor, prahovými hodnotami důvěry a výběrem formátu výstupu.

#batchprocessing

HSTS

HTTP Striktní zabezpečení transportu

Šifrování a bezpečnost

Mechanismus webové bezpečnostní politiky, který nutí prohlížeče používat pouze HTTPS připojení. anonym.legal nastavuje Strict-Transport-Security: max-age=31536000; includeSubDomains, aby zabránil útokům na downgrade protokolu a krádeži cookies.

#hsts

Hybridní detekce

Hybridní detekce NLP + Regex + ML

Technologie detekce

Třívrstvý přístup anonym.legal: regexové vzory pro strukturované PII (telefonní čísla, IBANy, kreditní karty), modely NLP/NER pro kontextové entity (jména, organizace, místa) a ML klasifikátory pro nejednoznačné případy. Snižuje jak falešně pozitivní, tak falešně negativní výsledky.

#hybriddetection
I

Identifikátory pojištění

Typy entit pojištění

Typy entit

Typy entit pro identifikátory související s pojištěním: US_NPI (národní identifikátor poskytovatele pro zdravotnické poskytovatele), ZDRAVOTNÍ_PLÁN_BENEFICIÁŘ a čísla zdravotního pojištění specifická pro zemi (např. DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Identifikátory vozidel

Typy entit vozidel

Typy entit

Typy entit pro identifikátory související s vozidly: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (identifikační číslo vozidla) a formáty registračních značek specifické pro zemi.

#vehicleidentifiers

ISO 27001

ISO/IEC 27001 Řízení bezpečnosti informací

Soulad a předpisy

Mezinárodní norma pro systémy řízení bezpečnosti informací (ISMS). Certifikace vyžaduje zdokumentované politiky, hodnocení rizik a kontrolní opatření. Servery anonym.legal v EU jsou certifikovány podle ISO 27001, což zajišťuje strukturované řízení bezpečnosti.

#iso27001

ISO 27001 SoA

Prohlášení o použitelnosti

Soulad a předpisy

Povinný dokument ISO 27001, který uvádí všechny kontroly z přílohy A, označuje, které se vztahují na organizaci, a poskytuje odůvodnění pro zahrnutí a vyloučení. Vyžaduje se pro certifikaci a audity.

#iso27001soa
J

JWT

JSON Web Token

Šifrování a bezpečnost

Kompaktní, URL-bezpečný formát tokenu používaný k přenosu tvrzení mezi stranami. anonym.legal používá JWT podepsané pomocí HS256 pro interní autentizaci služeb (např. frontend → Presidio API). Tokeny mají krátkou životnost a jsou validovány na serveru.

#jwt
K

KEK

Klíč pro šifrování klíčů

Šifrování a bezpečnost

Klíč používaný k šifrování jiných klíčů namísto dat přímo. V ZK architektuře anonym.legal klíč odvozený z uživatelské fráze funguje jako KEK k ochraně šifrovacích klíčů na úrovni dokumentu uložených v šifrovaném trezoru.

#kek
M

Maskování

Maskování dat

Ochrana údajů a PII

Nahrazení citlivých hodnot realistickými, ale fiktivními daty, která zachovávají formát a strukturu. Používá se pro testovací prostředí, analýzy a sdílení datových sad bez odhalení skutečných PII.

#masking

MCP

Model Context Protocol

Platforma a produkty

Otevřený protokol od Anthropic, který umožňuje AI modelům interagovat s externími nástroji a datovými zdroji standardizovaným způsobem. anonym.legal implementuje MCP server, aby AI kódové nástroje mohly vyvolávat anonymizaci, aniž by opustily svůj pracovní postup.

#mcp

MCP server

Server Model Context Protocol

Platforma a produkty

Integrace MCP serveru anonym.legal umožňuje AI kódovým asistentům (Claude Desktop, Cursor, VS Code Copilot) volat anonymizační API přímo jako nástroj. PII je odstraněno z kódu, výzev a kontextu před odesláním do AI modelu.

#mcpserver

Minimalizace dat

Princip minimalizace dat podle GDPR

Ochrana údajů a PII

Princip článku 5(1)(c) GDPR, který vyžaduje, aby byla shromažďována a zpracovávána pouze data, která jsou adekvátní, relevantní a nezbytná pro stanovený účel. Klíčové designové omezení pro systémy splňující požadavky na ochranu soukromí.

#dataminimization

ML Models

Modely strojového učení pro detekci PII

Technologie detekce

Statistické modely trénované na označených textových korpusech pro rozpoznávání PII v kontextu. anonym.legal používá jak transformační pipeline spaCy, tak jemně laděný XLM-RoBERTa pro vícejazyčné rozpoznávání entit v produkčním měřítku.

#mlmodels
N

Nedostatečná redakce

Nedostatečná redakce (falešně negativní)

Právní a audit

Nedostatečné odstranění všech PII, což ponechává jednotlivce vystavené ve sdílených dokumentech. Častější riziko dodržování předpisů. Způsobeno vysokými prahovými hodnotami důvěry, chybějícími typy entit nebo novými formáty PII. Zmírněno hybridní detekcí anonym.legal a podporou vlastních entit.

#underredaction

NER

Rozpoznávání pojmenovaných entit

Technologie detekce

Úkol zpracování přirozeného jazyka, který identifikuje a klasifikuje pojmenované entity v textu do předem definovaných kategorií, jako jsou osoby, organizace, místa, data a lékařské identifikátory. Hlavní technika strojového učení, která pohání detekci PII v anonym.legal.

#ner

NIS2

Směrnice o bezpečnosti sítí a informací 2

Soulad a předpisy

Směrnice EU 2022/2555, která rozšiřuje původní směrnici NIS na více sektorů (zdravotnictví, energetika, doprava, digitální infrastruktura) a posiluje požadavky na kybernetickou bezpečnost. Termín pro transpozici byl 17. října 2024; většina členských států EU tento termín nestihla a Evropská komise zahájila řízení o porušení proti nesplňujícím státům.

#nis2

NLP

Zpracování přirozeného jazyka

Technologie detekce

Obor umělé inteligence, který se zabývá interakcí mezi počítači a lidským jazykem. V detekci PII modely NLP chápou kontext, gramatiku a sémantiku, aby identifikovaly entity, které by samotné regexové vzory přehlédly.

#nlp
O

Obhajitelnost

Právně obhajitelná anonymizace

Právní a audit

Schopnost prokázat regulátorům, soudům nebo auditorům, že anonymizace byla provedena pomocí zdokumentované, konzistentní a technicky správné metodologie. Auditní záznamy anonym.legal, skóre důvěry a nastavení operátorů podporují obhajitelné pracovní postupy anonymizace.

#defensibility

Office doplněk

anonym.legal Microsoft Office doplněk

Platforma a produkty

Rozšíření Microsoft Office integrující anonymizaci PII přímo do Wordu, Excelu a PowerPointu. Podporuje redakci v dokumentu, správu předvoleb, ZK Auth a synchronizaci mezi zařízeními. K dispozici na Microsoft AppSource.

#officeaddin

Ochrana advokátního tajemství

Ochrana privilegovaných informací mezi advokáty a klienty

Právní a audit

Právní ochrana pro důvěrné komunikace mezi advokáty a klienty. V revizi dokumentů a e-discovery musí být privilegovaný obsah identifikován a zadržován nebo redigován. Vlastní typy entit v anonym.legal lze nakonfigurovat tak, aby označovaly značky privilegovaného obsahu.

#attorneyclientprivilege

Ochrana DDoS

Ochrana proti distribuovanému útoku typu Denial of Service

Infrastruktura

Obrané mechanismy na úrovni infrastruktury proti distribuovaným útokům typu denial-of-service. Serverová infrastruktura anonym.legal zahrnuje pravidla firewallu (UFW), limity připojení nginx a ochrany na úrovni upstreamu ekvivalentní Cloudflare pro udržení dostupnosti.

#ddosprotection

Ochrana soukromí od návrhu

Ochrana soukromí od návrhu a ve výchozím nastavení

Ochrana údajů a PII

Princip, který je stanoven článkem 25 GDPR, že opatření na ochranu dat jsou integrována do systémů od samého začátku, nikoli přidávána jako dodatečná myšlenka. Zahrnuje minimalizaci dat, kontrolu přístupu, šifrování a pseudonymizaci na úrovni architektury.

#privacybydesign

Omezení rychlosti

Omezení rychlosti API

Infrastruktura

Kontroly počtu API požadavků, které může klient provést v časovém okně. Zabraňuje zneužívání a zajišťuje spravedlivé přidělování zdrojů. anonym.legal aplikuje limity rychlosti na uživatele na základě úrovně plánu, s doporučeným exponenciálním zpětným odkladem pro logiku opakování.

#ratelimiting

Operátory

Operátory anonymizace

Platforma a produkty

Strategie nahrazení aplikovaná na detekované PII. anonym.legal podporuje REPLACE (text zástupce), REDACT (prázdný řetězec), MASK (hvězdičky), HASH (SHA-256 digest), ENCRYPT (reverzibilní AES-256-GCM) a CUSTOM (uživatelsky definované nahrazení).

#operators
P

PCI DSS

Standard bezpečnosti dat platebních karet

Soulad a předpisy

Bezpečnostní standard pro organizace, které zpracovávají údaje o platebních kartách, spravovaný Radou pro standardy bezpečnosti PCI. Vyžaduje šifrování, kontrolu přístupu, protokolování a pravidelné testování. Nedodržení může vést k pokutám a ztrátě oprávnění zpracovávat karty.

#pcidss

PHI

Chráněné zdravotní informace

Ochrana údajů a PII

Jakékoliv zdravotně související informace spojené s identifikovatelnou osobou, regulované podle HIPAA v USA. Zahrnuje diagnózy, záznamy o léčbě, údaje o pojištění a jakékoliv z 18 identifikátorů chráněných podle HIPAA.

#phi

PII

Osobně identifikovatelné informace

Ochrana údajů a PII

Jakákoliv data, která mohou přímo nebo v kombinaci s jinými daty identifikovat konkrétní osobu. Příklady: jména, e-mailové adresy, čísla sociálního zabezpečení, IP adresy, biometrické záznamy.

#pii

Pravidlo 26

Federální pravidla občanského řízení Pravidlo 26

Právní a audit

Pravidlo občanského řízení USA, které upravuje povinnosti zjišťování. Pravidlo 26(g) vyžaduje, aby advokáti potvrdili, že žádosti o zjištění a zveřejnění nejsou podávány za nevhodné účely - včetně nedostatečné redakce PII z produkovaných dokumentů.

#rule26

Presidio

Microsoft Presidio

Technologie detekce

Open-source SDK pro ochranu dat a anonymizaci od Microsoftu. Detekční engine anonym.legal je postaven na analyzátoru a anonymizátoru Presidio, rozšířeném o více než 285 vlastních rozpoznávačů entit napříč 48 jazyky.

#presidio

Presidio Analyzer

Microsoft Presidio Analyzer Service

Infrastruktura

Detekční komponenta backendu anonym.legal (port 8011). Přijímá text a vrací seznam detekovaných PII entit s jejich pozicemi, typy a skóre důvěry. Rozšířeno o 285+ vlastních rozpoznávačů ve 48 jazycích.

#presidioanalyzer

Presidio Anonymizer

Microsoft Presidio Anonymizer Service

Infrastruktura

Transformační komponenta backendu anonym.legal (port 8012). Přijímá text a výsledky analýzy jako vstup, aplikuje vybraného operátora (NAHRADIT, REDIGOVAT, MASKOVAT, HASHOVAT, ŠIFROVAT) na každou detekovanou entitu a vrací anonymizovaný text.

#presidioanonymizer

Předvolby

Předvolby anonymizace

Platforma a produkty

Uložené konfigurace vybraných typů entit, prahových hodnot důvěry a možností výstupu, které lze aplikovat jedním kliknutím. Předvolby se synchronizují mezi Webovou aplikací, Office doplňkem a Desktopovou aplikací prostřednictvím šifrovaného cloudového úložiště.

#presets

Přehnaná redakce

Přehnaná redakce (falešně pozitivní)

Právní a audit

Odstranění více informací, než je nutné, což snižuje užitečnost dokumentu a potenciálně může představovat spoliaci v právních řízeních. Způsobeno nízkými prahovými hodnotami důvěry nebo příliš širokým výběrem entit. Nastavitelné pomocí prahových hodnot a kontrol entit v anonym.legal.

#overredaction

Pseudonymizace

Pseudonymizace dat

Ochrana údajů a PII

Nahrazení přímých identifikátorů umělými hodnotami (pseudonymy) při zachování možnosti znovu identifikovat jednotlivce pomocí samostatného klíče. Článek 4(5) GDPR ji uznává jako techniku zvyšující ochranu soukromí, ale nevyjímá pseudonymizovaná data z regulace.

#pseudonymization
R

Redakce

Redakce dat

Ochrana údajů a PII

Trvalé odstranění nebo zakrytí citlivých informací z dokumentů, nahrazení vizuálním označením, jako je [REDACTED] nebo černá čára. Na rozdíl od šifrování je redakce jednosměrná a původní data nelze obnovit.

#redaction

Redaktor obrázků

Presidio Image Redactor Service

Infrastruktura

Specializovaná backendová služba (port 8013), která detekuje a rediguje PII z obrazových souborů (PNG, JPEG) pomocí OCR a analýzy Presidio. Aplikuje černé pruhy redakce na detekované oblasti PII v původním obrázku.

#presidioimageredactor

Regex

Porovnávání vzorů regulárních výrazů

Technologie detekce

Porovnávání textu na základě vzorů pomocí syntaxe formálního jazyka. V detekci PII regex zpracovává strukturálně předvídatelné identifikátory (telefonní čísla, kreditní karty, IBANy, e-mailové adresy) s validací kontrolního součtu. Doplněk NER pro hybridní detekci.

#regex

REST API

RESTful API

Infrastruktura

anonym.legal poskytuje RESTful HTTP API pro programovou integraci. Endpoints zahrnují /api/analyze, /api/anonymize, /api/image a /api/structured. Ověřeno pomocí JWT bearer tokenů. Kompletní dokumentace OpenAPI je k dispozici v API Referenci.

#restapi

Rezidence dat v EU

Rezidence dat v Evropské unii

Infrastruktura

Záruka, že data jsou ukládána a zpracovávána výhradně na území EU/EEA. Produkční servery anonym.legal jsou v Německu (Hetzner Frankfurt), což zajišťuje, že veškeré zpracování probíhá pod jurisdikcí GDPR bez dopadů na přenos dat přes hranice.

#eudataresidency
S

SCCs

Standardní smluvní doložky

Soulad a předpisy

Předem schválené smluvní doložky v souladu s GDPR pro přenos osobních údajů z EU/EHP do třetích zemí. Aktualizováno Evropskou komisí v roce 2021 (2021/914/EU) k zajištění souladu s požadavky Schrems II, včetně Hodnocení dopadu na přenos.

#sccs

SHA-256

Bezpečný hashovací algoritmus 256-bit

Šifrování a bezpečnost

Kryptografická hashovací funkce produkující 256-bit digest. Používá se v anonym.legal pro HMAC autentizaci API požadavků, důkazy ZK autentizace a konzistentní pseudonymizaci entit (hashování se solí produkuje stejné nahrazení pro stejnou původní hodnotu).

#sha256

Schrems II

Rozhodnutí Schrems II (C-311/18)

Soulad a předpisy

Rozhodnutí Soudního dvora EU z roku 2020, které zrušilo rámec EU-US Privacy Shield pro transatlantické přenosy dat, s odkazem na nedostatečnou ochranu zákonů o dohledu v USA. Vyžaduje doplňková opatření (šifrování, anonymizaci) při používání standardních smluvních doložek.

#schremsii

spaCy

Knihovna NLP spaCy

Technologie detekce

Knihovna NLP s průmyslovou silou, open-source, v Pythonu. anonym.legal používá transformační modely spaCy pro 24 jazyků (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko a další) pro rozpoznávání pojmenovaných entit v pipeline Presidio.

#spacy

Spoliace

Spoliace důkazů

Právní a audit

Destrukce, změna nebo selhání uchovat důkazy relevantní pro soudní řízení. Příliš agresivní redakce, která činí dokumenty nečitelnými, může představovat spoliaci. Kalibrace přesnosti anonymizace (prahové hodnoty důvěry, výběr entit) je důležitá pro právně obhajitelnou redakci.

#spoliation

Stanza

Knihovna NLP Stanza (Stanford NLP)

Technologie detekce

Python toolkit pro NLP od Stanford NLP Group podporující více než 70 jazyků s nejmodernějšími neuronovými modely. Používá se jako doplňkový backend NER v anonym.legal pro jazyky, které nejsou pokryty modely spaCy.

#stanza

Státní ID

Typy státních identifikátorů

Typy entit

Typy entit pro národní a vládou vydané identifikátory: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE a 50+ dalších formátů ID specifických pro zemi. Detekováno pomocí regexu specifického pro zemi + vzorů kontrolního součtu.

#governmentid
T

TLS

Bezpečnostní protokol transportní vrstvy

Šifrování a bezpečnost

Kryptografický protokol zajišťující bezpečnost dat během přenosu. anonym.legal vyžaduje minimálně TLS 1.2 s preferencí TLS 1.3, HSTS s maximálním věkem jednoho roku a HTTP/2. Veškerý provoz mezi klienty a serverem je šifrován během přenosu.

#tls

Tokenizace

Tokenizace dat

Ochrana údajů a PII

Nahrazení citlivých dat necitlivým zástupným symbolem (tokenem), který se bezpečně mapuje zpět na původní data v zabezpečeném trezoru. Na rozdíl od šifrování nemá token sám o sobě žádný matematický vztah k původním datům.

#tokenization

Tokenový systém

anonym.legal Systém kreditních tokenů

Platforma a produkty

Účtování na základě použití, kde API volání spotřebovávají tokeny vypočítané na základě délky textu, počtu entit a režimu zpracování (analyzovat vs. anonymizovat). Náklady na tokeny jsou konfigurovatelné v DB a zobrazují se v reálném čase před zpracováním.

#tokensystem

Trezor

Trezor šifrovacích klíčů

Platforma a produkty

Bezpečné místní úložiště pro šifrovací klíče v Desktopové aplikaci, chráněné derivací klíče Argon2id z hlavní fráze. Klíče jsou uloženy šifrované pomocí AES-256-GCM a zálohovány prostřednictvím BIP39 mnemotechnických frází.

#vault

Typ entity

Typ entity PII

Typy entit

Kategorie osobních údajů, kterou detekční engine rozpoznává a může anonymizovat. Příklady: OSOBA, EMAILOVÁ_ADRESA, TELEFONNÍ_CÍSLO, KREDITNÍ_KARTA, IBAN_KÓD, US_SSN, IP_ADRESA. anonym.legal podporuje 285+ typů entit ve 48 jazycích.

#entitytype
U

Univerzální entity

Typy jazykově univerzálních entit

Typy entit

Typy entit detekované bez ohledu na jazyk textu, obvykle pomocí regexu založeného na formátu s validací kontrolního součtu. Příklady: KREDITNÍ_KARTA, IBAN_KÓD, EMAILOVÁ_ADRESA, TELEFONNÍ_CÍSLO, IP_ADRESA, URL, CRYPTO adresa.

#universalentities
V

Vlastní entity

Rozpoznávače vlastních entit

Platforma a produkty

Uživatelsky definované vzory PII přidané na základě vestavěných 285+ typů entit anonym.legal. Podporuje regex vzory, seznamy slov a zakázané seznamy. Užitečné pro identifikátory specifické pro organizaci, jako jsou ID zaměstnanců, interní projektové kódy nebo proprietární názvy produktů.

#customentities
W

Webová aplikace

anonym.legal Webová aplikace

Platforma a produkty

Prohlížečové rozhraní na anonym.legal pro analýzu PII, anonymizaci a dešifrování. Podporuje textový vstup, nahrávání souborů (PDF, DOCX, TXT), hromadné zpracování, ZK Auth, 48 jazyků a 285+ typů entit. Není vyžadována instalace.

#webapp
X

XChaCha20

XChaCha20-Poly1305

Šifrování a bezpečnost

Algoritmus autentizovaného šifrování nabízející vysoký výkon na systémech bez hardwarové akcelerace AES. Používá 192-bit nonce (rozšířený z 96-bit nonce standardu IETF ChaCha20 podle RFC 8439), čímž eliminuje rizika kolize nonce. Používá se jako alternativní šifrovací algoritmus v šifrovací vrstvě anonym.legal.

#xchacha20

XLM-RoBERTa

Cross-Lingual RoBERTa

Technologie detekce

Vícejazyčný transformační jazykový model trénovaný na 100 jazycích, vyvinutý Meta AI. Používá se v anonym.legal pro úkoly NER napříč jazyky, zejména pro typy entit a jazyky, kde nejsou k dispozici monolingvní modely.

#xlmroberta
Z

Zdravotní entity

Typy zdravotních PII entit

Typy entit

Typy entit pro 18 identifikátorů HIPAA Safe Harbor a další PII související se zdravím: US_MRN (čísla zdravotních záznamů), ZDRAVOTNÍ_LICENCE, ZDRAVOTNÍ_PLÁN_BENEFICIÁŘ a entity v kontextu diagnózy/terapie.

#healthcareentities

Zero-Knowledge

Architektura Zero-Knowledge

Šifrování a bezpečnost

Návrh systému, kde poskytovatel služeb nemá žádný přístup k uživatelským datům v prostém textu nebo šifrovacím klíčům. Veškeré šifrování/dešifrování probíhá na straně klienta; server nikdy nevidí původní obsah. Zabraňuje hrozbám zevnitř a nucenému odhalení.

#zeroknowledge

ZK Auth

Zero-Knowledge Autentizace

Šifrování a bezpečnost

autentizační systém anonym.legal, kde jsou šifrovací klíče odvozeny na straně klienta z uživatelské fráze pomocí Argon2id, nikdy nejsou přenášeny na server ani na něm uloženy. Server uchovává pouze kryptografický důkaz, nikoli klíč nebo frázi.

#zkauth