Slovník soukromí a technologií
Definice všech termínů, zkratek a konceptů používaných v anonymizaci PII a ochraně údajů.
Zpět k dokumentům94 termíny
2FA
Dvoufaktorová autentizace
Autentizace vyžadující dva odlišné ověřovací faktory: něco, co uživatel zná (heslo) a něco, co uživatel má (TOTP aplikace, hardwarový klíč) nebo je (biometrické). Podporováno v anonym.legal jako další vrstva nad ZK Auth.
#twofaAES-256-GCM
Pokročilý šifrovací standard 256-bit Galois/Counter mód
Algoritmus autentizované šifrování kombinující AES-256 (256-bit klíč) s Galois/Counter módem pro zajištění důvěrnosti a integrity. Používá se v reverzibilní anonymizaci anonym.legal k šifrování nahrazených entit. Zajišťuje jak tajnost, tak detekci manipulace.
#aes256gcmAnonymizace
Anonymizace dat
Nevratný proces odstraňování nebo transformace identifikačních informací tak, aby jednotlivci již nemohli být identifikováni, přímo nebo nepřímo. Podle GDPR skutečně anonymizovaná data spadají mimo rámec regulace.
#anonymizationArgon2id
Funkce pro odvození klíče Argon2id
Vítěz soutěže o hashování hesel 2015. Argon2id kombinuje odolnost proti bočním kanálům Argon2i a odolnost vůči GPU Argon2d. Používá se v anonym.legal a v trezoru Desktop App pro odvozování šifrovacích klíčů z uživatelských frází.
#argon2idAuditní stopa
Neměnná auditní stopa
Sekvenční, důkazně odolný záznam, který zaznamenává, kdo přistupoval, měnil nebo zpracovával data a kdy. Vyžadováno normou ISO 27001 (A.8.15), HIPAA bezpečnostní pravidlo (§164.312(b)) a pravidly e-discovery. anonym.legal zaznamenává všechny operace anonymizace s časovými razítky, počty entit a ID operátorů.
#audittrailBIP39
Bitcoin Improvement Proposal 39 — Mnemotechnické fráze
Standard pro generování lidsky čitelných mnemotechnických seed frází (12–24 slov) z kryptografického seedu. Používá se v trezoru Desktop App anonym.legal jako uživatelsky přívětivá záloha pro šifrovací klíč odvozený z Argon2id.
#bip39CCPA
Zákon o ochraně soukromí spotřebitelů v Kalifornii
Kalifornský zákon o ochraně soukromí, který dává obyvatelům právo vědět, mazat a odhlásit se z prodeje svých osobních údajů. Platí pro podniky splňující příjmové, objemové nebo prahové hodnoty pro prodej údajů. Významně novelizováno CPRA (přijato v listopadu 2020, účinné od ledna 2023).
#ccpaCLOUD Act
Zákon o objasnění zákonného používání dat v zahraničí
Federální zákon USA (2018), který umožňuje americkým orgánům činným v trestním řízení přinutit poskytovatele cloudových služeb se sídlem v USA, aby poskytli data uložená v zahraničí. Konflikty s pravidly GDPR o přenosu dat pro obyvatele EU. Anonymizace dat před nahráním do cloudu je běžným zmírňujícím opatřením.
#cloudactCode-Switching
Vícejazyčné code-switching
Fenomen smíšení dvou nebo více jazyků v rámci jednoho textu nebo konverzace. Běžné v vícejazyčných dokumentech (např. německé právní dokumenty s anglickými technickými termíny). Hybridní detekce anonym.legal zpracovává texty s code-switchingem aplikováním více jazykových modelů současně.
#codeswitchingCSP
Politika zabezpečení obsahu
Mechanismus HTTP odpovědního hlavičky a meta tagu, který omezuje, které zdroje (skripty, styly, obrázky) může prohlížeč načíst. CSP anonym.legal zahrnuje object-src 'none', script-src s nonce a upgrade-insecure-requests, aby zabránil útokům XSS.
#cspChrome rozšíření
anonym.legal Chrome rozšíření
Prohlížečové rozšíření (Manifest V3), které zachycuje text před jeho odesláním do AI chatbotů (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymizuje v reálném čase a volitelně dešifruje odpovědi AI pomocí uložených šifrovacích klíčů.
#chromeextensionData Residency
Požadavky na umístění dat
Právní nebo smluvní požadavky specifikující, v jaké geografické lokalitě musí být data uložena a zpracovávána. Relevantní pro GDPR (přenos dat mimo EHP), německý BDSG a sektorové regulace ve zdravotnictví a financích.
#dataresidencyData Sovereignty
Digitální suverenita dat
Princip, že data podléhají zákonům a řídícím strukturám země, ve které byla shromážděna. Širší než umístění dat, zahrnuje kontrolu nad tím, kdo může k datům přistupovat a podle jakého právního rámce.
#datasovereigntyDe-anonymizace
Útok na znovu identifikaci
Proces znovu identifikace jednotlivců z údajně anonymizovaných datových sad pomocí křížového odkazování s pomocnými informacemi. Klírové riziko při sdílení dat s nedostatečnou hloubkou anonymizace.
#deanonymizationDesktopová aplikace
anonym.legal Desktopová aplikace
Křížová platforma (Windows, macOS, Linux) postavená na Tauri 2.0 a React 18. Obsahuje zpracování místních souborů, BIP39 trezor pro offline ZK Auth, hromadný export a API synchronizaci. Podporuje nasazení bez přístupu k internetu.
#desktopappDetekce jazyka
Automatická detekce jazyka
Automatická identifikace jazyka vstupního textu před analýzou PII. anonym.legal detekuje jazyk na úrovni požadavku a směruje k odpovídající pipeline modelu NER, s angličtinou jako záložním jazykem pro nepodporované jazyky.
#languagedetectionDifferenční soukromí
Differenční soukromí (DP)
Matematický rámec pro uvolňování statistických informací o datových sadách při poskytování prokazatelných záruk, že data jakékoli jednotlivé osoby nelze rozlišit. Používá se v agregovaných analýzách k prevenci znovu identifikace, i když se dotazují agregované výstupy.
#differentialprivacyDigitální identifikátory
Typy digitální identity
Typy entit pro online a digitální identifikátory: EMAILOVÁ_ADRESA, TELEFONNÍ_CÍSLO, IP_ADRESA (IPv4 a IPv6), URL, DOMÉNOVÉ_JMÉNO, CRYPTO (Bitcoin/Ethereum adresy) a identifikátory specifické pro platformu.
#digitalidentifiersDLP
Prevence ztráty dat
Bezpečnostní disciplína a kategorie softwarových nástrojů, které detekují a zabraňují neoprávněnému přenosu citlivých dat mimo organizaci. anonym.legal funguje jako DLP řešení na úrovni prohlížeče a AI pro PII.
#dlpDPA
Smlouva o zpracování údajů
Právně závazná smlouva mezi správcem údajů a zpracovatelem údajů, vyžadovaná článkem 28 GDPR. Specifikuje předmět, dobu trvání, povahu, účel a typ zpracování osobních údajů a práva a povinnosti obou stran.
#dpaDPIA
Hodnocení dopadu na ochranu údajů
Proces hodnocení rizik vyžadovaný článkem 35 GDPR pro zpracovatelské činnosti, které pravděpodobně povedou k vysokým rizikům pro práva a svobody jednotlivců. Povinné pro systematické profilování, zpracování PHI ve velkém měřítku a sledování veřejných prostor.
#dpiae-Discovery
Elektronické zjištění
Proces identifikace, shromažďování a produkce elektronicky uložených informací v právních řízeních. Vyžaduje redakci PII a privilegovaných informací z produkovaných dokumentů. Hlavní případ použití pro právní oddělení využívající anonym.legal.
#ediscoveryE2EE
Šifrování od konce k konci
Šifrování, při kterém mohou zprávy číst pouze komunikující strany; poskytovatel služeb nemá přístup k prostému textu. V režimu ZK Auth anonym.legal šifrovací klíče nikdy neopouštějí zařízení klienta, čímž se dosahuje E2EE pro ukládání anonymizovaných výstupů.
#e2eeFinanční entity
Typy finančních PII entit
Typy entit pokrývající finanční identifikátory: KREDITNÍ_KARTA (Luhnův kontrolní součet), IBAN_KÓD (ISO 13616 kontrolní součet), SWIFT_KÓD (BIC formát), US_BANK_NUMBER, NRP (španělské daňové ID). Detekováno s validací kontrolního součtu pro minimalizaci falešně pozitivních výsledků.
#financialentitiesFOIA
Zákon o svobodě informací
Federální zákon USA (a ekvivalentní právní předpisy v jiných jurisdikcích), který zaručuje veřejný přístup k vládním záznamům. Vyžaduje redakci PII a dalších výjimečných informací před zveřejněním — primární případ použití pro anonymizační pracovní postupy v právní a vládní sféře.
#foiaGDPR
Obecné nařízení o ochraně osobních údajů
Nařízení EU 2016/679, primární rámec ochrany údajů pro Evropskou unii. Platí pro jakoukoli organizaci zpracovávající osobní údaje obyvatel EU. Pokuty až do výše 20 milionů EUR nebo 4 % celosvětového ročního obratu. Klíčová práva: přístup, výmaz, přenositelnost, omezení, námitka.
#gdprGDPR Článek 25
GDPR Článek 25 — Ochrana údajů již při návrhu a ve výchozím nastavení
Vyžaduje, aby správci zavedli vhodná technická a organizační opatření (například pseudonymizaci a minimalizaci údajů) jak v době návrhu systému, tak ve výchozím nastavení během zpracování.
#gdprarticle25GDPR Článek 32
GDPR Článek 32 — Bezpečnost zpracování
Vyžaduje, aby správci a zpracovatelé zavedli vhodná technická a organizační opatření k zajištění úrovně bezpečnosti přiměřené riziku, včetně šifrování, pseudonymizace, důvěrnosti, integrity, dostupnosti a odolnosti zpracovatelských systémů.
#gdprarticle32GenAI DLP
Prevence ztráty dat generativní AI
Specializovaná kategorie DLP zaměřená na prevenci zahrnutí PII a důvěrných dat do výzev odesílaných generativním AI modelům (ChatGPT, Claude, Gemini). Chrome rozšíření anonym.legal a MCP server řeší toto riziko v okamžiku vstupu.
#genaidlpHashování
Kryptografické hashování
Jednosměrná transformace dat na fixní délku pomocí algoritmů, jako je SHA-256. Používá se pro konzistentní pseudonymizaci, deduplikaci a ověřování integrity. Hash hodnoty nelze obrátit, ale mohou být zranitelné vůči útokům pomocí rainbow tabulek, pokud nejsou osolené.
#hashingHetzner
Hetzner Online GmbH
Německý poskytovatel cloudu a hostingu, na kterém běží produkční infrastruktura anonym.legal. Nachází se ve Falkensteinu, Sasko (datové centrum fsn1) s certifikací ISO 27001. Zvolen pro rezidenci dat v EU, dodržování předpisů a jurisdikci přátelskou k GDPR podle německého práva.
#hetznerHIPAA
Zákon o přenositelnosti a odpovědnosti zdravotního pojištění
Federální zákon USA, který stanovuje standardy pro ochranu citlivých zdravotních informací pacientů. Pravidlo o ochraně soukromí upravuje používání PHI; Pravidlo o zabezpečení vyžaduje administrativní, fyzické a technické ochranné opatření pro elektronické PHI (ePHI). Porušení může vést k pokutám až do výše 1,9 milionu USD za kategorii za rok.
#hipaaHIPAA Safe Harbor
Metoda de-identifikace HIPAA Safe Harbor
Jedna ze dvou metod de-identifikace schválených HIPAA, která vyžaduje odstranění všech 18 specifikovaných identifikátorů pacientů (jméno, adresa, data, telefonní čísla, SSN, e-mail, IP adresa, biometrické údaje atd.), aby se zdravotní údaje staly neidentifikovatelnými.
#hipaasafeharborHodnocení důvěry
Skóre důvěry při detekci entit
Skóre od 0 do 1, které ukazuje, jak si je detekční model jistý, že textový úsek je entitou PII. anonym.legal poskytuje konfigurovatelné prahové hodnoty důvěry, aby uživatelé mohli ladit vyvážení mezi přesností a odvoláním pro svůj konkrétní případ použití.
#confidencescoringHromadné zpracování
Hromadná anonymizace souborů
Zpracování více souborů současně v jedné operaci. Hromadný režim anonym.legal podporuje soubory PDF, DOCX a TXT s konfigurací entit pro každý soubor, prahovými hodnotami důvěry a výběrem formátu výstupu.
#batchprocessingHSTS
HTTP Striktní zabezpečení transportu
Mechanismus webové bezpečnostní politiky, který nutí prohlížeče používat pouze HTTPS připojení. anonym.legal nastavuje Strict-Transport-Security: max-age=31536000; includeSubDomains, aby zabránil útokům na downgrade protokolu a krádeži cookies.
#hstsHybridní detekce
Hybridní detekce NLP + Regex + ML
Třívrstvý přístup anonym.legal: regexové vzory pro strukturované PII (telefonní čísla, IBANy, kreditní karty), modely NLP/NER pro kontextové entity (jména, organizace, místa) a ML klasifikátory pro nejednoznačné případy. Snižuje jak falešně pozitivní, tak falešně negativní výsledky.
#hybriddetectionIdentifikátory pojištění
Typy entit pojištění
Typy entit pro identifikátory související s pojištěním: US_NPI (národní identifikátor poskytovatele pro zdravotnické poskytovatele), ZDRAVOTNÍ_PLÁN_BENEFICIÁŘ a čísla zdravotního pojištění specifická pro zemi (např. DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersIdentifikátory vozidel
Typy entit vozidel
Typy entit pro identifikátory související s vozidly: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (identifikační číslo vozidla) a formáty registračních značek specifické pro zemi.
#vehicleidentifiersISO 27001
ISO/IEC 27001 Řízení bezpečnosti informací
Mezinárodní norma pro systémy řízení bezpečnosti informací (ISMS). Certifikace vyžaduje zdokumentované politiky, hodnocení rizik a kontrolní opatření. Servery anonym.legal v EU jsou certifikovány podle ISO 27001, což zajišťuje strukturované řízení bezpečnosti.
#iso27001ISO 27001 SoA
Prohlášení o použitelnosti
Povinný dokument ISO 27001, který uvádí všechny kontroly z přílohy A, označuje, které se vztahují na organizaci, a poskytuje odůvodnění pro zahrnutí a vyloučení. Vyžaduje se pro certifikaci a audity.
#iso27001soaJWT
JSON Web Token
Kompaktní, URL-bezpečný formát tokenu používaný k přenosu tvrzení mezi stranami. anonym.legal používá JWT podepsané pomocí HS256 pro interní autentizaci služeb (např. frontend → Presidio API). Tokeny mají krátkou životnost a jsou validovány na serveru.
#jwtKEK
Klíč pro šifrování klíčů
Klíč používaný k šifrování jiných klíčů namísto dat přímo. V ZK architektuře anonym.legal klíč odvozený z uživatelské fráze funguje jako KEK k ochraně šifrovacích klíčů na úrovni dokumentu uložených v šifrovaném trezoru.
#kekMaskování
Maskování dat
Nahrazení citlivých hodnot realistickými, ale fiktivními daty, která zachovávají formát a strukturu. Používá se pro testovací prostředí, analýzy a sdílení datových sad bez odhalení skutečných PII.
#maskingMCP
Model Context Protocol
Otevřený protokol od Anthropic, který umožňuje AI modelům interagovat s externími nástroji a datovými zdroji standardizovaným způsobem. anonym.legal implementuje MCP server, aby AI kódové nástroje mohly vyvolávat anonymizaci, aniž by opustily svůj pracovní postup.
#mcpMCP server
Server Model Context Protocol
Integrace MCP serveru anonym.legal umožňuje AI kódovým asistentům (Claude Desktop, Cursor, VS Code Copilot) volat anonymizační API přímo jako nástroj. PII je odstraněno z kódu, výzev a kontextu před odesláním do AI modelu.
#mcpserverMinimalizace dat
Princip minimalizace dat podle GDPR
Princip článku 5(1)(c) GDPR, který vyžaduje, aby byla shromažďována a zpracovávána pouze data, která jsou adekvátní, relevantní a nezbytná pro stanovený účel. Klíčové designové omezení pro systémy splňující požadavky na ochranu soukromí.
#dataminimizationML Models
Modely strojového učení pro detekci PII
Statistické modely trénované na označených textových korpusech pro rozpoznávání PII v kontextu. anonym.legal používá jak transformační pipeline spaCy, tak jemně laděný XLM-RoBERTa pro vícejazyčné rozpoznávání entit v produkčním měřítku.
#mlmodelsNedostatečná redakce
Nedostatečná redakce (falešně negativní)
Nedostatečné odstranění všech PII, což ponechává jednotlivce vystavené ve sdílených dokumentech. Častější riziko dodržování předpisů. Způsobeno vysokými prahovými hodnotami důvěry, chybějícími typy entit nebo novými formáty PII. Zmírněno hybridní detekcí anonym.legal a podporou vlastních entit.
#underredactionNER
Rozpoznávání pojmenovaných entit
Úkol zpracování přirozeného jazyka, který identifikuje a klasifikuje pojmenované entity v textu do předem definovaných kategorií, jako jsou osoby, organizace, místa, data a lékařské identifikátory. Hlavní technika strojového učení, která pohání detekci PII v anonym.legal.
#nerNIS2
Směrnice o bezpečnosti sítí a informací 2
Směrnice EU 2022/2555, která rozšiřuje původní směrnici NIS na více sektorů (zdravotnictví, energetika, doprava, digitální infrastruktura) a posiluje požadavky na kybernetickou bezpečnost. Termín pro transpozici byl 17. října 2024; většina členských států EU tento termín nestihla a Evropská komise zahájila řízení o porušení proti nesplňujícím státům.
#nis2NLP
Zpracování přirozeného jazyka
Obor umělé inteligence, který se zabývá interakcí mezi počítači a lidským jazykem. V detekci PII modely NLP chápou kontext, gramatiku a sémantiku, aby identifikovaly entity, které by samotné regexové vzory přehlédly.
#nlpObhajitelnost
Právně obhajitelná anonymizace
Schopnost prokázat regulátorům, soudům nebo auditorům, že anonymizace byla provedena pomocí zdokumentované, konzistentní a technicky správné metodologie. Auditní záznamy anonym.legal, skóre důvěry a nastavení operátorů podporují obhajitelné pracovní postupy anonymizace.
#defensibilityOffice doplněk
anonym.legal Microsoft Office doplněk
Rozšíření Microsoft Office integrující anonymizaci PII přímo do Wordu, Excelu a PowerPointu. Podporuje redakci v dokumentu, správu předvoleb, ZK Auth a synchronizaci mezi zařízeními. K dispozici na Microsoft AppSource.
#officeaddinOchrana advokátního tajemství
Ochrana privilegovaných informací mezi advokáty a klienty
Právní ochrana pro důvěrné komunikace mezi advokáty a klienty. V revizi dokumentů a e-discovery musí být privilegovaný obsah identifikován a zadržován nebo redigován. Vlastní typy entit v anonym.legal lze nakonfigurovat tak, aby označovaly značky privilegovaného obsahu.
#attorneyclientprivilegeOchrana DDoS
Ochrana proti distribuovanému útoku typu Denial of Service
Obrané mechanismy na úrovni infrastruktury proti distribuovaným útokům typu denial-of-service. Serverová infrastruktura anonym.legal zahrnuje pravidla firewallu (UFW), limity připojení nginx a ochrany na úrovni upstreamu ekvivalentní Cloudflare pro udržení dostupnosti.
#ddosprotectionOchrana soukromí od návrhu
Ochrana soukromí od návrhu a ve výchozím nastavení
Princip, který je stanoven článkem 25 GDPR, že opatření na ochranu dat jsou integrována do systémů od samého začátku, nikoli přidávána jako dodatečná myšlenka. Zahrnuje minimalizaci dat, kontrolu přístupu, šifrování a pseudonymizaci na úrovni architektury.
#privacybydesignOmezení rychlosti
Omezení rychlosti API
Kontroly počtu API požadavků, které může klient provést v časovém okně. Zabraňuje zneužívání a zajišťuje spravedlivé přidělování zdrojů. anonym.legal aplikuje limity rychlosti na uživatele na základě úrovně plánu, s doporučeným exponenciálním zpětným odkladem pro logiku opakování.
#ratelimitingOperátory
Operátory anonymizace
Strategie nahrazení aplikovaná na detekované PII. anonym.legal podporuje REPLACE (text zástupce), REDACT (prázdný řetězec), MASK (hvězdičky), HASH (SHA-256 digest), ENCRYPT (reverzibilní AES-256-GCM) a CUSTOM (uživatelsky definované nahrazení).
#operatorsPCI DSS
Standard bezpečnosti dat platebních karet
Bezpečnostní standard pro organizace, které zpracovávají údaje o platebních kartách, spravovaný Radou pro standardy bezpečnosti PCI. Vyžaduje šifrování, kontrolu přístupu, protokolování a pravidelné testování. Nedodržení může vést k pokutám a ztrátě oprávnění zpracovávat karty.
#pcidssPHI
Chráněné zdravotní informace
Jakékoliv zdravotně související informace spojené s identifikovatelnou osobou, regulované podle HIPAA v USA. Zahrnuje diagnózy, záznamy o léčbě, údaje o pojištění a jakékoliv z 18 identifikátorů chráněných podle HIPAA.
#phiPII
Osobně identifikovatelné informace
Jakákoliv data, která mohou přímo nebo v kombinaci s jinými daty identifikovat konkrétní osobu. Příklady: jména, e-mailové adresy, čísla sociálního zabezpečení, IP adresy, biometrické záznamy.
#piiPravidlo 26
Federální pravidla občanského řízení Pravidlo 26
Pravidlo občanského řízení USA, které upravuje povinnosti zjišťování. Pravidlo 26(g) vyžaduje, aby advokáti potvrdili, že žádosti o zjištění a zveřejnění nejsou podávány za nevhodné účely - včetně nedostatečné redakce PII z produkovaných dokumentů.
#rule26Presidio
Microsoft Presidio
Open-source SDK pro ochranu dat a anonymizaci od Microsoftu. Detekční engine anonym.legal je postaven na analyzátoru a anonymizátoru Presidio, rozšířeném o více než 285 vlastních rozpoznávačů entit napříč 48 jazyky.
#presidioPresidio Analyzer
Microsoft Presidio Analyzer Service
Detekční komponenta backendu anonym.legal (port 8011). Přijímá text a vrací seznam detekovaných PII entit s jejich pozicemi, typy a skóre důvěry. Rozšířeno o 285+ vlastních rozpoznávačů ve 48 jazycích.
#presidioanalyzerPresidio Anonymizer
Microsoft Presidio Anonymizer Service
Transformační komponenta backendu anonym.legal (port 8012). Přijímá text a výsledky analýzy jako vstup, aplikuje vybraného operátora (NAHRADIT, REDIGOVAT, MASKOVAT, HASHOVAT, ŠIFROVAT) na každou detekovanou entitu a vrací anonymizovaný text.
#presidioanonymizerPředvolby
Předvolby anonymizace
Uložené konfigurace vybraných typů entit, prahových hodnot důvěry a možností výstupu, které lze aplikovat jedním kliknutím. Předvolby se synchronizují mezi Webovou aplikací, Office doplňkem a Desktopovou aplikací prostřednictvím šifrovaného cloudového úložiště.
#presetsPřehnaná redakce
Přehnaná redakce (falešně pozitivní)
Odstranění více informací, než je nutné, což snižuje užitečnost dokumentu a potenciálně může představovat spoliaci v právních řízeních. Způsobeno nízkými prahovými hodnotami důvěry nebo příliš širokým výběrem entit. Nastavitelné pomocí prahových hodnot a kontrol entit v anonym.legal.
#overredactionPseudonymizace
Pseudonymizace dat
Nahrazení přímých identifikátorů umělými hodnotami (pseudonymy) při zachování možnosti znovu identifikovat jednotlivce pomocí samostatného klíče. Článek 4(5) GDPR ji uznává jako techniku zvyšující ochranu soukromí, ale nevyjímá pseudonymizovaná data z regulace.
#pseudonymizationRedakce
Redakce dat
Trvalé odstranění nebo zakrytí citlivých informací z dokumentů, nahrazení vizuálním označením, jako je [REDACTED] nebo černá čára. Na rozdíl od šifrování je redakce jednosměrná a původní data nelze obnovit.
#redactionRedaktor obrázků
Presidio Image Redactor Service
Specializovaná backendová služba (port 8013), která detekuje a rediguje PII z obrazových souborů (PNG, JPEG) pomocí OCR a analýzy Presidio. Aplikuje černé pruhy redakce na detekované oblasti PII v původním obrázku.
#presidioimageredactorRegex
Porovnávání vzorů regulárních výrazů
Porovnávání textu na základě vzorů pomocí syntaxe formálního jazyka. V detekci PII regex zpracovává strukturálně předvídatelné identifikátory (telefonní čísla, kreditní karty, IBANy, e-mailové adresy) s validací kontrolního součtu. Doplněk NER pro hybridní detekci.
#regexREST API
RESTful API
anonym.legal poskytuje RESTful HTTP API pro programovou integraci. Endpoints zahrnují /api/analyze, /api/anonymize, /api/image a /api/structured. Ověřeno pomocí JWT bearer tokenů. Kompletní dokumentace OpenAPI je k dispozici v API Referenci.
#restapiRezidence dat v EU
Rezidence dat v Evropské unii
Záruka, že data jsou ukládána a zpracovávána výhradně na území EU/EEA. Produkční servery anonym.legal jsou v Německu (Hetzner Frankfurt), což zajišťuje, že veškeré zpracování probíhá pod jurisdikcí GDPR bez dopadů na přenos dat přes hranice.
#eudataresidencySCCs
Standardní smluvní doložky
Předem schválené smluvní doložky v souladu s GDPR pro přenos osobních údajů z EU/EHP do třetích zemí. Aktualizováno Evropskou komisí v roce 2021 (2021/914/EU) k zajištění souladu s požadavky Schrems II, včetně Hodnocení dopadu na přenos.
#sccsSHA-256
Bezpečný hashovací algoritmus 256-bit
Kryptografická hashovací funkce produkující 256-bit digest. Používá se v anonym.legal pro HMAC autentizaci API požadavků, důkazy ZK autentizace a konzistentní pseudonymizaci entit (hashování se solí produkuje stejné nahrazení pro stejnou původní hodnotu).
#sha256Schrems II
Rozhodnutí Schrems II (C-311/18)
Rozhodnutí Soudního dvora EU z roku 2020, které zrušilo rámec EU-US Privacy Shield pro transatlantické přenosy dat, s odkazem na nedostatečnou ochranu zákonů o dohledu v USA. Vyžaduje doplňková opatření (šifrování, anonymizaci) při používání standardních smluvních doložek.
#schremsiispaCy
Knihovna NLP spaCy
Knihovna NLP s průmyslovou silou, open-source, v Pythonu. anonym.legal používá transformační modely spaCy pro 24 jazyků (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko a další) pro rozpoznávání pojmenovaných entit v pipeline Presidio.
#spacySpoliace
Spoliace důkazů
Destrukce, změna nebo selhání uchovat důkazy relevantní pro soudní řízení. Příliš agresivní redakce, která činí dokumenty nečitelnými, může představovat spoliaci. Kalibrace přesnosti anonymizace (prahové hodnoty důvěry, výběr entit) je důležitá pro právně obhajitelnou redakci.
#spoliationStanza
Knihovna NLP Stanza (Stanford NLP)
Python toolkit pro NLP od Stanford NLP Group podporující více než 70 jazyků s nejmodernějšími neuronovými modely. Používá se jako doplňkový backend NER v anonym.legal pro jazyky, které nejsou pokryty modely spaCy.
#stanzaStátní ID
Typy státních identifikátorů
Typy entit pro národní a vládou vydané identifikátory: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE a 50+ dalších formátů ID specifických pro zemi. Detekováno pomocí regexu specifického pro zemi + vzorů kontrolního součtu.
#governmentidTLS
Bezpečnostní protokol transportní vrstvy
Kryptografický protokol zajišťující bezpečnost dat během přenosu. anonym.legal vyžaduje minimálně TLS 1.2 s preferencí TLS 1.3, HSTS s maximálním věkem jednoho roku a HTTP/2. Veškerý provoz mezi klienty a serverem je šifrován během přenosu.
#tlsTokenizace
Tokenizace dat
Nahrazení citlivých dat necitlivým zástupným symbolem (tokenem), který se bezpečně mapuje zpět na původní data v zabezpečeném trezoru. Na rozdíl od šifrování nemá token sám o sobě žádný matematický vztah k původním datům.
#tokenizationTokenový systém
anonym.legal Systém kreditních tokenů
Účtování na základě použití, kde API volání spotřebovávají tokeny vypočítané na základě délky textu, počtu entit a režimu zpracování (analyzovat vs. anonymizovat). Náklady na tokeny jsou konfigurovatelné v DB a zobrazují se v reálném čase před zpracováním.
#tokensystemTrezor
Trezor šifrovacích klíčů
Bezpečné místní úložiště pro šifrovací klíče v Desktopové aplikaci, chráněné derivací klíče Argon2id z hlavní fráze. Klíče jsou uloženy šifrované pomocí AES-256-GCM a zálohovány prostřednictvím BIP39 mnemotechnických frází.
#vaultTyp entity
Typ entity PII
Kategorie osobních údajů, kterou detekční engine rozpoznává a může anonymizovat. Příklady: OSOBA, EMAILOVÁ_ADRESA, TELEFONNÍ_CÍSLO, KREDITNÍ_KARTA, IBAN_KÓD, US_SSN, IP_ADRESA. anonym.legal podporuje 285+ typů entit ve 48 jazycích.
#entitytypeUniverzální entity
Typy jazykově univerzálních entit
Typy entit detekované bez ohledu na jazyk textu, obvykle pomocí regexu založeného na formátu s validací kontrolního součtu. Příklady: KREDITNÍ_KARTA, IBAN_KÓD, EMAILOVÁ_ADRESA, TELEFONNÍ_CÍSLO, IP_ADRESA, URL, CRYPTO adresa.
#universalentitiesVlastní entity
Rozpoznávače vlastních entit
Uživatelsky definované vzory PII přidané na základě vestavěných 285+ typů entit anonym.legal. Podporuje regex vzory, seznamy slov a zakázané seznamy. Užitečné pro identifikátory specifické pro organizaci, jako jsou ID zaměstnanců, interní projektové kódy nebo proprietární názvy produktů.
#customentitiesWebová aplikace
anonym.legal Webová aplikace
Prohlížečové rozhraní na anonym.legal pro analýzu PII, anonymizaci a dešifrování. Podporuje textový vstup, nahrávání souborů (PDF, DOCX, TXT), hromadné zpracování, ZK Auth, 48 jazyků a 285+ typů entit. Není vyžadována instalace.
#webappXChaCha20
XChaCha20-Poly1305
Algoritmus autentizovaného šifrování nabízející vysoký výkon na systémech bez hardwarové akcelerace AES. Používá 192-bit nonce (rozšířený z 96-bit nonce standardu IETF ChaCha20 podle RFC 8439), čímž eliminuje rizika kolize nonce. Používá se jako alternativní šifrovací algoritmus v šifrovací vrstvě anonym.legal.
#xchacha20XLM-RoBERTa
Cross-Lingual RoBERTa
Vícejazyčný transformační jazykový model trénovaný na 100 jazycích, vyvinutý Meta AI. Používá se v anonym.legal pro úkoly NER napříč jazyky, zejména pro typy entit a jazyky, kde nejsou k dispozici monolingvní modely.
#xlmrobertaZdravotní entity
Typy zdravotních PII entit
Typy entit pro 18 identifikátorů HIPAA Safe Harbor a další PII související se zdravím: US_MRN (čísla zdravotních záznamů), ZDRAVOTNÍ_LICENCE, ZDRAVOTNÍ_PLÁN_BENEFICIÁŘ a entity v kontextu diagnózy/terapie.
#healthcareentitiesZero-Knowledge
Architektura Zero-Knowledge
Návrh systému, kde poskytovatel služeb nemá žádný přístup k uživatelským datům v prostém textu nebo šifrovacím klíčům. Veškeré šifrování/dešifrování probíhá na straně klienta; server nikdy nevidí původní obsah. Zabraňuje hrozbám zevnitř a nucenému odhalení.
#zeroknowledgeZK Auth
Zero-Knowledge Autentizace
autentizační systém anonym.legal, kde jsou šifrovací klíče odvozeny na straně klienta z uživatelské fráze pomocí Argon2id, nikdy nejsou přenášeny na server ani na něm uloženy. Server uchovává pouze kryptografický důkaz, nikoli klíč nebo frázi.
#zkauth