Slovník ochrany súkromia a technológie
Definície všetkých termínov, akronymov a konceptov používaných v anonymizácii PII a ochrane údajov.
Späť na dokumenty94 termíny
2
2FA
Dvojfaktorová autentifikácia
Autentifikácia vyžadujúca dva odlišné overovacie faktory: niečo, čo používateľ pozná (heslo) a niečo, čo používateľ má (TOTP aplikácia, hardvérový kľúč) alebo je (biometrický údaj). Podporované v anonym.legal ako ďalšia vrstva nad ZK Auth.
#twofaA
AES-256-GCM
Pokročilý šifrovací štandard 256-bit Galois/Counter Mode
Algoritmus autentifikovanej šifrovania kombinujúci AES-256 (256-bitový kľúč) s Galois/Counter Mode pre dôvernosť a integritu. Používa sa v reverzibilnej anonymizácii anonym.legal na šifrovanie nahradených entít. Poskytuje tajnosť a detekciu manipulácie.
#aes256gcmAnonymizácia
Anonymizácia údajov
Nezvratný proces odstraňovania alebo transformácie identifikačných informácií tak, aby jednotlivci už nemohli byť identifikovaní, priamo alebo nepriamo. Podľa GDPR skutočne anonymizované údaje spadajú mimo rozsah regulácie.
#anonymizationArgon2id
Funkcia odvodenia kľúča Argon2id
Víťaz súťaže o hashovanie hesiel 2015. Argon2id kombinuje odolnosť voči bočným kanálom Argon2i a odolnosť voči GPU Argon2d. Používa sa v anonym.legal a v trezore Desktop App na odvodenie kľúčov na šifrovanie z používateľských fráz.
#argon2idAuditná stopa
Nemenná auditná stopa
Sekvenčný, zjavne manipulovateľný záznam, ktorý zaznamenáva, kto pristupoval, upravoval alebo spracovával údaje a kedy. Vyžaduje sa podľa ISO 27001 (A.8.15), HIPAA bezpečnostného pravidla (§164.312(b)) a pravidiel e-discovery. anonym.legal zaznamenáva všetky anonymizačné operácie s časovými pečiatkami, počtami entít a ID operátorov.
#audittrailB
BIP39
Bitcoin Improvement Proposal 39 — Mnemotechnické frázy
Štandard na generovanie ľahko čitateľných mnemotechnických seed fráz (12–24 slov) z kryptografického seedu. Používa sa v trezore Desktop App anonym.legal ako používateľsky prívetivá záloha pre kľúč na šifrovanie odvodený z Argon2id.
#bip39C
CCPA
Zákon o ochrane súkromia spotrebiteľov v Kalifornii
Kalifornský zákon o ochrane súkromia, ktorý poskytuje obyvateľom právo vedieť, vymazať a odhlásiť sa z predaja svojich osobných údajov. Uplatňuje sa na podniky, ktoré spĺňajú prahové hodnoty príjmu, objemu údajov alebo predaja údajov. Významne novelizovaný CPRA (schválený v novembri 2020, účinný od januára 2023).
#ccpaCLOUD Act
Zákon o objasnení zákonného používania údajov v zahraničí
Federálny zákon USA (2018), ktorý umožňuje americkým orgánom činným v trestnom konaní donútiť amerických poskytovateľov cloudových služieb, aby poskytli údaje uložené v zahraničí. Konfliktuje s pravidlami prenosu údajov GDPR pre obyvateľov EÚ. Anonymizácia údajov pred nahrávaním do cloudu je bežné zmiernenie.
#cloudactCode-Switching
Viacjazyčné prechádzanie medzi jazykmi
Fenomén miešania dvoch alebo viacerých jazykov v rámci jedného textu alebo konverzácie. Bežné v viacjazyčných dokumentoch (napr. nemecké právne dokumenty s anglickými technickými termínmi). Hybridná detekcia anonym.legal spracováva text s prechádzaním medzi jazykmi aplikovaním viacerých jazykových modelov súčasne.
#codeswitchingConfidence Scoring
Skóre dôveryhodnosti detekcie entít
Skóre od 0 do 1, ktoré naznačuje, ako si je detekčný model istý, že textový úsek je entitou PII. anonym.legal poskytuje konfigurovateľné prahové hodnoty dôvery, aby si používatelia mohli prispôsobiť vyváženie presnosti a odvolania pre svoje konkrétne použitie.
#confidencescoringCSP
Politika zabezpečenia obsahu
Mechanizmus HTTP odpovedí a meta tagov, ktorý obmedzuje, ktoré zdroje (skripty, štýly, obrázky) môže prehliadač načítať. CSP anonym.legal zahŕňa object-src 'none', script-src s nonce a upgrade-insecure-requests na zabránenie útokom XSS.
#cspChrome rozšírenie
anonym.legal Chrome rozšírenie
Rozšírenie prehliadača (Manifest V3), ktoré zachytáva text pred jeho odoslaním do AI chatbotov (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymizuje v reálnom čase a voliteľne dešifruje odpovede AI pomocou uložených šifrovacích kľúčov.
#chromeextensionD
Dávkové spracovanie
Dávková anonymizácia súborov
Spracovanie viacerých súborov súčasne v jednej operácii. Dávkový režim anonym.legal podporuje súbory PDF, DOCX a TXT s konfiguráciou entít na súbor, prahmi dôvery a výberom formátu výstupu.
#batchprocessingDe-anonymizácia
Útok na znovu identifikáciu
Proces znovu identifikácie jednotlivcov z údajov, ktoré sa predpokladajú ako anonymizované, krížovým odkazovaním s pomocnými informáciami. Kľúčové riziko pri zdieľaní údajov s nedostatočnou hĺbkou anonymizácie.
#deanonymizationDesktopová aplikácia
anonym.legal Desktopová aplikácia
Aplikácia naprieč platformami (Windows, macOS, Linux) postavená na Tauri 2.0 a React 18. Obsahuje spracovanie lokálnych súborov, BIP39 trezor pre offline ZK Auth, dávkový export a API synchronizáciu. Podporuje nasadenia bez prístupu na internet.
#desktopappDifferenciálna ochrana súkromia
Differenciálna ochrana súkromia (DP)
Matematický rámec na uvoľňovanie štatistických informácií o súboroch údajov pri poskytovaní preukázateľných záruk, že údaje akejkoľvek osoby nemožno rozlíšiť. Používa sa v agregovanej analytike na zabránenie znovu identifikácii, aj keď sa dotazujú agregované výstupy.
#differentialprivacyDigitálne identifikátory
Typy entít digitálnej identity
Typy entít pre online a digitálne identifikátory: EMAILOVÁ_ADRESA, TELEFÓNNE_CISLO, IP_ADRESA (IPv4 a IPv6), URL, DOMÉNOVÉ_MENO, CRYPTO (Bitcoin/Ethereum adresy) a identifikátory špecifické pre platformu.
#digitalidentifiersDLP
Prevencia straty dát
Bezpečnostná disciplína a kategória softvérových nástrojov, ktoré detekujú a zabraňujú neoprávnenému prenosu citlivých údajov mimo organizáciu. anonym.legal funguje ako DLP riešenie na úrovni prehliadača a AI pre PII.
#dlpDPA
Zmluva o spracovaní údajov
Právne záväzná zmluva medzi správcom údajov a spracovateľom údajov, vyžadovaná článkom 28 GDPR. Špecifikuje predmet, trvanie, povahu, účel a typ spracovania osobných údajov, ako aj práva a povinnosti oboch strán.
#dpaDPIA
Hodnotenie vplyvu na ochranu údajov
Proces hodnotenia rizík vyžadovaný článkom 35 GDPR pre spracovateľské činnosti, ktoré môžu viesť k vysokým rizikám pre práva a slobody jednotlivcov. Povinné pre systematické profilovanie, spracovanie PHI vo veľkom meradle a dohľad v verejných priestoroch.
#dpiaE
e-Discovery
Elektronické objavovanie
Proces identifikácie, zhromažďovania a produkcie elektronicky uložených informácií v právnych konaniach. Vyžaduje redakciu PII a privilegovaných informácií z produkovaných dokumentov. Primárny prípad použitia pre právne oddelenia používajúce anonym.legal.
#ediscoveryE2EE
Šifrovanie od konca po koniec
Šifrovanie, pri ktorom môžu správy čítať iba komunikujúce strany; poskytovateľ služby nemá prístup k nešifrovaným údajom. V režime ZK Auth anonym.legal, kľúče na šifrovanie nikdy neopúšťajú zariadenie klienta, čím sa dosahuje E2EE pre uloženie anonymizovaných výstupov.
#e2eeF
Finančné entity
Finančné typy entít PII
Typy entít pokrývajúce finančné identifikátory: KREDITNÁ_KARTA (Luhn kontrolný súčet), IBAN_KÓD (ISO 13616 kontrolný súčet), SWIFT_KÓD (BIC formát), US_BANK_NUMBER, NRP (španielske daňové ID). Detekované s validáciou kontrolného súčtu na minimalizáciu falošných pozitív.
#financialentitiesFOIA
Zákon o slobode informácií
Federálny zákon USA (a ekvivalentné predpisy v iných jurisdikciách), ktorý zaručuje verejný prístup k vládnym záznamom. Vyžaduje redakciu PII a iných vylúčených informácií pred zverejnením — primárne použitie pre právne a vládne anonymizačné pracovné postupy.
#foiaG
GDPR
Všeobecné nariadenie o ochrane údajov
Nariadenie EÚ 2016/679, hlavný rámec ochrany údajov pre Európsku úniu. Uplatňuje sa na akúkoľvek organizáciu spracovávajúcu osobné údaje obyvateľov EÚ. Pokuty až do výšky 20 miliónov EUR alebo 4 % celkového ročného obratu. Kľúčové práva: prístup, vymazanie, prenositeľnosť, obmedzenie, námietka.
#gdprGDPR Article 25
GDPR článok 25 — Ochrana údajov už pri navrhovaní a predvolene
Vyžaduje od správcov, aby implementovali vhodné technické a organizačné opatrenia (ako je pseudonymizácia a minimalizácia údajov) už pri navrhovaní systému a predvolene počas spracovania.
#gdprarticle25GDPR Article 32
GDPR článok 32 — Bezpečnosť spracovania
Vyžaduje od správcov a spracovateľov implementáciu vhodných technických a organizačných opatrení na zabezpečenie úrovne bezpečnosti primeranej riziku, vrátane šifrovania, pseudonymizácie, dôvernosti, integrity, dostupnosti a odolnosti spracovateľských systémov.
#gdprarticle32GenAI DLP
Generatívna AI prevencia straty dát
Špecializovaná kategória DLP zameraná na zabránenie zahrnutiu PII a dôverných údajov do výziev zasielaných generatívnym AI modelom (ChatGPT, Claude, Gemini). Chrome rozšírenie anonym.legal a MCP server sa zaoberajú týmto rizikom v bode vstupu.
#genaidlpH
Hashovanie
Kryptografické hashovanie
Jednosmerná transformácia údajov na digest pevnej dĺžky pomocou algoritmov ako SHA-256. Používa sa na konzistentnú pseudonymizáciu, deduplikáciu a overovanie integrity. Hash hodnoty nie je možné zvrátiť, ale môžu byť zraniteľné voči útokom pomocou rainbow tabuliek, ak nie sú osolené.
#hashingHetzner
Hetzner Online GmbH
Nemecký poskytovateľ cloudu a hostingu, kde beží produkčná infraštruktúra anonym.legal. Nachádza sa vo Falkensteine, Sasko (datacentrum fsn1) s certifikáciou ISO 27001. Vybraný pre rezidenciu údajov v EÚ, dodržiavanie predpisov a jurisdikciu priateľskú k GDPR podľa nemeckého práva.
#hetznerHIPAA
Zákon o prenositeľnosti a zodpovednosti zdravotného poistenia
Federálny zákon USA, ktorý ustanovuje normy na ochranu citlivých informácií o zdraví pacientov. Pravidlo o ochrane osobných údajov upravuje používanie PHI; Pravidlo o bezpečnosti vyžaduje administratívne, fyzické a technické zabezpečenia pre elektronické PHI (ePHI). Porušenia môžu viesť k pokutám až do výšky 1,9 milióna USD za kategóriu za rok.
#hipaaHIPAA Safe Harbor
Metóda de-identifikácie HIPAA Safe Harbor
Jedna z dvoch metód de-identifikácie schválených HIPAA, ktorá vyžaduje odstránenie všetkých 18 špecifikovaných identifikátorov pacientov (meno, adresa, dátumy, telefónne čísla, SSN, e-mail, IP adresa, biometrické údaje atď.), aby sa zdravotné údaje stali neidentifikovateľnými.
#hipaasafeharborHSTS
HTTP Strict Transport Security
Mechanizmus webovej bezpečnostnej politiky, ktorý núti prehliadače používať iba HTTPS pripojenia. anonym.legal nastavuje Strict-Transport-Security: max-age=31536000; includeSubDomains na zabránenie útokom na zníženie protokolu a únosom cookies.
#hstsHybrid Detection
Hybridná detekcia NLP + Regex + ML
Trojvrstvový prístup anonym.legal: regex vzory pre štruktúrované PII (telefónne čísla, IBANy, kreditné karty), modely NLP/NER pre kontextové entity (mená, organizácie, miesta) a ML klasifikátory pre nejasné prípady. Znižuje počet falošných pozitív a falošných negatív.
#hybriddetectionI
Identifikátory poistenia
Typy entít poistenia
Typy entít pre identifikátory súvisiace s poistením: US_NPI (Národný identifikátor poskytovateľa pre zdravotníckych poskytovateľov), HEALTHCARE_PLAN_BENEFICIARY a krajinné čísla zdravotného poistenia (napr. DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersIdentifikátory vozidiel
Typy entít vozidla
Typy entít pre identifikátory súvisiace s vozidlami: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Číslo identifikácie vozidla) a krajinné formáty registračných tabuliek vozidiel.
#vehicleidentifiersISO 27001
ISO/IEC 27001 Riadenie bezpečnosti informácií
Medzinárodná norma pre systémy riadenia bezpečnosti informácií (ISMS). Certifikácia vyžaduje zdokumentované politiky, hodnotenia rizík a kontroly. Servery anonym.legal v EÚ sú certifikované podľa ISO 27001, čo zabezpečuje štruktúrované riadenie bezpečnosti.
#iso27001ISO 27001 SoA
Vyhlásenie o aplikovateľnosti
Povinný dokument ISO 27001, ktorý uvádza všetky kontroly z prílohy A, označuje, ktoré sú aplikovateľné na organizáciu, a poskytuje odôvodnenie pre zaradenie a vylúčenie. Vyžaduje sa na certifikáciu a audity.
#iso27001soaJ
JWT
JSON Web Token
Kompaktný, URL-bezpečný formát tokenu používaný na prenos nárokov medzi stranami. anonym.legal používa JWT podpísané s HS256 na internú autentifikáciu služieb (napr. frontend → Presidio API). Tokeny sú krátkodobé a overujú sa na strane servera.
#jwtK
KEK
Kľúč na šifrovanie kľúčov
Kľúč používaný na šifrovanie iných kľúčov namiesto priamo údajov. V architektúre ZK anonym.legal, kľúč odvodený z používateľskej frázy funguje ako KEK na ochranu kľúčov na šifrovanie na úrovni dokumentu uložených v šifrovanom trezore.
#kekL
Language Detection
Automatická detekcia jazyka
Automatická identifikácia jazyka vstupného textu pred analýzou PII. anonym.legal detekuje jazyk na úrovni požiadavky a smeruje k príslušnému pipeline modelu NER, pričom angličtina je záložným jazykom pre nepodporované jazyky.
#languagedetectionM
Maskovanie
Maskovanie údajov
Nahradenie citlivých hodnôt realistickými, ale fiktívnymi údajmi, ktoré zachovávajú formát a štruktúru. Používa sa na testovacie prostredia, analytiku a zdieľanie súborov údajov bez odhalenia skutočných PII.
#maskingMCP
Model Context Protocol
Otvorený protokol od Anthropic, ktorý umožňuje AI modelom interagovať s externými nástrojmi a zdrojmi dát štandardizovaným spôsobom. anonym.legal implementuje MCP server, aby AI kódové nástroje mohli vyvolať anonymizáciu bez opustenia svojho pracovného postupu.
#mcpMCP server
Server Model Context Protocol
Integrácia MCP servera anonym.legal umožňuje AI kódovým asistentom (Claude Desktop, Cursor, VS Code Copilot) priamo volať anonymizačné API ako nástroj. PII je odstránené z kódu, výziev a kontextu pred odoslaním do AI modelu.
#mcpserverMinimalizácia údajov
Princíp minimalizácie údajov podľa GDPR
Princíp článku 5(1)(c) GDPR, ktorý vyžaduje, aby sa zhromažďovali a spracovávali iba údaje, ktoré sú primerané, relevantné a nevyhnutné na stanovený účel. Základné návrhové obmedzenie pre systémy vyhovujúce ochrane súkromia.
#dataminimizationML Models
Modely strojového učenia pre detekciu PII
Štatistické modely trénované na označených textových korpusoch na rozpoznávanie PII v kontexte. anonym.legal používa ako spaCy transformer pipeline, tak aj jemne doladený XLM-RoBERTa pre viacjazyčné rozpoznávanie entít v produkčnej škále.
#mlmodelsN
Nadmierna redakcia
Nadmierna redakcia (falošné pozitíva)
Odstránenie viac informácií, než je potrebné, čo znižuje užitočnosť dokumentu a potenciálne predstavuje spoliáciu v právnych konaniach. Spôsobené nízkymi prahovými hodnotami dôvery alebo príliš širokým výberom entít. Možnosť nastavenia prostredníctvom prahových hodnôt a kontrol entít anonym.legal.
#overredactionNedostatočná redakcia
Nedostatočná redakcia (falošné negatívy)
Nedostatok odstránenia všetkých PII, čo zanecháva jednotlivcov vystavených v zdieľaných dokumentoch. Bežnejšie riziko dodržiavania predpisov. Spôsobené vysokými prahovými hodnotami dôvery, chýbajúcimi typmi entít alebo novými formátmi PII. Zmiernené hybridnou detekciou anonym.legal a podporou vlastných entít.
#underredactionNER
Rozpoznávanie pomenovaných entít
Úloha spracovania prirodzeného jazyka, ktorá identifikuje a klasifikuje pomenované entity v texte do preddefinovaných kategórií, ako sú osoby, organizácie, miesta, dátumy a medicínske identifikátory. Hlavná technika ML, ktorá poháňa detekciu PII v anonym.legal.
#nerNIS2
Smernica o bezpečnosti sietí a informácií 2
Smernica EÚ 2022/2555, ktorá rozširuje pôvodnú smernicu NIS na viac sektorov (zdravotná starostlivosť, energia, doprava, digitálna infraštruktúra) a posilňuje požiadavky na kybernetickú bezpečnosť. Lehota na transpozíciu bola 17. októbra 2024; väčšina členských štátov EÚ ju nestihla a Európska komisia otvorila konanie o porušení voči nevyhovujúcim štátom.
#nis2NLP
Spracovanie prirodzeného jazyka
Oblasť umelej inteligencie zaoberajúca sa interakciou medzi počítačmi a ľudským jazykom. Pri detekcii PII modely NLP chápu kontext, gramatiku a sémantiku, aby identifikovali entity, ktoré by samotné regex vzory prehliadli.
#nlpO
Obhájiteľnosť
Právne obhájiteľná anonymizácia
Schopnosť preukázať regulátorom, súdom alebo audítorom, že anonymizácia bola vykonaná pomocou zdokumentovanej, konzistentnej a technicky zvuknej metodológie. Auditné záznamy anonym.legal, skóre dôvery a nastavenia operátorov podporujú obhájiteľné anonymizačné pracovné toky.
#defensibilityObmedzenie rýchlosti
Obmedzenie rýchlosti API
Kontroly počtu API požiadaviek, ktoré môže klient uskutočniť v časovom okne. Zabraňuje zneužívaniu a zabezpečuje spravodlivé pridelenie zdrojov. anonym.legal aplikuje obmedzenia rýchlosti na používateľa na základe úrovne plánu, pričom sa odporúča exponenciálne oneskorenie pre logiku opätovného pokusu.
#ratelimitingOffice doplnok
anonym.legal Microsoft Office doplnok
Rozšírenie Microsoft Office integrujúce anonymizáciu PII priamo do Wordu, Excelu a PowerPointu. Podporuje redakciu v dokumente, správu prednastavení, ZK Auth a synchronizáciu naprieč zariadeniami. Dostupné z Microsoft AppSource.
#officeaddinOchrana DDoS
Ochrana pred distribuovaným odmietnutím služby
Obrany na úrovni infraštruktúry proti útokom distribuovaného odmietnutia služby. Serverová infraštruktúra anonym.legal zahŕňa pravidlá firewallu (UFW), obmedzenia pripojenia nginx a ochrany na úrovni Cloudflare na udržanie dostupnosti.
#ddosprotectionOchrana súkromia už od návrhu
Ochrana súkromia už od návrhu a predvolene
Princíp, ktorý je stanovený článkom 25 GDPR, že opatrenia na ochranu údajov sú zabudované do systémov od začiatku, a nie pridané dodatočne. Zahrňuje minimalizáciu údajov, kontrolu prístupu, šifrovanie a pseudonymizáciu na úrovni architektúry.
#privacybydesignOperátory
Operátory anonymizácie
Stratégia nahradenia aplikovaná na detegovanú PII. anonym.legal podporuje REPLACE (text zástupcu), REDACT (prázdny reťazec), MASK (hviezdičky), HASH (SHA-256 digest), ENCRYPT (reverzibilné AES-256-GCM) a CUSTOM (užívateľom definované nahradenie).
#operatorsP
PCI DSS
Štandard bezpečnosti údajov v odvetví platobných kariet
Bezpečnostný štandard pre organizácie, ktoré spracovávajú údaje o platobných kartách, udržiavaný Radou pre bezpečnostné štandardy PCI. Vyžaduje šifrovanie, prístupové kontroly, zaznamenávanie a pravidelné testovanie. Nedodržanie môže viesť k pokutám a strate oprávnení na spracovanie kariet.
#pcidssPHI
Chránené zdravotné informácie
Akékoľvek zdravotné informácie spojené s identifikovateľnou osobou, regulované podľa HIPAA v USA. Zahrňuje diagnózy, záznamy o liečbe, údaje o poistení a akékoľvek z 18 identifikátorov HIPAA Safe Harbor.
#phiPII
Osobne identifikovateľné informácie
Akékoľvek údaje, ktoré môžu priamo alebo v kombinácii s inými údajmi identifikovať konkrétnu osobu. Príklady: mená, e-mailové adresy, čísla sociálneho zabezpečenia, IP adresy, biometrické záznamy.
#piiPravidlo 26
Federálne pravidlá civilného konania Pravidlo 26
Pravidlo amerického civilného konania upravujúce povinnosti objavovania. Pravidlo 26(g) vyžaduje, aby právnici potvrdili, že žiadosti o objavovanie a zverejnenia nie sú podávané na nesprávne účely — vrátane nedostatočnej redakcie PII z produkovaných dokumentov.
#rule26Právne privilegium
Ochrana právneho privilegia
Právna ochrana pre dôverné komunikácie medzi právnikmi a klientmi. Pri preskúmaní dokumentov a e-discovery musia byť privilegovaný obsah identifikovaný a zadržaný alebo redigovaný. Vlastné typy entít v anonym.legal môžu byť nakonfigurované na označenie privilegovaných obsahových značiek.
#attorneyclientprivilegePrednastavenia
Prednastavenia anonymizácie
Uložené konfigurácie vybraných typov entít, prahov dôvery a možností výstupu, ktoré je možné aplikovať jedným kliknutím. Prednastavenia sa synchronizujú naprieč Webovou aplikáciou, Office doplnkom a Desktopovou aplikáciou prostredníctvom šifrovaného cloudového úložiska.
#presetsPresidio
Microsoft Presidio
Open-source SDK na ochranu údajov a anonymizáciu od spoločnosti Microsoft. Detekčný motor anonym.legal je postavený na analyzátoroch a anonymizátoroch Presidio, rozšírený o viac ako 285 vlastných rozpoznávačov entít v 48 jazykoch.
#presidioPresidio Analyzer
Služba Microsoft Presidio Analyzer
Detekčný komponent backendu anonym.legal (port 8011). Prijíma text a vracia zoznam detekovaných entít PII s ich pozíciami, typmi a skóre dôvery. Rozšírené o viac ako 285 vlastných rozpoznávačov v 48 jazykoch.
#presidioanalyzerPresidio Anonymizer
Služba Microsoft Presidio Anonymizer
Transformačný komponent backendu anonym.legal (port 8012). Berie text a výsledky analyzátora ako vstup, aplikuje vybraného operátora (NÁHRADA, REDAKCIA, MASKOVANIE, HASH, ŠIFROVANIE) na každú detekovanú entitu a vracia anonymizovaný text.
#presidioanonymizerPseudonymizácia
Pseudonymizácia údajov
Nahradenie priamych identifikátorov umelými hodnotami (pseudonymami) pri zachovaní schopnosti znovu identifikovať jednotlivcov pomocou samostatného kľúča. Článok 4(5) GDPR uznáva túto techniku ako techniku zvyšujúcu ochranu súkromia, ale nevyníma pseudonymizované údaje z regulácie.
#pseudonymizationR
Redakcia
Redakcia údajov
Trvalé odstránenie alebo zakrytie citlivých informácií z dokumentov, nahradenie vizuálnym markerom ako [REDACTED] alebo čiernym pruhom. Na rozdiel od šifrovania je redakcia jednosmerná a pôvodné údaje nie je možné obnoviť.
#redactionRedaktor obrázkov
Služba Presidio Image Redactor
Špecializovaná backendová služba (port 8013), ktorá detekuje a rediguje PII z obrazových súborov (PNG, JPEG) pomocou OCR a analýzy Presidio. Aplikuje redakciu čiernymi pruhmi na detekované oblasti PII v pôvodnom obrázku.
#presidioimageredactorRegex
Zhodovanie vzorov regulárnych výrazov
Zhodovanie textu na základe vzorov pomocou formálnej jazykovej syntaxe. Pri detekcii PII regex spracováva štrukturálne predvídateľné identifikátory (telefónne čísla, kreditné karty, IBANy, e-mailové adresy) s validáciou kontrolného súčtu. Dopĺňa NER pre hybridnú detekciu.
#regexResidencia údajov
Požiadavky na residenciu údajov
Právne alebo zmluvné požiadavky, ktoré špecifikujú, v ktorej geografickej lokalite musia byť údaje uložené a spracované. Relevantné pre GDPR (prenos údajov mimo EHP), nemecký BDSG a sektorové predpisy v zdravotnej starostlivosti a financiách.
#dataresidencyREST API
RESTful API
anonym.legal vystavuje RESTful HTTP API pre programatickú integráciu. Endpoints zahŕňajú /api/analyze, /api/anonymize, /api/image a /api/structured. Autentifikované pomocou JWT bearer tokenov. Kompletná dokumentácia OpenAPI je k dispozícii v API Referencii.
#restapiRezidencia údajov EÚ
Rezidencia údajov Európskej únie
Záruka, že údaje sú uložené a spracovávané výhradne v území EÚ/EEA. Produkčné servery anonym.legal sú v Nemecku (Hetzner Frankfurt), čo zabezpečuje, že všetko spracovanie prebieha pod jurisdikciou GDPR bez dôsledkov na prenos údajov cez hranice.
#eudataresidencyS
SCCs
Štandardné zmluvné doložky
Predschválené zmluvné doložky v súlade s GDPR na prenos osobných údajov z EÚ/EHP do tretích krajín. Aktualizované Európskou komisiou v roku 2021 (2021/914/EU) na splnenie požiadaviek Schrems II, vrátane hodnotenia vplyvu na prenos.
#sccsSHA-256
Bezpečný hashovací algoritmus 256-bit
Kryptografická hashovacia funkcia produkujúca 256-bitový digest. Používa sa v anonym.legal na HMAC autentifikáciu API požiadaviek, dôkazy ZK auth a konzistentnú pseudonymizáciu entít (hashovanie so soľou produkuje rovnaké nahradenie pre rovnakú pôvodnú hodnotu).
#sha256Schrems II
Rozhodnutie Schrems II (C-311/18)
Rozhodnutie Súdneho dvora EÚ z roku 2020, ktoré zrušilo rámec EU-US Privacy Shield pre transatlantické prenosy údajov, citujúc nedostatočné ochrany v americkom práve o dohľade. Vyžaduje doplnkové opatrenia (šifrovanie, anonymizáciu) pri používaní štandardných zmluvných doložiek.
#schremsiispaCy
Knižnica NLP spaCy
Priemyselná open-source knižnica NLP v Pythone. anonym.legal používa modely založené na transformátoroch spaCy pre 24 jazykov (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko a ďalšie) na rozpoznávanie pomenovaných entít v pipeline Presidio.
#spacySpoliácia
Spoliácia dôkazov
Zničenie, zmena alebo zlyhanie pri uchovávaní dôkazov relevantných pre súdne konanie. Príliš agresívna redakcia, ktorá robí dokumenty nečitateľnými, môže predstavovať spoliáciu. Kalibrácia presnosti anonymizácie (prahové hodnoty dôvery, výber entít) je dôležitá pre právne obhájiteľnú redakciu.
#spoliationStanza
Knižnica NLP Stanza (Stanford NLP)
Python nástrojová sada NLP skupiny Stanford NLP podporujúca viac ako 70 jazykov s najmodernejšími neurálnymi modelmi. Používa sa ako doplnkový backend NER v anonym.legal pre jazyky, ktoré nie sú pokryté modelmi spaCy.
#stanzaSúverenita údajov
Digitálna súverenita údajov
Princíp, že údaje podliehajú zákonom a riadiacim štruktúram krajiny, v ktorej boli zhromaždené. Je širší ako residencia údajov, zahŕňa kontrolu nad tým, kto môže mať prístup k údajom a na akom právnom základe.
#datasovereigntyŠ
Štátne ID
Typy entít štátneho identifikátora
Typy entít pre národné a štátom vydané identifikátory: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE a viac ako 50 ďalších krajinných formátov ID. Detekované pomocou krajinných regex + vzorov kontrolného súčtu.
#governmentidT
TLS
Transport Layer Security
Kryptografický protokol zabezpečujúci údaje počas prenosu. anonym.legal vynucuje minimálne TLS 1.2 s preferovaným TLS 1.3, HSTS s maximálnym vekom jeden rok a HTTP/2. Všetka komunikácia medzi klientmi a serverom je šifrovaná počas prenosu.
#tlsTokenizácia
Tokenizácia údajov
Nahradenie citlivých údajov necitlivým zástupným symbolom (tokenom), ktorý sa bezpečne mapuje späť na pôvodné údaje v zabezpečenom trezore. Na rozdiel od šifrovania nemá token sám o sebe matematický vzťah k pôvodným údajom.
#tokenizationTokenový systém
anonym.legal Kreditný tokenový systém
Účtovanie na základe použitia, kde API volania spotrebúvajú tokeny vypočítané z dĺžky textu, počtu entít a režimu spracovania (analyzovať vs. anonymizovať). Náklady na tokeny sú konfigurovateľné v DB a zobrazujú sa v reálnom čase pred spracovaním.
#tokensystemTrezor
Trezor šifrovacích kľúčov
Bezpečné lokálne úložisko pre šifrovacie kľúče v Desktopovej aplikácii, chránené deriváciou kľúča Argon2id z hlavnej frázy. Kľúče sú uložené šifrované pomocou AES-256-GCM a zálohované prostredníctvom BIP39 mnemotechnických fráz.
#vaultTyp entity
Typ entity PII
Kategória osobných informácií, ktorú detekčný engine rozpoznáva a môže anonymizovať. Príklady: OSOBA, EMAILOVÁ_ADRESA, TELEFÓNNE_CISLO, KREDITNÁ_KARTA, IBAN_KÓD, US_SSN, IP_ADRESA. anonym.legal podporuje viac ako 285 typov entít v 48 jazykoch.
#entitytypeU
Univerzálne entity
Jazykovo-univerzálne typy entít
Typy entít detekované bez ohľadu na jazyk textu, zvyčajne prostredníctvom regex založeného na formáte s validáciou kontrolného súčtu. Príklady: KREDITNÁ_KARTA, IBAN_KÓD, EMAILOVÁ_ADRESA, TELEFÓNNE_CISLO, IP_ADRESA, URL, CRYPTO adresa.
#universalentitiesV
Vlastné entity
Rozpoznávače vlastných entít
Užívateľom definované vzory PII pridané na vrch 285+ vstavaných typov entít anonym.legal. Podporuje regex vzory, zoznamy slov a zoznamy zamietnutých položiek. Užitečné pre identifikátory špecifické pre organizáciu, ako sú ID zamestnancov, interné projektové kódy alebo názvy vlastných produktov.
#customentitiesW
Webová aplikácia
anonym.legal Webová aplikácia
Rozhranie založené na prehliadači na anonymizáciu, analýzu a dešifrovanie PII na anonym.legal. Podporuje textový vstup, nahrávanie súborov (PDF, DOCX, TXT), dávkové spracovanie, ZK Auth, 48 jazykov a 285+ typov entít. Inštalácia nie je potrebná.
#webappX
XChaCha20
XChaCha20-Poly1305
Algoritmus autentifikovanej šifrovania ponúkajúci vysoký výkon na systémoch bez hardvérovej akcelerácie AES. Používa 192-bitový nonce (predĺžený z 96-bitového nonce štandardu IETF ChaCha20 podľa RFC 8439), čím eliminuje riziká kolízie nonce. Používa sa ako alternatívny šifrovací algoritmus v šifrovacej vrstve anonym.legal.
#xchacha20XLM-RoBERTa
Cross-Lingual RoBERTa
Viacjazyčný transformátorový jazykový model trénovaný na 100 jazykoch, vyvinutý spoločnosťou Meta AI. Používa sa v anonym.legal na úlohy cross-lingual NER, najmä pre typy entít a jazyky, kde nie sú k dispozícii monolingválne modely.
#xlmrobertaZ
Zdravotnícke entity
Zdravotnícke typy entít PII
Typy entít pre 18 identifikátorov HIPAA Safe Harbor a ďalšie zdravotne súvisiace PII: US_MRN (čísla zdravotných záznamov), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY a entity v kontexte diagnózy/liečby.
#healthcareentitiesZero-Knowledge
Architektúra Zero-Knowledge
Dizajn systému, kde poskytovateľ služby nemá žiadny prístup k používateľským nešifrovaným údajom alebo kľúčom na šifrovanie. Všetka šifrovanie/dešifrovanie prebieha na strane klienta; server nikdy nevidí pôvodný obsah. Zabraňuje vnútorným hrozbám a nútenému odhaleniu.
#zeroknowledgeZK Auth
Zero-Knowledge Authentication
autentifikačný systém anonym.legal, kde sú kľúče na šifrovanie odvodené na strane klienta z používateľskej frázy pomocou Argon2id, nikdy nie sú prenášané na server alebo tam uložené. Server uchováva iba kryptografický dôkaz, nie kľúč alebo frázu.
#zkauth