Privatumo ir Technologijų Žodynas
Apibrėžimai visiems terminams, akronimams ir koncepcijoms, naudojamoms PII anonimizavime ir duomenų privatume.
Grįžti į Dokumentus94 terminai
2FA
Dvi faktorių autentifikacija
Autentifikacija, reikalaujanti dviejų skirtingų patvirtinimo faktorių: kažko, ką vartotojas žino (slaptažodis), ir kažko, ką vartotojas turi (TOTP programa, aparatinis raktas) arba yra (biometrinis). Palaikoma anonym.legal kaip papildoma apsaugos priemonė virš ZK Auth.
#twofaAdvokato-kliento privilegija
Advokato-kliento privilegijos apsauga
Teisinė apsauga konfidencialioms komunikacijoms tarp advokatų ir klientų. Dokumentų peržiūroje ir e-atrankoje privilegijuotas turinys turi būti identifikuotas ir sulaikytas arba redaguotas. Anonym.legal gali būti sukonfigūruoti specialūs subjekto tipai, kad pažymėtų privilegijuoto turinio žymenis.
#attorneyclientprivilegeAES-256-GCM
Išplėstinis šifravimo standartas 256 bitų Galois/Counter režimu
Autentifikavimo šifravimo algoritmas, sujungiantis AES-256 (256 bitų raktą) su Galois/Counter režimu tiek konfidencialumui, tiek vientisumui užtikrinti. Naudojamas anonym.legal atvirkštiniam anonimizavimui, kad šifruotų pakeistus subjektus. Užtikrina tiek paslaptį, tiek klastojimo aptikimą.
#aes256gcmAnonymization
Duomenų anonimizacija
Negrįžtamas procesas, kurio metu pašalinama arba transformuojama identifikuojanti informacija, kad asmenys nebegalėtų būti identifikuojami, tiesiogiai ar netiesiogiai. Pagal GDPR, tikrai anonimizuoti duomenys nepatenka į reglamento taikymo sritį.
#anonymizationArgon2id
Argon2id raktų išgavimo funkcija
2015 metų slaptažodžių maišymo konkurso laimėtojas. Argon2id sujungia Argon2i šoninio kanalo atsparumą ir Argon2d GPU atsparumą. Naudojamas anonym.legal ir darbalaukio programos seife, kad gautų šifravimo raktus iš vartotojo slaptažodžių.
#argon2idAudito takas
Nepakeičiamas audito takas
Sekvencinis, klastojimo įrodymus pateikiantis žurnalas, fiksuojantis, kas pasiekė, pakeitė ar apdorojote duomenis ir kada. Reikalaujama pagal ISO 27001 (A.8.15), HIPAA saugumo taisyklę (§164.312(b)) ir e-atrankos taisykles. anonym.legal registruoja visus anonimizavimo veiksmus su laiko žymėmis, subjekto skaičiais ir operatorių ID.
#audittrailBIP39
Bitcoin tobulinimo pasiūlymas 39 — Mnemoninės frazės
Standartas, skirtas generuoti žmogui skaitomas mnemonines sėklos frazes (12–24 žodžiai) iš kriptografinės sėklos. Naudojamas anonym.legal darbalaukio programos seife kaip vartotojui patogus atsarginis variantas Argon2id gautam šifravimo raktui.
#bip39CCPA
Kalifornijos vartotojų privatumo aktas
Kalifornijos privatumo įstatymas, suteikiantis gyventojams teisę žinoti, ištrinti ir atsisakyti savo asmeninės informacijos pardavimo. Taikomas verslams, atitinkantiems pajamas, duomenų apimtis ar duomenų pardavimo ribas. Žymiai pakeistas CPRA (priimtas 2020 m. lapkričio mėn., įsigalioja 2023 m. sausio mėn.).
#ccpaChrome plėtinys
anonym.legal Chrome plėtinys
Naršyklės plėtinys (Manifest V3), kuris perima tekstą prieš jį siunčiant AI pokalbių robotams (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonimizuoja realiu laiku ir, pasirinktinai, dešifruoja AI atsakymus, naudodamas išsaugotus šifravimo raktus.
#chromeextensionCLOUD Act
Įstatymas dėl teisėto duomenų naudojimo užsienyje
JAV federalinis įstatymas (2018), leidžiantis JAV teisėsaugai priversti JAV įsikūrusius debesų teikėjus pateikti duomenis, saugomus užsienyje. Prieštarauja GDPR duomenų perdavimo taisyklėms ES gyventojams. Duomenų anonimizavimas prieš debesų įkėlimą yra dažna priemonė.
#cloudactCSP
Turinio saugumo politika
HTTP atsakymo antraštė ir meta žymos mechanizmas, kuris riboja, kokius išteklius (skriptus, stilius, vaizdus) naršyklė gali įkelti. anonym.legal CSP apima object-src 'none', script-src su nonce ir upgrade-insecure-requests, kad būtų išvengta XSS atakų.
#cspDarbo stoties programa
anonym.legal Darbo stoties programa
Kryžminės platformos programa (Windows, macOS, Linux), sukurta naudojant Tauri 2.0 ir React 18. Pasižymi vietiniu failų apdorojimu, BIP39 saugykla neprisijungus ZK Auth, partijų eksportu ir API sinchronizavimu. Palaiko oro spragą turinčius diegimus be interneto prieigos.
#desktopappData Minimization
GDPR duomenų minimizavimo principas
GDPR 5(1)(c) straipsnio principas, reikalaujantis, kad būtų renkama ir apdorojama tik ta informacija, kuri yra pakankama, svarbi ir būtina nurodytam tikslui. Pagrindinis dizaino apribojimas privatumo atitinkančioms sistemoms.
#dataminimizationDDoS apsauga
Paskirstytos paslaugos neigimo apsauga
Infrastruktūros lygio gynybos nuo paskirstytų paslaugos neigimo atakų. anonym.legal serverių infrastruktūra apima ugniasienės taisykles (UFW), nginx ryšio ribas ir Cloudflare atitikmenis, kad būtų išlaikoma prieinamumas.
#ddosprotectionDe-anonymization
Pakartotinis identifikavimas
Procesas, kurio metu asmenys vėl identifikuojami iš tariamai anonimizuotų duomenų rinkinių, kryžminant su papildoma informacija. Pagrindinis rizikos veiksnys, dalijantis duomenimis su nepakankamu anonimizacijos gylio.
#deanonymizationDifferential Privacy
Diferencinė privatumas (DP)
Matematinė sistema, leidžianti skelbti statistinę informaciją apie duomenų rinkinius, teikiant įrodytas garantijas, kad bet kurio asmens duomenys negali būti atskirti. Naudojama agregatinėje analizėje, siekiant užkirsti kelią pakartotiniam identifikavimui, net kai užklausiama agregatinių rezultatų.
#differentialprivacyDLP
Duomenų praradimo prevencija
Saugumo disciplina ir programinės įrangos įrankių kategorija, skirta aptikti ir užkirsti kelią neleistinam jautrių duomenų perdavimui už organizacijos ribų. anonym.legal veikia kaip naršyklės ir AI sluoksnio DLP sprendimas PII.
#dlpDPA
Duomenų apdorojimo sutartis
Teisiškai privalomas sutartis tarp duomenų valdytojo ir duomenų apdorotojo, reikalaujama pagal GDPR 28 straipsnį. Nurodo dalyką, trukmę, pobūdį, tikslą ir asmens duomenų apdorojimo tipą, taip pat abiejų šalių teises ir pareigas.
#dpaDPIA
Duomenų apsaugos poveikio vertinimas
Rizikos vertinimo procesas, reikalaujamas pagal GDPR 35 straipsnį, skirtas apdorojimo veikloms, kurios gali sukelti didelę riziką asmenų teisėms ir laisvėms. Privalomas sisteminiam profiliavimui, didelio masto PHI apdorojimui ir viešųjų erdvių stebėjimui.
#dpiaDraudimo identifikatoriai
Draudimo subjekto tipai
Subjekto tipai, susiję su draudimo identifikatoriais: JAV_NPI (Nacionalinis teikėjo identifikatorius sveikatos priežiūros teikėjams), SVEIKATOS_PRIEŽIŪROS_PLANAS_NAUDOJIMAS ir šaliai specifiniai sveikatos draudimo numeriai (pvz., DE_SVEIKATOS_DRAUDIMO_NUMERIS).
#insuranceidentifiersDuomenų buvimo vieta
Duomenų buvimo vietos reikalavimai
Teisiniai ar sutartiniai reikalavimai, nurodantys, kurioje geografinėje vietoje duomenys turi būti saugomi ir apdorojami. Aktualūs GDPR (duomenų perdavimams už EEE ribų), Vokietijos BDSG ir sektorių specifinėms taisyklėms sveikatos priežiūros ir finansų srityse.
#dataresidencyDuomenų suverenitetas
Skaitmeninis duomenų suverenitetas
Principas, kad duomenys priklauso tos šalies įstatymams ir valdymo struktūroms, kurioje jie buvo surinkti. Plačiau nei duomenų buvimo vieta, jis apima kontrolę, kas gali pasiekti duomenis ir pagal kokį teisinį pagrindą.
#datasovereigntye-Discovery
Elektroninis atradimas
Procesas, skirtas identifikuoti, rinkti ir pateikti elektroniniu būdu saugomą informaciją teisminiuose procesuose. Reikalauja PII ir privilegijuotos informacijos redagavimo iš pateiktų dokumentų. Pagrindinis naudojimo atvejis teisės departamentams, naudojantiems anonym.legal.
#ediscoveryE2EE
Galutinio šifravimo
Šifravimas, kurį gali perskaityti tik bendraujančios šalys; paslaugų teikėjas neturi prieigos prie neslėptų duomenų. anonym.legal ZK Auth režimu šifravimo raktai niekada nepalieka kliento įrenginio, pasiekiant E2EE anonimizuotų išvesties saugojimui.
#e2eeES duomenų buvimas
Europos Sąjungos duomenų buvimas
Garantija, kad duomenys saugomi ir apdorojami tik ES/EEA teritorijoje. anonym.legal gamybos serveriai yra Vokietijoje (Hetzner Frankfurt), užtikrinant, kad visas apdorojimas vyksta pagal GDPR jurisdikciją be tarptautinių duomenų perdavimo pasekmių.
#eudataresidencyFinansiniai subjektai
Finansiniai PII subjekto tipai
Subjekto tipai, apimantys finansinius identifikatorius: KREDITO_KORTELĖ (Luhn kontrolės suma), IBAN_KODAS (ISO 13616 kontrolės suma), SWIFT_KODAS (BIC formatas), JAV_BANKO_NUMERIS, NRP (Ispanijos mokesčių ID). Aptinkama naudojant kontrolės sumos patvirtinimą, kad sumažintų klaidingus teigiamus rezultatus.
#financialentitiesFOIA
Informacijos laisvės aktas
JAV federalinis įstatymas (ir atitinkami įstatymai kitose jurisdikcijose), suteikiantis viešą prieigą prie vyriausybes dokumentų. Reikalauja PII ir kitų išimtinių informacijų redagavimo prieš atskleidimą — pagrindinė teisinių ir vyriausybių anonimizavimo darbo srautų naudojimo atvejis.
#foiaGDPR
Bendrasis duomenų apsaugos reglamentas
ES reglamentas 2016/679, pagrindinis duomenų apsaugos teisinis pagrindas Europos Sąjungoje. Taikomas bet kuriai organizacijai, apdorojančiai asmens duomenis ES gyventojų. Baudos iki 20 mln. EUR arba 4% pasaulinių metinių pajamų. Pagrindinės teisės: prieiga, ištrynimas, perkeliamumas, apribojimas, prieštaravimas.
#gdprGDPR 25 straipsnis
GDPR 25 straipsnis — Duomenų apsauga projektuojant ir pagal numatytuosius nustatymus
Reikalauja, kad valdytojai įgyvendintų tinkamas technines ir organizacines priemones (tokias kaip pseudonimizacija ir duomenų minimizavimas) tiek sistemos projektavimo metu, tiek pagal numatytuosius nustatymus apdorojimo metu.
#gdprarticle25GDPR 32 straipsnis
GDPR 32 straipsnis — Apdorojimo saugumas
Reikalauja, kad valdytojai ir apdorotojai įgyvendintų tinkamas technines ir organizacines priemones, kad užtikrintų rizikai tinkamą saugumo lygį, įskaitant šifravimą, pseudonimizaciją, konfidencialumą, vientisumą, prieinamumą ir apdorojimo sistemų atsparumą.
#gdprarticle32GenAI DLP
Generatyvi AI duomenų praradimo prevencija
Specializuota DLP kategorija, skirta užkirsti kelią PII ir konfidencialiems duomenims patekti į užklausas, siunčiamas generatyviems AI modeliams (ChatGPT, Claude, Gemini). anonym.legal Chrome plėtinys ir MCP serveris sprendžia šią riziką įvedimo taške.
#genaidlpGynybiniškumas
Teisiškai gynybinis anonimizavimas
Galimybė parodyti reguliuotojams, teismams ar auditoriams, kad anonimizavimas buvo atliktas naudojant dokumentuotą, nuoseklų ir techniškai pagrįstą metodologiją. anonym.legal audito žurnalai, pasitikėjimo balai ir operatorių nustatymai palaiko gynybinius anonimizavimo darbo srautus.
#defensibilityHashing
Kryptografinis hashing
Vienpusis duomenų transformavimas į fiksuoto ilgio santrauką naudojant algoritmus, tokius kaip SHA-256. Naudojama nuosekliai pseudonimizacijai, deduplikuojant ir integriteto patikrinimui. Hash vertės negali būti atstatytos, tačiau gali būti pažeidžiamos dėl rainbow table atakų, jei nėra sūdyti.
#hashingHetzner
Hetzner Online GmbH
Vokietijos debesų ir hosting'o teikėjas, kuriame veikia anonym.legal gamybos infrastruktūra. Įsikūręs Falkensteine, Saksonijoje (duomenų centras fsn1) su ISO 27001 sertifikatu. Pasirinktas dėl ES duomenų buvimo, atitikties pozicijos ir GDPR draugiškos jurisdikcijos pagal Vokietijos teisę.
#hetznerHibridinis Aptikimas
Hibridinis NLP + Regex + ML Aptikimas
Programos anonym.legal trijų lygių požiūris: regex modeliai struktūrizuotam PII (telefono numeriai, IBAN, kredito kortelės), NLP/NER modeliai kontekstiniams entitetams (vardai, organizacijos, vietovės) ir ML klasifikatoriai neaiškiems atvejams. Sumažina tiek klaidingus teigiamus, tiek klaidingus neigiamus rezultatus.
#hybriddetectionHIPAA
Sveikatos draudimo perkėlimo ir atsakomybės aktas
JAV federalinis įstatymas, nustatantis standartus, skirtus jautrios pacientų sveikatos informacijos apsaugai. Privatumo taisyklė reglamentuoja PHI naudojimą; saugumo taisyklė reikalauja administracinių, fizinių ir techninių apsaugos priemonių elektroniniams PHI (ePHI). Pažeidimai gali sukelti baudas iki 1,9 mln. USD už kategoriją per metus.
#hipaaHIPAA Safe Harbor
HIPAA Safe Harbor deidentifikavimo metodas
Vienas iš dviejų HIPAA patvirtintų deidentifikavimo metodų, reikalaujantis pašalinti visus 18 nurodytų pacientų identifikatorių (vardas, adresas, datos, telefono numeriai, SSN, el. paštas, IP adresas, biometrika ir kt.), kad sveikatos duomenys nebūtų individualiai identifikuojami.
#hipaasafeharborHSTS
HTTP griežtas transporto saugumas
Interneto saugumo politikos mechanizmas, kuris verčia naršykles naudoti tik HTTPS ryšius. anonym.legal nustato Strict-Transport-Security: max-age=31536000; includeSubDomains, kad būtų išvengta protokolo sumažinimo atakų ir slapukų pagrobimo.
#hstsĮrodymų sunaikinimas
Įrodymų sunaikinimas
Įrodymų, susijusių su bylinėjimusi, sunaikinimas, pakeitimas ar nesugebėjimas išsaugoti. Per daug agresyvus redagavimas, dėl kurio dokumentai tampa neskaitytini, gali būti laikomas sunaikinimu. Anonimizavimo tikslumo kalibravimas (pasitikėjimo slenksčiai, subjekto pasirinkimas) yra svarbus teisiškai gynybiniam redagavimui.
#spoliationISO 27001
ISO/IEC 27001 Informacijos saugumo valdymas
Tarptautinis standartas informacijos saugumo valdymo sistemoms (ISMS). Sertifikavimas reikalauja dokumentuotų politikų, rizikos vertinimų ir kontrolės priemonių. anonym.legal ES serveriai yra ISO 27001 sertifikuoti, užtikrinant struktūrizuotą saugumo valdymą.
#iso27001ISO 27001 SoA
Taikymo pareiškimas
Privalomas ISO 27001 dokumentas, kuriame išvardijamos visos A priedo kontrolės, nurodant, kurios taikomos organizacijai, ir pateikiant pagrindimą dėl įtraukimų ir neįtraukimų. Reikalingas sertifikavimui ir auditams.
#iso27001soaJWT
JSON Web Token
Kompaktiškas, URL saugus žetonų formatas, naudojamas perduoti teiginius tarp šalių. anonym.legal naudoja JWT, pasirašytus su HS256, vidinei paslaugų autentifikacijai (pvz., frontend → Presidio API). Žetonai yra trumpalaikiai ir patvirtinami serverio pusėje.
#jwtKalbos Aptikimas
Automatinis Kalbos Aptikimas
Automatinis įvesties teksto kalbos identifikavimas prieš PII analizę. Programoje anonym.legal kalba aptinkama užklausos lygyje ir nukreipiama į atitinkamą NER modelio vamzdyną, o anglų kalba naudojama kaip atsarginė nepalaikomoms kalboms.
#languagedetectionKalbos Keitimas
Daugiakalbis Kalbos Keitimas
Fenomenas, kai dvi ar daugiau kalbų maišomos viename tekste ar pokalbyje. Dažnas daugiakalbiuose dokumentuose (pvz., Vokietijos teisės dokumentuose su anglų techniniais terminais). Programos anonym.legal hibridinis aptikimas tvarko kalbos pakeistą tekstą, taikydamas kelis kalbų modelius vienu metu.
#codeswitchingKEK
Raktų šifravimo raktas
Raktas, naudojamas šifruoti kitus raktus, o ne tiesiogiai duomenis. anonym.legal ZK architektūroje vartotojo slaptažodžio gautas raktas veikia kaip KEK, kad apsaugotų per dokumentą šifruotus raktus, saugomus šifruotame seife.
#kekKvietimų ribojimas
API kvietimų ribojimas
Kontrolės, kiek API užklausų klientas gali atlikti per tam tikrą laikotarpį. Užkerta kelią piktnaudžiavimui ir užtikrina teisingą išteklių paskirstymą. anonym.legal taiko kvietimų ribas pagal vartotojo planą, rekomenduojama naudoti eksponentinį atidėjimą pakartotinio bandymo logikai.
#ratelimitingMasking
Duomenų maskavimas
Jautrių verčių pakeitimas realistiškais, bet fiktyviais duomenimis, išlaikant formatą ir struktūrą. Naudojama testavimo aplinkose, analitikose ir dalijantis duomenų rinkiniais, neatskleidžiant tikrų PII.
#maskingMCP
Modelio konteksto protokolas
Atviras protokolas, sukurtas Anthropic, leidžiantis AI modeliams standartizuotu būdu bendrauti su išoriniais įrankiais ir duomenų šaltiniais. anonym.legal įgyvendina MCP serverį, kad AI kodavimo įrankiai galėtų iškviesti anonimizaciją, neišeidami iš savo darbo proceso.
#mcpMCP serveris
Modelio konteksto protokolo serveris
anonym.legal MCP serverio integracija leidžia AI kodavimo asistentams (Claude Desktop, Cursor, VS Code Copilot) tiesiogiai kviesti anonimizacijos API kaip įrankį. PII yra pašalinamas iš kodo, užklausų ir konteksto prieš siunčiant AI modeliui.
#mcpserverML Modeliai
Mašininio Mokymosi Modeliai PII Aptikimui
Statistiniai modeliai, apmokyti ant pažymėtų tekstų korpusų, kad atpažintų PII kontekste. Programoje anonym.legal naudojami tiek spaCy transformatorių vamzdynai, tiek tiksliai apmokytas XLM-RoBERTa, skirtas daugiakalbiam entitetų atpažinimui gamybos mastu.
#mlmodelsNepakankamas redagavimas
Nepakankamas redagavimas (klaidingi neigiami rezultatai)
Nepavyksta pašalinti visos PII, paliekant asmenis atvirus bendrinamuose dokumentuose. Dažnesnė atitikties rizika. Sukelia aukšti pasitikėjimo slenksčiai, trūkstami subjekto tipai arba nauji PII formatai. Sumažinama naudojant anonym.legal hibridinį aptikimą ir specialių subjekto palaikymą.
#underredactionNER
Vardinių Entitetų Atpažinimas
Natūralios kalbos apdorojimo užduotis, kuri identifikuoja ir klasifikuoja vardinius entitetus tekste į iš anksto nustatytas kategorijas, tokias kaip asmenys, organizacijos, vietovės, datos ir medicininiai identifikatoriai. Pagrindinė ML technika, naudojama PII aptikimui programoje anonym.legal.
#nerNIS2
Tinklo ir informacijos saugumo direktyva 2
ES direktyva 2022/2555, plečianti pradinę NIS direktyvą, kad apimtų daugiau sektorių (sveikatos priežiūra, energija, transportas, skaitmeninė infrastruktūra) ir stiprinanti kibernetinio saugumo reikalavimus. Įgyvendinimo terminas buvo 2024 m. spalio 17 d.; dauguma ES valstybių narių jo nesilaikė, o Europos Komisija pradėjo pažeidimų procedūras prieš nesilaikančias valstybes.
#nis2NLP
Natūralios Kalbos Apdorojimas
Dirbtinio intelekto šaka, susijusi su kompiuterių ir žmogaus kalbos sąveika. PII aptikime NLP modeliai supranta kontekstą, gramatiką ir semantiką, kad identifikuotų entitetus, kuriuos vien regex modeliai gali praleisti.
#nlpNulinės žinios
Nulinės žinios architektūra
Sistemos dizainas, kuriame paslaugų teikėjas neturi jokios prieigos prie vartotojų neslėptų duomenų ar šifravimo raktų. Visi šifravimo/dešifravimo procesai vyksta kliento pusėje; serveris niekada nemato originalaus turinio. Apsaugo nuo vidinių grėsmių ir priverstinio atskleidimo.
#zeroknowledgeNustatymai
Anonimizacijos nustatymai
Išsaugotos pasirinkto subjektų tipų, pasitikėjimo slenksčių ir išvesties parinkčių konfigūracijos, kurias galima pritaikyti vienu paspaudimu. Nustatymai sinchronizuojami tarp Žiniatinklio programos, Office papildinio ir Darbo stoties programos per šifruotą debesų saugyklą.
#presetsOffice papildinys
anonym.legal Microsoft Office papildinys
Microsoft Office plėtinys, integruojantis PII anonimizaciją tiesiai į Word, Excel ir PowerPoint. Palaiko dokumentų redagavimą, nustatymų valdymą, ZK Auth ir sinchronizavimą tarp įrenginių. Pasiekiamas iš Microsoft AppSource.
#officeaddinOperatoriai
Anonimizacijos operatoriai
Pakeitimo strategija, taikoma aptiktam PII. anonym.legal palaiko REPLACE (užpildymo tekstas), REDACT (tuščias tekstas), MASK (žvaigždutės), HASH (SHA-256 santrauka), ENCRYPT (atvirkštinis AES-256-GCM) ir CUSTOM (vartotojo apibrėžtas pakeitimas).
#operatorsPartijų apdorojimas
Partijų failų anonimizacija
Daugelio failų apdorojimas vienu metu vienoje operacijoje. anonym.legal partijos režimas palaiko PDF, DOCX ir TXT failus su kiekvieno failo subjektų konfigūracija, pasitikėjimo slenkstiais ir išvesties formato pasirinkimu.
#batchprocessingPasirinktinių subjektų
Pasirinktinių subjektų atpažintuvai
Vartotojo apibrėžti PII modeliai, pridėti prie anonym.legal įmontuotų 285+ subjektų tipų. Palaiko regex modelius, žodžių sąrašus ir neigiamas sąrašus. Naudinga organizacijoms, turinčioms specifinius identifikatorius, tokius kaip darbuotojų ID, vidiniai projektų kodai ar nuosavybės produktų pavadinimai.
#customentitiesPasitikėjimo Įvertinimas
Entitetų Aptikimo Pasitikėjimo Įvertinimas
0–1 įvertinimas, rodantis, kaip tikras yra aptikimo modelis, kad teksto fragmentas yra PII entitetas. Programoje anonym.legal pateikiami konfigūruojami pasitikėjimo slenksčiai, kad vartotojai galėtų pritaikyti tikslumo ir atgavimo kompromisus savo konkrečiam naudojimo atvejui.
#confidencescoringPCI DSS
Mokėjimo kortelių pramonės duomenų saugumo standartas
Saugumo standartas organizacijoms, tvarkančioms mokėjimo kortelių duomenis, palaikomas PCI saugumo standartų tarybos. Reikalauja šifravimo, prieigos kontrolės, žurnalavimo ir reguliaraus testavimo. Nesilaikymas gali sukelti baudas ir kortelių apdorojimo privilegijų praradimą.
#pcidssPer didelis redagavimas
Per didelis redagavimas (klaidingi teigiami rezultatai)
Pašalinant daugiau informacijos nei būtina, sumažinant dokumento naudingumą ir potencialiai sudarant sunaikinimo sąlygas teisminiuose procesuose. Sukelia žemi pasitikėjimo slenksčiai arba pernelyg platus subjekto pasirinkimas. Reguliuojama per anonym.legal slenksčius ir subjekto kontrolę.
#overredactionPHI
Apsaugota sveikatos informacija
Bet kokia su sveikata susijusi informacija, susijusi su identifikuojamu asmeniu, reglamentuojama HIPAA JAV. Apima diagnozes, gydymo įrašus, draudimo duomenis ir bet kurį iš 18 HIPAA Safe Harbor identifikatorių.
#phiPII
Asmens tapatybę atskleidžianti informacija
Bet kokie duomenys, kurie gali tiesiogiai identifikuoti konkretų asmenį arba kartu su kitais duomenimis. Pavyzdžiai: vardai, el. pašto adresai, socialinio draudimo numeriai, IP adresai, biometriniai įrašai.
#piiPresidio
Microsoft Presidio
Atvirojo kodo duomenų apsaugos ir anonimizavimo SDK, sukurtas Microsoft. Programos anonym.legal aptikimo variklis yra sukurtas ant Presidio analizatoriaus ir anonimizatoriaus paslaugų, išplėstas su 285+ individualiais entitetų atpažinėjais 48 kalboms.
#presidioPresidio analizatorius
Microsoft Presidio analizatoriaus paslauga
Aptikimo komponentas anonym.legal backend'e (prievadas 8011). Priima tekstą ir grąžina aptiktų PII subjektų sąrašą su jų pozicijomis, tipais ir pasitikėjimo balais. Išplėstas su 285+ specialiais atpažintojais 48 kalbomis.
#presidioanalyzerPresidio anonimizatorius
Microsoft Presidio anonimizatoriaus paslauga
Transformacijos komponentas anonym.legal backend'e (prievadas 8012). Priima tekstą ir analizatoriaus rezultatus kaip įvestį, taiko pasirinktą operatorių (Pakeisti, Redaguoti, Maskuoti, Hash, Šifruoti) kiekvienam aptiktam subjektui ir grąžina anonimizuotą tekstą.
#presidioanonymizerPrivacy by Design
Privatumas nuo dizaino
Principas, numatytas GDPR 25 straipsnyje, kad duomenų apsaugos priemonės yra integruotos į sistemas nuo pat pradžių, o ne pridėtos kaip požiūris. Apima duomenų minimizavimą, prieigos kontrolę, šifravimą ir pseudonimizaciją architektūros lygyje.
#privacybydesignPseudonymization
Duomenų pseudonimizacija
Tiesioginių identifikatorių pakeitimas dirbtiniais vertiniais (pseudonimais), išlaikant galimybę vėl identifikuoti asmenis naudojant atskirą raktą. GDPR 4(5) straipsnis pripažįsta tai kaip privatumo didinimo techniką, tačiau neleidžia pseudonimizuotiems duomenims būti išimtiems iš reglamento.
#pseudonymizationRedaction
Duomenų redagavimas
Nuolat pašalinama arba uždengiama jautri informacija iš dokumentų, pakeičiant ją vizualiniu žymekliu, tokiu kaip [REDACTED] arba juoda juosta. Skirtingai nuo šifravimo, redagavimas yra vienpusis, o originalių duomenų atkurti neįmanoma.
#redactionRegex
Reguliarių Išraiškų Modelių Atitikimas
Modelių pagrindu atliekamas teksto atitikimas naudojant formalios kalbos sintaksę. PII aptikime regex tvarko struktūriškai prognozuojamus identifikatorius (telefono numeriai, kredito kortelės, IBAN, el. pašto adresai) su kontroliniais patikrinimais. Papildo NER hibridiniam aptikimui.
#regexREST API
RESTful API
anonym.legal teikia RESTful HTTP API programinei integracijai. Pabaigos taškai apima /api/analyze, /api/anonymize, /api/image ir /api/structured. Autentifikuojama per JWT nešiklio žetonus. Pilna OpenAPI dokumentacija prieinama API nuorodoje.
#restapiSCCs
Standartinės sutartinės sąlygos
Išankstiniu būdu patvirtintos GDPR atitinkančios sutartinės sąlygos, skirtos asmens duomenims perduoti iš ES/EEE į trečiąsias šalis. 2021 m. Europos Komisija atnaujino (2021/914/EU), kad atitiktų Schrems II reikalavimus, įskaitant perdavimo poveikio vertinimą.
#sccsSchrems II
Schrems II sprendimas (C-311/18)
2020 m. Europos Sąjungos Teisingumo Teismo sprendimas, kuriuo buvo pripažinta negaliojančia ES-JAV privatumo skydas, nurodant nepakankamą JAV stebėjimo įstatymų apsaugą. Reikalauja papildomų priemonių (šifravimo, anonimizavimo) naudojant standartines sutartines sąlygas.
#schremsiiSeifas
Šifravimo raktų seifas
Saugus vietinis šifravimo raktų saugojimas Darbo stoties programoje, apsaugotas Argon2id raktų išvesties iš pagrindinės frazės. Raktai saugomi šifruoti naudojant AES-256-GCM ir atsarginės kopijos sukuriamos per BIP39 mnemonines frazes.
#vaultSHA-256
Saugus maišymo algoritmas 256 bitų
Kriptografinė maišymo funkcija, kuri sukuria 256 bitų maišą. Naudojama anonym.legal HMAC autentifikacijai API užklausoms, ZK autentifikacijos įrodymams ir nuosekliai subjektų pseudonimizacijai (maišymas su druska sukuria tą patį pakeitimą už tą patį originalų vertę).
#sha256Skaitmeniniai identifikatoriai
Skaitmeninės tapatybės subjekto tipai
Subjekto tipai internetiniams ir skaitmeniniams identifikatoriams: EL_PASTAS, TELEFONO_NUMERIS, IP_ADRESAS (IPv4 ir IPv6), URL, DOMENAS, KRIPTO (Bitcoin/Ethereum adresai) ir platformai specifiniai identifikatoriai.
#digitalidentifiersspaCy
spaCy NLP Biblioteka
Pramonės lygio atvirojo kodo NLP biblioteka Python kalba. Programoje anonym.legal naudojami spaCy transformatorių modeliai 24 kalboms (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko ir kt.) vardinių entitetų atpažinimui Presidio vamzdynuose.
#spacyStanza
Stanza NLP Biblioteka (Stanford NLP)
Stanford NLP grupės Python NLP įrankių rinkinys, palaikantis 70+ kalbų su pažangiais neuroniniais modeliais. Naudojamas kaip papildomas NER backend programoje anonym.legal kalboms, kurioms nepalaiko spaCy modeliai.
#stanzaSubjekto tipas
PII subjekto tipas
Asmeninės informacijos kategorija, kurią atpažįsta ir gali anonimizuoti aptikimo variklis. Pavyzdžiai: ASMUO, EL_PASTAS, TELEFONO_NUMERIS, KREDITO_KORTELĖ, IBAN_KODAS, JAV_SSN, IP_ADRESAS. anonym.legal palaiko 285+ subjekto tipų 48 kalbomis.
#entitytypeSveikatos priežiūros subjektai
Sveikatos priežiūros PII subjekto tipai
Subjekto tipai 18 HIPAA Safe Harbor identifikatoriams ir papildomai su sveikata susijusiai PII: JAV_MRN (medicinos įrašų numeriai), MEDICINOS_LICENCIJA, SVEIKATOS_PRIEŽIŪROS_PLANAS_NAUDOJIMAS, ir diagnozės/gydymo konteksto subjektai.
#healthcareentitiesTaisyklė 26
Federalinės civilinės procedūros taisyklė 26
JAV civilinės procedūros taisyklė, reglamentuojanti atradimo įsipareigojimus. Taisyklė 26(g) reikalauja, kad advokatai patvirtintų, jog atradimo prašymai ir atskleidimai nėra pateikiami netinkamais tikslais — įskaitant nesugebėjimą tinkamai redaguoti PII iš pateiktų dokumentų.
#rule26TLS
Transporto sluoksnio saugumas
Kriptografinis protokolas, užtikrinantis duomenų saugumą perduodant. anonym.legal reikalauja TLS 1.2 minimumo, pageidaujamas TLS 1.3, HSTS su vienerių metų maksimaliu amžiumi ir HTTP/2. Visi duomenys tarp klientų ir serverio yra šifruojami perduodant.
#tlsTokenization
Duomenų tokenizacija
Jautrių duomenų pakeitimas neskaidria vieta (token), kuri saugiai atitinka originalą. Skirtingai nuo šifravimo, pats token neturi matematinio ryšio su originaliais duomenimis.
#tokenizationTransporto priemonių identifikatoriai
Transporto priemonių subjekto tipai
Subjekto tipai, susiję su transporto priemonių identifikatoriais: JAV_VAIRUOTOJO_LICENCIJA, JK_VAIRUOTOJO_LICENCIJA, ES_VAIRUOTOJO_LICENCIJA, VIN (Transporto priemonės identifikavimo numeris) ir šaliai specifiniai transporto priemonių registracijos numerių formatų.
#vehicleidentifiersUniversalieji subjektai
Kalbos-universalūs subjekto tipai
Subjekto tipai, aptinkami nepriklausomai nuo teksto kalbos, paprastai naudojant formatą pagrįstą regex su kontrolės suma. Pavyzdžiai: KREDITO_KORTELĖ, IBAN_KODAS, EL_PASTAS, TELEFONO_NUMERIS, IP_ADRESAS, URL, KRIPTO adresas.
#universalentitiesVaizdo redaktorius
Presidio vaizdo redaktoriaus paslauga
Specializuota backend paslauga (prievadas 8013), kuri aptinka ir redaguoja PII iš vaizdo failų (PNG, JPEG) naudodama OCR ir Presidio analizę. Taiko juodą juostą redagavimą virš aptiktų PII regionų originaliame vaizde.
#presidioimageredactorVyriausybinis ID
Vyriausybinio identifikatoriaus subjekto tipai
Subjekto tipai nacionaliniams ir vyriausybių išduotiems identifikatoriams: JAV_SSN, JAV_PASAS, JK_NHS, ES_NIF, DE_PERSONALAUS_KODAS, FR_INSEE, IT_FISKALINIS_KODAS ir 50+ kitų šaliai specifinių ID formatų. Aptinkama naudojant šaliai specifinius regex + kontrolės sumos modelius.
#governmentidXChaCha20
XChaCha20-Poly1305
Autentifikavimo šifravimo algoritmas, siūlantis aukštą našumą sistemose be AES aparatinės įrangos pagreitino. Naudoja 192 bitų nonce (išplėstas iš IETF ChaCha20 standarto 96 bitų nonce pagal RFC 8439), pašalinant nonce-kolizijų riziką. Naudojamas kaip alternatyvus šifras anonym.legal šifravimo sluoksnyje.
#xchacha20XLM-RoBERTa
Kryžminis RoBERTa
Daugiakalbis transformatorių kalbos modelis, apmokytas 100 kalbų, sukurtas Meta AI. Naudojamas programoje anonym.legal kryžminio kalbų NER užduotims, ypač entitetų tipams ir kalboms, kuriose monolingvinių modelių nėra.
#xlmrobertaZK Auth
Nulinės žinios autentifikacija
anonym.legal autentifikacijos sistema, kurioje šifravimo raktai yra gaunami kliento pusėje iš vartotojo slaptažodžio naudojant Argon2id, niekada neperduodami į serverį ar ten saugomi. Serveris saugo tik kriptografinį įrodymą, o ne raktą ar slaptažodį.
#zkauthŽetono sistema
anonym.legal Kredito žetono sistema
Mokėjimas pagal naudojimą, kai API skambučiai sunaudoja žetonus, apskaičiuotus pagal teksto ilgį, subjektų skaičių ir apdorojimo režimą (analizuoti vs. anonimizuoti). Žetono kainos yra konfigūruojamos DB ir rodomos realiu laiku prieš apdorojimą.
#tokensystemŽiniatinklio programa
anonym.legal Žiniatinklio programa
Naršyklėje veikianti sąsaja anonym.legal, skirta PII analizei, anonimizacijai ir dešifravimui. Palaiko teksto įvedimą, failų įkėlimą (PDF, DOCX, TXT), partijų apdorojimą, ZK Auth, 48 kalbas ir 285+ subjektų tipus. Įdiegimas nereikalingas.
#webapp