Privaatsus ja Tehnoloogia Sõnastik
Mõisted kõikide terminite, akronüümide ja kontseptide kohta, mida kasutatakse PII anonüümitamises ja andmete privaatsuses.
Tagasi dokumentidesse94 termi
2FA
Kahefaktoriline autentimine
Autentimine, mis nõuab kahte erinevat kontrollimisfaktorit: midagi, mida kasutaja teab (parool) ja midagi, mis kasutajal on (TOTP rakendus, riistvaravõti) või on (biomeetriline). Toetatud anonym.legal'is lisakihina ZK Auth'i kohal.
#twofaAdvokaadi ja kliendi privileeg
Advokaadi ja kliendi privileegi kaitse
Õiguslik kaitse konfidentsiaalsete suhtluste jaoks advokaatide ja klientide vahel. Dokumentide ülevaatamisel ja e-avastamisel tuleb privileegiga sisu tuvastada ja hoida tagasi või redigeerida. Anonym.legalis saab konfigureerida kohandatud subjekti tüüpe privileegiga sisu markerite märkimiseks.
#attorneyclientprivilegeAES-256-GCM
Täpne krüpteerimisstandard 256-bit Galois/Counter režiim
Autentimisega krüpteerimisalgoritm, mis ühendab AES-256 (256-bitine võti) Galois/Counter režiimiga nii konfidentsiaalsuse kui ka terviklikkuse tagamiseks. Kasutatakse anonym.legal'i pöörduvas anonüümimises asendatud üksuste krüpteerimiseks. Tagab nii saladuse kui ka manipuleerimise tuvastamise.
#aes256gcmAlam-redigeerimine
Alam-redigeerimine (Vale-negatiivsed)
Kõikide PII eemaldamata jätmine, jättes isikud jagatud dokumentidesse paljastatuks. Levinum vastavuse risk. Tekib kõrgete usaldusväärsuse künniste, puuduva subjekti tüüpide või uute PII formaatide tõttu. Leevendatakse anonym.legali hübriidtuvastuse ja kohandatud subjekti toe abil.
#underredactionAndmete Elukoht
Andmete Elukoha Nõuded
Õiguslikud või lepingulised nõuded, mis täpsustavad, millises geograafilises asukohas andmeid tuleb salvestada ja töödelda. Oluline GDPRi (andmete üleviimine väljaspool EEA), Saksamaa BDSG ja sektorispetsiifiliste regulatsioonide jaoks tervishoius ja rahanduses.
#dataresidencyAndmete Suveräänsus
Digitaalne Andmete Suveräänsus
Printsiip, et andmed kuuluvad riigi seadustele ja valitsemisstruktuuridele, kus need on kogutud. Laiem kui andmete elukoht, hõlmab see kontrolli selle üle, kes pääseb andmetele juurde ja millise õigusraamistiku alusel.
#datasovereigntyAnonymization
Andmete anonüümitamine
Irreversiivne protsess, mille käigus eemaldatakse või muudetakse tuvastavat teavet, et isikuid ei saaks enam tuvastada, otse või kaudselt. GDPR alusel langeb tõeliselt anonüümitud teave regulatsiooni ulatusest välja.
#anonymizationArgon2id
Argon2id võtme tuletamise funktsioon
2015. aasta parooli hashimise konkursi võitja. Argon2id ühendab Argon2i külgkanali vastupidavuse ja Argon2d GPU-vastupidavuse. Kasutatakse anonym.legal'is ja Desktop App'i seifis krüpteerimisvõtmete tuletamiseks kasutaja paroolifraasidest.
#argon2idAuditijälg
Muudetav auditijälg
Järjestikune, manipuleerimise tõenditega logi, mis registreerib, kes andmetele juurde pääses, muutis või töötles ja millal. Nõutav ISO 27001 (A.8.15), HIPAA turvareegel (§164.312(b)) ja e-avastamise reeglid. anonym.legal logib kõik anonüümimise toimingud koos ajatempleid, subjekti arvu ja operaatori ID-dega.
#audittrailBIP39
Bitcoin'i täiustamise ettepanek 39 — Mnemoonilised fraasid
Standard inimloetavate mnemooniliste seemnefraaside (12–24 sõna) genereerimiseks krüptograafilisest seemnest. Kasutatakse anonym.legal Desktop App'i seifis kasutajasõbraliku varundusena Argon2id tuletatud krüpteerimisvõtme jaoks.
#bip39CCPA
California Tarbijate Privaatsuse Seadus
California privaatsusseadus, mis annab elanikele õiguse teada, kustutada ja loobuda oma isikuandmete müügist. Kehtib ettevõtetele, mis vastavad tulude, andmemahtude või andmete müügi künnistele. Oluliselt muudeti CPRA poolt (vastu võetud novembris 2020, jõustub jaanuaris 2023).
#ccpaChrome'i laiendus
anonym.legal Chrome'i laiendus
Brauseri laiendus (Manifest V3), mis peatab teksti enne selle saatmist AI vestlusrobotitele (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonüümiseerib reaalajas ja valikuliselt dekrüpteerib AI vastuseid, kasutades salvestatud krüpteerimisvõtmeid.
#chromeextensionCLOUD Act
Selgitav Seadus Andmete Ülemeremaade Kasutamise Kohta
USA föderaalseadus (2018), mis lubab USA õiguskaitseorganitel sundida USA-s asuvaid pilveteenuse pakkujaid tootma andmeid, mis on salvestatud välismaal. Konfliktis GDPRi andmete üleviimise reeglitega ELi residentide jaoks. Andmete anonüümsus enne pilve üleslaadimist on levinud leevendus.
#cloudactCSP
Sisu turvapoliitika
HTTP vastuse päis ja meta sildi mehhanism, mis piirab, milliseid ressursse (skriptid, stiilid, pildid) brauser saab laadida. anonym.legal'i CSP sisaldab object-src 'none', script-src koos nonce'idega ja upgrade-insecure-requests, et vältida XSS rünnakuid.
#cspData Minimization
GDPR andmete minimeerimise põhimõte
GDPR artikli 5(1)(c) põhimõte, mis nõuab, et kogutakse ja töödeldakse ainult andmeid, mis on piisavad, asjakohased ja vajalikud määratud eesmärgi saavutamiseks. Privaatsusvastavuse süsteemide põhikujunduse piirang.
#dataminimizationDDoS kaitse
Jaotatud teenuse keelamise kaitse
Infrastruktuuri tasandi kaitsed jaotatud teenuse keelamise rünnakute vastu. Anonym.legali serveri infrastruktuur sisaldab tulemüürireegleid (UFW), nginx ühenduse piiranguid ja Cloudflare'i sarnaseid ülemisi kaitsemeetmeid, et säilitada kättesaadavust.
#ddosprotectionDe-anonymization
Uuesti tuvastamise rünnak
Protsess, mille käigus tuvastatakse isikud näiliselt anonüümitud andmestikest, ristviidates abiteabega. Peamine risk andmete jagamisel ebapiisava anonüümituse sügavuse korral.
#deanonymizationDifferential Privacy
Diferentsiaalne privaatsus (DP)
Matemaatiline raamistik statistilise teabe vabastamiseks andmestike kohta, pakkudes samas tõestatud garantiisid, et üksiku isiku andmeid ei saa eristada. Kasutatakse kogumianalüüsides, et vältida uuesti tuvastamist isegi kogumiväljundite päringute korral.
#differentialprivacyDigitaalsed identifikaatorid
Digitaalne identiteedi subjekti tüübid
Subjekti tüübid veebipõhiste ja digitaalsete identifikaatorite jaoks: E-POSTI_AADRESS, TELEFONINUMBER, IP_AADRESS (IPv4 ja IPv6), URL, DOMAANINIMI, KRÜPTOVALUUTA (Bitcoin/Ethereum aadressid) ja platvormispetsiifilised identifikaatorid.
#digitalidentifiersDLP
Andmekao Ennetamine
Turvalisuse distsipliin ja tarkvaratööriistade kategooria, mis tuvastab ja takistab volitamata tundlike andmete edastamist organisatsioonist väljapoole. anonym.legal toimib brauseri- ja AI-tasandi DLP lahendusena PII jaoks.
#dlpDPA
Andmete Töötlemise Lepingu
Õiguslikult siduv leping andmete kontrollija ja andmete töötleja vahel, nagu nõuab GDPR artikkel 28. Täpsustab teema, kestuse, olemuse, eesmärgi ja isikuandmete töötlemise tüübi, samuti mõlema osapoole õigused ja kohustused.
#dpaDPIA
Andmekaitse Mõjuhinnang
Riskihindamisprotsess, mida nõuab GDPR artikkel 35, et hinnata töötlemistegevusi, mis võivad põhjustada kõrgeid riske isikute õigustele ja vabadustele. Kohustuslik süsteemse profiilimise, suuremahulise PHI töötlemise ja avalike alade järelevalve jaoks.
#dpiae-Avastamine
Elektrooniline avastamine
Protsess, mille käigus tuvastatakse, kogutakse ja toodetakse elektrooniliselt salvestatud teavet õiguslikes menetlustes. Nõuab PII ja privileege sisaldava teabe redigeerimist toodetud dokumentidest. Peamine kasutusjuht õigusosakondade jaoks, kes kasutavad anonym.legal.
#ediscoveryE2EE
Lõpp-lõpuni krüpteerimine
Krüpteerimine, mille puhul saavad sõnumeid lugeda ainult suhtlevad osalised; teenusepakkujal ei ole juurdepääsu selgele tekstile. anonym.legal'i ZK Auth režiimis ei lahku krüpteerimisvõtmed kunagi kliendiseadmest, saavutades E2EE anonüümsete väljundite salvestamiseks.
#e2eeEeldefineeritud seadistused
Anonüümitamise eeldefineeritud seadistused
Salvestatud konfiguratsioonid valitud üksustüüpide, usaldusväärsuse lävendite ja väljundvalikute jaoks, mida saab rakendada ühe klikiga. Eeldefineeritud seadistused sünkroniseeritakse veebirakenduse, Office'i lisandi ja töölauarakenduse vahel krüpteeritud pilvesalvestuse kaudu.
#presetsEL andmete residentuur
Euroopa Liidu andmete residentuur
Garantii, et andmeid hoitakse ja töödeldakse ainult EL/ETA territooriumil. Anonym.legali tootmisserverid asuvad Saksamaal (Hetzner Frankfurt), tagades, et kogu töötlemine toimub GDPR jurisdiktsiooni all ilma piiriüleste andmete edastamise tagajärgedeta.
#eudataresidencyFinants-subjektid
Finants PII subjekti tüübid
Subjekti tüübid, mis katavad finantsidentifikaatorid: KREDIITKAART (Luhni kontrollsumma), IBAN_KOOD (ISO 13616 kontrollsumma), SWIFT_KOOD (BIC formaat), USA_PANGANUMBER, NRP (Hispaania maksutunnus). Tuvastatakse kontrollsummade valideerimisega valepositiivide minimeerimiseks.
#financialentitiesFOIA
Teabe Vabaduse Seadus
USA föderaalseadus (ja samaväärsed sätted teistes jurisdiktsioonides), mis annab avalikkusele juurdepääsu valitsuse dokumentidele. Nõuab PII ja muude eranditega teabe redigeerimist enne avalikustamist — peamine kasutusjuht juriidiliste ja valitsuse anonüümsusprotsesside jaoks.
#foiaGDPR
Üldine Andmekaitse Määrus
EL määrus 2016/679, peamine andmekaitse raamistik Euroopa Liidu jaoks. Kehtib iga organisatsiooni kohta, mis töötleb ELi residentide isikuandmeid. Trahvid kuni 20 miljonit eurot või 4% globaalsetest aastatuludest. Peamised õigused: juurdepääs, kustutamine, üleviimine, piiramine, vastuväide.
#gdprGDPR Artikkel 25
GDPR Artikkel 25 — Andmekaitse Kavandamise ja Vaikimisi Kohaldamise Printsiip
Nõuab, et kontrollijad rakendaksid sobivaid tehnilisi ja organisatsioonilisi meetmeid (nt pseudonüümitamine ja andmete minimeerimine) nii süsteemi kavandamise ajal kui ka töötlemise ajal vaikimisi.
#gdprarticle25GDPR Artikkel 32
GDPR Artikkel 32 — Töötlemise Turvalisus
Nõuab, et kontrollijad ja töötlejad rakendaksid sobivaid tehnilisi ja organisatsioonilisi meetmeid, et tagada riskidele vastav turvalisuse tase, sealhulgas krüpteerimine, pseudonüümitamine, konfidentsiaalsus, terviklikkus, kättesaadavus ja töötlemissüsteemide vastupidavus.
#gdprarticle32GenAI DLP
Generatiivne AI Andmekao Ennetamine
Spetsialiseeritud DLP kategooria, mis keskendub PII ja konfidentsiaalsete andmete vältimisele, et need ei satuks generatiivsete AI mudelite (ChatGPT, Claude, Gemini) käsudesse. anonym.legal'i Chrome'i laiendus ja MCP Server käsitlevad seda riski sisendi hetkel.
#genaidlpHashing
Krüptograafiline hashimine
Ühesuunaline andmete transformatsioon fikseeritud pikkusega kokkuvõtteks, kasutades algoritme nagu SHA-256. Kasutatakse järjepidevaks pseudonüümimiseks, dubleerimise vältimiseks ja terviklikkuse kontrollimiseks. Hash väärtusi ei saa tagasi pöörata, kuid need võivad olla haavatavad vikerkaare tabeli rünnakute suhtes, kui neid ei ole soolatud.
#hashingHetzner
Hetzner Online GmbH
Saksa pilve- ja hostimisteenuse pakkuja, kus anonym.legali tootmisinfrastruktuur töötab. Asub Falkensteinis, Saksimaal (andmekeskus fsn1) ISO 27001 sertifikaadiga. Valitud EL-i andmete residentuuri, vastavuse seisundi ja GDPR-sõbraliku jurisdiktsiooni tõttu Saksamaa seaduse alusel.
#hetznerHIPAA
Tervisekindlustuse Ülekandmise ja Vastutuse Seadus
USA föderaalseadus, mis kehtestab standardid tundlike patsientide terviseandmete kaitsmiseks. Privaatsuse reegel reguleerib PHI kasutamist; turvareegel nõuab halduslikke, füüsilisi ja tehnilisi kaitsemeetmeid elektrooniliste PHI (ePHI) jaoks. Rikkumiste korral on trahvid kuni 1,9 miljonit dollarit kategooria kohta aastas.
#hipaaHIPAA Safe Harbor
HIPAA Safe Harbor De-identification Method
Üks kahest HIPAA poolt heakskiidetud de-identifitseerimise meetodist, mis nõuab kõigi 18 määratletud patsiendi identifikaatori (nimi, aadress, kuupäevad, telefoninumbrid, isikukood, e-post, IP-aadress, biometrika jne) eemaldamist, et muuta terviseandmed mitte individuaalselt tuvastatavaks.
#hipaasafeharborHSTS
HTTP range transporti turvalisus
Veebi turvapoliitika mehhanism, mis sunnib brausereid kasutama ainult HTTPS-ühendusi. anonym.legal seadistab Strict-Transport-Security: max-age=31536000; includeSubDomains, et vältida protokolli alandamise rünnakuid ja küpsiste röövimist.
#hstsHübriidtuvastus
Hübriid NLP + Regex + ML Tuvastus
anonym.legal'i kolmekihiline lähenemine: regex mustrid struktureeritud PII jaoks (telefoninumbrid, IBAN-id, krediitkaardid), NLP/NER mudelid kontekstuaalsete üksuste jaoks (nimed, organisatsioonid, asukohad) ja ML klassifikaatorid ambivalentsete juhtumite jaoks. Vähendab nii valepositiivseid kui ka vale-negatiivseid tulemusi.
#hybriddetectionISO 27001
ISO/IEC 27001 Teabe Turvalisuse Halduse Standard
Rahvusvaheline standard teabe turvalisuse haldussüsteemide (ISMS) jaoks. Sertifitseerimine nõuab dokumenteeritud poliitikaid, riskihindamisi ja kontrollimeetmeid. anonym.legal'i ELi serverid on ISO 27001 sertifitseeritud, tagades struktureeritud turvalisuse juhtimise.
#iso27001ISO 27001 SoA
Rakendatavuse Deklaratsioon
Kohustuslik ISO 27001 dokument, mis loetleb kõik lisas A olevad kontrollid, näidates, millised on organisatsioonile kohaldatavad, ja andes põhjenduse kaasamiste ja välistamiste jaoks. Nõutav sertifitseerimiseks ja audititeks.
#iso27001soaJWT
JSON Web Token
Kompaktne, URL-ohutu tokeni formaat, mida kasutatakse väidete edastamiseks osaliste vahel. anonym.legal kasutab HS256 allkirjastatud JWT-sid sisemiste teenuste autentimiseks (nt frontend → Presidio API). Tokenid on lühiajalised ja valideeritakse serveripoolselt.
#jwtKaitstavus
Seaduslikult kaitstav anonüümimine
Võime tõestada reguleerivatele asutustele, kohtutele või audiitoritele, et anonüümimine viidi läbi dokumenteeritud, järjepideva ja tehniliselt usaldusväärse metoodika abil. Anonym.legali auditilogid, usaldusväärsuse skoorid ja operaatori seaded toetavad kaitstava anonüümimise töövooge.
#defensibilityKeele Tuvastus
Automaatne Keele Tuvastus
Sisendteksti keele automaatne tuvastamine enne PII analüüsi. anonym.legal tuvastab keele taotluse tasemel ja suunab sobivasse NER mudeli torustikku, inglise keelt varuvariantina mitte toetatud keelte jaoks.
#languagedetectionKEK
Võtme krüpteerimise võti
Võti, mida kasutatakse teiste võtmete krüpteerimiseks, mitte andmete otse. anonym.legal'i ZK arhitektuuris toimib kasutaja paroolifraasist tuletatud võti KEK-na, et kaitsta krüpteeritud seifis salvestatud dokumentide krüpteerimisvõtmeid.
#kekKiiruspiirang
API kiiruspiirang
Kontrollid API päringute arvu üle, mida klient saab teha ajavahemikus. Takistab kuritarvitamist ja tagab õiglast ressursijaotust. Anonym.legal rakendab kasutaja kaupa kiiruspiiranguid, lähtudes plaani tasemest, soovitatav on kasutada eksponentsiaalset tagasiviimist uuesti katsetamise loogika jaoks.
#ratelimitingKindlustuse identifikaatorid
Kindlustuse subjekti tüübid
Subjekti tüübid kindlustusega seotud identifikaatorite jaoks: USA_NPI (Rahvuslik teenuseosutaja identifikaator tervishoiuteenuse osutajate jaoks), TERVISHOIU_PLANEERIMISE_KASUTAJA ja riigispetsiifilised tervisekindlustuse numbrid (nt DE_TERVISE_KINDLUSTUSE_NUMBER).
#insuranceidentifiersKohandatud üksused
Kohandatud üksuse tuvastajad
Kasutaja määratud PII mustrid, mis on lisatud anonym.legal'i sisseehitatud 285+ üksustüübi peale. Toetab regex mustreid, sõnaliste loendeid ja keeldude loendeid. Kasulik organisatsiooni spetsiifiliste identifikaatorite, nagu töötaja ID-d, sisemised projektikoodid või patenteeritud tootenimed, jaoks.
#customentitiesKoodivahetus
Mitmekeelne Koodivahetus
Kaks või enam keelt segamine ühe teksti või vestluse sees. Levinud mitmekeelses dokumentatsioonis (nt Saksamaa õigusdokumentides ingliskeelsed tehnilised terminid). anonym.legal'i hibridtugevus käsitleb koodivahetatud teksti, rakendades mitmeid keelemudeleid samaaegselt.
#codeswitchingMasking
Andmete maskeerimine
Tundlike väärtuste asendamine realistlike, kuid väljamõeldud andmetega, mis säilitavad formaadi ja struktuuri. Kasutatakse testimiskeskkondades, analüüsides ja andmestike jagamisel ilma reaalse PII avalikustamiseta.
#maskingMCP
Mudeli Konteksti Protokoll
Ava-protokoll, mille on loonud Anthropic, võimaldades AI mudelitel suhelda väliste tööriistade ja andmeallikatega standardiseeritud viisil. anonym.legal rakendab MCP Server'i, et AI kodeerimistööriistad saaksid anonüümitamist kutsuda, lahkumata oma töövoost.
#mcpMCP Server
Mudeli Konteksti Protokolli Server
anonym.legal'i MCP Server'i integreerimine võimaldab AI kodeerimisassistentidel (Claude Desktop, Cursor, VS Code Copilot) kutsuda anonüümitamise API-d otse tööriistana. PII eemaldatakse koodist, käsudest ja kontekstist enne saatmist AI mudelile.
#mcpserverML Mudelid
Masinõppe Mudelid PII Tuvastamiseks
Statistilised mudelid, mis on koolitatud märgistatud tekstikorpuste peal, et tuvastada PII kontekstis. anonym.legal kasutab nii spaCy muunduriputke kui ka täiendatud XLM-RoBERTa mitmekeelse nimeüksuste tuvastamiseks tootmismahust.
#mlmodelsNER
Nimeüksuste Tuvastus
Loodusliku keele töötlemise ülesanne, mis tuvastab ja klassifitseerib nimeüksused tekstis eelnevalt määratletud kategooriatesse, nagu isikud, organisatsioonid, asukohad, kuupäevad ja meditsiinilised identifikaatorid. PII tuvastamise peamine ML tehnika anonym.legal'is.
#nerNIS2
Võrgu- ja Teabe Turvalisuse Direktiiv 2
EL direktiiv 2022/2555, mis laiendab algset NIS direktiivi, et katta rohkem sektoreid (tervishoid, energia, transport, digitaalne infrastruktuur) ja tugevdada küberjulgeoleku nõudeid. Üleviimise tähtaeg oli 17. oktoober 2024; enamik ELi liikmesriike ei täitnud seda ja Euroopa Komisjon avas rikkumismenetlused mitte-nõuetele vastavate riikide vastu.
#nis2NLP
Loodusliku Keelte Töötlus
Tehisintellekti haru, mis tegeleb arvutite ja inimkeele vahelise suhtlusega. PII tuvastamises mõistavad NLP mudelid konteksti, grammatikat ja semantikat, et tuvastada üksusi, mida ainult regex mustrid ei suuda tuvastada.
#nlpNullteadmised
Nullteadmiste arhitektuur
Süsteemidisain, kus teenusepakkujal ei ole juurdepääsu kasutajate selgete andmete või krüpteerimisvõtmete juurde. Kõik krüpteerimine/dekrüpteerimine toimub kliendi poolel; server ei näe kunagi originaalset sisu. Takistab siseseid ohte ja sundavaldusi.
#zeroknowledgeOffice'i lisand
anonym.legal Microsoft Office'i lisand
Microsoft Office'i laiendus, mis integreerib PII anonüümitamise otse Wordi, Exceli ja PowerPointi. Toetab dokumendi siseselt redigeerimist, eeldefineeritud seadistuste haldamist, ZK Auth'i ja seadmete vahelise sünkroniseerimise. Saadaval Microsoft AppSource'is.
#officeaddinOperaatorid
Anonüümitamise operaatorid
Asendustrateegia, mida rakendatakse tuvastatud PII suhtes. anonym.legal toetab REPLACE (kohthoidja tekst), REDACT (tühi string), MASK (tähed), HASH (SHA-256 kokkuvõte), ENCRYPT (tagasivõetav AES-256-GCM) ja CUSTOM (kasutaja määratud asendus).
#operatorsPartii töötlemine
Partii faili anonüümitamine
Mitme faili töötlemine samaaegselt ühes operatsioonis. anonym.legal'i partii režiim toetab PDF, DOCX ja TXT faile koos failipõhise üksuse seadistamise, usaldusväärsuse lävendite ja väljundiformaadi valikuga.
#batchprocessingPCI DSS
Maksekarditööstuse Andmete Turvalisuse Standard
Turvastandard organisatsioonidele, mis käsitlevad maksekardiga seotud andmeid, mida haldab PCI Turvastandardite Nõukogu. Nõuab krüpteerimist, juurdepääsukontrolle, logimist ja regulaarset testimist. Nõuetele mittevastamine võib kaasa tuua trahve ja kaotada kaarditöötluse õigused.
#pcidssPHI
Kaitstud terviseinfo
Iga tervisega seotud teave, mis on seotud tuvastatava isikuga, reguleeritud HIPAA alusel Ameerika Ühendriikides. Sisaldab diagnoose, ravikirjeid, kindlustusandmeid ja kõiki 18 HIPAA Safe Harbor identifikaatorit.
#phiPII
Isiku tuvastatav teave
Iga andmed, mis võivad tuvastada konkreetse isiku otse või koos teiste andmetega. Näited: nimed, e-posti aadressid, sotsiaalkindlustuse numbrid, IP-aadressid, biomeetrilised andmed.
#piiPildi redigeerija
Presidio pildi redigeerija teenus
Spetsialiseeritud tagaplaani teenus (port 8013), mis tuvastab ja redigeerib PII pildifailidest (PNG, JPEG) kasutades OCR ja Presidio analüüsi. Rakendab musta riba redigeerimist tuvastatud PII piirkondadele originaalpildil.
#presidioimageredactorPresidio
Microsoft Presidio
Microsofti avatud lähtekoodiga andmekaitse ja anonüümituse SDK. anonym.legal'i tuvastusmootor põhineb Presidio analüsaatoril ja anonüümiseerimisteenustel, laiendatud 285+ kohandatud nimeüksuste tuvastajaga 48 keeles.
#presidioPresidio analüsaator
Microsoft Presidio analüsaatori teenus
Anonym.legali tagaplaani tuvastuskomponent (port 8011). Võtab vastu teksti ja tagastab tuvastatud PII subjekti loendi koos nende positsioonide, tüüpide ja usaldusväärsuse skooridega. Laiendatud 285+ kohandatud tuvastajaga 48 keeles.
#presidioanalyzerPresidio anonüümija
Microsoft Presidio anonüümija teenus
Anonym.legali tagaplaani transformatsioonikomponent (port 8012). Võtab sisendiks teksti ja analüsaatori tulemused, rakendab valitud operaatorit (ASENDAMINE, REDIGEERIMINE, MASKEERIMINE, HASH, KRÜPTIMINE) igale tuvastatud subjektile ja tagastab anonüümse teksti.
#presidioanonymizerPrivacy by Design
Privaatsus disainis ja vaikimisi
Põhimõte, mille kohaselt GDPR artikli 25 alusel on andmekaitse meetmed süsteemidesse sisse ehitatud alates algusest, mitte lisatud hiljem. Hõlmab andmete minimeerimist, juurdepääsukontrolle, krüpteerimist ja pseudonüümimist arhitektuuri tasandil.
#privacybydesignPseudonymization
Andmete pseudonüümimine
Otseste identifikaatorite asendamine kunstlike väärtustega (pseudonüümid), säilitades samas võimaluse isikute uuesti tuvastamiseks eraldi võtme abil. GDPR artikli 4(5) kohaselt tunnustatakse seda privaatsust parandava tehnikana, kuid see ei vabasta pseudonüümitud andmeid regulatsioonist.
#pseudonymizationRahakott
Krüpteerimisvõtme rahakott
Turvaline kohalik salvestus krüpteerimisvõtmete jaoks töölauarakenduses, kaitstud Argon2id võtme tuletamise abil peamise paroolifraasi põhjal. Võtmed salvestatakse krüpteerituna, kasutades AES-256-GCM ja varundatakse BIP39 mnemooniliste fraaside kaudu.
#vaultRedaction
Andmete redigeerimine
Tundlike andmete püsiv eemaldamine või varjamine dokumentidest, asendades selle visuaalse märgiga, nagu [REDACTED] või must riba. Erinevalt krüpteerimisest on redigeerimine ühesuunaline ja algset andmeid ei saa taastada.
#redactionReegel 26
USA föderaalsed tsiviilmenetluse reeglid, reegel 26
USA tsiviilmenetluse reegel, mis reguleerib avastamise kohustusi. Reegel 26(g) nõuab, et advokaadid kinnitaksid, et avastamisnõuded ja -avalikustamised ei ole tehtud ebaausatel eesmärkidel - sealhulgas PII nõuetekohase redigeerimise eiramine toodetud dokumentidest.
#rule26Regex
Regulaarne Väljend Mustri Sobitamine
Mustri põhine tekstisobitamine, kasutades formaalse keele süntaksit. PII tuvastamises tegeleb regex struktuurselt ettearvatavate identifikaatoritega (telefoninumbrid, krediitkaardid, IBAN-id, e-posti aadressid) koos kontrollsummade valideerimisega. Täiendavad NER-i hibridtugevuse jaoks.
#regexREST API
RESTful API
anonym.legal pakub RESTful HTTP API-d programmiliseks integreerimiseks. Lõpp-punktid hõlmavad /api/analyze, /api/anonymize, /api/image ja /api/structured. Autentimine toimub JWT kandjatokenite kaudu. Täielik OpenAPI dokumentatsioon on saadaval API viites.
#restapiSCCs
Standardsete Lepinguliste Klauslid
Eelnevalt heakskiidetud GDPRi nõuetele vastavad lepingulised klauslid isikuandmete üleviimiseks EList/EEA-st kolmandatesse riikidesse. Euroopa Komisjon uuendas neid 2021. aastal (2021/914/EU), et käsitleda Schrems II nõudeid, sealhulgas Üleviimise Mõjuhinnangut.
#sccsSchrems II
Schrems II Otsus (C-311/18)
2020. aasta Euroopa Liidu Kohtu otsus, millega tunnistati kehtetuks ELi ja USA Privaatsuse Kaitsja raamistik transatlantiliste andmete üleviimiseks, viidates USA jälgimisseaduse kaitse puudulikkusele. Nõuab täiendavaid meetmeid (krüpteerimine, anonüümsus) standardsete lepinguliste klauslite kasutamisel.
#schremsiiSHA-256
Turvaline hash algoritm 256-bitine
Krüptograafiline hash-funktsioon, mis toodab 256-bitise kokkuvõtte. Kasutatakse anonym.legal'is HMAC autentimiseks API päringutes, ZK autentimise tõendites ja järjepideva üksuste pseudonüümimise jaoks (hashimine soolaga toodab sama asendust sama originaalväärtuse jaoks).
#sha256spaCy
spaCy NLP Raamatukogu
Tööstuslikul tasemel avatud lähtekoodiga NLP raamatukogu Pythonis. anonym.legal kasutab spaCy muunduripõhiseid mudeleid 24 keeles (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko ja rohkem) nimeüksuste tuvastamiseks Presidio torustikus.
#spacySpoliatsioon
Tõendite spoliatsioon
Tõendite hävitamine, muutmine või säilitamise eiramine, mis on seotud kohtuvaidlusega. Üksikasjalik redigeerimine, mis muudab dokumendid loetamatuks, võib tähendada spoliatsiooni. Anonüümimise täpsuse kalibreerimine (usaldusväärsuse künnised, subjekti valik) on oluline seaduslikult kaitstava redigeerimise jaoks.
#spoliationStanza
Stanza NLP Raamatukogu (Stanford NLP)
Stanfordi NLP Grupi Python NLP tööriistakomplekt, mis toetab 70+ keelt tipptasemel närvivõrkude mudelitega. Kasutatakse täiendava NER-i tagaplaanina anonym.legal'is keeltes, mida spaCy mudelid ei kata.
#stanzaSubjekti tüüp
PII subjekti tüüp
Isikliku teabe kategooria, mida tuvastamisengine tunnustab ja suudab anonüümseks muuta. Näited: ISIK, E-POSTI_AADRESS, TELEFONINUMBER, KREDIITKAART, IBAN_KOOD, USA_SSN, IP_AADRESS. anonym.legal toetab 285+ subjekti tüüpi 48 keeles.
#entitytypeSõiduki identifikaatorid
Sõiduki subjekti tüübid
Subjekti tüübid sõidukiga seotud identifikaatorite jaoks: USA_JUHI_LITSENTS, ÜK_JUHI_LITSENTS, EL_JUHI_LITSENTS, VIN (Sõiduki identifitseerimisnumber) ja riigispetsiifilised sõiduki registreerimisnumbrite formaadid.
#vehicleidentifiersZK Auth
Nullteadmiste autentimine
anonym.legal'i autentimissüsteem, kus krüpteerimisvõtmed tuletatakse kliendi poolel kasutaja paroolifraasist, kasutades Argon2id, kunagi ei edastata ega salvestata serverisse. Server salvestab ainult krüptograafilise tõendi, mitte võtit ega paroolifraasi.
#zkauthTervishoiu subjektid
Tervishoiu PII subjekti tüübid
Subjekti tüübid 18 HIPAA Safe Harbor identifikaatori ja täiendava tervisega seotud PII jaoks: USA_MRN (meditsiinilised rekordinumbrid), MEDITSIINI_LITSENTS, TERVISHOIU_PLANEERIMISE_KASUTAJA, ja diagnoosi/ravi konteksti subjektid.
#healthcareentitiesTLS
Transport Layer Security
Krüptograafiline protokoll, mis kaitseb andmeid edastamise ajal. anonym.legal rakendab TLS 1.2 minimaalset nõuet, eelistades TLS 1.3, HSTS maksimaalse vanuse 1 aasta ja HTTP/2. Kõik liiklus klientide ja serveri vahel on edastamise ajal krüpteeritud.
#tlsTokeni süsteem
anonym.legal Krediidi Tokeni Süsteem
Kasutuspõhine arveldamine, kus API kõned tarbivad tokeneid, mis arvutatakse tekstipikkuse, üksuste arvu ja töötlemise režiimi (analüüs vs. anonüümitamine) põhjal. Tokeni kulud on konfigureeritavad andmebaasis ja kuvatakse reaalajas enne töötlemist.
#tokensystemTokenization
Andmete tokeniseerimine
Tundlike andmete asendamine mitte-tundliku kohatäitjaga (token), mis seondub originaaliga turvalises seifis. Erinevalt krüpteerimisest ei ole tokenil endal matemaatilist seost originaalandmetega.
#tokenizationTöölauarakendus
anonym.legal Töölauarakendus
Platvormidevaheline rakendus (Windows, macOS, Linux), mis on loodud Tauri 2.0 ja React 18 abil. Omab kohaliku faili töötlemise, BIP39 rahakoti offline ZK Auth'i, partiiexportimise ja API sünkroniseerimise funktsioone. Toetab õhku eraldatud paigaldusi ilma internetiühenduseta.
#desktopappUniversaalsed subjektid
Keele-Universaalsed subjekti tüübid
Subjekti tüübid, mida tuvastatakse sõltumata tekstikeelest, tavaliselt formaadi põhise regex'i ja kontrollsummade valideerimise kaudu. Näited: KREDIITKAART, IBAN_KOOD, E-POSTI_AADRESS, TELEFONINUMBER, IP_AADRESS, URL, KRÜPTOVALUUTA aadress.
#universalentitiesUsaldusväärsuse Hinnang
Üksuse Tuvastamise Usaldusväärsuse Hinnang
0–1 skoor, mis näitab, kui kindel on tuvastusmudel, et tekstiosa on PII üksus. anonym.legal pakub konfigureeritavaid usaldusväärsuse läve, et kasutajad saaksid kohandada täpsuse ja tagasikutsumise tasakaalu oma konkreetse kasutusjuhtumi jaoks.
#confidencescoringValitsuse ID
Valitsuse identifikaatori subjekti tüübid
Subjekti tüübid riiklike ja valitsuse välja antud identifikaatorite jaoks: USA_SSN, USA_PASS, ÜK_NHS, ES_NIF, DE_ISIKUTUNNISTUS, FR_INSEE, IT_MAKSU_KOOD ja 50+ muud riigispetsiifilised ID formaadid. Tuvastatakse riigispetsiifiliste regex'i + kontrollsummade mustrite abil.
#governmentidVeebirakendus
anonym.legal Veebirakendus
Brauseripõhine liides anonym.legal'is PII analüüsimiseks, anonüümitamiseks ja dekrüpteerimiseks. Toetab tekstisisestust, failide üleslaadimist (PDF, DOCX, TXT), partiitöötlust, ZK Auth, 48 keelt ja 285+ üksustüüpi. Paigaldamist ei ole vaja.
#webappÜksikasjalik redigeerimine
Üksikasjalik redigeerimine (Valepositiivsed)
Liigne teabe eemaldamine, vähendades dokumendi kasutusvõimet ja potentsiaalselt tähendades spoliatsiooni õiguslikes menetlustes. Tekib madalate usaldusväärsuse künniste või liiga laia subjekti valiku tõttu. Reguleeritav anonym.legali künniste ja subjekti kontrollide kaudu.
#overredactionXChaCha20
XChaCha20-Poly1305
Autentimisega krüpteerimisalgoritm, mis pakub kõrget jõudlust süsteemides, kus ei ole AES riistvarakiirendust. Kasutab 192-bitist nonce'i (pikendatud IETF ChaCha20 standardi 96-bitise nonce'i põhjal vastavalt RFC 8439), elimineerides nonce-kokkupõrke riskid. Kasutatakse alternatiivse šifrina anonym.legal'i krüpteerimiskihis.
#xchacha20XLM-RoBERTa
Ristkeelne RoBERTa
Mitmekeelne muundurite keelemudel, mis on koolitatud 100 keele peal, arendatud Meta AI poolt. Kasutatakse anonym.legal'is ristkeelsete NER-i ülesannete jaoks, eriti üksusetüüpide ja keelte puhul, kus monolingvaalsed mudelid ei ole saadaval.
#xlmroberta