Tietosuoja & Teknologia Sanasto
Määritelmät kaikille termeille, lyhenteille ja käsitteille, joita käytetään PII-anonymisoinnissa ja tietosuojassa.
Takaisin asiakirjoihin94 termiä
2
2FA
Kaksivaiheinen autentikointi
Autentikointi, joka vaatii kaksi erillistä vahvistustekijää: jotain, mitä käyttäjä tietää (salasana) ja jotain, mitä käyttäjä omistaa (TOTP-sovellus, laitteistoväline) tai on (biometrinen). Tuettu anonym.legalissa lisäkerroksena ZK Authin päällä.
#twofaA
AES-256-GCM
Edistynyt salausstandardi 256-bittinen Galois/Counter-tila
Autentikoitu salausalgoritmi, joka yhdistää AES-256 (256-bittinen avain) Galois/Counter-tilaan sekä luottamuksellisuuden että eheyden takaamiseksi. Käytetään anonym.legalin käännettävässä anonymisoinnissa korvattujen entiteettien salaamiseen. Tarjoaa sekä salaisuuden että manipulointitunnistuksen.
#aes256gcmAjoneuvotunnistajat
Ajoneuvon Yksikkötyypit
Yksikkötyypit ajoneuvoihin liittyville tunnistajille: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Ajoneuvon Tunnistusnumero), ja maakohtaiset ajoneuvon rekisterikilpimuodot.
#vehicleidentifiersAlipoisto
Alipoisto (Väärät Negatiiviset)
Kaikkien PII:n poistamisen epäonnistuminen, mikä jättää yksilöt alttiiksi jaettavissa asiakirjoissa. Yleisempää vaatimustenmukaisuuden riskiä. Aiheutuu korkeista luottamuskynnyksistä, puuttuvista yksikkötyypeistä tai uusista PII-muodoista. Vähennetään anonym.legalin hybriditunnistuksen ja mukautettujen yksikkötukien avulla.
#underredactionAnonymisointi
Tietojen anonymisointi
Irreversiivinen prosessi, jossa poistetaan tai muutetaan tunnistettavia tietoja siten, että henkilöitä ei voida enää tunnistaa suoraan tai epäsuorasti. GDPR:n mukaan täysin anonymisoidut tiedot eivät kuulu säädöksen piiriin.
#anonymizationArgon2id
Argon2id-avaimen johdantofunktio
Vuoden 2015 salasanasalauskilpailun voittaja. Argon2id yhdistää Argon2i:n sivukanavien vastustuskyvyn ja Argon2d:n GPU-vastustuskyvyn. Käytetään anonym.legalissa ja työpöytäsovelluksen holvissa salausavainten johdattamiseen käyttäjän salasanoista.
#argon2idArkisto
Salausavainten arkisto
Turvallinen paikallinen tallennus salausavaimille työpöytäsovelluksessa, suojattu Argon2id-avaimen johdannaisella pääsalasanasta. Avaimet tallennetaan salattuina käyttäen AES-256-GCM:ää ja varmuuskopioidaan BIP39-muistilauseilla.
#vaultAsianajaja-asiakas Etuoikeus
Asianajaja-asiakas Etuoikeuden Suoja
Oikeudellinen suoja luottamuksellisille viestinnöille asianajajien ja asiakkaiden välillä. Asiakirjojen tarkastuksessa ja e-löydössä etuoikeutettu sisältö on tunnistettava ja pidettävä eristyksissä tai poistettava. Mukautettuja yksikkötyyppejä anonym.legalissa voidaan konfiguroida merkitsemään etuoikeutettuja sisältömerkkejä.
#attorneyclientprivilegeAudit Trail
Muuttumaton Audit Trail
Peräkkäinen, muokkauskestävä loki, joka tallentaa kuka on päässyt käsiksi, muuttanut tai käsitellyt tietoja ja milloin. Vaaditaan ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)), ja e-löytö sääntöjä. anonym.legal kirjaa kaikki anonymisointitoiminnot aikaleimoilla, yksikkömäärillä ja operaattori-ID:illä.
#audittrailB
BIP39
Bitcoin-parannusehdotus 39 — Mnemoniset lauseet
Standardi, joka tuottaa ihmisten luettavissa olevia mnemonisia siemenlauseita (12–24 sanaa) kryptografisesta siemenestä. Käytetään anonym.legalin työpöytäsovelluksen holvissa käyttäjäystävällisen varmuuskopiona Argon2id-johdetulle salausavaimelle.
#bip39C
CCPA
Kalifornian kuluttajatietosuojalaki
Kalifornian tietosuojalaki, joka myöntää asukkaille oikeuden tietää, poistaa ja kieltäytyä henkilökohtaisten tietojensa myynnistä. Koskee liiketoimintoja, jotka täyttävät liikevaihto-, tietomäärä- tai tietomyyntikynnykset. Merkittävästi muutettu CPRA:n toimesta (hyväksytty marraskuussa 2020, voimaan tammikuussa 2023).
#ccpaChrome-laajennus
anonym.legal Chrome-laajennus
Selaimen laajennus (Manifest V3), joka keskeyttää tekstin ennen sen lähettämistä AI-chatboteille (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymisoi lennossa ja purkaa valinnaisesti AI-vastauksia tallennettujen salausavainten avulla.
#chromeextensionCLOUD Act
Selventävä laki tietojen laillisesta ulkomaisesta käytöstä
Yhdysvaltojen liittovaltion laki (2018), joka sallii Yhdysvaltojen lainvalvojille pakottaa Yhdysvalloissa toimivia pilvipalveluntarjoajia tuottamaan ulkomailla säilytettyjä tietoja. Konflikti GDPR:n tietosiirtosääntöjen kanssa EU:n asukkaille. Tietojen anonymisointi ennen pilveen lataamista on yleinen lieventämistoimenpide.
#cloudactCSP
Sisältöturvapolitiikka
HTTP-vastauspään ja meta-tagin mekanismi, joka rajoittaa, mitä resursseja (skriptit, tyylit, kuvat) selain voi ladata. anonym.legalin CSP sisältää object-src 'none', script-src nonceilla ja upgrade-insecure-requests estääkseen XSS-hyökkäykset.
#cspD
DDoS Suojaus
Jakautunut Palvelunestohyökkäyksiltä Suojaus
Infrastruktuuritason puolustukset jakautuneita palvelunestohyökkäyksiä vastaan. anonym.legalin palvelininfrastruktuuri sisältää palomuurisäännöt (UFW), nginx-yhteysrajoitukset ja Cloudflare-tyyppiset ylävirran suojat saatavuuden ylläpitämiseksi.
#ddosprotectionDe-anonymisointi
Uudelleen tunnistaminen
Prosessi, jossa tunnistetaan henkilöitä oletettavasti anonymisoiduista tietojoukoista viittaamalla aputietoihin. Keskeinen riski tietojen jakamisessa riittämättömän anonymisoinnin syvyyden vuoksi.
#deanonymizationDifferentiaalinen yksityisyys
Differentiaalinen yksityisyys (DP)
Matemaattinen kehys, jonka avulla voidaan julkaista tilastotietoja tietojoukoista samalla, kun tarjotaan todistettavia takeita siitä, että kenenkään henkilötietoja ei voida erottaa. Käytetään aggregaatti-analytiikassa estämään uudelleen tunnistaminen, jopa kun kysytään aggregaattiulostuloja.
#differentialprivacyDigitaaliset Tunnistajat
Digitaalisen Identiteetin Yksikkötyypit
Yksikkötyypit verkkopohjaisille ja digitaalisten tunnistajille: SÄHKÖPOSTIOSOITE, PUHELINNUMERO, IP_OSOITE (IPv4 ja IPv6), URL, DOMAIN_NIMI, KRYPTO (Bitcoin/Ethereum-osoitteet), ja alustakohtaiset tunnistajat.
#digitalidentifiersDLP
Tietovuotojen estäminen
Turvallisuusala ja ohjelmistotyökalujen kategoria, joka havaitsee ja estää valtuuttamattoman herkän tiedon siirron organisaation ulkopuolelle. anonym.legal toimii selaintason ja AI-tason DLP-ratkaisuna PII:lle.
#dlpDPA
Henkilötietojen käsittelysopimus
Laillisesti sitova sopimus tietojen valvojien ja käsittelijöiden välillä, joka vaaditaan GDPR:n artiklan 28 mukaan. Määrittelee käsittelyn kohteen, keston, luonteen, tarkoituksen ja henkilötietojen käsittelyn tyypin sekä molempien osapuolten oikeudet ja velvollisuudet.
#dpaDPIA
Tietosuojavaikutusten arviointi
Riskinarviointiprosessi, joka vaaditaan GDPR:n artiklan 35 mukaan käsittelytoimille, joilla on todennäköisesti korkea riski yksilöiden oikeuksille ja vapauksille. Pakollinen järjestelmälliselle profiloinnille, laajamittaiselle PHI:n käsittelylle ja julkisten alueiden valvonnalle.
#dpiaE
e-Löytö
Sähköinen Löytö
Prosessi, jossa tunnistetaan, kerätään ja tuotetaan sähköisesti tallennettua tietoa oikeudenkäynneissä. Vaatii PII:n ja etuoikeutettujen tietojen poistamista tuotetuista asiakirjoista. Pääasiallinen käyttötapaus oikeudellisille osastoille, jotka käyttävät anonym.legalia.
#ediscoveryE2EE
Päästä päähän -salaus
Salaus, jossa vain viestintäosapuolet voivat lukea viestit; palveluntarjoajalla ei ole pääsyä selkokielisiin tietoihin. anonym.legalin ZK Auth -tilassa salausavaimet eivät koskaan jätä asiakaslaitetta, saavuttaen E2EE anonymisoidun tulostuksen tallentamiseksi.
#e2eeEräkäsittely
Erätiedostojen anonymisointi
Useiden tiedostojen käsittely samanaikaisesti yhdessä toiminnossa. anonym.legalin erätila tukee PDF-, DOCX- ja TXT-tiedostoja, joissa on tiedostokohtainen entiteettikonfiguraatio, luottamuskynnykset ja tulostusmuodon valinta.
#batchprocessingEsiasetukset
Anonymisointiesiasetukset
Tallennetut konfiguraatiot valituista entiteettityypeistä, luottamuskynnyksistä ja tulostusvaihtoehdoista, joita voidaan soveltaa yhdellä napsautuksella. Esiasetukset synkronoidaan verkkosovelluksen, Office-lisäosan ja työpöytäsovelluksen välillä salatulla pilvitallennuksella.
#presetsEU Tietoresidenssi
Euroopan Unionin Tietoresidenssi
Takuu siitä, että tiedot tallennetaan ja käsitellään yksinomaan EU/ETA-alueella. anonym.legalin tuotantopalvelimet sijaitsevat Saksassa (Hetzner Frankfurt), varmistaen, että kaikki käsittely tapahtuu GDPR:n lainkäyttövallassa ilman rajat ylittäviä tietosiirtoja.
#eudataresidencyF
FOIA
Tietojen vapauttamislaki
Yhdysvaltojen liittovaltion laki (ja vastaavat säädökset muissa lainkäyttöalueissa), joka myöntää julkisen pääsyn hallituksen asiakirjoihin. Edellyttää PII:n ja muiden salassa pidettävien tietojen poistamista ennen julkistamista — ensisijainen käyttötapa oikeudellisille ja hallinnollisille anonymisointityönkulkuille.
#foiaG
GDPR
Yleinen tietosuoja-asetus
EU:n asetus 2016/679, joka on Euroopan unionin ensisijainen tietosuojakehys. Koskee kaikkia organisaatioita, jotka käsittelevät EU:n asukkaiden henkilötietoja. Sakot jopa 20 miljoonaa euroa tai 4 % maailmanlaajuisesta vuotuisesta liikevaihdosta. Keskeiset oikeudet: pääsy, poistaminen, siirrettävyys, rajoittaminen, vastustaminen.
#gdprGDPR Artikla 25
GDPR Artikla 25 — Tietosuoja suunnittelussa ja oletusarvoisesti
Edellyttää valvojilta, että he toteuttavat asianmukaisia teknisiä ja organisatorisia toimenpiteitä (kuten pseudonymisointi ja tietojen minimointi) sekä järjestelmän suunnittelun aikana että oletusarvoisesti käsittelyn aikana.
#gdprarticle25GDPR Artikla 32
GDPR Artikla 32 — Käsittelyn turvallisuus
Edellyttää valvojilta ja käsittelijöiltä, että he toteuttavat asianmukaisia teknisiä ja organisatorisia toimenpiteitä varmistaakseen riskin mukaisen turvallisuustason, mukaan lukien salaus, pseudonymisointi, luottamuksellisuus, eheys, saatavuus ja käsittelyjärjestelmien kestävyys.
#gdprarticle32GenAI DLP
Generatiivinen AI -tietovuotojen estäminen
Erityinen DLP-kategoria, joka keskittyy estämään PII:n ja luottamuksellisten tietojen sisällyttämisen kehotteisiin, joita lähetetään generatiivisille AI-malleille (ChatGPT, Claude, Gemini). anonym.legalin Chrome-laajennus ja MCP-palvelin käsittelevät tätä riskiä syöttöpisteessä.
#genaidlpH
Hashaus
Kryptografinen hash
Yksisuuntainen muunnos tiedoista kiinteän pituiseksi tiivisteeksi käyttäen algoritmeja, kuten SHA-256. Käytetään johdonmukaiseen pseudonymisointiin, deduplikaatioon ja eheyden varmistamiseen. Hash-arvoja ei voi kääntää, mutta ne voivat olla alttiita sateenkaarihyökkäyksille, jos niitä ei ole suolattu.
#hashingHetzner
Hetzner Online GmbH
Saksalainen pilvi- ja hosting-palveluntarjoaja, jossa anonym.legalin tuotanto-infrastruktuuri toimii. Sijaitsee Falkensteinissa, Saksassa (datakeskus fsn1) ja sillä on ISO 27001 -sertifikaatti. Valittu EU:n tietoresidenssin, vaatimustenmukaisuuden ja GDPR-ystävällisen lainkäyttövallan vuoksi.
#hetznerHIPAA
Terveydenhuollon tietosuoja- ja vastuulaki
Yhdysvaltojen liittovaltion laki, joka asettaa standardit potilaiden terveystietojen suojaamiselle. Tietosuojalaki säätelee PHI:n käyttöä; turvallisuuslaki vaatii hallinnollisia, fyysisiä ja teknisiä suojatoimia sähköisille PHI:lle (ePHI). Rikkomuksista voi seurata sakkoja jopa 1,9 miljoonaa dollaria vuodessa per kategoria.
#hipaaHIPAA Safe Harbor
HIPAA Safe Harbor -de-identifiointimenetelmä
Yksi kahdesta HIPAA:n hyväksymästä de-identifiointimenetelmästä, joka vaatii kaikkien 18 määritellyn potilastunnisteen (nimi, osoite, päivämäärät, puhelinnumerot, sosiaaliturvatunnus, sähköposti, IP-osoite, biometriset tiedot jne.) poistamista, jotta terveystiedot eivät ole yksilöitävissä.
#hipaasafeharborHSTS
HTTP Tiukka Siirtoturvallisuus
Verkkoturvapolitiikan mekanismi, joka pakottaa selaimet käyttämään vain HTTPS-yhteyksiä. anonym.legal asettaa Strict-Transport-Security: max-age=31536000; includeSubDomains estääkseen protokollan heikentämisyritykset ja evästeiden kaappaamisen.
#hstsHybriditunnistus
Hybridinen NLP + Regex + ML Tunnistus
anonym.legalin kolmitasoinen lähestymistapa: regex-mallit rakenteelliselle PII:lle (puhelinnumerot, IBANit, luottokortit), NLP/NER-mallit kontekstuaalisille entiteeteille (nimet, organisaatiot, sijainnit) ja ML-luokittajat epäselville tapauksille. Vähentää sekä vääriä positiivisia että vääriä negatiivisia tuloksia.
#hybriddetectionI
ISO 27001
ISO/IEC 27001 Tietoturvallisuuden hallinta
Kansainvälinen standardi tietoturvallisuuden hallintajärjestelmille (ISMS). Sertifiointi edellyttää asiakirjoitettuja käytäntöjä, riskinarviointeja ja kontrollitoimia. anonym.legalin EU:n palvelimet ovat ISO 27001 -sertifioituja, mikä varmistaa rakenteellisen tietoturvavalvonnan.
#iso27001ISO 27001 SoA
Soveltuvuusilmoitus
Pakollinen ISO 27001 -asiakirja, joka luettelee kaikki liitteen A kontrollit, osoittaen, mitkä ovat sovellettavissa organisaatioon, ja antamalla perustelut sisällyttämiselle ja poissulkemiselle. Vaaditaan sertifiointia ja tarkastuksia varten.
#iso27001soaJ
JWT
JSON Web Token
Kompakti, URL-turvallinen token-muoto, jota käytetään väitteiden siirtämiseen osapuolten välillä. anonym.legal käyttää HS256:lla allekirjoitettuja JWT:itä sisäiseen palvelimelta palvelimelle autentikointiin (esim. etupään → Presidio API). Tokenit ovat lyhytaikaisia ja validoidaan palvelinpuolella.
#jwtK
KEK
Avaimen salaava avain
Avain, jota käytetään muiden avainten salaamiseen sen sijaan, että salattaisiin suoraan tietoja. anonym.legalin ZK-arkkitehtuurissa käyttäjän salasanasta johdettu avain toimii KEK:na suojaten asiakirjakohtaisia salausavaimia, jotka on tallennettu salattuun holviin.
#kekKielentunnistus
Automaattinen Kielentunnistus
Syöte tekstin kielen automaattinen tunnistaminen ennen PII-analyysiä. anonym.legal tunnistaa kielen pyyntökohtaisesti ja ohjaa sen sopivaan NER-mallipipelineen, jossa englanti on varakielenä tuettujen kielten puuttuessa.
#languagedetectionKoodinvaihto
Monikielinen Koodinvaihto
Ilmiö, jossa kahta tai useampaa kieltä sekoitetaan yhdessä tekstissä tai keskustelussa. Yleistä monikielisissä asiakirjoissa (esim. saksalaiset oikeudelliset asiakirjat, joissa on englanninkielisiä teknisiä termejä). anonym.legalin hybriditunnistus käsittelee koodinvaihtotekstiä soveltamalla useita kielimalleja samanaikaisesti.
#codeswitchingKuvamuokkaaja
Presidio Kuvamuokkaaja -palvelu
Erityinen taustapalvelu (portti 8013), joka tunnistaa ja poistaa PII:tä kuvafailista (PNG, JPEG) käyttämällä OCR:ää ja Presidio-analyysiä. Soveltaa mustan nauhan poistoa tunnistettuihin PII-alueisiin alkuperäisessä kuvassa.
#presidioimageredactorKäyttörajoitus
API Käyttörajoitus
Rajoitukset API-pyyntöjen määrälle, joita asiakas voi tehdä tietyn ajan sisällä. Estää väärinkäytön ja varmistaa oikeudenmukaisen resurssien jakamisen. anonym.legal soveltaa käyttäjäkohtaisia käyttörajoituksia suunnitelman tason mukaan, ja suositellaan eksponentiaalista taantumista uudelleenyrityksille.
#ratelimitingL
Liiallinen Poisto
Liiallinen Poisto (Väärät Positiiviset)
Liian suuren tiedon poistaminen, mikä vähentää asiakirjan hyödyllisyyttä ja voi mahdollisesti muodostaa spoliation oikeudenkäynnissä. Aiheutuu matalista luottamuskynnyksistä tai liian laajasta yksikkövalinnasta. Säädettävissä anonym.legalin kynnyksen ja yksikköohjausten kautta.
#overredactionLuottamuspisteytys
Entiteettitunnistuksen Luottamuspiste
0–1 piste, joka osoittaa, kuinka varma tunnistusmalli on siitä, että tekstijakso on PII-entiteetti. anonym.legal tarjoaa konfiguroitavia luottamuskynnysarvoja, jotta käyttäjät voivat säätää tarkkuuden ja palautuksen välistä tasapainoa erityisiin käyttötarkoituksiinsa.
#confidencescoringM
Maskointi
Tietojen maskointi
Herkät arvot korvataan realistisilla mutta kuvitteellisilla tiedoilla, jotka säilyttävät muodon ja rakenteen. Käytetään testausympäristöissä, analytiikassa ja tietojoukkojen jakamisessa ilman, että todellisia PII-tietoja paljastetaan.
#maskingMCP
Mallikontekstiprotokolla
Anthropic-yhtiön avoin protokolla, joka mahdollistaa AI-mallien vuorovaikutuksen ulkoisten työkalujen ja tietolähteiden kanssa standardoidulla tavalla. anonym.legal toteuttaa MCP-palvelimen, jotta AI-koodausvälineet voivat kutsua anonymisointia ilman, että niiden työnkulku keskeytyy.
#mcpMCP-palvelin
Mallikontekstiprotokollapalvelin
anonym.legalin MCP-palvelinintegraatio mahdollistaa AI-koodausassistenttien (Claude Desktop, Cursor, VS Code Copilot) kutsua anonymisointia API:ta suoraan työkaluna. PII poistetaan koodista, kehotteista ja kontekstista ennen niiden lähettämistä AI-mallille.
#mcpserverML-mallit
Koneoppimismallit PII-tunnistukseen
Tilastolliset mallit, jotka on koulutettu merkittyjen tekstikorpusten avulla tunnistamaan PII kontekstissa. anonym.legal käyttää sekä spaCy-muunnospipelineja että hienosäädettyä XLM-RoBERTaa monikieliseen entiteettitunnistukseen tuotantotasoilla.
#mlmodelsMukautetut entiteetit
Mukautetut entiteettitunnistimet
Käyttäjän määrittelemät PII-mallit, jotka on lisätty anonym.legalin sisäänrakennettujen yli 285 entiteettityypin päälle. Tukee regex-malleja, sanalistoja ja estolistoja. Hyödyllisiä organisaatiokohtaisille tunnisteille, kuten työntekijätunnuksille, sisäisille projektikoodeille tai omille tuotenimille.
#customentitiesN
NER
Nimettävän Entiteetin Tunnistus
Luonnollisen kielen käsittelyn tehtävä, joka tunnistaa ja luokittelee nimettyjä entiteettejä tekstissä ennalta määriteltyihin kategorioihin, kuten henkilöihin, organisaatioihin, sijainteihin, päivämääriin ja lääketieteellisiin tunnisteisiin. PII-tunnistuksen ydin ML-tekniikka anonym.legalissa.
#nerNIS2
Verkko- ja tietoturvadirektiivi 2
EU:n direktiivi 2022/2555, joka laajentaa alkuperäistä NIS-direktiiviä kattamaan enemmän sektoreita (terveydenhuolto, energia, liikenne, digitaalinen infrastruktuuri) ja vahvistaa kyberturvallisuusvaatimuksia. Siirtymäaika päättyi 17. lokakuuta 2024; useimmat EU:n jäsenvaltiot eivät noudattaneet sitä ja Euroopan komissio aloitti rikkomusmenettelyt sääntöjen vastaisia valtioita vastaan.
#nis2NLP
Luonnollisen Kielen Käsittely
Tekoälyn haara, joka käsittelee vuorovaikutusta tietokoneiden ja ihmiskielen välillä. PII-tunnistuksessa NLP-mallit ymmärtävät kontekstia, kielioppia ja semantiikkaa tunnistaakseen entiteettejä, joita pelkät regex-mallit eivät havaitse.
#nlpNollatieto
Nollatietoarkkitehtuuri
Järjestelmän suunnittelu, jossa palveluntarjoajalla ei ole pääsyä käyttäjien selkokielisiin tietoihin tai salausavaimiin. Kaikki salaus/purku tapahtuu asiakaspuolella; palvelin ei koskaan näe alkuperäistä sisältöä. Estää sisäiset uhkat ja pakotetut paljastukset.
#zeroknowledgeO
Office-lisäosa
anonym.legal Microsoft Office -lisäosa
Microsoft Office -laajennus, joka integroi PII-anonymisoinnin suoraan Wordiin, Exceliin ja PowerPointiin. Tukee asiakirjojen muokkausta, esiasetusten hallintaa, ZK Authia ja synkronointia laitteiden välillä. Saatavilla Microsoft AppSource -palvelusta.
#officeaddinOperaattorit
Anonymisointiohjelmat
Korvausstrategia, jota sovelletaan havaittuun PII:hin. anonym.legal tukee REPLACE (paikkamerkkiteksti), REDACT (tyhjät merkit), MASK (tähtimerkki), HASH (SHA-256-hajautus), ENCRYPT (käänteinen AES-256-GCM) ja CUSTOM (käyttäjän määrittelemä korvaus).
#operatorsP
PCI DSS
Maksukorttiteollisuuden tietoturvastandardi
Turvastandardi organisaatioille, jotka käsittelevät maksukorttitietoja, jota ylläpitää PCI Security Standards Council. Edellyttää salausta, pääsynhallintaa, lokitusta ja säännöllisiä testauksia. Noudattamatta jättäminen voi johtaa sakkoihin ja maksukorttiprosessoinnin oikeuksien menettämiseen.
#pcidssPHI
Suojattu terveystieto
Mikä tahansa terveyteen liittyvä tieto, joka on liitetty tunnistettavissa olevaan henkilöön, ja jota säädellään HIPAA:n mukaan Yhdysvalloissa. Sisältää diagnoosit, hoitotiedot, vakuutustiedot ja kaikki 18 HIPAA Safe Harbor -tunnistetta.
#phiPII
Henkilökohtaisesti tunnistettavat tiedot
Mikä tahansa tieto, joka voi suoraan tai yhdessä muiden tietojen kanssa tunnistaa tietyn henkilön. Esimerkkejä: nimet, sähköpostiosoitteet, sosiaaliturvatunnukset, IP-osoitteet, biometriset tiedot.
#piiPresidio
Microsoft Presidio
Microsoftin avoimen lähdekoodin tietosuojan ja anonymisoinnin SDK. anonym.legalin tunnistusmoottori perustuu Presidion analysointi- ja anonymisointipalveluihin, joita on laajennettu yli 285 mukautetulla entiteettitunnistimella 48 kielellä.
#presidioPresidio Analyzer
Microsoft Presidio Analyzer -palvelu
anonym.legalin taustajärjestelmän tunnistuskomponentti (portti 8011). Hyväksyy tekstiä ja palauttaa luettelon tunnistetuista PII-yksiköistä niiden sijainneilla, tyypeillä ja luottamuspisteillä. Laajennettu yli 285 mukautetulla tunnistimella 48 kielellä.
#presidioanalyzerPresidio Anonymizer
Microsoft Presidio Anonymizer -palvelu
anonym.legalin taustajärjestelmän muunnoskomponentti (portti 8012). Ota teksti ja analyysitulokset syötteenä, soveltaa valittua operaattoria (KORVAA, POISTA, MASKI, HASH, SALAA) jokaiselle tunnistetulle yksikölle ja palauttaa anonymisoidun tekstin.
#presidioanonymizerPseudonymisointi
Tietojen pseudonymisointi
Suorien tunnisteiden korvaaminen keinotekoisilla arvoilla (pseudonyymeillä) samalla säilyttäen mahdollisuus tunnistaa henkilöt erillisen avaimen avulla. GDPR:n artikla 4(5) tunnustaa sen yksityisyyttä parantavana tekniikkana, mutta se ei vapauta pseudonymisoituja tietoja säädöksestä.
#pseudonymizationPuolustettavuus
Oikeudellisesti Puolustettava Anonymisointi
Kyky osoittaa sääntelyviranomaisille, tuomioistuimille tai tarkastajille, että anonymisointi on suoritettu dokumentoidulla, johdonmukaisella ja teknisesti pätevällä menetelmällä. anonym.legalin audit-lokit, luottamuspisteet ja operaattoriasetukset tukevat puolustettavia anonymisointityönkulkuja.
#defensibilityR
Rahoitusyksiköt
Rahoituksen PII Yksikkötyypit
Yksikkötyypit, jotka kattavat rahoitusidentifikaattorit: KREDITTIKORTTI (Luhn-tarkistussumma), IBAN-KOODI (ISO 13616 -tarkistussumma), SWIFT-KOODI (BIC-muoto), US_BANK_NUMBER, NRP (Espanjan veronumero). Tunnistetaan tarkistussumman validoinnin avulla väärien positiivisten minimoimiseksi.
#financialentitiesRedaktointi
Tietojen redaktointi
Herkän tiedon pysyvä poistaminen tai peittäminen asiakirjoista, korvaten se visuaalisella merkinnällä, kuten [REDACTED] tai mustalla palkilla. Toisin kuin salaus, redaktointi on yksisuuntainen, eikä alkuperäisiä tietoja voida palauttaa.
#redactionRegex
Säännöllinen Ilmausmallin Vertailu
Mallipohjainen tekstin vertailu käyttäen formaalia kielioppia. PII-tunnistuksessa regex käsittelee rakenteellisesti ennakoitavia tunnisteita (puhelinnumerot, luottokortit, IBANit, sähköpostiosoitteet) tarkistussumman vahvistuksella. Täydentää NER:iä hybriditunnistuksessa.
#regexREST API
RESTful API
anonym.legal tarjoaa RESTful HTTP API:n ohjelmallista integrointia varten. Päätepisteet sisältävät /api/analyze, /api/anonymize, /api/image, ja /api/structured. Todentaminen JWT-kantajamerkkien avulla. Täydellinen OpenAPI-dokumentaatio saatavilla API-viitteessä.
#restapiS
SCCs
Standardisopimuslausekkeet
Ennakkohyväksytyt GDPR-yhteensopivat sopimuslausekkeet henkilötietojen siirtämiseksi EU:sta/ETA:sta kolmansille maille. Euroopan komissio päivitti ne vuonna 2021 (2021/914/EU) vastatakseen Schrems II -vaatimuksiin, mukaan lukien siirtoarviointi.
#sccsSchrems II
Schrems II -päätös (C-311/18)
Euroopan unionin tuomioistuimen 2020 antama päätös, joka kumoaa EU:n ja Yhdysvaltojen tietosuojakehyksen transatlanttisille tietosiirroille, viitaten riittämättömiin Yhdysvaltojen valvontalakien suojatoimiin. Edellyttää täydentäviä toimenpiteitä (salaus, anonymisointi) käytettäessä standardisopimuslausekkeita.
#schremsiiSHA-256
Turvallinen hajautusalgoritmi 256-bittinen
Kryptografinen hajautusfunktio, joka tuottaa 256-bittisen tiivisteen. Käytetään anonym.legalissa HMAC-autentikointiin API-pyyntöjen, ZK auth -todisteiden ja johdonmukaisen entiteettipseudonymisoinnin (suolaamisen kanssa hajauttaminen tuottaa saman korvauksen samalle alkuperäiselle arvolle) yhteydessä.
#sha256spaCy
spaCy NLP-kirjasto
Teollisuustason avoimen lähdekoodin NLP-kirjasto Pythonissa. anonym.legal käyttää spaCyn muunnospohjaisia malleja 24 kielellä (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko ja muita) nimettyjen entiteettien tunnistamiseen Presidio-pipelineissa.
#spacySpoliation
Todistusaineiston Spoliation
Todistusaineiston tuhoaminen, muuttaminen tai säilyttämättä jättäminen, joka on olennaista oikeudenkäynnille. Liiallinen poistaminen, joka tekee asiakirjoista luettavissa olevia, voi muodostaa spoliation. Anonymisoinnin tarkkuuden säätäminen (luottamuskynnykset, yksikkövalinta) on tärkeää oikeudellisesti puolustettavalle poistolle.
#spoliationStanza
Stanza NLP-kirjasto (Stanford NLP)
Stanford NLP -ryhmän Python NLP-työkalu, joka tukee yli 70 kieltä huipputason neuroverkkomalleilla. Käytetään täydentävänä NER-taustapalveluna anonym.legalissa kielille, joita spaCy-mallit eivät kata.
#stanzaSääntö 26
Liittovaltion Siviilimenettelysäännön Sääntö 26
Yhdysvaltojen siviilimenettelysääntö, joka säätelee löytövelvoitteita. Sääntö 26(g) vaatii asianajajilta vahvistamaan, että löytöpyynnöt ja -ilmoitukset eivät ole tehty väärin perustein — mukaan lukien PII:n asianmukainen poistaminen tuotetuista asiakirjoista.
#rule26T
Terveydenhuollon Yksiköt
Terveydenhuollon PII Yksikkötyypit
Yksikkötyypit 18 HIPAA Safe Harbor -tunnistajalle ja muille terveyteen liittyville PII:lle: US_MRN (lääkärintodistusten numerot), LÄÄKETIETEELLINEN_LUPA, TERVEYDENHUOLTO_SUUNNITELMAN_EDUNSAJA, ja diagnoosi/hoitokontekstiin liittyvät yksiköt.
#healthcareentitiesTietojen minimointi
GDPR:n tietojen minimointiperiaate
GDPR:n artiklan 5(1)(c) periaate, joka vaatii, että vain tietoja, jotka ovat riittäviä, olennaisia ja tarpeellisia määriteltyyn tarkoitukseen, kerätään ja käsitellään. Keskeinen suunnittelurajoite yksityisyysvaatimusten mukaisille järjestelmille.
#dataminimizationTietojen säilytys
Tietojen säilytyksen vaatimukset
Lailliset tai sopimukselliset vaatimukset, jotka määrittelevät, missä maantieteellisessä sijainnissa tietoja on säilytettävä ja käsiteltävä. Relevantti GDPR:lle (tietojen siirrot EEA:n ulkopuolelle), Saksan BDSG:lle ja sektorikohtaisille säädöksille terveydenhuollossa ja rahoituksessa.
#dataresidencyTietosuoja
Digitaalinen tietosuoja
Periaate, jonka mukaan tiedot ovat sen kansakunnan lakien ja hallintorakenteiden alaisia, jossa ne on kerätty. Laajempi kuin tietojen säilytys, se kattaa hallinnan siitä, kuka voi käyttää tietoja ja minkälaisen oikeudellisen kehyksen alaisena.
#datasovereigntyTLS
Siirtokerroksen turvallisuus
Kryptografinen protokolla, joka suojaa tietoja siirron aikana. anonym.legal vaatii vähintään TLS 1.2:n, suosittelee TLS 1.3:a, HSTS:ää, jonka maksimikesto on yksi vuosi, ja HTTP/2:ta. Kaikki liikenne asiakkaiden ja palvelimen välillä on salattu siirron aikana.
#tlsToken-järjestelmä
anonym.legal Luottotoken-järjestelmä
Käyttöpohjainen laskutus, jossa API-kutsut kuluttavat tokeneita, jotka lasketaan tekstin pituuden, entiteettien määrän ja käsittelytilan (analysoi vs. anonymisoi) perusteella. Token-kustannukset ovat konfiguroitavissa tietokannassa ja näytetään reaaliaikaisesti ennen käsittelyä.
#tokensystemTokenisointi
Tietojen tokenisointi
Herkän tiedon korvaaminen ei-herkällä paikkamerkillä (token), joka kartoittaa takaisin alkuperäiseen turvallisessa holvissa. Toisin kuin salaus, tokenilla itsellään ei ole matemaattista suhdetta alkuperäisiin tietoihin.
#tokenizationTyöpöytäsovellus
anonym.legal Työpöytäsovellus
Monialustainen sovellus (Windows, macOS, Linux), joka on rakennettu Tauri 2.0:lla ja React 18:lla. Sisältää paikallisen tiedostokäsittelyn, BIP39-arkiston offline-ZK Authia varten, erävientitoiminnon ja API-synkronoinnin. Tukee ilmatilassa toimivia käyttöönottoja ilman internet-yhteyttä.
#desktopappU
Universaalit Yksiköt
Kielikohtaiset Universaalit Yksikkötyypit
Yksikkötyypit, jotka tunnistetaan tekstikielestä riippumatta, tyypillisesti muotoon perustuvan regexin ja tarkistussumman validoinnin avulla. Esimerkkejä: KREDITTIKORTTI, IBAN-KOODI, SÄHKÖPOSTIOSOITE, PUHELINNUMERO, IP_OSOITE, URL, KRYPTO-osoite.
#universalentitiesV
Vakuutustunnistajat
Vakuutuksen Yksikkötyypit
Yksikkötyypit vakuutuksiin liittyville tunnistajille: US_NPI (Kansallinen Palveluntarjoajan Tunniste terveydenhuollon tarjoajille), TERVEYDENHUOLTO_SUUNNITELMAN_EDUNSAJA, ja maakohtaiset sairausvakuutusnumerot (esim. DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersValtion ID
Valtion Tunnistaja Yksikkötyypit
Yksikkötyypit kansallisille ja valtion myöntämille tunnistajille: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, ja yli 50 muuta maakohtaista ID-muotoa. Tunnistetaan maakohtaisen regexin + tarkistussumman kaavojen avulla.
#governmentidVerkkosovellus
anonym.legal Verkkosovellus
Selaimeen perustuva käyttöliittymä anonym.legalissa PII-analyysiä, anonymisointia ja salauksen purkua varten. Tukee tekstisyöttöä, tiedostojen lataamista (PDF, DOCX, TXT), eräkäsittelyä, ZK Authia, 48 kieltä ja yli 285 entiteettityyppiä. Asennusta ei vaadita.
#webappX
XChaCha20
XChaCha20-Poly1305
Autentikoitu salausalgoritmi, joka tarjoaa korkean suorituskyvyn järjestelmissä ilman AES-laitteistokiihdytystä. Käyttää 192-bittistä noncea (laajennettu IETF ChaCha20 -standardin 96-bittisestä nonceista RFC 8439:n mukaan), mikä eliminoi nonce-kollisiovaarat. Käytetään vaihtoehtoisena salausalgoritmina anonym.legalin salauskerroksessa.
#xchacha20XLM-RoBERTa
Monikielinen RoBERTa
Monikielinen muunnospohjainen kielimalli, joka on koulutettu 100 kielellä, kehitetty Meta AI:n toimesta. Käytetään anonym.legalissa monikielisissä NER-tehtävissä, erityisesti entiteettityypeissä ja kielissä, joissa yksikieliset mallit eivät ole saatavilla.
#xlmrobertaY
Yksikkötyyppi
PII Yksikkötyyppi
Henkilökohtaisen tiedon kategoria, jonka tunnistusmoottori tunnistaa ja voi anonymisoida. Esimerkkejä: HENKILÖ, SÄHKÖPOSTIOSOITE, PUHELINNUMERO, KREDITTIKORTTI, IBAN-KOODI, US_SSN, IP_OSOITE. anonym.legal tukee yli 285 yksikkötyyppiä 48 kielellä.
#entitytypeYksityisyys suunnittelussa
Yksityisyys suunnittelussa ja oletuksena
Periaate, jonka GDPR:n artikla 25 määrää, että tietosuojatoimenpiteet sisällytetään järjestelmiin alusta alkaen sen sijaan, että ne lisättäisiin jälkikäteen. Kattaa tietojen minimoinnin, pääsynhallinnan, salauksen ja pseudonymisoinnin arkkitehtuuritasolla.
#privacybydesignZ
ZK Auth
Nollatietoautentikointi
anonym.legalin autentikointijärjestelmä, jossa salausavaimet johdetaan asiakaspuolella käyttäjän salasanasta Argon2id:n avulla, eikä niitä koskaan lähetetä tai tallenneta palvelimelle. Palvelin tallentaa vain kryptografisen todisteen, ei avainta tai salasanaa.
#zkauth