anonym.legal
Docs/Glossary

Tietosuoja & Teknologia Sanasto

Määritelmät kaikille termeille, lyhenteille ja käsitteille, joita käytetään PII-anonymisoinnissa ja tietosuojassa.

Takaisin asiakirjoihin

94 termiä

2

2FA

Kaksivaiheinen autentikointi

Salaus & Tietoturva

Autentikointi, joka vaatii kaksi erillistä vahvistustekijää: jotain, mitä käyttäjä tietää (salasana) ja jotain, mitä käyttäjä omistaa (TOTP-sovellus, laitteistoväline) tai on (biometrinen). Tuettu anonym.legalissa lisäkerroksena ZK Authin päällä.

#twofa

A

AES-256-GCM

Edistynyt salausstandardi 256-bittinen Galois/Counter-tila

Salaus & Tietoturva

Autentikoitu salausalgoritmi, joka yhdistää AES-256 (256-bittinen avain) Galois/Counter-tilaan sekä luottamuksellisuuden että eheyden takaamiseksi. Käytetään anonym.legalin käännettävässä anonymisoinnissa korvattujen entiteettien salaamiseen. Tarjoaa sekä salaisuuden että manipulointitunnistuksen.

#aes256gcm

Ajoneuvotunnistajat

Ajoneuvon Yksikkötyypit

Entiteettityypit

Yksikkötyypit ajoneuvoihin liittyville tunnistajille: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Ajoneuvon Tunnistusnumero), ja maakohtaiset ajoneuvon rekisterikilpimuodot.

#vehicleidentifiers

Alipoisto

Alipoisto (Väärät Negatiiviset)

Oikeudellinen & Auditointi

Kaikkien PII:n poistamisen epäonnistuminen, mikä jättää yksilöt alttiiksi jaettavissa asiakirjoissa. Yleisempää vaatimustenmukaisuuden riskiä. Aiheutuu korkeista luottamuskynnyksistä, puuttuvista yksikkötyypeistä tai uusista PII-muodoista. Vähennetään anonym.legalin hybriditunnistuksen ja mukautettujen yksikkötukien avulla.

#underredaction

Anonymisointi

Tietojen anonymisointi

Tietosuoja & PII

Irreversiivinen prosessi, jossa poistetaan tai muutetaan tunnistettavia tietoja siten, että henkilöitä ei voida enää tunnistaa suoraan tai epäsuorasti. GDPR:n mukaan täysin anonymisoidut tiedot eivät kuulu säädöksen piiriin.

#anonymization

Argon2id

Argon2id-avaimen johdantofunktio

Salaus & Tietoturva

Vuoden 2015 salasanasalauskilpailun voittaja. Argon2id yhdistää Argon2i:n sivukanavien vastustuskyvyn ja Argon2d:n GPU-vastustuskyvyn. Käytetään anonym.legalissa ja työpöytäsovelluksen holvissa salausavainten johdattamiseen käyttäjän salasanoista.

#argon2id

Arkisto

Salausavainten arkisto

Alusta & Tuotteet

Turvallinen paikallinen tallennus salausavaimille työpöytäsovelluksessa, suojattu Argon2id-avaimen johdannaisella pääsalasanasta. Avaimet tallennetaan salattuina käyttäen AES-256-GCM:ää ja varmuuskopioidaan BIP39-muistilauseilla.

#vault

Asianajaja-asiakas Etuoikeus

Asianajaja-asiakas Etuoikeuden Suoja

Oikeudellinen & Auditointi

Oikeudellinen suoja luottamuksellisille viestinnöille asianajajien ja asiakkaiden välillä. Asiakirjojen tarkastuksessa ja e-löydössä etuoikeutettu sisältö on tunnistettava ja pidettävä eristyksissä tai poistettava. Mukautettuja yksikkötyyppejä anonym.legalissa voidaan konfiguroida merkitsemään etuoikeutettuja sisältömerkkejä.

#attorneyclientprivilege

Audit Trail

Muuttumaton Audit Trail

Oikeudellinen & Auditointi

Peräkkäinen, muokkauskestävä loki, joka tallentaa kuka on päässyt käsiksi, muuttanut tai käsitellyt tietoja ja milloin. Vaaditaan ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)), ja e-löytö sääntöjä. anonym.legal kirjaa kaikki anonymisointitoiminnot aikaleimoilla, yksikkömäärillä ja operaattori-ID:illä.

#audittrail

B

BIP39

Bitcoin-parannusehdotus 39 — Mnemoniset lauseet

Salaus & Tietoturva

Standardi, joka tuottaa ihmisten luettavissa olevia mnemonisia siemenlauseita (12–24 sanaa) kryptografisesta siemenestä. Käytetään anonym.legalin työpöytäsovelluksen holvissa käyttäjäystävällisen varmuuskopiona Argon2id-johdetulle salausavaimelle.

#bip39

C

CCPA

Kalifornian kuluttajatietosuojalaki

Vaatimustenmukaisuus & Säännökset

Kalifornian tietosuojalaki, joka myöntää asukkaille oikeuden tietää, poistaa ja kieltäytyä henkilökohtaisten tietojensa myynnistä. Koskee liiketoimintoja, jotka täyttävät liikevaihto-, tietomäärä- tai tietomyyntikynnykset. Merkittävästi muutettu CPRA:n toimesta (hyväksytty marraskuussa 2020, voimaan tammikuussa 2023).

#ccpa

Chrome-laajennus

anonym.legal Chrome-laajennus

Alusta & Tuotteet

Selaimen laajennus (Manifest V3), joka keskeyttää tekstin ennen sen lähettämistä AI-chatboteille (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymisoi lennossa ja purkaa valinnaisesti AI-vastauksia tallennettujen salausavainten avulla.

#chromeextension

CLOUD Act

Selventävä laki tietojen laillisesta ulkomaisesta käytöstä

Vaatimustenmukaisuus & Säännökset

Yhdysvaltojen liittovaltion laki (2018), joka sallii Yhdysvaltojen lainvalvojille pakottaa Yhdysvalloissa toimivia pilvipalveluntarjoajia tuottamaan ulkomailla säilytettyjä tietoja. Konflikti GDPR:n tietosiirtosääntöjen kanssa EU:n asukkaille. Tietojen anonymisointi ennen pilveen lataamista on yleinen lieventämistoimenpide.

#cloudact

CSP

Sisältöturvapolitiikka

Salaus & Tietoturva

HTTP-vastauspään ja meta-tagin mekanismi, joka rajoittaa, mitä resursseja (skriptit, tyylit, kuvat) selain voi ladata. anonym.legalin CSP sisältää object-src 'none', script-src nonceilla ja upgrade-insecure-requests estääkseen XSS-hyökkäykset.

#csp

D

DDoS Suojaus

Jakautunut Palvelunestohyökkäyksiltä Suojaus

Infrastruktuuri

Infrastruktuuritason puolustukset jakautuneita palvelunestohyökkäyksiä vastaan. anonym.legalin palvelininfrastruktuuri sisältää palomuurisäännöt (UFW), nginx-yhteysrajoitukset ja Cloudflare-tyyppiset ylävirran suojat saatavuuden ylläpitämiseksi.

#ddosprotection

De-anonymisointi

Uudelleen tunnistaminen

Tietosuoja & PII

Prosessi, jossa tunnistetaan henkilöitä oletettavasti anonymisoiduista tietojoukoista viittaamalla aputietoihin. Keskeinen riski tietojen jakamisessa riittämättömän anonymisoinnin syvyyden vuoksi.

#deanonymization

Differentiaalinen yksityisyys

Differentiaalinen yksityisyys (DP)

Tietosuoja & PII

Matemaattinen kehys, jonka avulla voidaan julkaista tilastotietoja tietojoukoista samalla, kun tarjotaan todistettavia takeita siitä, että kenenkään henkilötietoja ei voida erottaa. Käytetään aggregaatti-analytiikassa estämään uudelleen tunnistaminen, jopa kun kysytään aggregaattiulostuloja.

#differentialprivacy

Digitaaliset Tunnistajat

Digitaalisen Identiteetin Yksikkötyypit

Entiteettityypit

Yksikkötyypit verkkopohjaisille ja digitaalisten tunnistajille: SÄHKÖPOSTIOSOITE, PUHELINNUMERO, IP_OSOITE (IPv4 ja IPv6), URL, DOMAIN_NIMI, KRYPTO (Bitcoin/Ethereum-osoitteet), ja alustakohtaiset tunnistajat.

#digitalidentifiers

DLP

Tietovuotojen estäminen

Alusta & Tuotteet

Turvallisuusala ja ohjelmistotyökalujen kategoria, joka havaitsee ja estää valtuuttamattoman herkän tiedon siirron organisaation ulkopuolelle. anonym.legal toimii selaintason ja AI-tason DLP-ratkaisuna PII:lle.

#dlp

DPA

Henkilötietojen käsittelysopimus

Vaatimustenmukaisuus & Säännökset

Laillisesti sitova sopimus tietojen valvojien ja käsittelijöiden välillä, joka vaaditaan GDPR:n artiklan 28 mukaan. Määrittelee käsittelyn kohteen, keston, luonteen, tarkoituksen ja henkilötietojen käsittelyn tyypin sekä molempien osapuolten oikeudet ja velvollisuudet.

#dpa

DPIA

Tietosuojavaikutusten arviointi

Vaatimustenmukaisuus & Säännökset

Riskinarviointiprosessi, joka vaaditaan GDPR:n artiklan 35 mukaan käsittelytoimille, joilla on todennäköisesti korkea riski yksilöiden oikeuksille ja vapauksille. Pakollinen järjestelmälliselle profiloinnille, laajamittaiselle PHI:n käsittelylle ja julkisten alueiden valvonnalle.

#dpia

E

e-Löytö

Sähköinen Löytö

Oikeudellinen & Auditointi

Prosessi, jossa tunnistetaan, kerätään ja tuotetaan sähköisesti tallennettua tietoa oikeudenkäynneissä. Vaatii PII:n ja etuoikeutettujen tietojen poistamista tuotetuista asiakirjoista. Pääasiallinen käyttötapaus oikeudellisille osastoille, jotka käyttävät anonym.legalia.

#ediscovery

E2EE

Päästä päähän -salaus

Salaus & Tietoturva

Salaus, jossa vain viestintäosapuolet voivat lukea viestit; palveluntarjoajalla ei ole pääsyä selkokielisiin tietoihin. anonym.legalin ZK Auth -tilassa salausavaimet eivät koskaan jätä asiakaslaitetta, saavuttaen E2EE anonymisoidun tulostuksen tallentamiseksi.

#e2ee

Eräkäsittely

Erätiedostojen anonymisointi

Alusta & Tuotteet

Useiden tiedostojen käsittely samanaikaisesti yhdessä toiminnossa. anonym.legalin erätila tukee PDF-, DOCX- ja TXT-tiedostoja, joissa on tiedostokohtainen entiteettikonfiguraatio, luottamuskynnykset ja tulostusmuodon valinta.

#batchprocessing

Esiasetukset

Anonymisointiesiasetukset

Alusta & Tuotteet

Tallennetut konfiguraatiot valituista entiteettityypeistä, luottamuskynnyksistä ja tulostusvaihtoehdoista, joita voidaan soveltaa yhdellä napsautuksella. Esiasetukset synkronoidaan verkkosovelluksen, Office-lisäosan ja työpöytäsovelluksen välillä salatulla pilvitallennuksella.

#presets

EU Tietoresidenssi

Euroopan Unionin Tietoresidenssi

Infrastruktuuri

Takuu siitä, että tiedot tallennetaan ja käsitellään yksinomaan EU/ETA-alueella. anonym.legalin tuotantopalvelimet sijaitsevat Saksassa (Hetzner Frankfurt), varmistaen, että kaikki käsittely tapahtuu GDPR:n lainkäyttövallassa ilman rajat ylittäviä tietosiirtoja.

#eudataresidency

F

FOIA

Tietojen vapauttamislaki

Vaatimustenmukaisuus & Säännökset

Yhdysvaltojen liittovaltion laki (ja vastaavat säädökset muissa lainkäyttöalueissa), joka myöntää julkisen pääsyn hallituksen asiakirjoihin. Edellyttää PII:n ja muiden salassa pidettävien tietojen poistamista ennen julkistamista — ensisijainen käyttötapa oikeudellisille ja hallinnollisille anonymisointityönkulkuille.

#foia

G

GDPR

Yleinen tietosuoja-asetus

Vaatimustenmukaisuus & Säännökset

EU:n asetus 2016/679, joka on Euroopan unionin ensisijainen tietosuojakehys. Koskee kaikkia organisaatioita, jotka käsittelevät EU:n asukkaiden henkilötietoja. Sakot jopa 20 miljoonaa euroa tai 4 % maailmanlaajuisesta vuotuisesta liikevaihdosta. Keskeiset oikeudet: pääsy, poistaminen, siirrettävyys, rajoittaminen, vastustaminen.

#gdpr

GDPR Artikla 25

GDPR Artikla 25 — Tietosuoja suunnittelussa ja oletusarvoisesti

Vaatimustenmukaisuus & Säännökset

Edellyttää valvojilta, että he toteuttavat asianmukaisia teknisiä ja organisatorisia toimenpiteitä (kuten pseudonymisointi ja tietojen minimointi) sekä järjestelmän suunnittelun aikana että oletusarvoisesti käsittelyn aikana.

#gdprarticle25

GDPR Artikla 32

GDPR Artikla 32 — Käsittelyn turvallisuus

Vaatimustenmukaisuus & Säännökset

Edellyttää valvojilta ja käsittelijöiltä, että he toteuttavat asianmukaisia teknisiä ja organisatorisia toimenpiteitä varmistaakseen riskin mukaisen turvallisuustason, mukaan lukien salaus, pseudonymisointi, luottamuksellisuus, eheys, saatavuus ja käsittelyjärjestelmien kestävyys.

#gdprarticle32

GenAI DLP

Generatiivinen AI -tietovuotojen estäminen

Alusta & Tuotteet

Erityinen DLP-kategoria, joka keskittyy estämään PII:n ja luottamuksellisten tietojen sisällyttämisen kehotteisiin, joita lähetetään generatiivisille AI-malleille (ChatGPT, Claude, Gemini). anonym.legalin Chrome-laajennus ja MCP-palvelin käsittelevät tätä riskiä syöttöpisteessä.

#genaidlp

H

Hashaus

Kryptografinen hash

Tietosuoja & PII

Yksisuuntainen muunnos tiedoista kiinteän pituiseksi tiivisteeksi käyttäen algoritmeja, kuten SHA-256. Käytetään johdonmukaiseen pseudonymisointiin, deduplikaatioon ja eheyden varmistamiseen. Hash-arvoja ei voi kääntää, mutta ne voivat olla alttiita sateenkaarihyökkäyksille, jos niitä ei ole suolattu.

#hashing

Hetzner

Hetzner Online GmbH

Infrastruktuuri

Saksalainen pilvi- ja hosting-palveluntarjoaja, jossa anonym.legalin tuotanto-infrastruktuuri toimii. Sijaitsee Falkensteinissa, Saksassa (datakeskus fsn1) ja sillä on ISO 27001 -sertifikaatti. Valittu EU:n tietoresidenssin, vaatimustenmukaisuuden ja GDPR-ystävällisen lainkäyttövallan vuoksi.

#hetzner

HIPAA

Terveydenhuollon tietosuoja- ja vastuulaki

Vaatimustenmukaisuus & Säännökset

Yhdysvaltojen liittovaltion laki, joka asettaa standardit potilaiden terveystietojen suojaamiselle. Tietosuojalaki säätelee PHI:n käyttöä; turvallisuuslaki vaatii hallinnollisia, fyysisiä ja teknisiä suojatoimia sähköisille PHI:lle (ePHI). Rikkomuksista voi seurata sakkoja jopa 1,9 miljoonaa dollaria vuodessa per kategoria.

#hipaa

HIPAA Safe Harbor

HIPAA Safe Harbor -de-identifiointimenetelmä

Vaatimustenmukaisuus & Säännökset

Yksi kahdesta HIPAA:n hyväksymästä de-identifiointimenetelmästä, joka vaatii kaikkien 18 määritellyn potilastunnisteen (nimi, osoite, päivämäärät, puhelinnumerot, sosiaaliturvatunnus, sähköposti, IP-osoite, biometriset tiedot jne.) poistamista, jotta terveystiedot eivät ole yksilöitävissä.

#hipaasafeharbor

HSTS

HTTP Tiukka Siirtoturvallisuus

Salaus & Tietoturva

Verkkoturvapolitiikan mekanismi, joka pakottaa selaimet käyttämään vain HTTPS-yhteyksiä. anonym.legal asettaa Strict-Transport-Security: max-age=31536000; includeSubDomains estääkseen protokollan heikentämisyritykset ja evästeiden kaappaamisen.

#hsts

Hybriditunnistus

Hybridinen NLP + Regex + ML Tunnistus

Tunnistusteknologia

anonym.legalin kolmitasoinen lähestymistapa: regex-mallit rakenteelliselle PII:lle (puhelinnumerot, IBANit, luottokortit), NLP/NER-mallit kontekstuaalisille entiteeteille (nimet, organisaatiot, sijainnit) ja ML-luokittajat epäselville tapauksille. Vähentää sekä vääriä positiivisia että vääriä negatiivisia tuloksia.

#hybriddetection

I

ISO 27001

ISO/IEC 27001 Tietoturvallisuuden hallinta

Vaatimustenmukaisuus & Säännökset

Kansainvälinen standardi tietoturvallisuuden hallintajärjestelmille (ISMS). Sertifiointi edellyttää asiakirjoitettuja käytäntöjä, riskinarviointeja ja kontrollitoimia. anonym.legalin EU:n palvelimet ovat ISO 27001 -sertifioituja, mikä varmistaa rakenteellisen tietoturvavalvonnan.

#iso27001

ISO 27001 SoA

Soveltuvuusilmoitus

Vaatimustenmukaisuus & Säännökset

Pakollinen ISO 27001 -asiakirja, joka luettelee kaikki liitteen A kontrollit, osoittaen, mitkä ovat sovellettavissa organisaatioon, ja antamalla perustelut sisällyttämiselle ja poissulkemiselle. Vaaditaan sertifiointia ja tarkastuksia varten.

#iso27001soa

J

JWT

JSON Web Token

Salaus & Tietoturva

Kompakti, URL-turvallinen token-muoto, jota käytetään väitteiden siirtämiseen osapuolten välillä. anonym.legal käyttää HS256:lla allekirjoitettuja JWT:itä sisäiseen palvelimelta palvelimelle autentikointiin (esim. etupään → Presidio API). Tokenit ovat lyhytaikaisia ja validoidaan palvelinpuolella.

#jwt

K

KEK

Avaimen salaava avain

Salaus & Tietoturva

Avain, jota käytetään muiden avainten salaamiseen sen sijaan, että salattaisiin suoraan tietoja. anonym.legalin ZK-arkkitehtuurissa käyttäjän salasanasta johdettu avain toimii KEK:na suojaten asiakirjakohtaisia salausavaimia, jotka on tallennettu salattuun holviin.

#kek

Kielentunnistus

Automaattinen Kielentunnistus

Tunnistusteknologia

Syöte tekstin kielen automaattinen tunnistaminen ennen PII-analyysiä. anonym.legal tunnistaa kielen pyyntökohtaisesti ja ohjaa sen sopivaan NER-mallipipelineen, jossa englanti on varakielenä tuettujen kielten puuttuessa.

#languagedetection

Koodinvaihto

Monikielinen Koodinvaihto

Tunnistusteknologia

Ilmiö, jossa kahta tai useampaa kieltä sekoitetaan yhdessä tekstissä tai keskustelussa. Yleistä monikielisissä asiakirjoissa (esim. saksalaiset oikeudelliset asiakirjat, joissa on englanninkielisiä teknisiä termejä). anonym.legalin hybriditunnistus käsittelee koodinvaihtotekstiä soveltamalla useita kielimalleja samanaikaisesti.

#codeswitching

Kuvamuokkaaja

Presidio Kuvamuokkaaja -palvelu

Infrastruktuuri

Erityinen taustapalvelu (portti 8013), joka tunnistaa ja poistaa PII:tä kuvafailista (PNG, JPEG) käyttämällä OCR:ää ja Presidio-analyysiä. Soveltaa mustan nauhan poistoa tunnistettuihin PII-alueisiin alkuperäisessä kuvassa.

#presidioimageredactor

Käyttörajoitus

API Käyttörajoitus

Infrastruktuuri

Rajoitukset API-pyyntöjen määrälle, joita asiakas voi tehdä tietyn ajan sisällä. Estää väärinkäytön ja varmistaa oikeudenmukaisen resurssien jakamisen. anonym.legal soveltaa käyttäjäkohtaisia käyttörajoituksia suunnitelman tason mukaan, ja suositellaan eksponentiaalista taantumista uudelleenyrityksille.

#ratelimiting

L

Liiallinen Poisto

Liiallinen Poisto (Väärät Positiiviset)

Oikeudellinen & Auditointi

Liian suuren tiedon poistaminen, mikä vähentää asiakirjan hyödyllisyyttä ja voi mahdollisesti muodostaa spoliation oikeudenkäynnissä. Aiheutuu matalista luottamuskynnyksistä tai liian laajasta yksikkövalinnasta. Säädettävissä anonym.legalin kynnyksen ja yksikköohjausten kautta.

#overredaction

Luottamuspisteytys

Entiteettitunnistuksen Luottamuspiste

Tunnistusteknologia

0–1 piste, joka osoittaa, kuinka varma tunnistusmalli on siitä, että tekstijakso on PII-entiteetti. anonym.legal tarjoaa konfiguroitavia luottamuskynnysarvoja, jotta käyttäjät voivat säätää tarkkuuden ja palautuksen välistä tasapainoa erityisiin käyttötarkoituksiinsa.

#confidencescoring

M

Maskointi

Tietojen maskointi

Tietosuoja & PII

Herkät arvot korvataan realistisilla mutta kuvitteellisilla tiedoilla, jotka säilyttävät muodon ja rakenteen. Käytetään testausympäristöissä, analytiikassa ja tietojoukkojen jakamisessa ilman, että todellisia PII-tietoja paljastetaan.

#masking

MCP

Mallikontekstiprotokolla

Alusta & Tuotteet

Anthropic-yhtiön avoin protokolla, joka mahdollistaa AI-mallien vuorovaikutuksen ulkoisten työkalujen ja tietolähteiden kanssa standardoidulla tavalla. anonym.legal toteuttaa MCP-palvelimen, jotta AI-koodausvälineet voivat kutsua anonymisointia ilman, että niiden työnkulku keskeytyy.

#mcp

MCP-palvelin

Mallikontekstiprotokollapalvelin

Alusta & Tuotteet

anonym.legalin MCP-palvelinintegraatio mahdollistaa AI-koodausassistenttien (Claude Desktop, Cursor, VS Code Copilot) kutsua anonymisointia API:ta suoraan työkaluna. PII poistetaan koodista, kehotteista ja kontekstista ennen niiden lähettämistä AI-mallille.

#mcpserver

ML-mallit

Koneoppimismallit PII-tunnistukseen

Tunnistusteknologia

Tilastolliset mallit, jotka on koulutettu merkittyjen tekstikorpusten avulla tunnistamaan PII kontekstissa. anonym.legal käyttää sekä spaCy-muunnospipelineja että hienosäädettyä XLM-RoBERTaa monikieliseen entiteettitunnistukseen tuotantotasoilla.

#mlmodels

Mukautetut entiteetit

Mukautetut entiteettitunnistimet

Alusta & Tuotteet

Käyttäjän määrittelemät PII-mallit, jotka on lisätty anonym.legalin sisäänrakennettujen yli 285 entiteettityypin päälle. Tukee regex-malleja, sanalistoja ja estolistoja. Hyödyllisiä organisaatiokohtaisille tunnisteille, kuten työntekijätunnuksille, sisäisille projektikoodeille tai omille tuotenimille.

#customentities

N

NER

Nimettävän Entiteetin Tunnistus

Tunnistusteknologia

Luonnollisen kielen käsittelyn tehtävä, joka tunnistaa ja luokittelee nimettyjä entiteettejä tekstissä ennalta määriteltyihin kategorioihin, kuten henkilöihin, organisaatioihin, sijainteihin, päivämääriin ja lääketieteellisiin tunnisteisiin. PII-tunnistuksen ydin ML-tekniikka anonym.legalissa.

#ner

NIS2

Verkko- ja tietoturvadirektiivi 2

Vaatimustenmukaisuus & Säännökset

EU:n direktiivi 2022/2555, joka laajentaa alkuperäistä NIS-direktiiviä kattamaan enemmän sektoreita (terveydenhuolto, energia, liikenne, digitaalinen infrastruktuuri) ja vahvistaa kyberturvallisuusvaatimuksia. Siirtymäaika päättyi 17. lokakuuta 2024; useimmat EU:n jäsenvaltiot eivät noudattaneet sitä ja Euroopan komissio aloitti rikkomusmenettelyt sääntöjen vastaisia valtioita vastaan.

#nis2

NLP

Luonnollisen Kielen Käsittely

Tunnistusteknologia

Tekoälyn haara, joka käsittelee vuorovaikutusta tietokoneiden ja ihmiskielen välillä. PII-tunnistuksessa NLP-mallit ymmärtävät kontekstia, kielioppia ja semantiikkaa tunnistaakseen entiteettejä, joita pelkät regex-mallit eivät havaitse.

#nlp

Nollatieto

Nollatietoarkkitehtuuri

Salaus & Tietoturva

Järjestelmän suunnittelu, jossa palveluntarjoajalla ei ole pääsyä käyttäjien selkokielisiin tietoihin tai salausavaimiin. Kaikki salaus/purku tapahtuu asiakaspuolella; palvelin ei koskaan näe alkuperäistä sisältöä. Estää sisäiset uhkat ja pakotetut paljastukset.

#zeroknowledge

O

Office-lisäosa

anonym.legal Microsoft Office -lisäosa

Alusta & Tuotteet

Microsoft Office -laajennus, joka integroi PII-anonymisoinnin suoraan Wordiin, Exceliin ja PowerPointiin. Tukee asiakirjojen muokkausta, esiasetusten hallintaa, ZK Authia ja synkronointia laitteiden välillä. Saatavilla Microsoft AppSource -palvelusta.

#officeaddin

Operaattorit

Anonymisointiohjelmat

Alusta & Tuotteet

Korvausstrategia, jota sovelletaan havaittuun PII:hin. anonym.legal tukee REPLACE (paikkamerkkiteksti), REDACT (tyhjät merkit), MASK (tähtimerkki), HASH (SHA-256-hajautus), ENCRYPT (käänteinen AES-256-GCM) ja CUSTOM (käyttäjän määrittelemä korvaus).

#operators

P

PCI DSS

Maksukorttiteollisuuden tietoturvastandardi

Vaatimustenmukaisuus & Säännökset

Turvastandardi organisaatioille, jotka käsittelevät maksukorttitietoja, jota ylläpitää PCI Security Standards Council. Edellyttää salausta, pääsynhallintaa, lokitusta ja säännöllisiä testauksia. Noudattamatta jättäminen voi johtaa sakkoihin ja maksukorttiprosessoinnin oikeuksien menettämiseen.

#pcidss

PHI

Suojattu terveystieto

Tietosuoja & PII

Mikä tahansa terveyteen liittyvä tieto, joka on liitetty tunnistettavissa olevaan henkilöön, ja jota säädellään HIPAA:n mukaan Yhdysvalloissa. Sisältää diagnoosit, hoitotiedot, vakuutustiedot ja kaikki 18 HIPAA Safe Harbor -tunnistetta.

#phi

PII

Henkilökohtaisesti tunnistettavat tiedot

Tietosuoja & PII

Mikä tahansa tieto, joka voi suoraan tai yhdessä muiden tietojen kanssa tunnistaa tietyn henkilön. Esimerkkejä: nimet, sähköpostiosoitteet, sosiaaliturvatunnukset, IP-osoitteet, biometriset tiedot.

#pii

Presidio

Microsoft Presidio

Tunnistusteknologia

Microsoftin avoimen lähdekoodin tietosuojan ja anonymisoinnin SDK. anonym.legalin tunnistusmoottori perustuu Presidion analysointi- ja anonymisointipalveluihin, joita on laajennettu yli 285 mukautetulla entiteettitunnistimella 48 kielellä.

#presidio

Presidio Analyzer

Microsoft Presidio Analyzer -palvelu

Infrastruktuuri

anonym.legalin taustajärjestelmän tunnistuskomponentti (portti 8011). Hyväksyy tekstiä ja palauttaa luettelon tunnistetuista PII-yksiköistä niiden sijainneilla, tyypeillä ja luottamuspisteillä. Laajennettu yli 285 mukautetulla tunnistimella 48 kielellä.

#presidioanalyzer

Presidio Anonymizer

Microsoft Presidio Anonymizer -palvelu

Infrastruktuuri

anonym.legalin taustajärjestelmän muunnoskomponentti (portti 8012). Ota teksti ja analyysitulokset syötteenä, soveltaa valittua operaattoria (KORVAA, POISTA, MASKI, HASH, SALAA) jokaiselle tunnistetulle yksikölle ja palauttaa anonymisoidun tekstin.

#presidioanonymizer

Pseudonymisointi

Tietojen pseudonymisointi

Tietosuoja & PII

Suorien tunnisteiden korvaaminen keinotekoisilla arvoilla (pseudonyymeillä) samalla säilyttäen mahdollisuus tunnistaa henkilöt erillisen avaimen avulla. GDPR:n artikla 4(5) tunnustaa sen yksityisyyttä parantavana tekniikkana, mutta se ei vapauta pseudonymisoituja tietoja säädöksestä.

#pseudonymization

Puolustettavuus

Oikeudellisesti Puolustettava Anonymisointi

Oikeudellinen & Auditointi

Kyky osoittaa sääntelyviranomaisille, tuomioistuimille tai tarkastajille, että anonymisointi on suoritettu dokumentoidulla, johdonmukaisella ja teknisesti pätevällä menetelmällä. anonym.legalin audit-lokit, luottamuspisteet ja operaattoriasetukset tukevat puolustettavia anonymisointityönkulkuja.

#defensibility

R

Rahoitusyksiköt

Rahoituksen PII Yksikkötyypit

Entiteettityypit

Yksikkötyypit, jotka kattavat rahoitusidentifikaattorit: KREDITTIKORTTI (Luhn-tarkistussumma), IBAN-KOODI (ISO 13616 -tarkistussumma), SWIFT-KOODI (BIC-muoto), US_BANK_NUMBER, NRP (Espanjan veronumero). Tunnistetaan tarkistussumman validoinnin avulla väärien positiivisten minimoimiseksi.

#financialentities

Redaktointi

Tietojen redaktointi

Tietosuoja & PII

Herkän tiedon pysyvä poistaminen tai peittäminen asiakirjoista, korvaten se visuaalisella merkinnällä, kuten [REDACTED] tai mustalla palkilla. Toisin kuin salaus, redaktointi on yksisuuntainen, eikä alkuperäisiä tietoja voida palauttaa.

#redaction

Regex

Säännöllinen Ilmausmallin Vertailu

Tunnistusteknologia

Mallipohjainen tekstin vertailu käyttäen formaalia kielioppia. PII-tunnistuksessa regex käsittelee rakenteellisesti ennakoitavia tunnisteita (puhelinnumerot, luottokortit, IBANit, sähköpostiosoitteet) tarkistussumman vahvistuksella. Täydentää NER:iä hybriditunnistuksessa.

#regex

REST API

RESTful API

Infrastruktuuri

anonym.legal tarjoaa RESTful HTTP API:n ohjelmallista integrointia varten. Päätepisteet sisältävät /api/analyze, /api/anonymize, /api/image, ja /api/structured. Todentaminen JWT-kantajamerkkien avulla. Täydellinen OpenAPI-dokumentaatio saatavilla API-viitteessä.

#restapi

S

SCCs

Standardisopimuslausekkeet

Vaatimustenmukaisuus & Säännökset

Ennakkohyväksytyt GDPR-yhteensopivat sopimuslausekkeet henkilötietojen siirtämiseksi EU:sta/ETA:sta kolmansille maille. Euroopan komissio päivitti ne vuonna 2021 (2021/914/EU) vastatakseen Schrems II -vaatimuksiin, mukaan lukien siirtoarviointi.

#sccs

Schrems II

Schrems II -päätös (C-311/18)

Vaatimustenmukaisuus & Säännökset

Euroopan unionin tuomioistuimen 2020 antama päätös, joka kumoaa EU:n ja Yhdysvaltojen tietosuojakehyksen transatlanttisille tietosiirroille, viitaten riittämättömiin Yhdysvaltojen valvontalakien suojatoimiin. Edellyttää täydentäviä toimenpiteitä (salaus, anonymisointi) käytettäessä standardisopimuslausekkeita.

#schremsii

SHA-256

Turvallinen hajautusalgoritmi 256-bittinen

Salaus & Tietoturva

Kryptografinen hajautusfunktio, joka tuottaa 256-bittisen tiivisteen. Käytetään anonym.legalissa HMAC-autentikointiin API-pyyntöjen, ZK auth -todisteiden ja johdonmukaisen entiteettipseudonymisoinnin (suolaamisen kanssa hajauttaminen tuottaa saman korvauksen samalle alkuperäiselle arvolle) yhteydessä.

#sha256

spaCy

spaCy NLP-kirjasto

Tunnistusteknologia

Teollisuustason avoimen lähdekoodin NLP-kirjasto Pythonissa. anonym.legal käyttää spaCyn muunnospohjaisia malleja 24 kielellä (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko ja muita) nimettyjen entiteettien tunnistamiseen Presidio-pipelineissa.

#spacy

Spoliation

Todistusaineiston Spoliation

Oikeudellinen & Auditointi

Todistusaineiston tuhoaminen, muuttaminen tai säilyttämättä jättäminen, joka on olennaista oikeudenkäynnille. Liiallinen poistaminen, joka tekee asiakirjoista luettavissa olevia, voi muodostaa spoliation. Anonymisoinnin tarkkuuden säätäminen (luottamuskynnykset, yksikkövalinta) on tärkeää oikeudellisesti puolustettavalle poistolle.

#spoliation

Stanza

Stanza NLP-kirjasto (Stanford NLP)

Tunnistusteknologia

Stanford NLP -ryhmän Python NLP-työkalu, joka tukee yli 70 kieltä huipputason neuroverkkomalleilla. Käytetään täydentävänä NER-taustapalveluna anonym.legalissa kielille, joita spaCy-mallit eivät kata.

#stanza

Sääntö 26

Liittovaltion Siviilimenettelysäännön Sääntö 26

Oikeudellinen & Auditointi

Yhdysvaltojen siviilimenettelysääntö, joka säätelee löytövelvoitteita. Sääntö 26(g) vaatii asianajajilta vahvistamaan, että löytöpyynnöt ja -ilmoitukset eivät ole tehty väärin perustein — mukaan lukien PII:n asianmukainen poistaminen tuotetuista asiakirjoista.

#rule26

T

Terveydenhuollon Yksiköt

Terveydenhuollon PII Yksikkötyypit

Entiteettityypit

Yksikkötyypit 18 HIPAA Safe Harbor -tunnistajalle ja muille terveyteen liittyville PII:lle: US_MRN (lääkärintodistusten numerot), LÄÄKETIETEELLINEN_LUPA, TERVEYDENHUOLTO_SUUNNITELMAN_EDUNSAJA, ja diagnoosi/hoitokontekstiin liittyvät yksiköt.

#healthcareentities

Tietojen minimointi

GDPR:n tietojen minimointiperiaate

Tietosuoja & PII

GDPR:n artiklan 5(1)(c) periaate, joka vaatii, että vain tietoja, jotka ovat riittäviä, olennaisia ja tarpeellisia määriteltyyn tarkoitukseen, kerätään ja käsitellään. Keskeinen suunnittelurajoite yksityisyysvaatimusten mukaisille järjestelmille.

#dataminimization

Tietojen säilytys

Tietojen säilytyksen vaatimukset

Vaatimustenmukaisuus & Säännökset

Lailliset tai sopimukselliset vaatimukset, jotka määrittelevät, missä maantieteellisessä sijainnissa tietoja on säilytettävä ja käsiteltävä. Relevantti GDPR:lle (tietojen siirrot EEA:n ulkopuolelle), Saksan BDSG:lle ja sektorikohtaisille säädöksille terveydenhuollossa ja rahoituksessa.

#dataresidency

Tietosuoja

Digitaalinen tietosuoja

Vaatimustenmukaisuus & Säännökset

Periaate, jonka mukaan tiedot ovat sen kansakunnan lakien ja hallintorakenteiden alaisia, jossa ne on kerätty. Laajempi kuin tietojen säilytys, se kattaa hallinnan siitä, kuka voi käyttää tietoja ja minkälaisen oikeudellisen kehyksen alaisena.

#datasovereignty

TLS

Siirtokerroksen turvallisuus

Salaus & Tietoturva

Kryptografinen protokolla, joka suojaa tietoja siirron aikana. anonym.legal vaatii vähintään TLS 1.2:n, suosittelee TLS 1.3:a, HSTS:ää, jonka maksimikesto on yksi vuosi, ja HTTP/2:ta. Kaikki liikenne asiakkaiden ja palvelimen välillä on salattu siirron aikana.

#tls

Token-järjestelmä

anonym.legal Luottotoken-järjestelmä

Alusta & Tuotteet

Käyttöpohjainen laskutus, jossa API-kutsut kuluttavat tokeneita, jotka lasketaan tekstin pituuden, entiteettien määrän ja käsittelytilan (analysoi vs. anonymisoi) perusteella. Token-kustannukset ovat konfiguroitavissa tietokannassa ja näytetään reaaliaikaisesti ennen käsittelyä.

#tokensystem

Tokenisointi

Tietojen tokenisointi

Tietosuoja & PII

Herkän tiedon korvaaminen ei-herkällä paikkamerkillä (token), joka kartoittaa takaisin alkuperäiseen turvallisessa holvissa. Toisin kuin salaus, tokenilla itsellään ei ole matemaattista suhdetta alkuperäisiin tietoihin.

#tokenization

Työpöytäsovellus

anonym.legal Työpöytäsovellus

Alusta & Tuotteet

Monialustainen sovellus (Windows, macOS, Linux), joka on rakennettu Tauri 2.0:lla ja React 18:lla. Sisältää paikallisen tiedostokäsittelyn, BIP39-arkiston offline-ZK Authia varten, erävientitoiminnon ja API-synkronoinnin. Tukee ilmatilassa toimivia käyttöönottoja ilman internet-yhteyttä.

#desktopapp

U

Universaalit Yksiköt

Kielikohtaiset Universaalit Yksikkötyypit

Entiteettityypit

Yksikkötyypit, jotka tunnistetaan tekstikielestä riippumatta, tyypillisesti muotoon perustuvan regexin ja tarkistussumman validoinnin avulla. Esimerkkejä: KREDITTIKORTTI, IBAN-KOODI, SÄHKÖPOSTIOSOITE, PUHELINNUMERO, IP_OSOITE, URL, KRYPTO-osoite.

#universalentities

V

Vakuutustunnistajat

Vakuutuksen Yksikkötyypit

Entiteettityypit

Yksikkötyypit vakuutuksiin liittyville tunnistajille: US_NPI (Kansallinen Palveluntarjoajan Tunniste terveydenhuollon tarjoajille), TERVEYDENHUOLTO_SUUNNITELMAN_EDUNSAJA, ja maakohtaiset sairausvakuutusnumerot (esim. DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Valtion ID

Valtion Tunnistaja Yksikkötyypit

Entiteettityypit

Yksikkötyypit kansallisille ja valtion myöntämille tunnistajille: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, ja yli 50 muuta maakohtaista ID-muotoa. Tunnistetaan maakohtaisen regexin + tarkistussumman kaavojen avulla.

#governmentid

Verkkosovellus

anonym.legal Verkkosovellus

Alusta & Tuotteet

Selaimeen perustuva käyttöliittymä anonym.legalissa PII-analyysiä, anonymisointia ja salauksen purkua varten. Tukee tekstisyöttöä, tiedostojen lataamista (PDF, DOCX, TXT), eräkäsittelyä, ZK Authia, 48 kieltä ja yli 285 entiteettityyppiä. Asennusta ei vaadita.

#webapp

X

XChaCha20

XChaCha20-Poly1305

Salaus & Tietoturva

Autentikoitu salausalgoritmi, joka tarjoaa korkean suorituskyvyn järjestelmissä ilman AES-laitteistokiihdytystä. Käyttää 192-bittistä noncea (laajennettu IETF ChaCha20 -standardin 96-bittisestä nonceista RFC 8439:n mukaan), mikä eliminoi nonce-kollisiovaarat. Käytetään vaihtoehtoisena salausalgoritmina anonym.legalin salauskerroksessa.

#xchacha20

XLM-RoBERTa

Monikielinen RoBERTa

Tunnistusteknologia

Monikielinen muunnospohjainen kielimalli, joka on koulutettu 100 kielellä, kehitetty Meta AI:n toimesta. Käytetään anonym.legalissa monikielisissä NER-tehtävissä, erityisesti entiteettityypeissä ja kielissä, joissa yksikieliset mallit eivät ole saatavilla.

#xlmroberta

Y

Yksikkötyyppi

PII Yksikkötyyppi

Entiteettityypit

Henkilökohtaisen tiedon kategoria, jonka tunnistusmoottori tunnistaa ja voi anonymisoida. Esimerkkejä: HENKILÖ, SÄHKÖPOSTIOSOITE, PUHELINNUMERO, KREDITTIKORTTI, IBAN-KOODI, US_SSN, IP_OSOITE. anonym.legal tukee yli 285 yksikkötyyppiä 48 kielellä.

#entitytype

Yksityisyys suunnittelussa

Yksityisyys suunnittelussa ja oletuksena

Tietosuoja & PII

Periaate, jonka GDPR:n artikla 25 määrää, että tietosuojatoimenpiteet sisällytetään järjestelmiin alusta alkaen sen sijaan, että ne lisättäisiin jälkikäteen. Kattaa tietojen minimoinnin, pääsynhallinnan, salauksen ja pseudonymisoinnin arkkitehtuuritasolla.

#privacybydesign

Z

ZK Auth

Nollatietoautentikointi

Salaus & Tietoturva

anonym.legalin autentikointijärjestelmä, jossa salausavaimet johdetaan asiakaspuolella käyttäjän salasanasta Argon2id:n avulla, eikä niitä koskaan lähetetä tai tallenneta palvelimelle. Palvelin tallentaa vain kryptografisen todisteen, ei avainta tai salasanaa.

#zkauth