Docs/Glossary

Talaan ng Privacy at Teknolohiya

Mga depinisyon para sa lahat ng mga termino, akronim, at konsepto na ginagamit sa PII anonymization at privacy ng data.

Bumalik sa Docs

94 mga termino

2

2FA

Two-Factor Authentication

Encryption at Seguridad

Authentication na nangangailangan ng dalawang natatanging verification factors: isang bagay na alam ng gumagamit (password) at isang bagay na mayroon ang gumagamit (TOTP app, hardware key) o siya (biometric). Sinusuportahan sa anonym.legal bilang karagdagang layer sa itaas ng ZK Auth.

#twofa

A

AES-256-GCM

Advanced Encryption Standard 256-bit Galois/Counter Mode

Encryption at Seguridad

Isang authenticated encryption algorithm na pinagsasama ang AES-256 (256-bit key) sa Galois/Counter Mode para sa parehong pagiging kompidensyal at integridad. Ginagamit sa reversible anonymization ng anonym.legal upang i-encrypt ang mga pinalitang entidad. Nagbibigay ng parehong lihim at pagtuklas ng panghihimasok.

#aes256gcm

Anonymization

Pag-anonimize ng Datos

Privacy ng Data at PII

Ang hindi maibabalik na proseso ng pagtanggal o pagbabago ng mga nakikilalang impormasyon upang hindi na makilala ang mga indibidwal, nang direkta o hindi direkta. Sa ilalim ng GDPR, ang tunay na na-anonimize na datos ay hindi saklaw ng regulasyon.

#anonymization

Argon2id

Argon2id Key Derivation Function

Encryption at Seguridad

Ang nagwagi ng 2015 Password Hashing Competition. Pinagsasama ng Argon2id ang side-channel resistance ng Argon2i at ang GPU-resistance ng Argon2d. Ginagamit sa anonym.legal at sa vault ng Desktop App para sa pagkuha ng mga susi ng encryption mula sa mga passphrase ng gumagamit.

#argon2id

Audit Trail

Immutable Audit Trail

Legal at Audit

Isang sunud-sunod, tamper-evident na log na nagtatala kung sino ang nag-access, nagbago, o nagproseso ng data at kailan. Kinakailangan ng ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)), at mga patakaran sa e-discovery. Nagtatala ang anonym.legal ng lahat ng operasyon ng anonymization na may mga timestamp, bilang ng entidad, at mga ID ng operator.

#audittrail

B

Batch Processing

Batch File Anonymization

Plataporma at Mga Produkto

Pagproseso ng maraming file nang sabay-sabay sa isang operasyon. Sinusuportahan ng batch mode ng anonym.legal ang PDF, DOCX, at TXT files na may per-file entity configuration, confidence thresholds, at output format selection.

#batchprocessing

BIP39

Bitcoin Improvement Proposal 39 — Mnemonic Phrases

Encryption at Seguridad

Isang pamantayan para sa pagbuo ng mga human-readable mnemonic seed phrases (12–24 na salita) mula sa isang cryptographic seed. Ginagamit sa vault ng Desktop App ng anonym.legal bilang isang user-friendly na backup para sa susi ng encryption na nakuha mula sa Argon2id.

#bip39

C

CCPA

Batas sa Privacy ng Mamimili ng California

Pagsunod at mga Regulasyon

Batas sa privacy ng California na nagbibigay sa mga residente ng karapatan na malaman, burahin, at mag-opt out sa pagbebenta ng kanilang personal na impormasyon. Nalalapat sa mga negosyo na nakakatugon sa mga threshold ng kita, dami ng datos, o pagbebenta ng datos. Malaking binago ng CPRA (naipasa noong Nobyembre 2020, epektibo noong Enero 2023).

#ccpa

Chrome Extension

anonym.legal Chrome Extension

Plataporma at Mga Produkto

Browser extension (Manifest V3) na humahadlang sa text bago ito ipadala sa AI chatbots (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymizes on-the-fly at opsyonal na nagde-decrypt ng mga sagot ng AI gamit ang mga naka-save na encryption keys.

#chromeextension

CLOUD Act

Batas sa Paglilinaw ng Legal na Paggamit ng Datos sa Ibang Bansa

Pagsunod at mga Regulasyon

Pederal na batas ng US (2018) na nagpapahintulot sa mga ahensya ng batas ng US na pilitin ang mga cloud provider na nakabase sa US na magbigay ng datos na nakaimbak sa ibang bansa. Nagkakaroon ng salungatan sa mga patakaran ng GDPR sa paglilipat ng datos para sa mga residente ng EU. Ang pag-anonymize ng datos bago ang pag-upload sa cloud ay isang karaniwang mitigasyon.

#cloudact

Code-Switching

Multilinggwal na Code-Switching

Teknolohiya ng Pagtuklas

Ang phenomenon ng paghahalo ng dalawa o higit pang mga wika sa loob ng isang teksto o pag-uusap. Karaniwan sa mga multilinggwal na dokumento (hal. mga legal na dokumento sa Aleman na may mga teknikal na termino sa Ingles). Ang hybrid detection ng anonym.legal ay humahawak ng code-switched na teksto sa pamamagitan ng paglalapat ng maraming modelo ng wika nang sabay-sabay.

#codeswitching

Confidence Scoring

Score ng Kumpiyansa sa Pagtukoy ng Entidad

Teknolohiya ng Pagtuklas

Isang score mula 0–1 na nagpapahiwatig kung gaano katiyak ang detection model na ang isang bahagi ng teksto ay isang PII na entidad. Nagbibigay ang anonym.legal ng mga configurable na threshold ng kumpiyansa upang maayos ng mga gumagamit ang trade-offs sa pagitan ng precision at recall para sa kanilang tiyak na kaso.

#confidencescoring

CSP

Content Security Policy

Encryption at Seguridad

Isang HTTP response header at mekanismo ng meta tag na naglilimita kung aling mga mapagkukunan (scripts, styles, images) ang maaaring i-load ng isang browser. Kasama sa CSP ng anonym.legal ang object-src 'none', script-src na may mga nonce, at upgrade-insecure-requests upang maiwasan ang mga pag-atake ng XSS.

#csp

Custom Entities

Custom Entity Recognizers

Plataporma at Mga Produkto

Mga pattern ng PII na tinukoy ng gumagamit na idinadagdag sa mga built-in na 285+ uri ng entity ng anonym.legal. Sinusuportahan ang regex patterns, word lists, at deny-lists. Kapaki-pakinabang para sa mga identifier na tiyak sa organisasyon tulad ng mga employee IDs, internal project codes, o proprietary product names.

#customentities

D

Data Minimization

Prinsipyo ng Pagbawas ng Datos ng GDPR

Privacy ng Data at PII

Prinsipyo ng GDPR Article 5(1)(c) na nangangailangan na tanging datos na sapat, may kaugnayan, at kinakailangan para sa tinukoy na layunin ang kinokolekta at pinoproseso. Isang pangunahing disenyo na limitasyon para sa mga privacy-compliant na sistema.

#dataminimization

Data Residency

Mga Kinakailangan sa Data Residency

Pagsunod at mga Regulasyon

Mga legal o kontraktwal na kinakailangan na tinutukoy kung aling heograpikal na lokasyon dapat itago at iproseso ang datos. Mahalaga para sa GDPR (mga paglilipat ng datos sa labas ng EEA), German BDSG, at mga regulasyon na tiyak sa sektor sa pangangalaga sa kalusugan at pananalapi.

#dataresidency

Data Sovereignty

Digital Data Sovereignty

Pagsunod at mga Regulasyon

Ang prinsipyo na ang datos ay napapailalim sa mga batas at estruktura ng pamamahala ng bansa kung saan ito nakolekta. Mas malawak kaysa sa data residency, kinabibilangan nito ang kontrol kung sino ang maaaring makakuha ng datos at sa ilalim ng anong legal na balangkas.

#datasovereignty

DDoS Protection

Distributed Denial of Service Protection

Imprastruktura

Mga depensa sa antas ng imprastruktura laban sa mga distributed denial-of-service na pag-atake. Kasama sa server infrastructure ng anonym.legal ang mga firewall rules (UFW), mga limitasyon ng koneksyon ng nginx, at mga proteksyon na katumbas ng Cloudflare upang mapanatili ang availability.

#ddosprotection

De-anonymization

Pagkilala Muli sa Indibidwal

Privacy ng Data at PII

Ang proseso ng muling pagkilala sa mga indibidwal mula sa mga pinaniniwalaang na-anonimize na datasets sa pamamagitan ng pag-cross-reference sa auxiliary na impormasyon. Isang pangunahing panganib kapag nagbabahagi ng datos na may hindi sapat na lalim ng pag-anonimize.

#deanonymization

Defensibility

Legal na Defensible na Anonymization

Legal at Audit

Ang kakayahang ipakita sa mga regulator, korte, o auditor na ang anonymization ay isinagawa gamit ang isang dokumentado, pare-pareho, at teknikal na maaasahang metodolohiya. Sinusuportahan ng mga audit log ng anonym.legal, mga score ng kumpiyansa, at mga setting ng operator ang mga defensible na workflow ng anonymization.

#defensibility

Desktop App

anonym.legal Desktop Application

Plataporma at Mga Produkto

Cross-platform na application (Windows, macOS, Linux) na ginawa gamit ang Tauri 2.0 at React 18. May mga tampok na lokal na pagproseso ng file, BIP39 vault para sa offline ZK Auth, batch export, at API sync. Sinusuportahan ang air-gapped deployments nang walang access sa internet.

#desktopapp

Differential Privacy

Differential Privacy (DP)

Privacy ng Data at PII

Isang matematikal na balangkas para sa pagpapalabas ng estadistikang impormasyon tungkol sa mga datasets habang nagbibigay ng napatunayang garantiya na ang datos ng sinumang indibidwal ay hindi maaaring makilala. Ginagamit sa aggregate analytics upang maiwasan ang muling pagkilala kahit na nag-query ng mga aggregate outputs.

#differentialprivacy

Digital Identifiers

Mga Uri ng Digital na Entidad

Mga Uri ng Entidad

Mga uri ng entidad para sa online at digital na tagapagkilala: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 at IPv6), URL, DOMAIN_NAME, CRYPTO (mga address ng Bitcoin/Ethereum), at mga tagapagkilala na tiyak sa platform.

#digitalidentifiers

DLP

Data Loss Prevention

Plataporma at Mga Produkto

Isang disiplina sa seguridad at kategorya ng mga software tools na nag-detect at pumipigil sa hindi awtorisadong paglipat ng sensitibong data sa labas ng isang organisasyon. Ang anonym.legal ay gumagana bilang isang browser-layer at AI-layer DLP solution para sa PII.

#dlp

DPA

Kasunduan sa Pagproseso ng Datos

Pagsunod at mga Regulasyon

Isang legal na kontrata sa pagitan ng isang data controller at data processor, na kinakailangan ng GDPR Article 28. Tinutukoy ang paksa, tagal, kalikasan, layunin, at uri ng pagproseso ng personal na datos, at ang mga karapatan at obligasyon ng parehong partido.

#dpa

DPIA

Pagsusuri ng Epekto sa Proteksyon ng Datos

Pagsunod at mga Regulasyon

Isang proseso ng pagsusuri ng panganib na kinakailangan ng GDPR Article 35 para sa mga aktibidad ng pagproseso na malamang na magresulta sa mataas na panganib sa mga karapatan at kalayaan ng mga indibidwal. Kinakailangan para sa sistematikong profiling, malakihang pagproseso ng PHI, at pagmamasid sa pampublikong lugar.

#dpia

E

e-Discovery

Electronic Discovery

Legal at Audit

Ang proseso ng pagtukoy, pagkuha, at paggawa ng electronically stored information sa mga legal na proseso. Kinakailangan ang pag-redact ng PII at mga pribilehiyadong impormasyon mula sa mga na-produce na dokumento. Isang pangunahing kaso ng paggamit para sa mga legal na departamento na gumagamit ng anonym.legal.

#ediscovery

E2EE

End-to-End Encryption

Encryption at Seguridad

Encryption kung saan tanging ang mga nag-uusap na partido ang makakabasa ng mga mensahe; walang access ang tagapagbigay ng serbisyo sa plaintext. Sa ZK Auth mode ng anonym.legal, ang mga susi ng encryption ay hindi kailanman umaalis sa device ng client, na nakakamit ang E2EE para sa naka-anonymize na imbakan ng output.

#e2ee

EU Data Residency

European Union Data Residency

Imprastruktura

Ang garantiya na ang data ay naka-imbak at pinoproseso lamang sa loob ng teritoryo ng EU/EEA. Ang production servers ng anonym.legal ay nasa Germany (Hetzner Frankfurt), na tinitiyak na ang lahat ng pagproseso ay nagaganap sa ilalim ng hurisdiksyon ng GDPR nang walang mga implikasyon ng cross-border data transfer.

#eudataresidency

F

FOIA

Batas sa Kalayaan ng Impormasyon

Pagsunod at mga Regulasyon

Pederal na batas ng US (at mga katumbas na batas sa iba pang hurisdiksyon) na nagbibigay ng pampublikong access sa mga rekord ng gobyerno. Nangangailangan ng redaction ng PII at iba pang exempt na impormasyon bago ang pagbubunyag — isang pangunahing gamit para sa mga legal at gobyernong anonymization workflows.

#foia

G

GDPR

Pangkalahatang Regulasyon sa Proteksyon ng Datos

Pagsunod at mga Regulasyon

EU Regulasyon 2016/679, ang pangunahing balangkas ng proteksyon ng datos para sa European Union. Nalalapat sa anumang organisasyon na nagpoproseso ng personal na datos ng mga residente ng EU. Multa hanggang €20M o 4% ng pandaigdigang taunang kita. Mga pangunahing karapatan: pag-access, pagbura, portability, limitasyon, pagtutol.

#gdpr

GDPR Article 25

GDPR Article 25 — Proteksyon ng Datos sa Disenyo at sa Default

Pagsunod at mga Regulasyon

Nangangailangan sa mga controller na ipatupad ang angkop na teknikal at organisasyonal na mga hakbang (tulad ng pseudonymization at data minimization) sa parehong oras ng disenyo ng sistema at sa default sa panahon ng pagproseso.

#gdprarticle25

GDPR Article 32

GDPR Article 32 — Seguridad ng Pagproseso

Pagsunod at mga Regulasyon

Nangangailangan sa mga controller at processor na ipatupad ang angkop na teknikal at organisasyonal na mga hakbang upang matiyak ang isang antas ng seguridad na angkop sa panganib, kabilang ang encryption, pseudonymization, pagiging kompidensyal, integridad, availability, at katatagan ng mga sistema ng pagproseso.

#gdprarticle32

GenAI DLP

Generative AI Data Loss Prevention

Plataporma at Mga Produkto

Isang espesyal na kategorya ng DLP na nakatuon sa pagpigil sa PII at kumpidensyal na data mula sa pagiging kasama sa mga prompts na ipinapadala sa mga generative AI models (ChatGPT, Claude, Gemini). Ang Chrome Extension at MCP Server ng anonym.legal ay tumutugon sa panganib na ito sa punto ng input.

#genaidlp

H

Hashing

Cryptographic Hashing

Privacy ng Data at PII

Isang one-way na pagbabago ng datos sa isang fixed-length digest gamit ang mga algorithm tulad ng SHA-256. Ginagamit para sa pare-parehong pseudonymization, deduplication, at pag-verify ng integridad. Ang mga hash value ay hindi maaaring baligtarin ngunit maaaring maging bulnerable sa rainbow table attacks kung hindi salted.

#hashing

Healthcare Entities

Healthcare PII Uri ng Entidad

Mga Uri ng Entidad

Mga uri ng entidad para sa 18 HIPAA Safe Harbor na tagapagkilala at karagdagang PII na may kaugnayan sa kalusugan: US_MRN (mga numero ng medikal na rekord), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY, at mga konteksto ng diagnosis/paggamot.

#healthcareentities

Hetzner

Hetzner Online GmbH

Imprastruktura

German cloud at hosting provider kung saan tumatakbo ang production infrastructure ng anonym.legal. Matatagpuan sa Falkenstein, Saxony (datacenter fsn1) na may ISO 27001 certification. Pinili para sa EU data residency, compliance posture, at GDPR-friendly jurisdiction sa ilalim ng batas ng Aleman.

#hetzner

HIPAA

Batas sa Pagpapalipat-lipat at Pananagutan ng Seguro sa Kalusugan

Pagsunod at mga Regulasyon

Pederal na batas ng US na nagtatakda ng mga pamantayan para sa proteksyon ng sensitibong impormasyon sa kalusugan ng pasyente. Ang Privacy Rule ay namamahala sa paggamit ng PHI; ang Security Rule ay nangangailangan ng mga administratibong, pisikal, at teknikal na mga proteksyon para sa elektronikong PHI (ePHI). Ang mga paglabag ay nagdadala ng multa hanggang $1.9M bawat kategorya bawat taon.

#hipaa

HIPAA Safe Harbor

Pamamaraan ng De-identification ng HIPAA Safe Harbor

Pagsunod at mga Regulasyon

Isa sa dalawang pamamaraan ng de-identification na inaprubahan ng HIPAA na nangangailangan ng pagtanggal ng lahat ng 18 na tinukoy na pagkakakilanlan ng pasyente (pangalan, address, mga petsa, numero ng telepono, SSN, email, IP address, biometrics, atbp.) upang gawing hindi natutukoy ang datos ng kalusugan.

#hipaasafeharbor

HSTS

HTTP Strict Transport Security

Encryption at Seguridad

Isang mekanismo ng web security policy na pinipilit ang mga browser na gumamit lamang ng HTTPS na koneksyon. Itinatakda ng anonym.legal ang Strict-Transport-Security: max-age=31536000; includeSubDomains upang maiwasan ang mga pag-atake ng protocol downgrade at cookie hijacking.

#hsts

Hybrid Detection

Hybrid NLP + Regex + ML Detection

Teknolohiya ng Pagtuklas

Tatlong-layer na diskarte ng anonym.legal: mga regex pattern para sa estrukturadong PII (mga numero ng telepono, IBAN, mga credit card), mga modelo ng NLP/NER para sa mga kontekstwal na entidad (mga pangalan, organisasyon, lokasyon), at mga ML classifier para sa mga hindi tiyak na kaso. Binabawasan ang parehong false positives at false negatives.

#hybriddetection

I

ID ng Gobyerno

Mga Uri ng Entidad ng Tagapagkilala ng Gobyerno

Mga Uri ng Entidad

Mga uri ng entidad para sa mga pambansa at gobyernong ibinibigay na tagapagkilala: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, at 50+ iba pang mga format ng ID na tiyak sa bansa. Natutukoy gamit ang mga regex na tiyak sa bansa + mga pattern ng checksum.

#governmentid

Image Redactor

Presidio Image Redactor Service

Imprastruktura

Isang specialized backend service (port 8013) na tumutukoy at nag-redact ng PII mula sa mga image file (PNG, JPEG) gamit ang OCR at Presidio analysis. Nag-aaplay ng black-bar redaction sa mga natukoy na PII na rehiyon sa orihinal na imahe.

#presidioimageredactor

Insurance Identifiers

Mga Uri ng Entidad ng Seguro

Mga Uri ng Entidad

Mga uri ng entidad para sa mga tagapagkilala na may kaugnayan sa seguro: US_NPI (National Provider Identifier para sa mga tagapagbigay ng healthcare), HEALTHCARE_PLAN_BENEFICIARY, at mga numero ng health insurance na tiyak sa bansa (hal., DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

ISO 27001

Pamamahala sa Seguridad ng Impormasyon ng ISO/IEC 27001

Pagsunod at mga Regulasyon

Internasyonal na pamantayan para sa mga sistema ng pamamahala ng seguridad ng impormasyon (ISMS). Ang sertipikasyon ay nangangailangan ng mga dokumentadong patakaran, pagsusuri ng panganib, at mga kontrol. Ang mga server ng anonym.legal sa EU ay ISO 27001-certified, na tinitiyak ang nakabalangkas na pamamahala ng seguridad.

#iso27001

ISO 27001 SoA

Pahayag ng Aplikabilidad

Pagsunod at mga Regulasyon

Isang kinakailangang dokumento ng ISO 27001 na naglilista ng lahat ng Annex A controls, na nagpapahiwatig kung aling mga ito ay naaangkop sa organisasyon, at nagbibigay ng paliwanag para sa mga inclusions at exclusions. Kinakailangan para sa sertipikasyon at mga audit.

#iso27001soa

J

JWT

JSON Web Token

Encryption at Seguridad

Isang compact, URL-safe na format ng token na ginagamit para sa pagpapadala ng mga claim sa pagitan ng mga partido. Gumagamit ang anonym.legal ng mga JWT na nilagdaan gamit ang HS256 para sa internal na authentication ng serbisyo-sa-serbisyo (hal. frontend → Presidio API). Ang mga token ay may maikling buhay at validated sa server-side.

#jwt

K

KEK

Key Encryption Key

Encryption at Seguridad

Isang susi na ginagamit upang i-encrypt ang iba pang mga susi sa halip na data nang direkta. Sa ZK architecture ng anonym.legal, ang susi na nakuha mula sa passphrase ng gumagamit ay nagsisilbing KEK upang protektahan ang mga susi ng encryption sa bawat dokumento na naka-imbak sa encrypted vault.

#kek

L

Language Detection

Awtomatikong Pagtukoy ng Wika

Teknolohiya ng Pagtuklas

Ang awtomatikong pagkilala ng wika ng input na teksto bago ang pagsusuri ng PII. Ang anonym.legal ay tumutukoy ng wika sa antas ng kahilingan at nagruruta sa naaangkop na NER model pipeline, na may English bilang fallback para sa mga hindi suportadong wika.

#languagedetection

M

Masking

Pag-mask ng Datos

Privacy ng Data at PII

Papalitan ang mga sensitibong halaga ng makatotohanang ngunit kathang-isip na datos na nagpapanatili ng format at estruktura. Ginagamit para sa mga testing environment, analytics, at pagbabahagi ng datasets nang hindi inilalantad ang totoong PII.

#masking

MCP

Model Context Protocol

Plataporma at Mga Produkto

Isang open protocol mula sa Anthropic na nagpapahintulot sa mga AI model na makipag-ugnayan sa mga panlabas na tool at data sources sa isang standardized na paraan. Ang anonym.legal ay nagpapatupad ng MCP Server upang ang mga AI coding tools ay makapag-invoke ng anonymization nang hindi umaalis sa kanilang workflow.

#mcp

MCP Server

Model Context Protocol Server

Plataporma at Mga Produkto

Ang integrasyon ng MCP Server ng anonym.legal ay nagpapahintulot sa mga AI coding assistants (Claude Desktop, Cursor, VS Code Copilot) na tawagan ang anonymization API nang direkta bilang isang tool. Ang PII ay tinatanggal mula sa code, prompts, at context bago ito ipadala sa AI model.

#mcpserver

Mga Tagapagkilala ng Sasakyan

Mga Uri ng Entidad ng Sasakyan

Mga Uri ng Entidad

Mga uri ng entidad para sa mga tagapagkilala na may kaugnayan sa sasakyan: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Vehicle Identification Number), at mga format ng rehistrasyon ng sasakyan na tiyak sa bansa.

#vehicleidentifiers

ML Models

Mga Modelo ng Machine Learning para sa Pagtukoy ng PII

Teknolohiya ng Pagtuklas

Mga estadistikang modelo na sinanay sa mga nakatagong teksto upang makilala ang PII sa konteksto. Gumagamit ang anonym.legal ng parehong spaCy transformer pipelines at fine-tuned XLM-RoBERTa para sa multilinggwal na pagtukoy ng entidad sa antas ng produksyon.

#mlmodels

N

NER

Pagtukoy ng Nakatagong Entidad

Teknolohiya ng Pagtuklas

Isang gawain sa pagproseso ng natural na wika na tumutukoy at nag-uuri ng mga nakatagong entidad sa teksto sa mga paunang natukoy na kategorya tulad ng mga tao, organisasyon, lokasyon, mga petsa, at mga medikal na tagatukoy. Ang pangunahing teknolohiya ng ML na nagpapagana ng pagtukoy ng PII sa anonym.legal.

#ner

NIS2

Network and Information Security Directive 2

Pagsunod at mga Regulasyon

EU Directive 2022/2555 na pinalawak ang orihinal na NIS Directive upang sakupin ang higit pang mga sektor (pangangalaga sa kalusugan, enerhiya, transportasyon, digital na imprastruktura) at pinatibay ang mga kinakailangan sa cybersecurity. Ang deadline ng transposisyon ay noong Oktubre 17, 2024; karamihan sa mga estado ng EU ay hindi ito natugunan at nagbukas ang European Commission ng mga proseso ng paglabag laban sa mga hindi sumusunod na estado.

#nis2

NLP

Pagproseso ng Natural na Wika

Teknolohiya ng Pagtuklas

Isang sangay ng artipisyal na talino na may kinalaman sa interaksyon sa pagitan ng mga computer at wika ng tao. Sa pagtukoy ng PII, nauunawaan ng mga modelo ng NLP ang konteksto, gramatika, at semantika upang matukoy ang mga entidad na hindi kayang makita ng mga regex pattern lamang.

#nlp

O

Office Add-in

anonym.legal Microsoft Office Add-in

Plataporma at Mga Produkto

Microsoft Office extension na nag-iintegrate ng PII anonymization nang direkta sa Word, Excel, at PowerPoint. Sinusuportahan ang in-document redaction, preset management, ZK Auth, at sync sa mga device. Available mula sa Microsoft AppSource.

#officeaddin

Operators

Anonymization Operators

Plataporma at Mga Produkto

Ang estratehiya ng pagpapalit na inilalapat sa natukoy na PII. Sinusuportahan ng anonym.legal ang REPLACE (placeholder text), REDACT (empty string), MASK (asterisks), HASH (SHA-256 digest), ENCRYPT (reversible AES-256-GCM), at CUSTOM (user-defined replacement).

#operators

Over-Redaction

Over-Redaction (Maling Positibo)

Legal at Audit

Ang pagtanggal ng higit pang impormasyon kaysa sa kinakailangan, na binabawasan ang utility ng dokumento at maaaring magdulot ng spoliation sa mga legal na proseso. Nagmumula ito sa mababang threshold ng kumpiyansa o labis na malawak na pagpili ng entidad. Maaaring i-tune sa pamamagitan ng threshold at mga kontrol ng entidad ng anonym.legal.

#overredaction

P

Pangkalahatang Entidad

Mga Uri ng Entidad na Wika-Pangkalahatan

Mga Uri ng Entidad

Mga uri ng entidad na natutukoy anuman ang wika ng teksto, karaniwang sa pamamagitan ng format-based regex na may checksum validation. Mga halimbawa: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO address.

#universalentities

PCI DSS

Pamantayan sa Seguridad ng Datos ng Industriya ng Bayad na Kard

Pagsunod at mga Regulasyon

Pamantayan sa seguridad para sa mga organisasyon na humahawak ng datos ng bayad na kard, na pinananatili ng PCI Security Standards Council. Nangangailangan ng encryption, access controls, logging, at regular na pagsusuri. Ang hindi pagsunod ay maaaring magresulta sa multa at pagkawala ng pribilehiyo sa pagproseso ng kard.

#pcidss

PHI

Nakaprotektang Impormasyon sa Kalusugan

Privacy ng Data at PII

Anumang impormasyon na may kaugnayan sa kalusugan na konektado sa isang makikilalang indibidwal, na pinangangasiwaan sa ilalim ng HIPAA sa US. Kasama ang mga diagnosis, tala ng paggamot, datos ng seguro, at alinman sa 18 na tagapagkilalang Safe Harbor ng HIPAA.

#phi

PII

Personal na Makikilalang Impormasyon

Privacy ng Data at PII

Anumang datos na maaaring makilala ang isang tiyak na indibidwal nang direkta o sa kumbinasyon ng ibang datos. Mga halimbawa: mga pangalan, email address, numero ng social security, IP address, mga biometric na tala.

#pii

Pinansyal na Entidad

Pinansyal na PII Uri ng Entidad

Mga Uri ng Entidad

Mga uri ng entidad na sumasaklaw sa mga pinansyal na tagapagkilala: CREDIT_CARD (Luhn checksum), IBAN_CODE (ISO 13616 checksum), SWIFT_CODE (BIC format), US_BANK_NUMBER, NRP (Spanish tax ID). Natutukoy gamit ang checksum validation upang mabawasan ang mga maling positibo.

#financialentities

Presets

Anonymization Presets

Plataporma at Mga Produkto

Naka-save na mga configuration ng mga napiling uri ng entity, confidence thresholds, at mga opsyon sa output na maaaring ilapat sa isang click. Ang mga presets ay nag-sync sa Web App, Office Add-in, at Desktop App sa pamamagitan ng encrypted cloud storage.

#presets

Presidio

Microsoft Presidio

Teknolohiya ng Pagtuklas

Isang open-source na SDK para sa proteksyon ng data at anonymization mula sa Microsoft. Ang detection engine ng anonym.legal ay nakabatay sa mga serbisyo ng analyzer at anonymizer ng Presidio, na pinalawak ng higit sa 285 na pasadyang tagatukoy ng entidad sa 48 na wika.

#presidio

Presidio Analyzer

Microsoft Presidio Analyzer Service

Imprastruktura

Ang detection component ng backend ng anonym.legal (port 8011). Tumanggap ng teksto at nagbabalik ng listahan ng mga natukoy na PII entities kasama ang kanilang mga posisyon, uri, at mga score ng kumpiyansa. Pinalawak na may 285+ custom recognizers sa 48 wika.

#presidioanalyzer

Presidio Anonymizer

Microsoft Presidio Anonymizer Service

Imprastruktura

Ang transformation component ng backend ng anonym.legal (port 8012). Tumanggap ng teksto at mga resulta ng analyzer bilang input, inilalapat ang napiling operator (REPLACE, REDACT, MASK, HASH, ENCRYPT) sa bawat natukoy na entidad, at nagbabalik ng anonymized na teksto.

#presidioanonymizer

Pribilehiyo ng Abogado-Kliyente

Proteksyon ng Pribilehiyo ng Abogado-Kliyente

Legal at Audit

Legal na proteksyon para sa mga kumpidensyal na komunikasyon sa pagitan ng mga abogado at kliyente. Sa pagsusuri ng dokumento at e-discovery, ang pribilehiyadong nilalaman ay dapat matukoy at itago o i-redact. Ang mga custom na uri ng entidad sa anonym.legal ay maaaring i-configure upang markahan ang mga pribilehiyadong nilalaman.

#attorneyclientprivilege

Privacy by Design

Privacy by Design at Default

Privacy ng Data at PII

Ang prinsipyo, na ipinag-uutos ng GDPR Article 25, na ang mga hakbang sa proteksyon ng datos ay nakabuo sa mga sistema mula sa simula sa halip na idagdag bilang isang afterthought. Saklaw nito ang pagbawas ng datos, mga kontrol sa pag-access, encryption, at pseudonymization sa antas ng arkitektura.

#privacybydesign

Pseudonymization

Pagsusunod ng Datos

Privacy ng Data at PII

Papalitan ang mga direktang tagapagkilala ng mga artipisyal na halaga (pseudonyms) habang pinapanatili ang kakayahang muling makilala ang mga indibidwal gamit ang hiwalay na susi. Kinilala ng GDPR Article 4(5) ito bilang isang teknolohiya na nagpapahusay sa privacy ngunit hindi nag-aalis ng pseudonymized na datos mula sa regulasyon.

#pseudonymization

R

Rate Limiting

API Rate Limiting

Imprastruktura

Mga kontrol sa bilang ng mga API request na maaaring gawin ng isang kliyente sa loob ng isang time window. Pinipigilan ang pang-aabuso at tinitiyak ang patas na alokasyon ng mapagkukunan. Nag-aaplay ang anonym.legal ng per-user rate limits batay sa tier ng plano, na may exponential backoff na inirerekomenda para sa retry logic.

#ratelimiting

Redaction

Pag-redact ng Datos

Privacy ng Data at PII

Permanenteng pagtanggal o pagtakip ng sensitibong impormasyon mula sa mga dokumento, pinalitan ito ng isang visual na tagapagpahiwatig tulad ng [REDACTED] o isang itim na bar. Hindi tulad ng encryption, ang redaction ay isang-way at ang orihinal na datos ay hindi maaaring maibalik.

#redaction

Regex

Pagpapares ng Regular na Ekspresyon

Teknolohiya ng Pagtuklas

Pagpapares ng teksto batay sa pattern gamit ang pormal na syntax ng wika. Sa pagtukoy ng PII, pinangangasiwaan ng regex ang mga estruktural na nakatakdang tagatukoy (mga numero ng telepono, mga credit card, IBAN, mga email address) na may pagsusuri ng checksum. Kumplementaryo sa NER para sa hybrid na pagtukoy.

#regex

REST API

RESTful API

Imprastruktura

nag-e-expose ang anonym.legal ng isang RESTful HTTP API para sa programmatic integration. Kasama sa mga endpoint ang /api/analyze, /api/anonymize, /api/image, at /api/structured. Naka-authenticate sa pamamagitan ng JWT bearer tokens. Buong OpenAPI documentation ay available sa API Reference.

#restapi

Rule 26

Pederal na Mga Patakaran ng Civil Procedure Rule 26

Legal at Audit

Patakaran sa sibil ng US na namamahala sa mga obligasyon sa discovery. Ang Rule 26(g) ay nangangailangan sa mga abogado na tiyakin na ang mga kahilingan at pagbubunyag ng discovery ay hindi ginawa para sa mga hindi wastong layunin — kabilang ang hindi wastong pag-redact ng PII mula sa mga na-produce na dokumento.

#rule26

S

SCCs

Mga Standard Contractual Clauses

Pagsunod at mga Regulasyon

Mga pre-approved na kontraktwal na mga clause na sumusunod sa GDPR para sa paglilipat ng personal na datos mula sa EU/EEA patungo sa mga third countries. Na-update ng European Commission noong 2021 (2021/914/EU) upang matugunan ang mga kinakailangan ng Schrems II, kabilang ang isang Transfer Impact Assessment.

#sccs

Schrems II

Desisyon ng Schrems II (C-311/18)

Pagsunod at mga Regulasyon

2020 Desisyon ng Hukuman ng Hustisya ng EU na nagbabasura sa balangkas ng EU-US Privacy Shield para sa mga paglilipat ng datos sa transatlantic, na binanggit ang hindi sapat na proteksyon ng batas ng US sa pagmamasid. Nangangailangan ng mga karagdagang hakbang (encryption, anonymization) kapag gumagamit ng Standard Contractual Clauses.

#schremsii

SHA-256

Secure Hash Algorithm 256-bit

Encryption at Seguridad

Isang cryptographic hash function na gumagawa ng 256-bit digest. Ginagamit sa anonym.legal para sa HMAC authentication ng mga kahilingan sa API, ZK auth proofs, at pare-parehong pseudonymization ng entidad (ang hashing na may salt ay nagbubunga ng parehong kapalit para sa parehong orihinal na halaga).

#sha256

spaCy

spaCy NLP Library

Teknolohiya ng Pagtuklas

Isang matibay na open-source NLP library sa Python. Gumagamit ang anonym.legal ng mga modelo ng spaCy na batay sa transformer para sa 24 na wika (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, at iba pa) para sa pagtukoy ng nakatagong entidad sa Presidio pipeline.

#spacy

Spoliation

Pagsira ng Ebidensya

Legal at Audit

Ang pagkasira, pagbabago, o pagkabigong mapanatili ang ebidensya na may kaugnayan sa litgasyon. Ang labis na agresibong pag-redact na nagiging sanhi ng mga dokumento na hindi mabasa ay maaaring ituring na spoliation. Mahalaga ang pag-calibrate ng precision ng anonymization (mga threshold ng kumpiyansa, pagpili ng entidad) para sa legal na defensible na pag-redact.

#spoliation

Stanza

Stanza NLP Library (Stanford NLP)

Teknolohiya ng Pagtuklas

Toolkit ng NLP ng Stanford NLP Group sa Python na sumusuporta sa higit sa 70 wika gamit ang mga makabagong neural na modelo. Ginagamit bilang karagdagang NER backend sa anonym.legal para sa mga wika na hindi saklaw ng mga modelo ng spaCy.

#stanza

T

TLS

Transport Layer Security

Encryption at Seguridad

Ang cryptographic protocol na nagse-secure ng data sa transit. Pinipilit ng anonym.legal ang minimum na TLS 1.2 na may TLS 1.3 na ginustong, HSTS na may maximum na edad na isang taon, at HTTP/2. Lahat ng trapiko sa pagitan ng mga kliyente at ng server ay naka-encrypt sa transit.

#tls

Token System

anonym.legal Credit Token System

Plataporma at Mga Produkto

Usage-based billing kung saan ang mga API calls ay kumokonsumo ng mga token na kinakalkula mula sa haba ng text, bilang ng entity, at processing mode (analyze vs. anonymize). Ang mga gastos sa token ay maaaring i-configure sa DB at ipinapakita sa real-time bago ang pagproseso.

#tokensystem

Tokenization

Pag-tokenize ng Datos

Privacy ng Data at PII

Papalitan ang sensitibong datos ng isang hindi sensitibong placeholder (token) na nagma-map pabalik sa orihinal sa isang secure na vault. Hindi tulad ng encryption, ang token mismo ay walang matematikal na ugnayan sa orihinal na datos.

#tokenization

U

Under-Redaction

Under-Redaction (Maling Negatibo)

Legal at Audit

Ang pagkabigong alisin ang lahat ng PII, na nag-iiwan ng mga indibidwal na nakalantad sa mga ibinahaging dokumento. Ang mas karaniwang panganib sa pagsunod. Nagmumula ito sa mataas na threshold ng kumpiyansa, nawawalang mga uri ng entidad, o mga bagong format ng PII. Naibsan ng hybrid detection at suporta sa custom na entidad ng anonym.legal.

#underredaction

Uri ng Entidad

Uri ng PII Entidad

Mga Uri ng Entidad

Isang kategorya ng personal na impormasyon na kinikilala ng detection engine at maaaring i-anonymize. Mga halimbawa: TAO, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. sinusuportahan ng anonym.legal ang 285+ uri ng entidad sa 48 wika.

#entitytype

V

Vault

Encryption Key Vault

Plataporma at Mga Produkto

Secure local storage para sa mga encryption keys sa Desktop App, na protektado ng Argon2id key derivation mula sa isang master passphrase. Ang mga keys ay naka-store na encrypted gamit ang AES-256-GCM at naka-backup sa pamamagitan ng BIP39 mnemonic phrases.

#vault

W

Web App

anonym.legal Web Application

Plataporma at Mga Produkto

Browser-based interface sa anonym.legal para sa pagsusuri ng PII, anonymization, at decryption. Sinusuportahan ang text input, file upload (PDF, DOCX, TXT), batch processing, ZK Auth, 48 wika, at 285+ uri ng entity. Walang kinakailangang installation.

#webapp

X

XChaCha20

XChaCha20-Poly1305

Encryption at Seguridad

Isang authenticated encryption algorithm na nag-aalok ng mataas na pagganap sa mga sistema na walang AES hardware acceleration. Gumagamit ng 192-bit nonce (pinalawak mula sa 96-bit nonce ng IETF ChaCha20 standard ayon sa RFC 8439), na inaalis ang mga panganib ng nonce-collision. Ginagamit bilang alternatibong cipher sa encryption layer ng anonym.legal.

#xchacha20

XLM-RoBERTa

Cross-Lingual RoBERTa

Teknolohiya ng Pagtuklas

Isang multilinggwal na modelo ng wika na transformer na sinanay sa 100 wika, na binuo ng Meta AI. Ginagamit sa anonym.legal para sa mga cross-lingual na gawain ng NER, partikular para sa mga uri ng entidad at mga wika kung saan hindi magagamit ang mga monolingual na modelo.

#xlmroberta

Z

Zero-Knowledge

Zero-Knowledge Architecture

Encryption at Seguridad

Isang disenyo ng sistema kung saan ang tagapagbigay ng serbisyo ay walang access sa plaintext na data ng mga gumagamit o mga susi ng encryption. Lahat ng encryption/decryption ay nangyayari sa client-side; hindi kailanman nakikita ng server ang orihinal na nilalaman. Pinipigilan ang mga banta mula sa loob at sapilitang pagsisiwalat.

#zeroknowledge

ZK Auth

Zero-Knowledge Authentication

Encryption at Seguridad

sistema ng authentication ng anonym.legal kung saan ang mga susi ng encryption ay nagmumula sa client-side mula sa passphrase ng gumagamit gamit ang Argon2id, na hindi kailanman ipinapadala o iniimbak sa server. Ang server ay nag-iimbak lamang ng isang cryptographic proof, hindi ang susi o passphrase.

#zkauth