Talaan ng Privacy at Teknolohiya
Mga depinisyon para sa lahat ng mga termino, akronim, at konsepto na ginagamit sa PII anonymization at privacy ng data.
Bumalik sa Docs94 mga termino
2
2FA
Two-Factor Authentication
Authentication na nangangailangan ng dalawang natatanging verification factors: isang bagay na alam ng gumagamit (password) at isang bagay na mayroon ang gumagamit (TOTP app, hardware key) o siya (biometric). Sinusuportahan sa anonym.legal bilang karagdagang layer sa itaas ng ZK Auth.
#twofaA
AES-256-GCM
Advanced Encryption Standard 256-bit Galois/Counter Mode
Isang authenticated encryption algorithm na pinagsasama ang AES-256 (256-bit key) sa Galois/Counter Mode para sa parehong pagiging kompidensyal at integridad. Ginagamit sa reversible anonymization ng anonym.legal upang i-encrypt ang mga pinalitang entidad. Nagbibigay ng parehong lihim at pagtuklas ng panghihimasok.
#aes256gcmAnonymization
Pag-anonimize ng Datos
Ang hindi maibabalik na proseso ng pagtanggal o pagbabago ng mga nakikilalang impormasyon upang hindi na makilala ang mga indibidwal, nang direkta o hindi direkta. Sa ilalim ng GDPR, ang tunay na na-anonimize na datos ay hindi saklaw ng regulasyon.
#anonymizationArgon2id
Argon2id Key Derivation Function
Ang nagwagi ng 2015 Password Hashing Competition. Pinagsasama ng Argon2id ang side-channel resistance ng Argon2i at ang GPU-resistance ng Argon2d. Ginagamit sa anonym.legal at sa vault ng Desktop App para sa pagkuha ng mga susi ng encryption mula sa mga passphrase ng gumagamit.
#argon2idAudit Trail
Immutable Audit Trail
Isang sunud-sunod, tamper-evident na log na nagtatala kung sino ang nag-access, nagbago, o nagproseso ng data at kailan. Kinakailangan ng ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)), at mga patakaran sa e-discovery. Nagtatala ang anonym.legal ng lahat ng operasyon ng anonymization na may mga timestamp, bilang ng entidad, at mga ID ng operator.
#audittrailB
Batch Processing
Batch File Anonymization
Pagproseso ng maraming file nang sabay-sabay sa isang operasyon. Sinusuportahan ng batch mode ng anonym.legal ang PDF, DOCX, at TXT files na may per-file entity configuration, confidence thresholds, at output format selection.
#batchprocessingBIP39
Bitcoin Improvement Proposal 39 — Mnemonic Phrases
Isang pamantayan para sa pagbuo ng mga human-readable mnemonic seed phrases (12–24 na salita) mula sa isang cryptographic seed. Ginagamit sa vault ng Desktop App ng anonym.legal bilang isang user-friendly na backup para sa susi ng encryption na nakuha mula sa Argon2id.
#bip39C
CCPA
Batas sa Privacy ng Mamimili ng California
Batas sa privacy ng California na nagbibigay sa mga residente ng karapatan na malaman, burahin, at mag-opt out sa pagbebenta ng kanilang personal na impormasyon. Nalalapat sa mga negosyo na nakakatugon sa mga threshold ng kita, dami ng datos, o pagbebenta ng datos. Malaking binago ng CPRA (naipasa noong Nobyembre 2020, epektibo noong Enero 2023).
#ccpaChrome Extension
anonym.legal Chrome Extension
Browser extension (Manifest V3) na humahadlang sa text bago ito ipadala sa AI chatbots (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Anonymizes on-the-fly at opsyonal na nagde-decrypt ng mga sagot ng AI gamit ang mga naka-save na encryption keys.
#chromeextensionCLOUD Act
Batas sa Paglilinaw ng Legal na Paggamit ng Datos sa Ibang Bansa
Pederal na batas ng US (2018) na nagpapahintulot sa mga ahensya ng batas ng US na pilitin ang mga cloud provider na nakabase sa US na magbigay ng datos na nakaimbak sa ibang bansa. Nagkakaroon ng salungatan sa mga patakaran ng GDPR sa paglilipat ng datos para sa mga residente ng EU. Ang pag-anonymize ng datos bago ang pag-upload sa cloud ay isang karaniwang mitigasyon.
#cloudactCode-Switching
Multilinggwal na Code-Switching
Ang phenomenon ng paghahalo ng dalawa o higit pang mga wika sa loob ng isang teksto o pag-uusap. Karaniwan sa mga multilinggwal na dokumento (hal. mga legal na dokumento sa Aleman na may mga teknikal na termino sa Ingles). Ang hybrid detection ng anonym.legal ay humahawak ng code-switched na teksto sa pamamagitan ng paglalapat ng maraming modelo ng wika nang sabay-sabay.
#codeswitchingConfidence Scoring
Score ng Kumpiyansa sa Pagtukoy ng Entidad
Isang score mula 0–1 na nagpapahiwatig kung gaano katiyak ang detection model na ang isang bahagi ng teksto ay isang PII na entidad. Nagbibigay ang anonym.legal ng mga configurable na threshold ng kumpiyansa upang maayos ng mga gumagamit ang trade-offs sa pagitan ng precision at recall para sa kanilang tiyak na kaso.
#confidencescoringCSP
Content Security Policy
Isang HTTP response header at mekanismo ng meta tag na naglilimita kung aling mga mapagkukunan (scripts, styles, images) ang maaaring i-load ng isang browser. Kasama sa CSP ng anonym.legal ang object-src 'none', script-src na may mga nonce, at upgrade-insecure-requests upang maiwasan ang mga pag-atake ng XSS.
#cspCustom Entities
Custom Entity Recognizers
Mga pattern ng PII na tinukoy ng gumagamit na idinadagdag sa mga built-in na 285+ uri ng entity ng anonym.legal. Sinusuportahan ang regex patterns, word lists, at deny-lists. Kapaki-pakinabang para sa mga identifier na tiyak sa organisasyon tulad ng mga employee IDs, internal project codes, o proprietary product names.
#customentitiesD
Data Minimization
Prinsipyo ng Pagbawas ng Datos ng GDPR
Prinsipyo ng GDPR Article 5(1)(c) na nangangailangan na tanging datos na sapat, may kaugnayan, at kinakailangan para sa tinukoy na layunin ang kinokolekta at pinoproseso. Isang pangunahing disenyo na limitasyon para sa mga privacy-compliant na sistema.
#dataminimizationData Residency
Mga Kinakailangan sa Data Residency
Mga legal o kontraktwal na kinakailangan na tinutukoy kung aling heograpikal na lokasyon dapat itago at iproseso ang datos. Mahalaga para sa GDPR (mga paglilipat ng datos sa labas ng EEA), German BDSG, at mga regulasyon na tiyak sa sektor sa pangangalaga sa kalusugan at pananalapi.
#dataresidencyData Sovereignty
Digital Data Sovereignty
Ang prinsipyo na ang datos ay napapailalim sa mga batas at estruktura ng pamamahala ng bansa kung saan ito nakolekta. Mas malawak kaysa sa data residency, kinabibilangan nito ang kontrol kung sino ang maaaring makakuha ng datos at sa ilalim ng anong legal na balangkas.
#datasovereigntyDDoS Protection
Distributed Denial of Service Protection
Mga depensa sa antas ng imprastruktura laban sa mga distributed denial-of-service na pag-atake. Kasama sa server infrastructure ng anonym.legal ang mga firewall rules (UFW), mga limitasyon ng koneksyon ng nginx, at mga proteksyon na katumbas ng Cloudflare upang mapanatili ang availability.
#ddosprotectionDe-anonymization
Pagkilala Muli sa Indibidwal
Ang proseso ng muling pagkilala sa mga indibidwal mula sa mga pinaniniwalaang na-anonimize na datasets sa pamamagitan ng pag-cross-reference sa auxiliary na impormasyon. Isang pangunahing panganib kapag nagbabahagi ng datos na may hindi sapat na lalim ng pag-anonimize.
#deanonymizationDefensibility
Legal na Defensible na Anonymization
Ang kakayahang ipakita sa mga regulator, korte, o auditor na ang anonymization ay isinagawa gamit ang isang dokumentado, pare-pareho, at teknikal na maaasahang metodolohiya. Sinusuportahan ng mga audit log ng anonym.legal, mga score ng kumpiyansa, at mga setting ng operator ang mga defensible na workflow ng anonymization.
#defensibilityDesktop App
anonym.legal Desktop Application
Cross-platform na application (Windows, macOS, Linux) na ginawa gamit ang Tauri 2.0 at React 18. May mga tampok na lokal na pagproseso ng file, BIP39 vault para sa offline ZK Auth, batch export, at API sync. Sinusuportahan ang air-gapped deployments nang walang access sa internet.
#desktopappDifferential Privacy
Differential Privacy (DP)
Isang matematikal na balangkas para sa pagpapalabas ng estadistikang impormasyon tungkol sa mga datasets habang nagbibigay ng napatunayang garantiya na ang datos ng sinumang indibidwal ay hindi maaaring makilala. Ginagamit sa aggregate analytics upang maiwasan ang muling pagkilala kahit na nag-query ng mga aggregate outputs.
#differentialprivacyDigital Identifiers
Mga Uri ng Digital na Entidad
Mga uri ng entidad para sa online at digital na tagapagkilala: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 at IPv6), URL, DOMAIN_NAME, CRYPTO (mga address ng Bitcoin/Ethereum), at mga tagapagkilala na tiyak sa platform.
#digitalidentifiersDLP
Data Loss Prevention
Isang disiplina sa seguridad at kategorya ng mga software tools na nag-detect at pumipigil sa hindi awtorisadong paglipat ng sensitibong data sa labas ng isang organisasyon. Ang anonym.legal ay gumagana bilang isang browser-layer at AI-layer DLP solution para sa PII.
#dlpDPA
Kasunduan sa Pagproseso ng Datos
Isang legal na kontrata sa pagitan ng isang data controller at data processor, na kinakailangan ng GDPR Article 28. Tinutukoy ang paksa, tagal, kalikasan, layunin, at uri ng pagproseso ng personal na datos, at ang mga karapatan at obligasyon ng parehong partido.
#dpaDPIA
Pagsusuri ng Epekto sa Proteksyon ng Datos
Isang proseso ng pagsusuri ng panganib na kinakailangan ng GDPR Article 35 para sa mga aktibidad ng pagproseso na malamang na magresulta sa mataas na panganib sa mga karapatan at kalayaan ng mga indibidwal. Kinakailangan para sa sistematikong profiling, malakihang pagproseso ng PHI, at pagmamasid sa pampublikong lugar.
#dpiaE
e-Discovery
Electronic Discovery
Ang proseso ng pagtukoy, pagkuha, at paggawa ng electronically stored information sa mga legal na proseso. Kinakailangan ang pag-redact ng PII at mga pribilehiyadong impormasyon mula sa mga na-produce na dokumento. Isang pangunahing kaso ng paggamit para sa mga legal na departamento na gumagamit ng anonym.legal.
#ediscoveryE2EE
End-to-End Encryption
Encryption kung saan tanging ang mga nag-uusap na partido ang makakabasa ng mga mensahe; walang access ang tagapagbigay ng serbisyo sa plaintext. Sa ZK Auth mode ng anonym.legal, ang mga susi ng encryption ay hindi kailanman umaalis sa device ng client, na nakakamit ang E2EE para sa naka-anonymize na imbakan ng output.
#e2eeEU Data Residency
European Union Data Residency
Ang garantiya na ang data ay naka-imbak at pinoproseso lamang sa loob ng teritoryo ng EU/EEA. Ang production servers ng anonym.legal ay nasa Germany (Hetzner Frankfurt), na tinitiyak na ang lahat ng pagproseso ay nagaganap sa ilalim ng hurisdiksyon ng GDPR nang walang mga implikasyon ng cross-border data transfer.
#eudataresidencyF
FOIA
Batas sa Kalayaan ng Impormasyon
Pederal na batas ng US (at mga katumbas na batas sa iba pang hurisdiksyon) na nagbibigay ng pampublikong access sa mga rekord ng gobyerno. Nangangailangan ng redaction ng PII at iba pang exempt na impormasyon bago ang pagbubunyag — isang pangunahing gamit para sa mga legal at gobyernong anonymization workflows.
#foiaG
GDPR
Pangkalahatang Regulasyon sa Proteksyon ng Datos
EU Regulasyon 2016/679, ang pangunahing balangkas ng proteksyon ng datos para sa European Union. Nalalapat sa anumang organisasyon na nagpoproseso ng personal na datos ng mga residente ng EU. Multa hanggang €20M o 4% ng pandaigdigang taunang kita. Mga pangunahing karapatan: pag-access, pagbura, portability, limitasyon, pagtutol.
#gdprGDPR Article 25
GDPR Article 25 — Proteksyon ng Datos sa Disenyo at sa Default
Nangangailangan sa mga controller na ipatupad ang angkop na teknikal at organisasyonal na mga hakbang (tulad ng pseudonymization at data minimization) sa parehong oras ng disenyo ng sistema at sa default sa panahon ng pagproseso.
#gdprarticle25GDPR Article 32
GDPR Article 32 — Seguridad ng Pagproseso
Nangangailangan sa mga controller at processor na ipatupad ang angkop na teknikal at organisasyonal na mga hakbang upang matiyak ang isang antas ng seguridad na angkop sa panganib, kabilang ang encryption, pseudonymization, pagiging kompidensyal, integridad, availability, at katatagan ng mga sistema ng pagproseso.
#gdprarticle32GenAI DLP
Generative AI Data Loss Prevention
Isang espesyal na kategorya ng DLP na nakatuon sa pagpigil sa PII at kumpidensyal na data mula sa pagiging kasama sa mga prompts na ipinapadala sa mga generative AI models (ChatGPT, Claude, Gemini). Ang Chrome Extension at MCP Server ng anonym.legal ay tumutugon sa panganib na ito sa punto ng input.
#genaidlpH
Hashing
Cryptographic Hashing
Isang one-way na pagbabago ng datos sa isang fixed-length digest gamit ang mga algorithm tulad ng SHA-256. Ginagamit para sa pare-parehong pseudonymization, deduplication, at pag-verify ng integridad. Ang mga hash value ay hindi maaaring baligtarin ngunit maaaring maging bulnerable sa rainbow table attacks kung hindi salted.
#hashingHealthcare Entities
Healthcare PII Uri ng Entidad
Mga uri ng entidad para sa 18 HIPAA Safe Harbor na tagapagkilala at karagdagang PII na may kaugnayan sa kalusugan: US_MRN (mga numero ng medikal na rekord), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY, at mga konteksto ng diagnosis/paggamot.
#healthcareentitiesHetzner
Hetzner Online GmbH
German cloud at hosting provider kung saan tumatakbo ang production infrastructure ng anonym.legal. Matatagpuan sa Falkenstein, Saxony (datacenter fsn1) na may ISO 27001 certification. Pinili para sa EU data residency, compliance posture, at GDPR-friendly jurisdiction sa ilalim ng batas ng Aleman.
#hetznerHIPAA
Batas sa Pagpapalipat-lipat at Pananagutan ng Seguro sa Kalusugan
Pederal na batas ng US na nagtatakda ng mga pamantayan para sa proteksyon ng sensitibong impormasyon sa kalusugan ng pasyente. Ang Privacy Rule ay namamahala sa paggamit ng PHI; ang Security Rule ay nangangailangan ng mga administratibong, pisikal, at teknikal na mga proteksyon para sa elektronikong PHI (ePHI). Ang mga paglabag ay nagdadala ng multa hanggang $1.9M bawat kategorya bawat taon.
#hipaaHIPAA Safe Harbor
Pamamaraan ng De-identification ng HIPAA Safe Harbor
Isa sa dalawang pamamaraan ng de-identification na inaprubahan ng HIPAA na nangangailangan ng pagtanggal ng lahat ng 18 na tinukoy na pagkakakilanlan ng pasyente (pangalan, address, mga petsa, numero ng telepono, SSN, email, IP address, biometrics, atbp.) upang gawing hindi natutukoy ang datos ng kalusugan.
#hipaasafeharborHSTS
HTTP Strict Transport Security
Isang mekanismo ng web security policy na pinipilit ang mga browser na gumamit lamang ng HTTPS na koneksyon. Itinatakda ng anonym.legal ang Strict-Transport-Security: max-age=31536000; includeSubDomains upang maiwasan ang mga pag-atake ng protocol downgrade at cookie hijacking.
#hstsHybrid Detection
Hybrid NLP + Regex + ML Detection
Tatlong-layer na diskarte ng anonym.legal: mga regex pattern para sa estrukturadong PII (mga numero ng telepono, IBAN, mga credit card), mga modelo ng NLP/NER para sa mga kontekstwal na entidad (mga pangalan, organisasyon, lokasyon), at mga ML classifier para sa mga hindi tiyak na kaso. Binabawasan ang parehong false positives at false negatives.
#hybriddetectionI
ID ng Gobyerno
Mga Uri ng Entidad ng Tagapagkilala ng Gobyerno
Mga uri ng entidad para sa mga pambansa at gobyernong ibinibigay na tagapagkilala: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, at 50+ iba pang mga format ng ID na tiyak sa bansa. Natutukoy gamit ang mga regex na tiyak sa bansa + mga pattern ng checksum.
#governmentidImage Redactor
Presidio Image Redactor Service
Isang specialized backend service (port 8013) na tumutukoy at nag-redact ng PII mula sa mga image file (PNG, JPEG) gamit ang OCR at Presidio analysis. Nag-aaplay ng black-bar redaction sa mga natukoy na PII na rehiyon sa orihinal na imahe.
#presidioimageredactorInsurance Identifiers
Mga Uri ng Entidad ng Seguro
Mga uri ng entidad para sa mga tagapagkilala na may kaugnayan sa seguro: US_NPI (National Provider Identifier para sa mga tagapagbigay ng healthcare), HEALTHCARE_PLAN_BENEFICIARY, at mga numero ng health insurance na tiyak sa bansa (hal., DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersISO 27001
Pamamahala sa Seguridad ng Impormasyon ng ISO/IEC 27001
Internasyonal na pamantayan para sa mga sistema ng pamamahala ng seguridad ng impormasyon (ISMS). Ang sertipikasyon ay nangangailangan ng mga dokumentadong patakaran, pagsusuri ng panganib, at mga kontrol. Ang mga server ng anonym.legal sa EU ay ISO 27001-certified, na tinitiyak ang nakabalangkas na pamamahala ng seguridad.
#iso27001ISO 27001 SoA
Pahayag ng Aplikabilidad
Isang kinakailangang dokumento ng ISO 27001 na naglilista ng lahat ng Annex A controls, na nagpapahiwatig kung aling mga ito ay naaangkop sa organisasyon, at nagbibigay ng paliwanag para sa mga inclusions at exclusions. Kinakailangan para sa sertipikasyon at mga audit.
#iso27001soaJ
JWT
JSON Web Token
Isang compact, URL-safe na format ng token na ginagamit para sa pagpapadala ng mga claim sa pagitan ng mga partido. Gumagamit ang anonym.legal ng mga JWT na nilagdaan gamit ang HS256 para sa internal na authentication ng serbisyo-sa-serbisyo (hal. frontend → Presidio API). Ang mga token ay may maikling buhay at validated sa server-side.
#jwtK
KEK
Key Encryption Key
Isang susi na ginagamit upang i-encrypt ang iba pang mga susi sa halip na data nang direkta. Sa ZK architecture ng anonym.legal, ang susi na nakuha mula sa passphrase ng gumagamit ay nagsisilbing KEK upang protektahan ang mga susi ng encryption sa bawat dokumento na naka-imbak sa encrypted vault.
#kekL
Language Detection
Awtomatikong Pagtukoy ng Wika
Ang awtomatikong pagkilala ng wika ng input na teksto bago ang pagsusuri ng PII. Ang anonym.legal ay tumutukoy ng wika sa antas ng kahilingan at nagruruta sa naaangkop na NER model pipeline, na may English bilang fallback para sa mga hindi suportadong wika.
#languagedetectionM
Masking
Pag-mask ng Datos
Papalitan ang mga sensitibong halaga ng makatotohanang ngunit kathang-isip na datos na nagpapanatili ng format at estruktura. Ginagamit para sa mga testing environment, analytics, at pagbabahagi ng datasets nang hindi inilalantad ang totoong PII.
#maskingMCP
Model Context Protocol
Isang open protocol mula sa Anthropic na nagpapahintulot sa mga AI model na makipag-ugnayan sa mga panlabas na tool at data sources sa isang standardized na paraan. Ang anonym.legal ay nagpapatupad ng MCP Server upang ang mga AI coding tools ay makapag-invoke ng anonymization nang hindi umaalis sa kanilang workflow.
#mcpMCP Server
Model Context Protocol Server
Ang integrasyon ng MCP Server ng anonym.legal ay nagpapahintulot sa mga AI coding assistants (Claude Desktop, Cursor, VS Code Copilot) na tawagan ang anonymization API nang direkta bilang isang tool. Ang PII ay tinatanggal mula sa code, prompts, at context bago ito ipadala sa AI model.
#mcpserverMga Tagapagkilala ng Sasakyan
Mga Uri ng Entidad ng Sasakyan
Mga uri ng entidad para sa mga tagapagkilala na may kaugnayan sa sasakyan: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Vehicle Identification Number), at mga format ng rehistrasyon ng sasakyan na tiyak sa bansa.
#vehicleidentifiersML Models
Mga Modelo ng Machine Learning para sa Pagtukoy ng PII
Mga estadistikang modelo na sinanay sa mga nakatagong teksto upang makilala ang PII sa konteksto. Gumagamit ang anonym.legal ng parehong spaCy transformer pipelines at fine-tuned XLM-RoBERTa para sa multilinggwal na pagtukoy ng entidad sa antas ng produksyon.
#mlmodelsN
NER
Pagtukoy ng Nakatagong Entidad
Isang gawain sa pagproseso ng natural na wika na tumutukoy at nag-uuri ng mga nakatagong entidad sa teksto sa mga paunang natukoy na kategorya tulad ng mga tao, organisasyon, lokasyon, mga petsa, at mga medikal na tagatukoy. Ang pangunahing teknolohiya ng ML na nagpapagana ng pagtukoy ng PII sa anonym.legal.
#nerNIS2
Network and Information Security Directive 2
EU Directive 2022/2555 na pinalawak ang orihinal na NIS Directive upang sakupin ang higit pang mga sektor (pangangalaga sa kalusugan, enerhiya, transportasyon, digital na imprastruktura) at pinatibay ang mga kinakailangan sa cybersecurity. Ang deadline ng transposisyon ay noong Oktubre 17, 2024; karamihan sa mga estado ng EU ay hindi ito natugunan at nagbukas ang European Commission ng mga proseso ng paglabag laban sa mga hindi sumusunod na estado.
#nis2NLP
Pagproseso ng Natural na Wika
Isang sangay ng artipisyal na talino na may kinalaman sa interaksyon sa pagitan ng mga computer at wika ng tao. Sa pagtukoy ng PII, nauunawaan ng mga modelo ng NLP ang konteksto, gramatika, at semantika upang matukoy ang mga entidad na hindi kayang makita ng mga regex pattern lamang.
#nlpO
Office Add-in
anonym.legal Microsoft Office Add-in
Microsoft Office extension na nag-iintegrate ng PII anonymization nang direkta sa Word, Excel, at PowerPoint. Sinusuportahan ang in-document redaction, preset management, ZK Auth, at sync sa mga device. Available mula sa Microsoft AppSource.
#officeaddinOperators
Anonymization Operators
Ang estratehiya ng pagpapalit na inilalapat sa natukoy na PII. Sinusuportahan ng anonym.legal ang REPLACE (placeholder text), REDACT (empty string), MASK (asterisks), HASH (SHA-256 digest), ENCRYPT (reversible AES-256-GCM), at CUSTOM (user-defined replacement).
#operatorsOver-Redaction
Over-Redaction (Maling Positibo)
Ang pagtanggal ng higit pang impormasyon kaysa sa kinakailangan, na binabawasan ang utility ng dokumento at maaaring magdulot ng spoliation sa mga legal na proseso. Nagmumula ito sa mababang threshold ng kumpiyansa o labis na malawak na pagpili ng entidad. Maaaring i-tune sa pamamagitan ng threshold at mga kontrol ng entidad ng anonym.legal.
#overredactionP
Pangkalahatang Entidad
Mga Uri ng Entidad na Wika-Pangkalahatan
Mga uri ng entidad na natutukoy anuman ang wika ng teksto, karaniwang sa pamamagitan ng format-based regex na may checksum validation. Mga halimbawa: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO address.
#universalentitiesPCI DSS
Pamantayan sa Seguridad ng Datos ng Industriya ng Bayad na Kard
Pamantayan sa seguridad para sa mga organisasyon na humahawak ng datos ng bayad na kard, na pinananatili ng PCI Security Standards Council. Nangangailangan ng encryption, access controls, logging, at regular na pagsusuri. Ang hindi pagsunod ay maaaring magresulta sa multa at pagkawala ng pribilehiyo sa pagproseso ng kard.
#pcidssPHI
Nakaprotektang Impormasyon sa Kalusugan
Anumang impormasyon na may kaugnayan sa kalusugan na konektado sa isang makikilalang indibidwal, na pinangangasiwaan sa ilalim ng HIPAA sa US. Kasama ang mga diagnosis, tala ng paggamot, datos ng seguro, at alinman sa 18 na tagapagkilalang Safe Harbor ng HIPAA.
#phiPII
Personal na Makikilalang Impormasyon
Anumang datos na maaaring makilala ang isang tiyak na indibidwal nang direkta o sa kumbinasyon ng ibang datos. Mga halimbawa: mga pangalan, email address, numero ng social security, IP address, mga biometric na tala.
#piiPinansyal na Entidad
Pinansyal na PII Uri ng Entidad
Mga uri ng entidad na sumasaklaw sa mga pinansyal na tagapagkilala: CREDIT_CARD (Luhn checksum), IBAN_CODE (ISO 13616 checksum), SWIFT_CODE (BIC format), US_BANK_NUMBER, NRP (Spanish tax ID). Natutukoy gamit ang checksum validation upang mabawasan ang mga maling positibo.
#financialentitiesPresets
Anonymization Presets
Naka-save na mga configuration ng mga napiling uri ng entity, confidence thresholds, at mga opsyon sa output na maaaring ilapat sa isang click. Ang mga presets ay nag-sync sa Web App, Office Add-in, at Desktop App sa pamamagitan ng encrypted cloud storage.
#presetsPresidio
Microsoft Presidio
Isang open-source na SDK para sa proteksyon ng data at anonymization mula sa Microsoft. Ang detection engine ng anonym.legal ay nakabatay sa mga serbisyo ng analyzer at anonymizer ng Presidio, na pinalawak ng higit sa 285 na pasadyang tagatukoy ng entidad sa 48 na wika.
#presidioPresidio Analyzer
Microsoft Presidio Analyzer Service
Ang detection component ng backend ng anonym.legal (port 8011). Tumanggap ng teksto at nagbabalik ng listahan ng mga natukoy na PII entities kasama ang kanilang mga posisyon, uri, at mga score ng kumpiyansa. Pinalawak na may 285+ custom recognizers sa 48 wika.
#presidioanalyzerPresidio Anonymizer
Microsoft Presidio Anonymizer Service
Ang transformation component ng backend ng anonym.legal (port 8012). Tumanggap ng teksto at mga resulta ng analyzer bilang input, inilalapat ang napiling operator (REPLACE, REDACT, MASK, HASH, ENCRYPT) sa bawat natukoy na entidad, at nagbabalik ng anonymized na teksto.
#presidioanonymizerPribilehiyo ng Abogado-Kliyente
Proteksyon ng Pribilehiyo ng Abogado-Kliyente
Legal na proteksyon para sa mga kumpidensyal na komunikasyon sa pagitan ng mga abogado at kliyente. Sa pagsusuri ng dokumento at e-discovery, ang pribilehiyadong nilalaman ay dapat matukoy at itago o i-redact. Ang mga custom na uri ng entidad sa anonym.legal ay maaaring i-configure upang markahan ang mga pribilehiyadong nilalaman.
#attorneyclientprivilegePrivacy by Design
Privacy by Design at Default
Ang prinsipyo, na ipinag-uutos ng GDPR Article 25, na ang mga hakbang sa proteksyon ng datos ay nakabuo sa mga sistema mula sa simula sa halip na idagdag bilang isang afterthought. Saklaw nito ang pagbawas ng datos, mga kontrol sa pag-access, encryption, at pseudonymization sa antas ng arkitektura.
#privacybydesignPseudonymization
Pagsusunod ng Datos
Papalitan ang mga direktang tagapagkilala ng mga artipisyal na halaga (pseudonyms) habang pinapanatili ang kakayahang muling makilala ang mga indibidwal gamit ang hiwalay na susi. Kinilala ng GDPR Article 4(5) ito bilang isang teknolohiya na nagpapahusay sa privacy ngunit hindi nag-aalis ng pseudonymized na datos mula sa regulasyon.
#pseudonymizationR
Rate Limiting
API Rate Limiting
Mga kontrol sa bilang ng mga API request na maaaring gawin ng isang kliyente sa loob ng isang time window. Pinipigilan ang pang-aabuso at tinitiyak ang patas na alokasyon ng mapagkukunan. Nag-aaplay ang anonym.legal ng per-user rate limits batay sa tier ng plano, na may exponential backoff na inirerekomenda para sa retry logic.
#ratelimitingRedaction
Pag-redact ng Datos
Permanenteng pagtanggal o pagtakip ng sensitibong impormasyon mula sa mga dokumento, pinalitan ito ng isang visual na tagapagpahiwatig tulad ng [REDACTED] o isang itim na bar. Hindi tulad ng encryption, ang redaction ay isang-way at ang orihinal na datos ay hindi maaaring maibalik.
#redactionRegex
Pagpapares ng Regular na Ekspresyon
Pagpapares ng teksto batay sa pattern gamit ang pormal na syntax ng wika. Sa pagtukoy ng PII, pinangangasiwaan ng regex ang mga estruktural na nakatakdang tagatukoy (mga numero ng telepono, mga credit card, IBAN, mga email address) na may pagsusuri ng checksum. Kumplementaryo sa NER para sa hybrid na pagtukoy.
#regexREST API
RESTful API
nag-e-expose ang anonym.legal ng isang RESTful HTTP API para sa programmatic integration. Kasama sa mga endpoint ang /api/analyze, /api/anonymize, /api/image, at /api/structured. Naka-authenticate sa pamamagitan ng JWT bearer tokens. Buong OpenAPI documentation ay available sa API Reference.
#restapiRule 26
Pederal na Mga Patakaran ng Civil Procedure Rule 26
Patakaran sa sibil ng US na namamahala sa mga obligasyon sa discovery. Ang Rule 26(g) ay nangangailangan sa mga abogado na tiyakin na ang mga kahilingan at pagbubunyag ng discovery ay hindi ginawa para sa mga hindi wastong layunin — kabilang ang hindi wastong pag-redact ng PII mula sa mga na-produce na dokumento.
#rule26S
SCCs
Mga Standard Contractual Clauses
Mga pre-approved na kontraktwal na mga clause na sumusunod sa GDPR para sa paglilipat ng personal na datos mula sa EU/EEA patungo sa mga third countries. Na-update ng European Commission noong 2021 (2021/914/EU) upang matugunan ang mga kinakailangan ng Schrems II, kabilang ang isang Transfer Impact Assessment.
#sccsSchrems II
Desisyon ng Schrems II (C-311/18)
2020 Desisyon ng Hukuman ng Hustisya ng EU na nagbabasura sa balangkas ng EU-US Privacy Shield para sa mga paglilipat ng datos sa transatlantic, na binanggit ang hindi sapat na proteksyon ng batas ng US sa pagmamasid. Nangangailangan ng mga karagdagang hakbang (encryption, anonymization) kapag gumagamit ng Standard Contractual Clauses.
#schremsiiSHA-256
Secure Hash Algorithm 256-bit
Isang cryptographic hash function na gumagawa ng 256-bit digest. Ginagamit sa anonym.legal para sa HMAC authentication ng mga kahilingan sa API, ZK auth proofs, at pare-parehong pseudonymization ng entidad (ang hashing na may salt ay nagbubunga ng parehong kapalit para sa parehong orihinal na halaga).
#sha256spaCy
spaCy NLP Library
Isang matibay na open-source NLP library sa Python. Gumagamit ang anonym.legal ng mga modelo ng spaCy na batay sa transformer para sa 24 na wika (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, at iba pa) para sa pagtukoy ng nakatagong entidad sa Presidio pipeline.
#spacySpoliation
Pagsira ng Ebidensya
Ang pagkasira, pagbabago, o pagkabigong mapanatili ang ebidensya na may kaugnayan sa litgasyon. Ang labis na agresibong pag-redact na nagiging sanhi ng mga dokumento na hindi mabasa ay maaaring ituring na spoliation. Mahalaga ang pag-calibrate ng precision ng anonymization (mga threshold ng kumpiyansa, pagpili ng entidad) para sa legal na defensible na pag-redact.
#spoliationStanza
Stanza NLP Library (Stanford NLP)
Toolkit ng NLP ng Stanford NLP Group sa Python na sumusuporta sa higit sa 70 wika gamit ang mga makabagong neural na modelo. Ginagamit bilang karagdagang NER backend sa anonym.legal para sa mga wika na hindi saklaw ng mga modelo ng spaCy.
#stanzaT
TLS
Transport Layer Security
Ang cryptographic protocol na nagse-secure ng data sa transit. Pinipilit ng anonym.legal ang minimum na TLS 1.2 na may TLS 1.3 na ginustong, HSTS na may maximum na edad na isang taon, at HTTP/2. Lahat ng trapiko sa pagitan ng mga kliyente at ng server ay naka-encrypt sa transit.
#tlsToken System
anonym.legal Credit Token System
Usage-based billing kung saan ang mga API calls ay kumokonsumo ng mga token na kinakalkula mula sa haba ng text, bilang ng entity, at processing mode (analyze vs. anonymize). Ang mga gastos sa token ay maaaring i-configure sa DB at ipinapakita sa real-time bago ang pagproseso.
#tokensystemTokenization
Pag-tokenize ng Datos
Papalitan ang sensitibong datos ng isang hindi sensitibong placeholder (token) na nagma-map pabalik sa orihinal sa isang secure na vault. Hindi tulad ng encryption, ang token mismo ay walang matematikal na ugnayan sa orihinal na datos.
#tokenizationU
Under-Redaction
Under-Redaction (Maling Negatibo)
Ang pagkabigong alisin ang lahat ng PII, na nag-iiwan ng mga indibidwal na nakalantad sa mga ibinahaging dokumento. Ang mas karaniwang panganib sa pagsunod. Nagmumula ito sa mataas na threshold ng kumpiyansa, nawawalang mga uri ng entidad, o mga bagong format ng PII. Naibsan ng hybrid detection at suporta sa custom na entidad ng anonym.legal.
#underredactionUri ng Entidad
Uri ng PII Entidad
Isang kategorya ng personal na impormasyon na kinikilala ng detection engine at maaaring i-anonymize. Mga halimbawa: TAO, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. sinusuportahan ng anonym.legal ang 285+ uri ng entidad sa 48 wika.
#entitytypeV
Vault
Encryption Key Vault
Secure local storage para sa mga encryption keys sa Desktop App, na protektado ng Argon2id key derivation mula sa isang master passphrase. Ang mga keys ay naka-store na encrypted gamit ang AES-256-GCM at naka-backup sa pamamagitan ng BIP39 mnemonic phrases.
#vaultW
Web App
anonym.legal Web Application
Browser-based interface sa anonym.legal para sa pagsusuri ng PII, anonymization, at decryption. Sinusuportahan ang text input, file upload (PDF, DOCX, TXT), batch processing, ZK Auth, 48 wika, at 285+ uri ng entity. Walang kinakailangang installation.
#webappX
XChaCha20
XChaCha20-Poly1305
Isang authenticated encryption algorithm na nag-aalok ng mataas na pagganap sa mga sistema na walang AES hardware acceleration. Gumagamit ng 192-bit nonce (pinalawak mula sa 96-bit nonce ng IETF ChaCha20 standard ayon sa RFC 8439), na inaalis ang mga panganib ng nonce-collision. Ginagamit bilang alternatibong cipher sa encryption layer ng anonym.legal.
#xchacha20XLM-RoBERTa
Cross-Lingual RoBERTa
Isang multilinggwal na modelo ng wika na transformer na sinanay sa 100 wika, na binuo ng Meta AI. Ginagamit sa anonym.legal para sa mga cross-lingual na gawain ng NER, partikular para sa mga uri ng entidad at mga wika kung saan hindi magagamit ang mga monolingual na modelo.
#xlmrobertaZ
Zero-Knowledge
Zero-Knowledge Architecture
Isang disenyo ng sistema kung saan ang tagapagbigay ng serbisyo ay walang access sa plaintext na data ng mga gumagamit o mga susi ng encryption. Lahat ng encryption/decryption ay nangyayari sa client-side; hindi kailanman nakikita ng server ang orihinal na nilalaman. Pinipigilan ang mga banta mula sa loob at sapilitang pagsisiwalat.
#zeroknowledgeZK Auth
Zero-Knowledge Authentication
sistema ng authentication ng anonym.legal kung saan ang mga susi ng encryption ay nagmumula sa client-side mula sa passphrase ng gumagamit gamit ang Argon2id, na hindi kailanman ipinapadala o iniimbak sa server. Ang server ay nag-iimbak lamang ng isang cryptographic proof, hindi ang susi o passphrase.
#zkauth