Docs/Glossary

Glosari Privasi & Teknologi

Definisi untuk semua istilah, akronim, dan konsep yang digunakan dalam anonimisasi PII dan privasi data.

Kembali ke Dokumen

94 istilah

2

2FA

Pengesahan Dua Faktor

Penyulitan & Keselamatan

Pengesahan yang memerlukan dua faktor pengesahan yang berbeza: sesuatu yang diketahui pengguna (kata laluan) dan sesuatu yang dimiliki pengguna (aplikasi TOTP, kunci perkakasan) atau adalah (biometrik). Disokong dalam anonym.legal sebagai lapisan tambahan di atas ZK Auth.

#twofa

A

Add-in Office

Add-in Microsoft Office anonym.legal

Platform & Produk

Sambungan Microsoft Office yang mengintegrasikan penganonyman PII terus ke dalam Word, Excel, dan PowerPoint. Menyokong redaksi dalam dokumen, pengurusan tetapan, ZK Auth, dan penyegerakan merentasi peranti. Tersedia dari Microsoft AppSource.

#officeaddin

AES-256-GCM

Standard Penyulitan Lanjutan 256-bit Galois/Counter Mode

Penyulitan & Keselamatan

Algoritma penyulitan yang disahkan yang menggabungkan AES-256 (kunci 256-bit) dengan Galois/Counter Mode untuk kerahsiaan dan integriti. Digunakan dalam penyamaran terbalik anonym.legal untuk menyulitkan entiti yang diganti. Menyediakan kerahsiaan dan pengesanan pengubahsuaian.

#aes256gcm

Anonymization

Anonymization Data

Privasi Data & PII

Proses tidak boleh balik untuk menghapuskan atau mengubah maklumat pengenalan supaya individu tidak lagi boleh dikenalpasti, secara langsung atau tidak langsung. Di bawah GDPR, data yang benar-benar dianonimkan berada di luar skop peraturan.

#anonymization

Aplikasi Desktop

Aplikasi Desktop anonym.legal

Platform & Produk

Aplikasi pelbagai platform (Windows, macOS, Linux) dibina dengan Tauri 2.0 dan React 18. Menampilkan pemprosesan fail tempatan, peti simpanan BIP39 untuk ZK Auth luar talian, eksport kumpulan, dan penyegerakan API. Menyokong penyebaran tanpa sambungan internet.

#desktopapp

Aplikasi Web

Aplikasi Web anonym.legal

Platform & Produk

Antara muka berasaskan pelayar di anonym.legal untuk analisis PII, penganonyman, dan penyahsulitan. Menyokong input teks, muat naik fail (PDF, DOCX, TXT), pemprosesan kumpulan, ZK Auth, 48 bahasa, dan 285+ jenis entiti. Tiada pemasangan diperlukan.

#webapp

Argon2id

Fungsi Penghasilan Kunci Argon2id

Penyulitan & Keselamatan

Pemenang Pertandingan Hashing Kata Laluan 2015. Argon2id menggabungkan ketahanan saluran sisi Argon2i dan ketahanan GPU Argon2d. Digunakan dalam anonym.legal dan peti aplikasi Desktop untuk menghasilkan kunci penyulitan daripada frasa laluan pengguna.

#argon2id

B

BIP39

Cadangan Penambahbaikan Bitcoin 39 — Frasa Mnemonik

Penyulitan & Keselamatan

Standard untuk menghasilkan frasa benih mnemonik yang boleh dibaca manusia (12–24 perkataan) daripada benih kriptografi. Digunakan dalam peti Aplikasi Desktop anonym.legal sebagai sandaran mesra pengguna untuk kunci penyulitan yang diperoleh daripada Argon2id.

#bip39

C

CCPA

Akta Privasi Pengguna California

Pematuhan & Peraturan

Undang-undang privasi California yang memberikan hak kepada penduduk untuk mengetahui, memadam, dan menolak penjualan maklumat peribadi mereka. Terpakai kepada perniagaan yang memenuhi ambang pendapatan, jumlah data, atau penjualan data. Dipinda secara signifikan oleh CPRA (diluluskan November 2020, berkuatkuasa Januari 2023).

#ccpa

CLOUD Act

Akta Penjelasan Penggunaan Data Luar Negara yang Sah

Pematuhan & Peraturan

Undang-undang persekutuan AS (2018) yang membenarkan penguatkuasa undang-undang AS memaksa penyedia awan yang berpusat di AS untuk menghasilkan data yang disimpan di luar negara. Bertentangan dengan peraturan pemindahan data GDPR untuk penduduk EU. Menganonimkan data sebelum muat naik awan adalah mitigasi biasa.

#cloudact

Code-Switching

Code-Switching Pelbagai Bahasa

Teknologi Pengesanan

Fenomena mencampurkan dua atau lebih bahasa dalam satu teks atau perbualan. Biasa dalam dokumen pelbagai bahasa (contohnya, dokumen undang-undang Jerman dengan istilah teknikal dalam bahasa Inggeris). Pengesanan hibrid anonym.legal mengendalikan teks yang beralih bahasa dengan menggunakan beberapa model bahasa secara serentak.

#codeswitching

CSP

Dasar Keselamatan Kandungan

Penyulitan & Keselamatan

Mekanisme header respons HTTP dan tag meta yang mengehadkan sumber mana (skrip, gaya, imej) yang boleh dimuatkan oleh pelayar. CSP anonym.legal termasuk object-src 'none', script-src dengan nonce, dan upgrade-insecure-requests untuk mencegah serangan XSS.

#csp

D

Data Minimization

Prinsip Minimization Data GDPR

Privasi Data & PII

Prinsip Artikel 5(1)(c) GDPR yang memerlukan bahawa hanya data yang mencukupi, relevan, dan perlu untuk tujuan yang ditetapkan dikumpulkan dan diproses. Satu kekangan reka bentuk teras untuk sistem yang mematuhi privasi.

#dataminimization

De-anonymization

Serangan Pengenalan Semula

Privasi Data & PII

Proses mengenal pasti semula individu daripada set data yang sepatutnya dianonimkan dengan merujuk kepada maklumat tambahan. Risiko utama apabila berkongsi data dengan kedalaman anonimisasi yang tidak mencukupi.

#deanonymization

Differential Privacy

Privasi Diferensial (DP)

Privasi Data & PII

Kerangka matematik untuk melepaskan maklumat statistik tentang set data sambil memberikan jaminan yang boleh dibuktikan bahawa data mana-mana individu tidak boleh dibezakan. Digunakan dalam analitik agregat untuk mencegah pengenalan semula walaupun ketika menyoal output agregat.

#differentialprivacy

DLP

Pencegahan Kehilangan Data

Platform & Produk

Disiplin keselamatan dan kategori alat perisian yang mengesan dan mencegah penghantaran tidak sah data sensitif di luar organisasi. anonym.legal berfungsi sebagai penyelesaian DLP lapisan pelayar dan lapisan AI untuk PII.

#dlp

DPA

Perjanjian Pemprosesan Data

Pematuhan & Peraturan

Kontrak yang mengikat secara sah antara pengawal data dan pemproses data, yang diperlukan oleh Artikel 28 GDPR. Menentukan perkara, tempoh, sifat, tujuan, dan jenis pemprosesan data peribadi, serta hak dan kewajipan kedua-dua pihak.

#dpa

DPIA

Penilaian Kesan Perlindungan Data

Pematuhan & Peraturan

Proses penilaian risiko yang diperlukan oleh Artikel 35 GDPR untuk aktiviti pemprosesan yang berkemungkinan menghasilkan risiko tinggi kepada hak dan kebebasan individu. Wajib untuk pemprofilan sistematik, pemprosesan PHI berskala besar, dan pengawasan kawasan awam.

#dpia

E

e-Discovery

Penemuan Elektronik

Undang-Undang & Audit

Proses mengenal pasti, mengumpul, dan menghasilkan maklumat yang disimpan secara elektronik dalam prosiding undang-undang. Memerlukan penghapusan PII dan maklumat terpelihara daripada dokumen yang dihasilkan. Kes penggunaan utama untuk jabatan undang-undang yang menggunakan anonym.legal.

#ediscovery

E2EE

Penyulitan Dari Hujung ke Hujung

Penyulitan & Keselamatan

Penyulitan di mana hanya pihak yang berkomunikasi boleh membaca mesej; penyedia perkhidmatan tidak mempunyai akses kepada plaintext. Dalam mod ZK Auth anonym.legal, kunci penyulitan tidak pernah meninggalkan peranti klien, mencapai E2EE untuk penyimpanan output yang dianonimkan.

#e2ee

Entiti Kewangan

Jenis Entiti PII Kewangan

Jenis Entiti

Jenis entiti yang merangkumi pengenalan kewangan: CREDIT_CARD (checksum Luhn), IBAN_CODE (checksum ISO 13616), SWIFT_CODE (format BIC), US_BANK_NUMBER, NRP (ID cukai Sepanyol). Dikesan dengan pengesahan checksum untuk meminimumkan positif palsu.

#financialentities

Entiti Kustom

Pengenal Entiti Kustom

Platform & Produk

Corak PII yang ditentukan oleh pengguna ditambah di atas 285+ jenis entiti terbina dalam anonym.legal. Menyokong corak regex, senarai perkataan, dan senarai larangan. Berguna untuk pengenalan khusus organisasi seperti ID pekerja, kod projek dalaman, atau nama produk proprietari.

#customentities

Entiti Penjagaan Kesihatan

Jenis Entiti PII Penjagaan Kesihatan

Jenis Entiti

Jenis entiti untuk 18 pengenalan HIPAA Safe Harbor dan PII berkaitan kesihatan tambahan: US_MRN (nombor rekod perubatan), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY, dan entiti konteks diagnosis/rawatan.

#healthcareentities

Entiti Universal

Jenis Entiti Bahasa-Universal

Jenis Entiti

Jenis entiti yang dikesan tanpa mengira bahasa teks, biasanya melalui regex berasaskan format dengan pengesahan checksum. Contoh: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, alamat CRYPTO.

#universalentities

F

FOIA

Akta Kebebasan Maklumat

Pematuhan & Peraturan

Undang-undang persekutuan AS (dan statut setara di bidang kuasa lain) yang memberikan akses awam kepada rekod kerajaan. Memerlukan penghapusan PII dan maklumat lain yang dikecualikan sebelum pendedahan — kes penggunaan utama untuk aliran kerja pengenalan tanpa nama dalam bidang undang-undang dan kerajaan.

#foia

G

GDPR

Peraturan Perlindungan Data Umum

Pematuhan & Peraturan

Peraturan EU 2016/679, kerangka perlindungan data utama untuk Kesatuan Eropah. Terpakai kepada mana-mana organisasi yang memproses data peribadi penduduk EU. Denda sehingga €20M atau 4% daripada pendapatan tahunan global. Hak utama: akses, pemadaman, pemindahan, sekatan, bantahan.

#gdpr

GDPR Artikel 25

GDPR Artikel 25 — Perlindungan Data dengan Reka Bentuk dan Secara Lalai

Pematuhan & Peraturan

Memerlukan pengawal untuk melaksanakan langkah teknikal dan organisasi yang sesuai (seperti pseudonimisasi dan pengurangan data) pada masa reka bentuk sistem dan secara lalai semasa pemprosesan.

#gdprarticle25

GDPR Artikel 32

GDPR Artikel 32 — Keselamatan Pemprosesan

Pematuhan & Peraturan

Memerlukan pengawal dan pemproses untuk melaksanakan langkah teknikal dan organisasi yang sesuai untuk memastikan tahap keselamatan yang sesuai dengan risiko, termasuk penyulitan, pseudonimisasi, kerahsiaan, integriti, ketersediaan, dan ketahanan sistem pemprosesan.

#gdprarticle32

GenAI DLP

Pencegahan Kehilangan Data AI Generatif

Platform & Produk

Kategori DLP khusus yang memberi tumpuan kepada mencegah PII dan data sulit daripada disertakan dalam arahan yang dihantar kepada model AI generatif (ChatGPT, Claude, Gemini). Sambungan Chrome anonym.legal dan Pelayan MCP menangani risiko ini pada titik input.

#genaidlp

H

Had Kadar

Had Kadar API

Infrastruktur

Kawalan terhadap jumlah permintaan API yang boleh dibuat oleh pelanggan dalam satu jendela masa. Mencegah penyalahgunaan dan memastikan pengagihan sumber yang adil. anonym.legal menerapkan had kadar per pengguna berdasarkan tahap pelan, dengan pengurangan eksponen disyorkan untuk logik percubaan semula.

#ratelimiting

Hak Privilege Peguam-Pelanggan

Perlindungan Hak Privilege Peguam-Pelanggan

Undang-Undang & Audit

Perlindungan undang-undang untuk komunikasi sulit antara peguam dan pelanggan. Dalam semakan dokumen dan e-discovery, kandungan terpelihara mesti dikenalpasti dan ditahan atau dihapuskan. Jenis entiti khusus dalam anonym.legal boleh dikonfigurasikan untuk menandakan penanda kandungan terpelihara.

#attorneyclientprivilege

Hashing

Hashing Kriptografi

Privasi Data & PII

Transformasi satu arah data menjadi digest panjang tetap menggunakan algoritma seperti SHA-256. Digunakan untuk pseudonymization yang konsisten, deduplikasi, dan pengesahan integriti. Nilai hash tidak boleh dibalik tetapi boleh terdedah kepada serangan rainbow table jika tidak disalurkan.

#hashing

Hetzner

Hetzner Online GmbH

Infrastruktur

Penyedia awan dan hosting Jerman di mana infrastruktur pengeluaran anonym.legal beroperasi. Terletak di Falkenstein, Saxony (datacenter fsn1) dengan pensijilan ISO 27001. Dipilih untuk kediaman data EU, kedudukan pematuhan, dan bidang kuasa mesra GDPR di bawah undang-undang Jerman.

#hetzner

HIPAA

Akta Kebolehcapaian dan Tanggungjawab Insurans Kesihatan

Pematuhan & Peraturan

Undang-undang persekutuan AS yang menetapkan standard untuk melindungi maklumat kesihatan pesakit yang sensitif. Peraturan Privasi mengawal penggunaan PHI; Peraturan Keselamatan memerlukan langkah-langkah keselamatan pentadbiran, fizikal, dan teknikal untuk ePHI. Pelanggaran boleh dikenakan denda sehingga $1.9M bagi setiap kategori setiap tahun.

#hipaa

HIPAA Safe Harbor

Kaedah De-identifikasi HIPAA Safe Harbor

Pematuhan & Peraturan

Salah satu daripada dua kaedah de-identifikasi yang diluluskan oleh HIPAA yang memerlukan penghapusan semua 18 pengenalan pesakit yang ditentukan (nama, alamat, tarikh, nombor telefon, SSN, emel, alamat IP, biometrik, dan lain-lain) untuk menjadikan data kesihatan tidak dapat dikenalpasti secara individu.

#hipaasafeharbor

HSTS

Keselamatan Pengangkutan Ketat HTTP

Penyulitan & Keselamatan

Mekanisme dasar keselamatan web yang memaksa pelayar untuk hanya menggunakan sambungan HTTPS. anonym.legal menetapkan Strict-Transport-Security: max-age=31536000; includeSubDomains untuk mencegah serangan penurunan protokol dan pencurian kuki.

#hsts

I

ID Kerajaan

Jenis Pengenal Kerajaan

Jenis Entiti

Jenis entiti untuk pengenalan nasional dan yang dikeluarkan oleh kerajaan: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, dan lebih daripada 50 format ID khusus negara lain. Dikesan menggunakan regex khusus negara + corak checksum.

#governmentid

ISO 27001

Pengurusan Keselamatan Maklumat ISO/IEC 27001

Pematuhan & Peraturan

Standard antarabangsa untuk sistem pengurusan keselamatan maklumat (ISMS). Pensijilan memerlukan dasar yang didokumenkan, penilaian risiko, dan kawalan. Pelayan EU anonym.legal adalah disahkan ISO 27001, memastikan tadbir urus keselamatan yang terstruktur.

#iso27001

ISO 27001 SoA

Pernyataan Kesesuaian

Pematuhan & Peraturan

Dokumen ISO 27001 yang wajib yang menyenaraikan semua kawalan Lampiran A, menunjukkan yang mana yang terpakai kepada organisasi, dan memberikan justifikasi untuk penyertaan dan pengecualian. Diperlukan untuk pensijilan dan audit.

#iso27001soa

J

Jejak Audit

Jejak Audit Tidak Boleh Diubah

Undang-Undang & Audit

Satu log berturutan yang jelas menunjukkan siapa yang mengakses, mengubah, atau memproses data dan bila. Diperlukan oleh ISO 27001 (A.8.15), Peraturan Keselamatan HIPAA (§164.312(b)), dan peraturan e-discovery. anonym.legal merekod semua operasi anonimisasi dengan cap waktu, jumlah entiti, dan ID pengendali.

#audittrail

Jenis Entiti

Jenis Entiti PII

Jenis Entiti

Satu kategori maklumat peribadi yang dikenali oleh enjin pengesanan dan boleh dianonimkan. Contoh: PERSON, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal menyokong lebih daripada 285 jenis entiti dalam 48 bahasa.

#entitytype

JWT

Token Web JSON

Penyulitan & Keselamatan

Format token yang padat dan selamat untuk URL yang digunakan untuk menghantar tuntutan antara pihak. anonym.legal menggunakan JWT yang ditandatangani dengan HS256 untuk pengesahan perkhidmatan ke perkhidmatan dalaman (contohnya, frontend → API Presidio). Token adalah jangka pendek dan disahkan di sisi pelayan.

#jwt

K

Kebolehan Dipertahankan

Anonimisasi yang Boleh Dipertahankan Secara Undang-Undang

Undang-Undang & Audit

Keupayaan untuk menunjukkan kepada pengawal selia, mahkamah, atau juruaudit bahawa anonimisasi dilakukan menggunakan metodologi yang didokumenkan, konsisten, dan teknikal yang kukuh. Log audit anonym.legal, skor keyakinan, dan tetapan pengendali menyokong aliran kerja anonimisasi yang boleh dipertahankan.

#defensibility

Kedaulatan Data

Kedaulatan Data Digital

Pematuhan & Peraturan

Prinsip bahawa data tertakluk kepada undang-undang dan struktur tadbir urus negara di mana ia dikumpulkan. Lebih luas daripada residensi data, ia merangkumi kawalan ke atas siapa yang boleh mengakses data dan di bawah kerangka undang-undang apa.

#datasovereignty

Kediaman Data EU

Kediaman Data Kesatuan Eropah

Infrastruktur

Jaminan bahawa data disimpan dan diproses secara eksklusif dalam wilayah EU/EEA. Pelayan pengeluaran anonym.legal berada di Jerman (Hetzner Frankfurt), memastikan semua pemprosesan berlaku di bawah bidang kuasa GDPR tanpa implikasi pemindahan data merentas sempadan.

#eudataresidency

KEK

Kunci Penyulitan Kunci

Penyulitan & Keselamatan

Kunci yang digunakan untuk menyulitkan kunci lain dan bukannya data secara langsung. Dalam seni bina ZK anonym.legal, kunci yang diperoleh daripada frasa laluan pengguna bertindak sebagai KEK untuk melindungi kunci penyulitan per-dokumen yang disimpan dalam peti yang disulitkan.

#kek

M

Masking

Masking Data

Privasi Data & PII

Menggantikan nilai sensitif dengan data yang realistik tetapi rekaan yang mengekalkan format dan struktur. Digunakan untuk persekitaran ujian, analitik, dan berkongsi set data tanpa mendedahkan PII sebenar.

#masking

MCP

Protokol Konteks Model

Platform & Produk

Protokol terbuka oleh Anthropic yang membolehkan model AI berinteraksi dengan alat dan sumber data luaran dengan cara yang standard. anonym.legal melaksanakan Pelayan MCP supaya alat pengkodan AI boleh memanggil penganonyman tanpa meninggalkan aliran kerja mereka.

#mcp

ML Models

Model Pembelajaran Mesin untuk Pengesanan PII

Teknologi Pengesanan

Model statistik yang dilatih pada korpus teks berlabel untuk mengenali PII dalam konteks. anonym.legal menggunakan kedua-dua saluran transformer spaCy dan XLM-RoBERTa yang disesuaikan untuk pengenalan entiti pelbagai bahasa pada skala pengeluaran.

#mlmodels

N

NER

Pengenalan Entiti Bernama

Teknologi Pengesanan

Tugas pemprosesan bahasa semula jadi yang mengenal pasti dan mengklasifikasikan entiti bernama dalam teks ke dalam kategori yang telah ditetapkan seperti individu, organisasi, lokasi, tarikh, dan pengenalan perubatan. Teknik ML teras yang menggerakkan pengesanan PII dalam anonym.legal.

#ner

NIS2

Arahan Keselamatan Rangkaian dan Maklumat 2

Pematuhan & Peraturan

Arahan EU 2022/2555 yang memperluas Arahan NIS asal untuk merangkumi lebih banyak sektor (kesihatan, tenaga, pengangkutan, infrastruktur digital) dan menguatkan keperluan keselamatan siber. Tarikh akhir pemindahan adalah 17 Oktober 2024; kebanyakan negeri anggota EU terlepasnya dan Suruhanjaya Eropah membuka prosiding pelanggaran terhadap negeri yang tidak mematuhi.

#nis2

NLP

Pemprosesan Bahasa Semula Jadi

Teknologi Pengesanan

Cabang kecerdasan buatan yang berkaitan dengan interaksi antara komputer dan bahasa manusia. Dalam pengesanan PII, model NLP memahami konteks, tatabahasa, dan semantik untuk mengenal pasti entiti yang mungkin terlepas oleh pola regex sahaja.

#nlp

P

PCI DSS

Standard Keselamatan Data Industri Kad Pembayaran

Pematuhan & Peraturan

Standard keselamatan untuk organisasi yang mengendalikan data kad pembayaran, dikendalikan oleh Majlis Standard Keselamatan PCI. Memerlukan penyulitan, kawalan akses, log, dan ujian berkala. Ketidakpatuhan boleh mengakibatkan denda dan kehilangan hak pemprosesan kad.

#pcidss

Pelayan MCP

Pelayan Protokol Konteks Model

Platform & Produk

Integrasi Pelayan MCP anonym.legal membolehkan pembantu pengkodan AI (Claude Desktop, Cursor, VS Code Copilot) memanggil API penganonyman secara langsung sebagai alat. PII dibuang dari kod, arahan, dan konteks sebelum dihantar kepada model AI.

#mcpserver

Pemprosesan Kumpulan

Penganonyman Fail Kumpulan

Platform & Produk

Memproses pelbagai fail secara serentak dalam satu operasi. Mod kumpulan anonym.legal menyokong fail PDF, DOCX, dan TXT dengan konfigurasi entiti per fail, ambang keyakinan, dan pemilihan format output.

#batchprocessing

Pengenal Digital

Jenis Entiti Identiti Digital

Jenis Entiti

Jenis entiti untuk pengenalan dalam talian dan digital: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 dan IPv6), URL, DOMAIN_NAME, CRYPTO (alamat Bitcoin/Ethereum), dan pengenalan khusus platform.

#digitalidentifiers

Pengenal Insurans

Jenis Entiti Insurans

Jenis Entiti

Jenis entiti untuk pengenalan berkaitan insurans: US_NPI (Pengenal Penyedia Nasional untuk penyedia penjagaan kesihatan), HEALTHCARE_PLAN_BENEFICIARY, dan nombor insurans kesihatan khusus negara (contohnya, DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Pengenal Kenderaan

Jenis Entiti Kenderaan

Jenis Entiti

Jenis entiti untuk pengenalan berkaitan kenderaan: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Nombor Pengenalan Kenderaan), dan format plat pendaftaran kenderaan khusus negara.

#vehicleidentifiers

Pengendali

Pengendali Penganonyman

Platform & Produk

Strategi penggantian yang digunakan untuk PII yang dikesan. anonym.legal menyokong REPLACE (teks pemegang), REDACT (rentetan kosong), MASK (bintang), HASH (digest SHA-256), ENCRYPT (AES-256-GCM boleh dibalik), dan CUSTOM (penggantian yang ditentukan oleh pengguna).

#operators

Pengesanan Bahasa

Pengesanan Bahasa Automatik

Teknologi Pengesanan

Pengenalan automatik bahasa teks input sebelum analisis PII. anonym.legal mengesan bahasa pada tahap permintaan dan mengarahkan kepada saluran model NER yang sesuai, dengan bahasa Inggeris sebagai pilihan sekiranya bahasa tidak disokong.

#languagedetection

Pengesanan Hibrid

Pengesanan Hibrid NLP + Regex + ML

Teknologi Pengesanan

Pendekatan tiga lapisan anonym.legal: pola regex untuk PII berstruktur (nombor telefon, IBAN, kad kredit), model NLP/NER untuk entiti kontekstual (nama, organisasi, lokasi), dan pengklasifikasi ML untuk kes yang tidak jelas. Mengurangkan kedua-dua positif palsu dan negatif palsu.

#hybriddetection

Penghapus Imej

Perkhidmatan Penghapus Imej Presidio

Infrastruktur

Perkhidmatan backend khusus (port 8013) yang mengesan dan menghapuskan PII daripada fail imej (PNG, JPEG) menggunakan OCR dan analisis Presidio. Menerapkan penghapusan jalur hitam ke atas kawasan PII yang dikesan dalam imej asal.

#presidioimageredactor

Penghapusan Berlebihan

Penghapusan Berlebihan (Positif Palsu)

Undang-Undang & Audit

Menghapuskan lebih banyak maklumat daripada yang diperlukan, mengurangkan kegunaan dokumen dan berpotensi menjadi spoliation dalam prosiding undang-undang. Disebabkan oleh ambang keyakinan yang rendah atau pemilihan entiti yang terlalu luas. Boleh disesuaikan melalui ambang dan kawalan entiti anonym.legal.

#overredaction

Penghapusan Kurang

Penghapusan Kurang (Negatif Palsu)

Undang-Undang & Audit

Gagal untuk menghapuskan semua PII, meninggalkan individu terdedah dalam dokumen yang dikongsi. Risiko pematuhan yang lebih biasa. Disebabkan oleh ambang keyakinan yang tinggi, jenis entiti yang hilang, atau format PII yang baru. Diminimumkan oleh pengesanan hibrid anonym.legal dan sokongan entiti khusus.

#underredaction

Penilaian Keyakinan

Skor Keyakinan Pengenalan Entiti

Teknologi Pengesanan

Skor 0–1 yang menunjukkan betapa pasti model pengesanan bahawa satu rentang teks adalah entiti PII. anonym.legal mendedahkan ambang keyakinan yang boleh disesuaikan supaya pengguna dapat menyesuaikan pertukaran ketepatan berbanding pengingatan untuk kes penggunaan tertentu mereka.

#confidencescoring

Peraturan 26

Peraturan Prosedur Sivil Persekutuan Peraturan 26

Undang-Undang & Audit

Peraturan prosedur sivil AS yang mengawal kewajipan penemuan. Peraturan 26(g) memerlukan peguam untuk mengesahkan bahawa permintaan dan pendedahan penemuan tidak dibuat untuk tujuan yang tidak wajar — termasuk gagal untuk menghapuskan PII dengan betul daripada dokumen yang dihasilkan.

#rule26

Perlindungan DDoS

Perlindungan Penafian Perkhidmatan Teragih

Infrastruktur

Pertahanan tahap infrastruktur terhadap serangan penafian perkhidmatan teragih. Infrastruktur pelayan anonym.legal termasuk peraturan firewall (UFW), had sambungan nginx, dan perlindungan setara Cloudflare untuk mengekalkan ketersediaan.

#ddosprotection

Peti Simpanan

Peti Simpanan Kunci Penyulitan

Platform & Produk

Penyimpanan tempatan yang selamat untuk kunci penyulitan dalam Aplikasi Desktop, dilindungi oleh derivasi kunci Argon2id daripada frasa laluan induk. Kunci disimpan dalam keadaan disulitkan menggunakan AES-256-GCM dan disandarkan melalui frasa mnemonik BIP39.

#vault

PHI

Maklumat Kesihatan Terlindung

Privasi Data & PII

Sebarang maklumat berkaitan kesihatan yang dikaitkan dengan individu yang boleh dikenalpasti, diatur di bawah HIPAA di AS. Termasuk diagnosis, rekod rawatan, data insurans, dan mana-mana 18 pengenalan Selamat HIPAA.

#phi

PII

Maklumat Peribadi yang Boleh Dikenal Pasti

Privasi Data & PII

Sebarang data yang boleh mengenal pasti individu tertentu secara langsung atau dalam kombinasi dengan data lain. Contoh: nama, alamat emel, nombor keselamatan sosial, alamat IP, rekod biometrik.

#pii

Presidio

Microsoft Presidio

Teknologi Pengesanan

SDK perlindungan data dan pengenalan sumber terbuka oleh Microsoft. Enjin pengesanan anonym.legal dibina berdasarkan perkhidmatan penganalisis dan pengenalan Presidio, diperluas dengan 285+ pengenalan entiti khusus merentasi 48 bahasa.

#presidio

Presidio Analyzer

Perkhidmatan Microsoft Presidio Analyzer

Infrastruktur

Komponen pengesanan backend anonym.legal (port 8011). Menerima teks dan mengembalikan senarai entiti PII yang dikesan dengan kedudukan, jenis, dan skor keyakinan mereka. Diperluas dengan lebih daripada 285 pengenali khusus dalam 48 bahasa.

#presidioanalyzer

Presidio Anonymizer

Perkhidmatan Microsoft Presidio Anonymizer

Infrastruktur

Komponen transformasi backend anonym.legal (port 8012). Mengambil teks dan hasil penganalisis sebagai input, menerapkan pengendali yang dipilih (REPLACE, REDACT, MASK, HASH, ENCRYPT) kepada setiap entiti yang dikesan, dan mengembalikan teks yang dianonimkan.

#presidioanonymizer

Privacy by Design

Privasi Mengikut Reka Bentuk dan Lalai

Privasi Data & PII

Prinsip, yang diwajibkan oleh Artikel 25 GDPR, bahawa langkah-langkah perlindungan data dibina ke dalam sistem dari awal dan bukannya ditambah sebagai pemikiran selepas. Merangkumi minimization data, kawalan akses, penyulitan, dan pseudonymization di peringkat seni bina.

#privacybydesign

Pseudonymization

Pseudonymization Data

Privasi Data & PII

Menggantikan pengenalan langsung dengan nilai tiruan (pseudonim) sambil mengekalkan keupayaan untuk mengenal pasti semula individu menggunakan kunci yang berasingan. Artikel 4(5) GDPR mengiktirafnya sebagai teknik yang meningkatkan privasi tetapi tidak mengecualikan data yang dipseudonimkan daripada peraturan.

#pseudonymization

R

Redaction

Redaction Data

Privasi Data & PII

Menghapuskan atau menyembunyikan maklumat sensitif secara kekal daripada dokumen, menggantikannya dengan penanda visual seperti [REDACTED] atau bar hitam. Berbeza dengan penyulitan, redaction adalah satu arah dan data asal tidak boleh dipulihkan.

#redaction

Regex

Pencocokan Pola Ekspresi Reguler

Teknologi Pengesanan

Pencocokan teks berdasarkan pola menggunakan sintaks bahasa formal. Dalam pengesanan PII, regex mengendalikan pengenalan yang boleh diramalkan secara struktur (nombor telefon, kad kredit, IBAN, alamat emel) dengan pengesahan checksum. Melengkapi NER untuk pengesanan hibrid.

#regex

Residensi Data

Keperluan Residensi Data

Pematuhan & Peraturan

Keperluan undang-undang atau kontrak yang menentukan lokasi geografi di mana data mesti disimpan dan diproses. Berkaitan dengan GDPR (pemindahan data di luar EEA), BDSG Jerman, dan peraturan khusus sektor dalam kesihatan dan kewangan.

#dataresidency

REST API

API RESTful

Infrastruktur

anonym.legal mendedahkan API HTTP RESTful untuk integrasi programatik. Titik akhir termasuk /api/analyze, /api/anonymize, /api/image, dan /api/structured. Disahkan melalui token pembawa JWT. Dokumentasi OpenAPI penuh tersedia dalam Rujukan API.

#restapi

S

Sambungan Chrome

Sambungan Chrome anonym.legal

Platform & Produk

Sambungan pelayar (Manifest V3) yang menangkap teks sebelum dihantar kepada chatbot AI (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Menganonymkan secara langsung dan secara pilihan menyahsulit respons AI menggunakan kunci penyulitan yang disimpan.

#chromeextension

SCCs

Klausa Kontrak Standard

Pematuhan & Peraturan

Klausa kontrak yang telah diluluskan dan mematuhi GDPR untuk memindahkan data peribadi dari EU/EEA ke negara ketiga. Dikemas kini oleh Suruhanjaya Eropah pada 2021 (2021/914/EU) untuk memenuhi keperluan Schrems II, termasuk Penilaian Kesan Pemindahan.

#sccs

Schrems II

Keputusan Schrems II (C-311/18)

Pematuhan & Peraturan

Keputusan Mahkamah Keadilan EU 2020 yang membatalkan kerangka Privasi EU-AS untuk pemindahan data transatlantik, dengan alasan perlindungan undang-undang pengawasan AS yang tidak mencukupi. Memerlukan langkah tambahan (penyulitan, pengenalan tanpa nama) apabila menggunakan Klausa Kontrak Standard.

#schremsii

SHA-256

Algoritma Hash Selamat 256-bit

Penyulitan & Keselamatan

Fungsi hash kriptografi yang menghasilkan digest 256-bit. Digunakan dalam anonym.legal untuk pengesahan HMAC permintaan API, bukti ZK auth, dan penyamaran entiti yang konsisten (hashing dengan garam menghasilkan penggantian yang sama untuk nilai asal yang sama).

#sha256

Sistem Token

Sistem Token Kredit anonym.legal

Platform & Produk

Penagihan berdasarkan penggunaan di mana panggilan API menggunakan token yang dikira daripada panjang teks, bilangan entiti, dan mod pemprosesan (analisis vs. penganonyman). Kos token boleh dikonfigurasikan dalam DB dan dipaparkan secara masa nyata sebelum pemprosesan.

#tokensystem

spaCy

Perpustakaan NLP spaCy

Teknologi Pengesanan

Perpustakaan NLP sumber terbuka yang kuat dalam Python. anonym.legal menggunakan model berasaskan transformer spaCy untuk 24 bahasa (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko, dan lain-lain) untuk pengenalan entiti bernama dalam saluran Presidio.

#spacy

Spoliation

Spoliation Bukti

Undang-Undang & Audit

Penghancuran, pengubahsuaian, atau kegagalan untuk memelihara bukti yang relevan dengan litigasi. Penghapusan yang terlalu agresif yang menjadikan dokumen tidak boleh dibaca boleh dianggap sebagai spoliation. Menyesuaikan ketepatan anonimisasi (ambang keyakinan, pemilihan entiti) adalah penting untuk penghapusan yang boleh dipertahankan secara undang-undang.

#spoliation

Stanza

Perpustakaan NLP Stanza (Stanford NLP)

Teknologi Pengesanan

Alat NLP Python dari Kumpulan NLP Stanford yang menyokong lebih daripada 70 bahasa dengan model neural terkini. Digunakan sebagai backend NER tambahan dalam anonym.legal untuk bahasa yang tidak diliputi oleh model spaCy.

#stanza

T

Tetapan Prabentuk

Tetapan Penganonyman

Platform & Produk

Konfigurasi yang disimpan bagi jenis entiti yang dipilih, ambang keyakinan, dan pilihan output yang boleh digunakan dengan satu klik. Tetapan disegerakkan merentasi Aplikasi Web, Add-in Office, dan Aplikasi Desktop melalui penyimpanan awan yang disulitkan.

#presets

TLS

Keselamatan Lapisan Pengangkutan

Penyulitan & Keselamatan

Protokol kriptografi yang mengamankan data dalam transit. anonym.legal menguatkuasakan minimum TLS 1.2 dengan TLS 1.3 yang disukai, HSTS dengan maksimum umur satu tahun, dan HTTP/2. Semua trafik antara klien dan pelayan disulitkan dalam transit.

#tls

Tokenization

Tokenization Data

Privasi Data & PII

Menggantikan data sensitif dengan penanda bukan sensitif (token) yang memetakan kembali kepada yang asal dalam peti keselamatan yang selamat. Berbeza dengan penyulitan, token itu sendiri tidak mempunyai hubungan matematik dengan data asal.

#tokenization

X

XChaCha20

XChaCha20-Poly1305

Penyulitan & Keselamatan

Algoritma penyulitan yang disahkan yang menawarkan prestasi tinggi pada sistem tanpa pemecut perkakasan AES. Menggunakan nonce 192-bit (diperluas dari nonce 96-bit standard IETF ChaCha20 mengikut RFC 8439), menghapuskan risiko perlanggaran nonce. Digunakan sebagai cipher alternatif dalam lapisan penyulitan anonym.legal.

#xchacha20

XLM-RoBERTa

RoBERTa Rentas Bahasa

Teknologi Pengesanan

Model bahasa transformer pelbagai bahasa yang dilatih pada 100 bahasa, dibangunkan oleh Meta AI. Digunakan dalam anonym.legal untuk tugas NER rentas bahasa, terutamanya untuk jenis entiti dan bahasa di mana model monolingual tidak tersedia.

#xlmroberta

Z

Zero-Knowledge

Arsitektur Zero-Knowledge

Penyulitan & Keselamatan

Reka bentuk sistem di mana penyedia perkhidmatan tidak mempunyai akses kepada data plaintext pengguna atau kunci penyulitan. Semua penyulitan/penyahulitan berlaku di sisi klien; pelayan tidak pernah melihat kandungan asal. Mencegah ancaman dalaman dan pendedahan yang dipaksa.

#zeroknowledge

ZK Auth

Pengesahan Zero-Knowledge

Penyulitan & Keselamatan

Sistem pengesahan anonym.legal di mana kunci penyulitan diperoleh di sisi klien daripada frasa laluan pengguna menggunakan Argon2id, tidak pernah dihantar ke atau disimpan di pelayan. Pelayan hanya menyimpan bukti kriptografi, bukan kunci atau frasa laluan.

#zkauth