By · Last updated 2026-06-03

Kembali ke BlogTeknologi Undang-Undang

PII Undang-Undang: Pengesanan Keistimewaan

Nombor rujukan kes, nombor kemasukan bar, nombor docket mahkamah, dan ID perkara klien adalah pengenal pasti sensitif dari segi undang-undang yang terlepas daripada alat PII standard.

June 3, 20267 min baca
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "PII Undang-Undang: Pengesanan Keistimewaan" description: "Nombor rujukan kes, nombor kemasukan bar, nombor docket mahkamah, dan ID perkara klien adalah pengenal pasti sensitif dari segi undang-undang yang terlepas daripada alat PII standard." category: legal-tech publishedAt: 2026-06-03 tags:

  • keistimewaan peguam-klien
  • semakan dokumen undang-undang
  • nombor kes
  • privasi firma guaman
  • teknologi undang-undang readingTime: 7

Keistimewaan Peguam-Klien dalam Era AI: PII Undang-Undang yang Mesti Dikesan oleh Alat Penanaman Nama Anda

Alat PII standard mengesan nama, e-mel, dan SSN. Mereka terlepas ID rujukan kes, nombor kemasukan bar, dan tag perkara klien. Perkara ini membawa risiko keistimewaan yang serius. Alat generik membiarkan jurang itu terbuka.

Firma guaman menghantar fail kepada alat AI setiap hari. Fail tersebut mengandungi penanda sensitif keistimewaan yang tidak dapat dikesan oleh alat standard.

Apabila firma guaman menghalakan fail melalui pembantu AI, fail tersebut mengandungi ID undang-undang bersama PII standard:

  • Tag perkara klien: Mengaitkan ke fail perkara penuh dan menamakan klien
  • ID rujukan kes: Kod yang diberikan mahkamah yang menghubungkan rekod awam dengan butiran peribadi
  • Nombor kemasukan bar: ID peguam yang boleh dicari dalam direktori awam negeri
  • Kod docket mahkamah: Menghubungkan ke sistem pemfailan awam dengan sejarah kes penuh
  • Kod penugasan kehakiman: Mengenal pasti hakim yang memimpin dalam situasi sensitif

Mana-mana sahaja daripada ini, jika dihantar kepada vendor AI luar, mewujudkan potensi masalah keistimewaan.

Mengapa ID Ini Memerlukan Pengesanan Tersuai

Format docket mahkamah mengikut corak peringkat daerah. Tiada satu corak pun yang merangkumi semua mahkamah persekutuan dan negeri.

Kes sivil persekutuan menggunakan tahun dua digit, kemudian "cv," kemudian nombor kes. Kes jenayah menggunakan "cr" di tempat yang sama. Mahkamah negeri berbeza mengikut rantau tanpa standard yang dikongsi.

Nombor kemasukan bar adalah khusus negeri. California menggunakan format angka. New York menggunakan format pendaftaran. Texas menggunakan format ID bar sendiri. Tiada format kebangsaan wujud.

Tag perkara klien adalah khusus firma. Setiap firma membina formatnya sendiri. Tahun-klien-perkara. Kod kumpulan amalan. ID berurutan.

Alat PII standard tidak dapat mengetahui mana-mana perkara ini tanpa persediaan tersuai.

Jurang itu nyata. Alat dokumen menerima konteks perkara penuh. Kod docket menghubungkan ke rekod awam. Tag klien ada. Alat melaporkan PII telah dibuang. Nama dan e-mel telah dibuang. ID sensitif keistimewaan tidak dibuang.

Kes Permulaan AI Undang-Undang

Sebuah permulaan AI undang-undang membina alat dokumen untuk firma guaman. Produk ini mengimbas fail penemuan, mengenal pasti klausa relevan, dan menanda kandungan yang berpotensi istimewa. Klien perusahaan memerlukan penyuntingan tag perkara klien bersama PII standard sebelum pemprosesan.

Penghalang pematuhan: alat AI memproses data fail yang mengandungi tag perkara klien. Digabungkan dengan pemfailan mahkamah awam, tag tersebut boleh membolehkan pengenalpastian perkara. Pasukan ops undang-undang perusahaan menandai ini sebagai tidak boleh diterima.

Sebelum pengesanan entiti tersuai:

  • Semakan perjanjian mendapati jurang pematuhan
  • Barisan kejuruteraan 3+ bulan untuk model NLP tersuai
  • Kontrak perusahaan tertangguh

Dengan API entiti tersuai:

  • Pegawai pematuhan menentukan format tag perkara semasa onboarding
  • Corak diuji terhadap fail sampel: 2 hari
  • Entiti tersuai ditambah ke saluran paip: 1 hari lagi
  • Kontrak perusahaan diteruskan

Jurangnya ialah 3 hari berbanding 3+ bulan. Kerja adalah persediaan corak dan integrasi API. Tiada latihan model NLP diperlukan.

Format Biasa mengikut Kategori

Docket mahkamah persekutuan:

Kes sivil persekutuan menggunakan: tahun dua digit + "cv" + nombor kes 4-6 digit. Contoh: 24-cv-12345. Kes jenayah menggunakan "cr" di tempat yang sama. Kes kebankrapan menggunakan "bk." Rayuan menggunakan tahun dua digit dan nombor 4-5 digit yang berbeza mengikut litar.

Format mahkamah negeri (contoh):

Mahkamah Unggul California menggunakan sistem awalan enam digit. New York menggunakan format indeks dengan tahun dan urutan. Texas menggunakan format sebab dengan tahun, urutan, dan kod mahkamah.

Tag perkara klien (format firma tipikal):

Tiga corak biasa muncul di kebanyakan firma:

  • Tahun dua digit, ID klien, urutan perkara (cth., 24-ACME-001)
  • Inisial kumpulan amalan, tahun, kemudian urutan empat digit (cth., LIT240042)
  • Awalan klien dengan ID enam digit (cth., SMITHCO-000123)

ID kemasukan bar AS:

Kebanyakan negeri menggunakan nombor 4-8 digit, kadangkala dengan awalan peringkat negeri. ID kemasukan USDC berbeza mengikut daerah dan tidak mengikut format yang dikongsi.

Saluran Paip Pemprosesan Sedar-Keistimewaan

Untuk AI semakan dokumen, saluran paip berlapis mengendalikan skop penuh.

Lapisan 1 - Pengesanan PII Standard

Nama, e-mel, nombor telefon, alamat, SSN. Ketepatan tinggi. Alatan yang telah mantap mengendalikan lapisan ini dengan baik.

Lapisan 2 - Pengesanan kod tersuai

Kod perkara, ID docket, ID bar. Corak khusus firma ditetapkan semasa onboarding. Lapisan ini mengisi jurang yang terlepas oleh alat standard.

Lapisan 3 - Semakan keistimewaan (manusia)

Selepas pengesanan automatik, seorang peguam menyemak penanda yang ditandai. Pengepala ATTORNEY-CLIENT. Label WORK PRODUCT. Tanda CONFIDENTIAL. Semakan manusia di lapisan ini bukan pilihan.

Lapisan 4 - Semakan pengecualian konteks

Docket rekod awam yang tidak menimbulkan risiko keistimewaan berbanding tag perkara klien yang membuat. Ini memerlukan pertimbangan peguam. Ia tidak boleh diotomatikkan.

Lapisan 1 dan 2 mengendalikan kerja bervolum tinggi. Lapisan 3 dan 4 memastikan pertimbangan peguam kekal di mana keputusan keistimewaan sepatutnya. Untuk apa yang berlaku apabila keistimewaan sudah dilepaskan oleh penggunaan alat AI, lihat keistimewaan peguam-klien dan AI.

Persediaan untuk Pembangun

Konfigurasi onboarding

Kumpulkan format tag perkara klien semasa onboarding perusahaan. Setiap firma menggunakan format yang berbeza. Simpan sebagai entiti tersuai khusus firma. Gunakan pada semua pemprosesan untuk akaun tersebut.

Praset lalai

Praset pra-bina merangkumi konteks biasa tanpa kerja tersuai:

  • "Dokumen Mahkamah Persekutuan" - corak docket persekutuan untuk sivil, jenayah, dan kebankrapan
  • "Dokumen Mahkamah Negeri (CA/NY/TX)" - format khusus negeri untuk tiga bidang kuasa utama
  • "Operasi Dalaman" - tag perkara ditambah PII standard
  • "Portal Peguam Luar" - rujukan bil, tag perkara, dan PII standard

Dokumentasi audit

Rekod pemprosesan harus menunjukkan bahawa kod tersuai disertakan dalam setiap laluan pengesanan. Ini menyokong perlindungan produk kerja untuk kaedah analisis.

Untuk pandangan lebih luas tentang cara kos penyuntingan berskala dalam litigasi, lihat automasi PII e-discovery dan pengurangan kos semakan undang-undang.

Kesimpulan

ID sensitif keistimewaan adalah berisiko sebagaimana PII standard - sering lebih berisiko. Alat yang terlepas kod docket dan tag perkara meninggalkan jurang nyata dalam aliran kerja dokumen.

Penyelesaiannya bukan model NLP. Ia adalah persediaan corak. Untuk pembangun yang membina alat firma guaman, itulah perbezaan antara penyelesaian 3 hari dan projek 3 bulan. Untuk firma guaman, ia adalah perbezaan antara semakan berbantuan AI yang boleh dipertahankan dan risiko penepian keistimewaan.

Sumber

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.