By · Last updated 2026-06-03

Atpakaļ uz BloguJuridiskā Tehnoloģija

Juridiskais PII: Privilēģiju noteikšana

Lietu atsauces numuri, advokātu reģistrācijas numuri, tiesas lietu numuri un klientu lietu ID ir juridiski sensitīvi identifikatori, kurus standarta PII rīki nenosaka.

June 3, 20267 min lasīšanai
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "Juridiskais PII: Privilēģiju noteikšana" description: "Lietu atsauces numuri, advokātu reģistrācijas numuri, tiesas lietu numuri un klientu lietu ID ir juridiski sensitīvi identifikatori, kurus standarta PII rīki nenosaka." category: legal-tech publishedAt: 2026-06-03 tags:

  • advokāta un klienta privilēģija
  • juridisko dokumentu pārskatīšana
  • lietu numuri
  • advokātu biroja privātums
  • juridiskās tehnoloģijas readingTime: 7

Advokāta un klienta privilēģija mākslīgā intelekta laikmetā: juridiskais PII, ko jūsu anonimizācijas rīkam jānosaka

Standarta PII rīki nosaka vārdus, e-pastus un sociālās apdrošināšanas numurus. Tie nenosaka lietu atsauces ID, advokātu reģistrācijas numurus un klientu lietu atzīmes. Šie elementi rada nopietnus privilēģiju riskus. Vispārēji rīki atstāj šo robu vaļā.

Advokātu biroji katru dienu sūta failus AI rīkiem. Šie faili satur privilēģijām sensitīvus marķierus, kurus standarta rīki nenošķir.

Kad advokātu birojs maršrutē failus caur AI asistentu, šie faili satur juridiskos ID blakus standarta PII:

  • Klientu lietu atzīmes: Saista ar pilno lietu failu un norāda klienta vārdu
  • Lietu atsauces ID: Tiesas piešķirtie kodi, kas saistīti ar publiskiem reģistriem ar privātām detaļām
  • Advokātu reģistrācijas numuri: Advokātu ID, ko var meklēt valstu publiskajos reģistros
  • Tiesas lietu kodi: Savieno ar publiskām iesniegumu sistēmām ar pilnu lietas vēsturi
  • Tiesnešu norīkojuma kodi: Identificē priekšsēdētāju tiesnesi sensitīvās situācijās

Jebkurš no šiem elementiem, nosūtīts ārējam AI pārdevējam, rada potenciālu privilēģiju problēmu.

Kāpēc šiem ID nepieciešama pielāgota noteikšana

Tiesas lietu formāti seko apgabala līmeņa paraugiem. Neviens vienots paraugs nesedz visas federālās un štata tiesas.

Federālās civillietās izmanto divus ciparus gadā, tad "cv", tad lietas numuru. Krimināllietās tajā pašā vietā izmanto "cr". Štatu tiesas atšķiras reģionāli bez kopīga standarta.

Advokātu reģistrācijas numuri ir štata specifiski. Kalifornija izmanto skaitlisku formātu. Ņujorka izmanto reģistra formātu. Teksasa izmanto savu advokātu ID formātu. Valsts mēroga formāts nepastāv.

Klientu lietu atzīmes ir biroja specifiskas. Katrs birojs veido savu formātu. Gads-klients-lieta. Prakses grupas kodi. Secīgi ID.

Standarta PII rīki nevar zināt nevienu no šiem elementiem bez pielāgotas iestatīšanas.

Robs ir reāls. Dokumentu rīks saņem pilnu lietas kontekstu. Lietu kodi saistās ar publiskiem reģistriem. Klientu atzīmes ir klāt. Rīks ziņo, ka PII ir noņemts. Vārdi un e-pasti tika noņemti. Privilēģijām sensitīvie ID — ne.

Juridiskā AI jaunuzņēmuma gadījums

Juridiskais AI jaunuzņēmums veido dokumentu rīku advokātu birojiem. Produkts skenē atklāšanas failus, identificē relevantās klauzulas un atzīmē potenciāli priviliģētu saturu. Uzņēmumu klienti pieprasa klientu lietu atzīmju anonimizāciju kopā ar standarta PII pirms apstrādes.

Atbilstības bloķētājs: AI rīks apstrādā failu datus, kas satur klientu lietu atzīmes. Apvienojumā ar publiskiem tiesas iesniegumiem šīs atzīmes varētu ļaut identificēt lietu. Uzņēmumu juridisko operāciju komandas atzīmē to par nepieņemamu.

Pirms pielāgotas entītiju noteikšanas:

  • Darījuma pārskatīšana atklāj atbilstības robu
  • Vairāk nekā 3 mēnešu inženieru rinda pielāgotam NLP modelim
  • Uzņēmuma līgums gaidīšanas režīmā

Ar pielāgotu entītiju API:

  • Atbilstības darbinieks definē lietu atzīmju formātu onboardinga laikā
  • Paraugs pārbaudīts pret parauga failiem: 2 dienas
  • Pielāgota entītija pievienota konveieram: vēl 1 diena
  • Uzņēmuma līgums turpinās

Robs ir 3 dienas pret vairāk nekā 3 mēnešiem. Darbs ir parauga iestatīšana un API integrācija. NLP modeļa apmācība nav nepieciešama.

Izplatītākie formāti pēc kategorijām

Federālo tiesu lietu numuri:

Federālās civiltiesās izmanto: divi cipari gadā + "cv" + 4–6 ciparu lietas numurs. Piemērs: 24-cv-12345. Krimināllietās tajā pašā vietā izmanto "cr". Bankrota lietās izmanto "bk". Apelācijās izmanto divi cipari gadā un 4–5 ciparu numurs, kas atšķiras atkarībā no apgabala.

Štata tiesu formāti (piemēri):

Kalifornijas Augstākā tiesa izmanto sešciparu prefiksa sistēmu. Ņujorka izmanto indeksa formātu ar gadu un secību. Teksasa izmanto cēloņa formātu ar gadu, secību un tiesas kodu.

Klientu lietu atzīmes (tipiskākie biroja formāti):

Trīs izplatīti paraugi parādās vairumā biroju:

  • Divi cipari gadā, klienta ID, lietas secība (piem., 24-ACME-001)
  • Prakses grupas iniciāļi, gads, tad četrciparu secība (piem., LIT240042)
  • Klienta prefikss ar sešciparu ID (piem., SMITHCO-000123)

ASV advokātu reģistrācijas ID:

Vairumā štatu izmanto 4–8 ciparu numurus, dažreiz ar štata līmeņa prefiksu. USDC uzņemšanas ID atšķiras pēc apgabala un neseko kopīgam formātam.

Privilēģijām apzināts apstrādes konveiers

Dokumentu pārskatīšanas AI daudzslāņu konveiers apstrādā pilno apjomu.

1. slānis — standarta PII noteikšana

Vārdi, e-pasti, tālruņa numuri, adreses, sociālās apdrošināšanas numuri. Augsta precizitāte. Labi izveidoti rīki šo slāni apstrādā labi.

2. slānis — pielāgota koda noteikšana

Lietu kodi, lietu ID, advokātu ID. Biroja specifiskie paraugi iestatīti onboardinga laikā. Šis slānis aizpilda robu, ko standarta rīki palaiž garām.

3. slānis — privilēģiju pārskatīšana (cilvēka veikta)

Pēc automatizētas noteikšanas advokāts pārskata atzīmētos marķierus. ATTORNEY-CLIENT galvenes. WORK PRODUCT atzīmes. CONFIDENTIAL apzīmējumi. Cilvēka pārskatīšana šajā slānī nav izvēles jautājums.

4. slānis — konteksta izņēmumu pārskatīšana

Publiski reģistru lietu numuri, kas nerada privilēģiju risku, salīdzinājumā ar klientu lietu atzīmēm, kas to rada. Tam nepieciešams advokāta spriedums. To nevar automatizēt.

  1. un 2. slānis apstrādā liela apjoma darbus. 3. un 4. slānis saglabā advokāta spriedumu tur, kur privilēģiju lēmumiem pieder vieta. Par to, kas notiek, kad privilēģija jau ir atteikta ar AI rīka izmantošanu, skatiet advokāta un klienta privilēģija un AI.

Iestatīšana izstrādātājiem

Onboardinga konfigurācija

Ievāciet klientu lietu atzīmju formātus uzņēmuma onboardinga laikā. Katrs birojs izmanto citu formātu. Glabājiet tos kā biroja specifiskas pielāgotas entītijas. Piemērojiet visai apstrādei šim kontam.

Noklusētie iepriekšiestatījumi

Iepriekš izveidoti iepriekšiestatījumi aptver izplatītos kontekstus bez pielāgota darba:

  • "Federal Court Documents" — federālie lietu numuru paraugi civiltiesām, krimināllietām un bankrotam
  • "State Court Documents (CA/NY/TX)" — štata specifiskie formāti trim galvenajiem apgabaliem
  • "Internal Operations" — lietu atzīme plus standarta PII
  • "Outside Counsel Portal" — rēķina atsauce, lietu atzīme un standarta PII

Revīzijas dokumentācija

Apstrādes ierakstiem jāparāda, ka pielāgoti kodi tika iekļauti katrā noteikšanas kārtā. Tas atbalsta darba produkta aizsardzību analīzes metodei.

Plašāku pārskatu par to, kā anonimizācijas izmaksas mērogojas tiesas procesā, skatiet e-atklāšanas PII automatizācija un juridisko pārskatīšanas izmaksu samazināšana.

Secinājums

Privilēģijām sensitīvie ID ir tikpat riskantas kā standarta PII — bieži vien vairāk. Rīki, kas palaiž garām lietu numurus un lietu atzīmes, atstāj reālu robu dokumentu darbplūsmās.

Labojums nav NLP modelis. Tas ir parauga iestatīšana. Izstrādātājiem, kas veido advokātu biroju rīkus, tā ir atšķirība starp 3 dienu labojumu un 3 mēnešu projektu. Advokātu birojiem tā ir atšķirība starp aizstāvamu AI palīdzīgu pārskatīšanu un privilēģijas atteikuma risku.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.