By · Last updated 2026-06-03

Povratak na BlogPravna Tehnologija

Pravni PII: Otkrivanje povlastice

Referentni brojevi predmeta, brojevi bar dozvola, brojevni sudski spisi i ID-ovi klijentskih predmeta pravno su osjetljivi identifikatori koje standardni PII alati propustaju.

June 3, 20267 min čitanja
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "Pravni PII: Otkrivanje povlastice" description: "Referentni brojevi predmeta, brojevi bar dozvola, brojevni sudski spisi i ID-ovi klijentskih predmeta pravno su osjetljivi identifikatori koje standardni PII alati propustaju." category: legal-tech publishedAt: 2026-06-03 tags:

  • odvjetnička povlastica
  • pregled pravnih dokumenata
  • brojevni predmeta
  • privatnost odvjetničkih ureda
  • pravna tehnologija readingTime: 7

Odvjetnička povlastica u eri AI: Pravni PII koji vas alat za anonimizaciju mora detektirati

Standardni PII alati hvataju imena, e-mail adrese i matične brojeve. Propuštaju referentne ID-ove predmeta, brojeve bar dozvola i oznake klijentskih predmeta. Oni nose ozbiljne rizike za povlasticu. Generički alati ostavljaju taj jaz otvoren.

Odvjetnički uredi svakodnevno šalju datoteke AI alatima. Te datoteke sadrze markere osjetljive na povlasticu koje standardni alati ne hvataju.

Kada odvjetnički ured preusmjerava datoteke kroz AI asistenta, te datoteke sadrze pravne ID-ove uz standardne PII:

  • Oznake klijentskog predmeta: Povezuju se s cijelim spisom predmeta i imenuju klijenta
  • Referentni ID-ovi predmeta: Kodovi koje dodjeljuje sud i koji se vežu uz javne zapise s privatnim detaljima
  • Brojevi bar dozvola: ID-ovi odvjetnika pretraživi u javnim državnim imenicima
  • Kodovi sudskih spisa: Povezuju se s javnim sustavima podnošenja s punom poviješću predmeta
  • Kodovi dodjele suca: Identificiraju predsjedavajuceg suca u osjetljivim situacijama

Bilo koji od njih, poslan vanjskom AI vendoru, stvara potencijalni problem povlastice.

Zasto ti ID-ovi trebaju prilagodenu detekciju

Formati sudskih spisa slijede uzorke na razini okruga. Nijedan jedinstven uzorak ne pokriva sve federalne i državne sudove.

Federalni gradanski predmeti koriste dvoznamenkasti godišnji broj, zatim "cv", a potom broj predmeta. Kazneni predmeti koriste "cr" na istom mjestu. Državni sudovi razlikuju se po regiji bez zajednickog standarda.

Brojevi bar dozvola su specificni za državu. Kalifornija koristi numerickim format. New York koristi format registra. Texas ima vlastiti format bar ID-a. Ne postoji nacionalni format.

Oznake klijentskih predmeta specificne su za ured. Svaki ured gradi vlastiti format. Godina-klijent-predmet. Kodovi praksnih skupina. Sekvencijalni ID-ovi.

Standardni PII alati ne mogu znati nijedno od toga bez prilagodene postavke.

Jaz je stvaran. Alat za dokumente prima puni kontekst predmeta. Kodovi spisa povezuju se s javnim zapisima. Klijentske oznake su prisutne. Alat izvještava da je PII uklonjen. Imena i e-mail adrese su uklonjeni. Povlastici osjetljivi ID-ovi nisu.

Slucaj startupa za pravni AI

Startup za pravni AI gradi alat za dokumente za odvjetnicke urede. Proizvod skenira datoteke istrage, pronalazi relevantne klauzule i oznacava potencijalno povlasteni sadržaj. Enterprise klijenti zahtijevaju brisanje oznaka klijentskih predmeta uz standardni PII prije obrade.

Zapreka uskladjenosti: AI alat obradjuje podatke datoteka koji sadrze oznake klijentskih predmeta. U kombinaciji s javnim sudskim podnescima, te oznake mogle bi omoguciti identifikaciju predmeta. Enterprise pravni ops timovi to oznacavaju kao neprihvatljivo.

Prije prilagodene detekcije entiteta:

  • Pregled dogovora pronalazi jaz uskladjenosti
  • Red cekanja inženjeringa 3+ mjeseca za prilagodeni NLP model
  • Enterprise ugovor na cekanju

S prilagodenim API-jem za entitete:

  • Compliance officer definira format oznake predmeta pri uvodenju
  • Uzorak testiran na uzorcima datoteka: 2 dana
  • Prilagodeni entitet dodan u pipeline: još 1 dan
  • Enterprise ugovor napreduje

Jaz je 3 dana nasuprot 3+ mjeseca. Posao je postavljanje uzorka i integracija API-ja. Nije potrebno treniranje NLP modela.

Uobicajeni formati po kategoriji

Federalni sudski spisi:

Federalni gradanski predmeti koriste: dvoznamenkasti godišnji broj + "cv" + broj predmeta od 4-6 znamenki. Primjer: 24-cv-12345. Kazneni predmeti koriste "cr" na istom mjestu. Stecajni predmeti koriste "bk." Žalbe koriste dvoznamenkasti godišnji broj i broj od 4-5 znamenki koji se razlikuje po krugu.

Formati državnih sudova (primjeri):

Viši sud Kalifornije koristi sustav šesteroznamenkastog prefiksa. New York koristi format indeksa s godinom i redoslijedom. Texas koristi format razloga s godinom, redoslijedom i kodom suda.

Oznake klijentskih predmeta (tipicni formati ureda):

Tri uobicajena uzorka pojavljuju se u vecini ureda:

  • Dvoznamenkasti godišnji broj, ID klijenta, redoslijed predmeta (npr. 24-ACME-001)
  • Inicijali praksne grupe, godina, zatim cetverozmenkasti redoslijed (npr. LIT240042)
  • Prefiks klijenta sa šesteroznamenkastim ID-om (npr. SMITHCO-000123)

ID-ovi bar dozvola u SAD-u:

Vecina država koristi brojeve od 4-8 znamenki, ponekad s prefiksom na razini države. USDC dozvole pristupa razlikuju se po okrugu i ne slijede zajednicki format.

Pipeline obrade svjestan povlastice

Za AI pregled dokumenata, višeslojna linija obrade pokriva cijeli opseg.

Sloj 1 - Standardna detekcija PII-a

Imena, e-mail adrese, brojevi telefona, adrese, matični brojevi. Visoka tocnost. Dobro etablirani alati pokrivaju ovaj sloj.

Sloj 2 - Detekcija prilagodenih kodova

Kodovi predmeta, ID-ovi spisa, bar ID-ovi. Uzorci specificni za ured postavljaju se pri uvodenju. Ovaj sloj popunjava jaz koji standardni alati propuštaju.

Sloj 3 - Pregled povlastice (covjek)

Nakon automatske detekcije, odvjetnik pregledava oznacene markere. Zaglavlja ATTORNEY-CLIENT. Oznake WORK PRODUCT. Oznake CONFIDENTIAL. Ljudski pregled na ovom sloju nije opcija.

Sloj 4 - Pregled iznimki konteksta

Javni zapisi spisa koji ne predstavljaju nikakav rizik povlastice nasuprot oznakama klijentskih predmeta koje predstavljaju. To zahtijeva odvjetnicku prosudbu. Ne može se automatizirati.

Slojevi 1 i 2 obraduju visoki volumen posla. Slojevi 3 i 4 drže odvjetnicku prosudbu tamo gdje odluke o povlastici pripadaju. Za što se dogodi kada je povlastica vec odrecena korištenjem AI alata, pogledajte odvjetnička povlastica i AI.

Postavljanje za developere

Konfiguracija pri uvodenju

Prikupite formate oznaka klijentskih predmeta tijekom enterprise uvodenja. Svaki ured koristi drugaciji format. Pohranite ih kao prilagodene entitete specificne za ured. Primijenite na svu obradu za taj racun.

Zadane postavke

Unaprijed izgradeni predlošci pokrivaju uobicajene kontekste bez prilagodenog rada:

  • "Federal Court Documents" - federalni uzorci spisa za gradanske, kaznene i stecajne predmete
  • "State Court Documents (CA/NY/TX)" - formati specificni za države za tri glavne jurisdikcije
  • "Internal Operations" - oznaka predmeta plus standardni PII
  • "Outside Counsel Portal" - referenca racuna, oznaka predmeta i standardni PII

Dokumentacija revizije

Zapisi obrade trebaju pokazati da su prilagodeni kodovi bili ukljuceni u svaki prolaz detekcije. To podupire zaštitu radnog proizvoda za metodu analize.

Za širi pogled na to kako troškovi brisanja skaliraju u parnicama, pogledajte PII automatizacija e-otkrija i smanjenje troškova pravnog pregleda.

Zakljucak

Povlastici osjetljivi ID-ovi jednako su rizicni kao standardni PII - cesto i više. Alati koji propuštaju kodove spisa i oznake predmeta ostavljaju stvarni jaz u tijekovima rada s dokumentima.

Ispravak nije NLP model. To je postavljanje uzorka. Za developere koji grade alate za odvjetnicke urede, to je razlika izmedju 3-dnevnog ispravka i 3-mjesecnog projekta. Za odvjetnicke urede, to je razlika izmedju obranjivog AI-asistiranog pregleda i rizika odricanja od povlastice.

Izvori

Spremni za zaštitu vaših podataka?

Započnite anonimizaciju PII-a s 285+ vrsta entiteta na 48 jezika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.