title: "Pravni PII: Otkrivanje povlastice" description: "Referentni brojevi predmeta, brojevi bar dozvola, brojevni sudski spisi i ID-ovi klijentskih predmeta pravno su osjetljivi identifikatori koje standardni PII alati propustaju." category: legal-tech publishedAt: 2026-06-03 tags:
- odvjetnička povlastica
- pregled pravnih dokumenata
- brojevni predmeta
- privatnost odvjetničkih ureda
- pravna tehnologija readingTime: 7
Odvjetnička povlastica u eri AI: Pravni PII koji vas alat za anonimizaciju mora detektirati
Standardni PII alati hvataju imena, e-mail adrese i matične brojeve. Propuštaju referentne ID-ove predmeta, brojeve bar dozvola i oznake klijentskih predmeta. Oni nose ozbiljne rizike za povlasticu. Generički alati ostavljaju taj jaz otvoren.
Odvjetnički uredi svakodnevno šalju datoteke AI alatima. Te datoteke sadrze markere osjetljive na povlasticu koje standardni alati ne hvataju.
Kada odvjetnički ured preusmjerava datoteke kroz AI asistenta, te datoteke sadrze pravne ID-ove uz standardne PII:
- Oznake klijentskog predmeta: Povezuju se s cijelim spisom predmeta i imenuju klijenta
- Referentni ID-ovi predmeta: Kodovi koje dodjeljuje sud i koji se vežu uz javne zapise s privatnim detaljima
- Brojevi bar dozvola: ID-ovi odvjetnika pretraživi u javnim državnim imenicima
- Kodovi sudskih spisa: Povezuju se s javnim sustavima podnošenja s punom poviješću predmeta
- Kodovi dodjele suca: Identificiraju predsjedavajuceg suca u osjetljivim situacijama
Bilo koji od njih, poslan vanjskom AI vendoru, stvara potencijalni problem povlastice.
Zasto ti ID-ovi trebaju prilagodenu detekciju
Formati sudskih spisa slijede uzorke na razini okruga. Nijedan jedinstven uzorak ne pokriva sve federalne i državne sudove.
Federalni gradanski predmeti koriste dvoznamenkasti godišnji broj, zatim "cv", a potom broj predmeta. Kazneni predmeti koriste "cr" na istom mjestu. Državni sudovi razlikuju se po regiji bez zajednickog standarda.
Brojevi bar dozvola su specificni za državu. Kalifornija koristi numerickim format. New York koristi format registra. Texas ima vlastiti format bar ID-a. Ne postoji nacionalni format.
Oznake klijentskih predmeta specificne su za ured. Svaki ured gradi vlastiti format. Godina-klijent-predmet. Kodovi praksnih skupina. Sekvencijalni ID-ovi.
Standardni PII alati ne mogu znati nijedno od toga bez prilagodene postavke.
Jaz je stvaran. Alat za dokumente prima puni kontekst predmeta. Kodovi spisa povezuju se s javnim zapisima. Klijentske oznake su prisutne. Alat izvještava da je PII uklonjen. Imena i e-mail adrese su uklonjeni. Povlastici osjetljivi ID-ovi nisu.
Slucaj startupa za pravni AI
Startup za pravni AI gradi alat za dokumente za odvjetnicke urede. Proizvod skenira datoteke istrage, pronalazi relevantne klauzule i oznacava potencijalno povlasteni sadržaj. Enterprise klijenti zahtijevaju brisanje oznaka klijentskih predmeta uz standardni PII prije obrade.
Zapreka uskladjenosti: AI alat obradjuje podatke datoteka koji sadrze oznake klijentskih predmeta. U kombinaciji s javnim sudskim podnescima, te oznake mogle bi omoguciti identifikaciju predmeta. Enterprise pravni ops timovi to oznacavaju kao neprihvatljivo.
Prije prilagodene detekcije entiteta:
- Pregled dogovora pronalazi jaz uskladjenosti
- Red cekanja inženjeringa 3+ mjeseca za prilagodeni NLP model
- Enterprise ugovor na cekanju
S prilagodenim API-jem za entitete:
- Compliance officer definira format oznake predmeta pri uvodenju
- Uzorak testiran na uzorcima datoteka: 2 dana
- Prilagodeni entitet dodan u pipeline: još 1 dan
- Enterprise ugovor napreduje
Jaz je 3 dana nasuprot 3+ mjeseca. Posao je postavljanje uzorka i integracija API-ja. Nije potrebno treniranje NLP modela.
Uobicajeni formati po kategoriji
Federalni sudski spisi:
Federalni gradanski predmeti koriste: dvoznamenkasti godišnji broj + "cv" + broj predmeta od 4-6 znamenki. Primjer: 24-cv-12345. Kazneni predmeti koriste "cr" na istom mjestu. Stecajni predmeti koriste "bk." Žalbe koriste dvoznamenkasti godišnji broj i broj od 4-5 znamenki koji se razlikuje po krugu.
Formati državnih sudova (primjeri):
Viši sud Kalifornije koristi sustav šesteroznamenkastog prefiksa. New York koristi format indeksa s godinom i redoslijedom. Texas koristi format razloga s godinom, redoslijedom i kodom suda.
Oznake klijentskih predmeta (tipicni formati ureda):
Tri uobicajena uzorka pojavljuju se u vecini ureda:
- Dvoznamenkasti godišnji broj, ID klijenta, redoslijed predmeta (npr. 24-ACME-001)
- Inicijali praksne grupe, godina, zatim cetverozmenkasti redoslijed (npr. LIT240042)
- Prefiks klijenta sa šesteroznamenkastim ID-om (npr. SMITHCO-000123)
ID-ovi bar dozvola u SAD-u:
Vecina država koristi brojeve od 4-8 znamenki, ponekad s prefiksom na razini države. USDC dozvole pristupa razlikuju se po okrugu i ne slijede zajednicki format.
Pipeline obrade svjestan povlastice
Za AI pregled dokumenata, višeslojna linija obrade pokriva cijeli opseg.
Sloj 1 - Standardna detekcija PII-a
Imena, e-mail adrese, brojevi telefona, adrese, matični brojevi. Visoka tocnost. Dobro etablirani alati pokrivaju ovaj sloj.
Sloj 2 - Detekcija prilagodenih kodova
Kodovi predmeta, ID-ovi spisa, bar ID-ovi. Uzorci specificni za ured postavljaju se pri uvodenju. Ovaj sloj popunjava jaz koji standardni alati propuštaju.
Sloj 3 - Pregled povlastice (covjek)
Nakon automatske detekcije, odvjetnik pregledava oznacene markere. Zaglavlja ATTORNEY-CLIENT. Oznake WORK PRODUCT. Oznake CONFIDENTIAL. Ljudski pregled na ovom sloju nije opcija.
Sloj 4 - Pregled iznimki konteksta
Javni zapisi spisa koji ne predstavljaju nikakav rizik povlastice nasuprot oznakama klijentskih predmeta koje predstavljaju. To zahtijeva odvjetnicku prosudbu. Ne može se automatizirati.
Slojevi 1 i 2 obraduju visoki volumen posla. Slojevi 3 i 4 drže odvjetnicku prosudbu tamo gdje odluke o povlastici pripadaju. Za što se dogodi kada je povlastica vec odrecena korištenjem AI alata, pogledajte odvjetnička povlastica i AI.
Postavljanje za developere
Konfiguracija pri uvodenju
Prikupite formate oznaka klijentskih predmeta tijekom enterprise uvodenja. Svaki ured koristi drugaciji format. Pohranite ih kao prilagodene entitete specificne za ured. Primijenite na svu obradu za taj racun.
Zadane postavke
Unaprijed izgradeni predlošci pokrivaju uobicajene kontekste bez prilagodenog rada:
- "Federal Court Documents" - federalni uzorci spisa za gradanske, kaznene i stecajne predmete
- "State Court Documents (CA/NY/TX)" - formati specificni za države za tri glavne jurisdikcije
- "Internal Operations" - oznaka predmeta plus standardni PII
- "Outside Counsel Portal" - referenca racuna, oznaka predmeta i standardni PII
Dokumentacija revizije
Zapisi obrade trebaju pokazati da su prilagodeni kodovi bili ukljuceni u svaki prolaz detekcije. To podupire zaštitu radnog proizvoda za metodu analize.
Za širi pogled na to kako troškovi brisanja skaliraju u parnicama, pogledajte PII automatizacija e-otkrija i smanjenje troškova pravnog pregleda.
Zakljucak
Povlastici osjetljivi ID-ovi jednako su rizicni kao standardni PII - cesto i više. Alati koji propuštaju kodove spisa i oznake predmeta ostavljaju stvarni jaz u tijekovima rada s dokumentima.
Ispravak nije NLP model. To je postavljanje uzorka. Za developere koji grade alate za odvjetnicke urede, to je razlika izmedju 3-dnevnog ispravka i 3-mjesecnog projekta. Za odvjetnicke urede, to je razlika izmedju obranjivog AI-asistiranog pregleda i rizika odricanja od povlastice.