By · Last updated 2026-06-03

Tornar al BlogTecnologia Legal

PII Legal: Detecció de Privilègi

Els números de referència de casos, els números d'admissió al col·legi d'advocats, els números de dossier judicial i els identificadors de matèria del client són identificadors legalment sensibles que les eines PII estàndard no detecten.

June 3, 20267 min llegit
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "PII Legal: Detecció de Privilègi" description: "Els números de referència de casos, els números d'admissió al col·legi d'advocats, els números de dossier judicial i els identificadors de matèria del client són identificadors legalment sensibles que les eines PII estàndard no detecten." category: legal-tech publishedAt: 2026-06-03 tags:

  • privilegi advocat-client
  • revisió de documents legals
  • números de cas
  • privacitat de despatxos d'advocats
  • tecnologia legal readingTime: 7

Les eines PII estàndard capturen noms, correus electrònics i números de la Seguretat Social. No detecten els identificadors de referència de casos, els números d'admissió al col·legi d'advocats ni les etiquetes de matèria del client. Aquests elements comporten riscos greus de privilegi. Les eines genèriques deixen aquest buit obert.

Els despatxos d'advocats envien arxius a eines d'IA cada dia. Aquests arxius contenen marcadors sensibles al privilegi que les eines estàndard no detecten.

Quan un despatx d'advocats enruta arxius a través d'un assistent d'IA, aquests arxius contenen identificadors legals juntament amb la PII estàndard:

  • Etiquetes de matèria del client: Enllacen amb l'arxiu complet de la matèria i identifiquen el client
  • Identificadors de referència del cas: Codis assignats pel tribunal que connecten amb registres públics que contenen detalls privats
  • Números d'admissió al col·legi: Identificadors d'advocats consultables als directoris estatals públics
  • Codis de dossier judicial: Connecten amb sistemes de presentació públics amb l'històric complet del cas
  • Codis d'assignació judicial: Identifiquen el jutge president en situacions sensibles

Qualsevol d'aquests, enviat a un proveïdor d'IA extern, crea un possible problema de privilegi.

Per Què Aquests Identificadors Necessiten Detecció Personalitzada

Els formats de dossier judicial segueixen patróns a nivell de districte. Cap patró única cobreix tots els tribunals federals i estatals.

Els casos civils federals utilitzen un any de dos dígits, després "cv", després un número de cas. Els casos penals utilitzen "cr" al mateix lloc. Els tribunals estatals varien per regió sense cap estàndard compartit.

Els números d'admissió al col·legi són específics de cada estat. Califòrnia utilitza un format numèric. Nova York utilitza un format de registre. Texas utilitza el seu propi format d'identificador del col·legi. No existeix cap format nacional.

Les etiquetes de matèria del client són específiques de cada despatx. Cada despatx construeix el seu propi format: any-client-matèria, codis de grup de pràctica, identificadors sequèncials.

Les eines PII estàndard no poden coneixer cap d'aquests sense configuració personalitzada.

El buit és real. Una eina de documents rep el context complet de la matèria. Els codis de dossier enllacen amb registres públics. Les etiquetes del client hi són presents. L'eina informa que s'ha eliminat la PII. S'han eliminat noms i correus electrònics. Els identificadors sensibles al privilegi no s'han eliminat.

Una startup d'IA legal construeix una eina de documents per a despatxos d'advocats. El producte escaneja arxius de descobriment, identifica clàusules rellevants i marca contingut potencialment privilegiat. Els clients empresarials requereixen la redacció de les etiquetes de matèria del client juntament amb la PII estàndard abans del processament.

El bloqueig de compliment: l'eina d'IA processa dades d'arxius que contenen etiquetes de matèria del client. Combinades amb les presentacions judicials públiques, aquestes etiquetes podrien permetre la identificació de la matèria. Els equips d'operacions legals empresarials consideren això inacceptable.

Abans de la detecció d'entitats personalitzades:

  • La revisió del contracte troba el buit de compliment
  • Cua d'enginyeria de més de 3 mesos per a un model NLP personalitzat
  • Contracte empresarial en espera

Amb una API d'entitats personalitzades:

  • El responsable de compliment defineix el format de l'etiqueta de matèria en l'incorporació
  • Patró provat amb arxius de mostra: 2 dies
  • Entitat personalitzada afegida a la pipeline: 1 dia més
  • El contracte empresarial progressa

La diferència és 3 dies enfront de més de 3 mesos. La feina consisteix en la configuració de patrons i la integració de l'API. No cal cap entrenament de model NLP.

Formats Comuns per Categoria

Dossiers judicials federals:

Els casos civils federals utilitzen: any de dos dígits + "cv" + un número de cas de 4-6 dígits. Exemple: 24-cv-12345. Els casos penals utilitzen "cr" al mateix lloc. Els casos de fallida utilitzen "bk". Els recursos utilitzen un any de dos dígits i un número de 4-5 dígits que varia per circuit.

Formats de tribunals estatals (exemples):

El Tribunal Superior de Califòrnia utilitza un sistema de prefix de sis dígits. Nova York utilitza un format d'índex amb any i sequència. Texas utilitza un format de causa amb any, sequència i codi de tribunal.

Etiquetes de matèria del client (formats típics de despatxos):

Tres patrons comuns apareixen a la majoria de despatxos:

  • Any de dos dígits, ID del client, sequència de matèria (p. ex., 24-ACME-001)
  • Inicials del grup de pràctica, any i després una sequència de quatre dígits (p. ex., LIT240042)
  • Prefix del client amb un identificador de sis dígits (p. ex., SMITHCO-000123)

Identificadors d'admissió al col·legi dels EUA:

La majoria d'estats utilitzen números de 4-8 dígits, de vegades amb un prefix a nivell estatal. Els identificadors d'admissió al USDC varien per districte i no segueixen un format compartit.

Pipeline de Processament Conscient del Privilegi

Per a la IA de revisió de documents, una pipeline per capes gestiona l'àmbit complet.

Capa 1 -- Detecció PII estàndard

Noms, correus electrònics, números de telèfon, adreces, números de la Seguretat Social. Alta precisió. Les eines ben establertes gestionen bé aquesta capa.

Capa 2 -- Detecció de codis personalitzats

Codis de matèria, identificadors de dossier, identificadors del col·legi. Patrons específics del despatx configurats en l'incorporació. Aquesta capa omple el buit que les eines estàndard no cobreixen.

Capa 3 -- Revisió de privilegi (humana)

Despés de la detecció automatitzada, un advocat revisa els marcadors marcats: capçaleres ADVOCAT-CLIENT, etiquetes PRODUCTE DE TREBALL, marques CONFIDENCIAL. La revisió humana en aquesta capa no és opcional.

Capa 4 -- Revisió d'excepcions de context

Dossiers de registre públic que no presenten cap risc de privilegi enfront d'etiquetes de matèria del client que sí que el presenten. Això requereix criteri d'advocat. No es pot automatitzar.

Les capes 1 i 2 gestionen el treball d'alt volum. Les capes 3 i 4 mantenen el criteri de l'advocat on pertanyen les decisions de privilegi. Per saber què passa quan el privilegi ja ha estat renunciat per l'ús d'eines d'IA, consulteu privilegi advocat-client i IA.

Configuració per a Desenvolupadors

Configuració d'incorporació

Recolliu els formats d'etiquetes de matèria del client durant l'incorporació empresarial. Cada despatx utilitza un format diferent. Emmagatzemeu-los com a entitats personalitzades específiques del despatx. Apliqueu-los a tot el processament d'aquest compte.

Presets per defecte

Els presets prebàsics cobreixen contextos comuns sense treball personalitzat:

  • "Documents de Tribunals Federals" -- patrons de dossier federal per a casos civils, penals i de fallida
  • "Documents de Tribunals Estatals (CA/NY/TX)" -- formats específics per estat per a tres jurisdiccions principals
  • "Operacions Internes" -- etiqueta de matèria més PII estàndard
  • "Portal d'Assessors Externs" -- referència de factura, etiqueta de matèria i PII estàndard

Documentació d'auditoria

Els registres de processament han de mostrar que els codis personalitzats es van incloure en cada pas de detecció. Això dóna suport a la protecció del producte de treball per al mètode d'anàlisi.

Per a una visió més àmplia de com els costos de redacció escalen en litigis, consulteu automatització PII en e-discovery i reducció dels costos de revisió legal.

Conclusió

Els identificadors sensibles al privilegi són tan arriscats com la PII estàndard, sovint més. Les eines que no detecten els codis de dossier i les etiquetes de matèria deixen un buit real en els fluxos de treball de documents.

La solució no és un model NLP. És la configuració de patrons. Per als desenvolupadors que construeixen eines per a despatxos d'advocats, això representa la diferència entre una correcció de 3 dies i un projecte de 3 mesos. Per als despatxos d'advocats, és la diferència entre una revisió assistida per IA defensable i un risc de renúncia al privilegi.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.