By · Last updated 2026-06-03

Tilbage til BlogJuridisk Teknologi

Juridisk PII: Privilege-detektion

Sagsnumre, advokaters licensnumre, domstolsakter og klientmappenumre er juridisk følsomme identifikatorer, som standardværktøjer til PII overser.

June 3, 20267 min læsning
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "Juridisk PII: Privilege-detektion" description: "Sagsnumre, advokaters licensnumre, domstolsakter og klientmappenumre er juridisk følsomme identifikatorer, som standardværktøjer til PII overser." category: legal-tech publishedAt: 2026-06-03 tags:

  • attorney-client privilege
  • juridisk dokumentgennemgang
  • sagsnumre
  • advokatfirmaets privatliv
  • legal tech readingTime: 7

Advokat-klient-privilegium i AI-æraen: Juridisk PII, dit anonymiseringsværktøj skal opdage

Standard PII-værktøjer fanger navne, e-mails og CPR-numre. De overser sagsnumre, advokaters licensnumre og klientmappenumre. Disse bærer alvorlige privilegierisici. Generiske værktøjer efterlader den sårbarhed åben.

Advokatfirmaer sender filer til AI-værktøjer hver dag. Disse filer indeholder privilege-følsomme markører, som standardværktøjer ikke opfanger.

Når et advokatfirma videresender filer gennem en AI-assistent, indeholder disse filer juridiske ID'er ved siden af standard PII:

  • Klientmappenumre: Linker til den fulde sag og identificerer klienten
  • Sagsnumre: Domstolstildelte koder, der er knyttet til offentlige registre med private oplysninger
  • Advokatregistreringsnumre: Advokat-ID'er, der kan søges i offentlige statsregistre
  • Domstolsaktekoder: Forbinder til offentlige arkivsystemer med fuld sagshistorik
  • Dommertildelingskoder: Identificerer den præsiderende dommer i følsomme situationer

Hver af disse, sendt til en ekstern AI-leverandør, skaber et potentielt privilegieproblem.

Hvorfor disse ID'er kræver tilpasset detektion

Domstolsaktformater følger distriktsbaserede mønstre. Intet enkelt mønster dækker alle føderale og statslige domstole.

Føderale civile sager bruger et tocifret årstal, derefter "cv," derefter et sagsnummer. Straffesager bruger "cr" samme sted. Statsdomstole varierer efter region uden fælles standard.

Advokatregistreringsnumre er statsspecifikke. Californien bruger et numerisk format. New York bruger et registreringsformat. Texas bruger sit eget advokat-ID-format. Intet nationalt format eksisterer.

Klientmappenumre er firmaspecifikke. Hvert firma bygger sit eget format. År-klient-sag. Praksisgruppekoder. Sekventielle ID'er.

Standard PII-værktøjer kan ikke kende nogen af disse uden tilpasset opsætning.

Sårbarheden er reel. Et dokumentværktøj modtager fuld sagskontekst. Aktekoder linker til offentlige registre. Klienttags er til stede. Værktøjet rapporterer, at PII er fjernet. Navne og e-mails blev fjernet. De privilege-følsomme ID'er blev ikke fjernet.

Casen med den juridiske AI-startup

En juridisk AI-startup bygger et dokumentværktøj til advokatfirmaer. Produktet scanner opdagelsesfiler, identificerer relevante klausuler og markerer potentielt privilegeret indhold. Enterprise-klienter kræver sletning af klientmappenumre ved siden af standard PII, inden behandling.

Complianceblokaden: AI-værktøjet behandler fildata, der indeholder klientmappenumre. Kombineret med offentlige domstolsindgivelser kunne disse tags muliggøre sagsidentifikation. Enterprise legal ops-teams markerer dette som uacceptabelt.

Før tilpasset entitetsdetektion:

  • Aftalegennemgang finder compliancesårbarheden
  • 3+ måneder i engineering-kø til en tilpasset NLP-model
  • Enterprise-kontrakt på hold

Med en tilpasset entitets-API:

  • Compliance-officer definerer mappenummerformatet ved onboarding
  • Mønster testet mod eksempelfiler: 2 dage
  • Tilpasset entitet tilføjet til pipeline: 1 dag mere
  • Enterprise-kontrakt skrider frem

Forskellen er 3 dage versus 3+ måneder. Arbejdet er mønsteropsætning og API-integration. Ingen NLP-modeltræning er nødvendig.

Almindelige formater efter kategori

Føderale domstolsakter:

Føderale civile sager bruger: tocifret år + "cv" + et 4–6-cifret sagsnummer. Eksempel: 24-cv-12345. Straffesager bruger "cr" samme sted. Konkursbehandlinger bruger "bk." Anker bruger et tocifret årstal og et 4–5-cifret nummer, der varierer efter kredsret.

Statsdomstolsformater (eksempler):

Californien Superior Court bruger et sekscifret præfikssystem. New York bruger et indeksformat med år og sekvens. Texas bruger et årsags-format med år, sekvens og domstolskode.

Klientmappenumre (typiske firmamønstre):

Tre almindelige mønstre optræder hos de fleste firmaer:

  • Tocifret år, klient-ID, sagssekvens (f.eks. 24-ACME-001)
  • Praksisgruppeinitialerne, år, derefter en firecifret sekvens (f.eks. LIT240042)
  • Klientpræfiks med et sekscifret ID (f.eks. SMITHCO-000123)

Amerikanske advokatregistrerings-ID'er:

De fleste stater bruger 4–8-cifrede numre, nogle gange med et statsspecifikt præfiks. USDC-optagerelses-ID'er varierer efter distrikt og følger ikke et fælles format.

Privilege-bevidst behandlingspipeline

For AI til dokumentgennemgang håndterer en lagdelt pipeline det fulde omfang.

Lag 1 — Standard PII-detektion

Navne, e-mails, telefonnumre, adresser, CPR-numre. Høj nøjagtighed. Velkendt værktøj håndterer dette lag godt.

Lag 2 — Tilpasset kodedetektion

Sagskoder, akte-ID'er, advokat-ID'er. Firmaspecifikke mønstre indstillet ved onboarding. Dette lag udfylder hullet, som standardværktøjer overser.

Lag 3 — Privilegegennemgang (menneskelig)

Efter automatisk detektion gennemgår en advokat markerede identifikatorer. ADVOKAT-KLIENT-overskrifter. ARBEJDSPRODUKT-etiketter. FORTROLIGE markeringer. Menneskelig gennemgang på dette lag er ikke valgfri.

Lag 4 — Kontekstundtagelsesgennemgang

Offentlige registerakter, der ikke udgør en privilegierisiko, versus klientmappenumre, der gør. Dette kræver advokatmæssig vurdering. Det kan ikke automatiseres.

Lag 1 og 2 håndterer store mængder. Lag 3 og 4 holder advokatmæssig vurdering, der hvor privilegiebeslutninger hører hjemme. For hvad der sker, når privilegiet allerede er opgivet ved brug af AI-værktøjer, se advokat-klient-privilegium og AI.

Opsætning for udviklere

Onboarding-konfiguration

Indsaml klientmappenummerformater under enterprise-onboarding. Hvert firma bruger et andet format. Gem dem som firmaspecifikke tilpassede entiteter. Anvend på al behandling for den pågældende konto.

Standardforudindstillinger

Færdigbyggede forudindstillinger dækker almindelige kontekster uden tilpasset arbejde:

  • "Føderale domstolsdokumenter" — føderale aktemønstre for civile, strafferetlige og konkurssager
  • "Statsdomstolsdokumenter (CA/NY/TX)" — statsspecifikke formater for tre store jurisdiktioner
  • "Interne operationer" — sagsnummer plus standard PII
  • "Ekstern advokatportal" — fakturareferencer, sagsnummer og standard PII

Revisionsdokumentation

Behandlingsregistreringer skal vise, at tilpassede koder var inkluderet i hvert detektionsforløb. Dette understøtter arbejdsproduktbeskyttelse for analysemetoden.

For et bredere overblik over, hvordan redigeringsomkostninger skaleres i retssager, se e-discovery PII-automatisering og reduktion af juridiske gennemgangsomkostninger.

Konklusion

Privilege-følsomme ID'er er lige så risikable som standard PII — ofte mere så. Værktøjer, der overser aktekoder og sagsnumre, efterlader et reelt hul i dokumentworkflows.

Rettelsen er ikke en NLP-model. Det er mønsteropsætning. For udviklere, der bygger advokatfirmaværktøjer, er det forskellen mellem en 3-dages løsning og et 3-måneders projekt. For advokatfirmaer er det forskellen mellem forsvarlig AI-assisteret gennemgang og risikoen for at opgive privilegiet.

Kilder

Klar til at beskytte dine data?

Begynd at anonymisere PII med 285+ enhedstyper på tværs af 48 sprog.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.