By · Last updated 2026-05-26

Tornar al BlogTecnologia Legal

La deteccio de dades personals redueix els costos de descoberta electronica

La redaccio de dades personals dirigida per advocats en la descoberta electronica costa 1-2 USD per pagina. Un litigi de 50.000 documents genera mes de 375.000 USD nomes en costos de redaccio. L'automatitzacio els redueix fins a un 70%.

May 26, 20268 min llegit
e-discoverylegal redactionlitigation costslaw firm technologydocument review

Reduccio dels costos de la descoberta electronica: la deteccio automatitzada de dades personals redueix les factures juridiques fins a un 70%

Actualitzat per al 2026

El treball dels advocats es la part mes costosa de la descoberta electronica. Trobar i ocultar dades personals costa 1-2 USD per pagina. Un cas de 50.000 documents te aproximadament 250.000 pagines. A 1,50 USD per pagina, aixo son 375.000 USD. I aixo nomes per al filtratge.

Els clients ho saben. Impugnen les factures. Els despatxos han de reduir costos sense perdre qualitat.

Utilitzar personal junior a tarifes mes baixes no resol el problema de fons. Un document que triga 15 minuts en filtrar-se tarda 15 minuts a qualsevol tarifa de facturacio.

El pre-filtratge automatitzat ho canvia.

Com passen el temps els advocats ara

En un flux de descoberta electronica normal, un revisor fa cinc coses:

  1. Obre el document
  2. El llegeix per trobar dades personals cobertes per les normes de privadesa
  3. Redacta cada element trobat
  4. Registra la base de cada redaccio
  5. Passa al document seguent

Els passos 2 i 3 suposen aproximadament el 70% del temps per document. El pas 4 necessita un advocat. El pas 5 es nomes flux de treball.

Per als documents amb pocs o cap element sensible, les eines poden realitzar els passos 2-3 en segons. L'advocat comprova la sortida i gestiona els casos excepcionals.

El flux de treball de pre-filtratge

Un bon flux de pre-filtratge te tres fases.

Fase 1: Carrega per lots

Carrega tots els documents al processament per lots. Per a 5.000 documents:

  • Carrega: 15-30 minuts
  • Processament: 2-4 hores, pot executar-se durant la nit
  • Sortida: documents marcats mes un informe que llista quins fitxers tenen dades sensibles i de quin tipus

Fase 2: Triatge

Comprova l'informe i classifica els documents en tres grups:

  • No s'han trobat elements sensibles: envia al client. No cal temps d'advocat.
  • Elements clars estandard (correu electronic, telefon): comprova la sortida, aplica les redaccions, registra la base.
  • Marcat com a excepcio: l'advocat comprova aquests elements en context.

Per a un cas corporatiu normal:

  • El 20-30% dels documents no necessiten cap redaccio
  • El 50-60% te elements estandard on l'eina es precisa
  • El 10-20% necessita revisio de l'advocat (noms de personatges publics, historials medics, comprovacions de privilegi)

Fase 3: Revisio d'excepcions

Els advocats gestionen nomes el conjunt d'excepcions del 10-20%. En un cas de 5.000 documents, son 500-1.000 fitxers en lloc de 5.000. El temps dels advocats es redueix un 70-80%.

Per que aixo aguanta als tribunals

La descoberta electronica pot ser impugnada. Qualsevol metode de redaccio ha de ser solid.

Les mateixes normes cada vegada: les eines apliquen la mateixa configuracio a cada document. La revisio manual no es igual. Un revisor gestiona el document 500 de manera diferent que el document 1 despres de quatre hores de treball.

Registres clars: els registres de processament mostren el que s'ha trobat, el metode utilitzat i quan s'ha executat. Aixo crea un rastre d'auditoria. Quan l'adversari impugna, un registre clar suporta la defensa.

Comprovacions puntuals: prova l'eina en una mostra abans del processament complet. Desa aquests resultats. Aixo demostra que s'ha tingut cura.

L'estandard de "diligencia raonable": els tribunals que apliquen la Norma Federal de Procediment Civil 26 analitzen si les parts van prendre "diligencia raonable" en la produccio. Una eina amb un metode clar i una prova de mostra compleix aquest requisit. La feina manual ad hoc sense registres sovint no ho fa.

Comparativa de costos: un cas real

Exemple: cas de discriminacio laboral de 50.000 documents

Nomes revisio manual:

  • 50.000 documents x 5 pagines = 250.000 pagines
  • 250.000 pagines x 1,50 USD = 375.000 USD
  • Calendari: 8-12 setmanes, equip de cinc persones

Revisio assistida per eines mes treball d'excepcions:

  • 30% sense dades sensibles (15.000 fitxers): passa al client, 0 USD
  • 60% elements estandard (30.000 fitxers): comprova a 3-5 minuts per fitxer vs. 15-30 minuts, 90.000-150.000 USD
  • 10% excepcio (5.000 fitxers): revisio completa a 1,50 USD/pagina, 37.500 USD
  • Total: aproximadament 130.000-190.000 USD

Estalvis: 185.000-245.000 USD, una reduccio del 49-65% nomes en aquest cas.

Que necessiten els despatxos per configurar-ho

Els despatxos que comencen aquest enfocament necessiten algunes coses a punt.

Suport de formats de fitxer: els casos inclouen PDF de text, PDF escanejats, fitxers Word, fitxers de correu electronic (MSG, EML) i fulls de calcul. Els documents basats en text s'executen amb alta precisio. Els PDF escanejats necessiten OCR primer.

Configuracio d'ordres de proteccio: els assumptes amb ordres de proteccio que anomenen tipus de dades especifics necessiten configuracions personalitzades que coincideixin amb les paraules exactes de l'ordre.

Presets per cas: desa la configuracio per tipus de cas: laboral, sanitat, finances. Utilitza la mateixa configuracio en casos similars.

Enlla cos amb plataformes: la sortida pot anar a Relativity, Everlaw o Nuix per a la revisio dels advocats. Els fitxers o l'exportacio de metadades s'integra en els processos existents.

Per al context sobre com les eines es comparen amb la redaccio estandard, vegeu el nostre article sobre precisio de la IA en el treball amb documents juridics. Per a com els tribunals gestionen els incompliments de la descoberta electronica, vegeu el nostre post sobre redaccio excessiva en la descoberta electronica i sancions.

Conclusio

La factura de 375.000 USD de la descoberta electronica no es fixa. Es el cost d'un proces manual a escala. Una reduccio del 70% en el temps dels advocats vol dir factures mes baixes per als clients, un millor preu dels casos i una sortida mes rapida.

Per als despatxos que competeixen en tecnologia juridica, ara una demanda habitual dels clients, la deteccio automatitzada documentada es un avantatge real. Per als clients que gestionen pressupostos de descoberta electronica, es una necessitat.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.