anonym.legal

By · Last updated 2026-06-03

Назад към блогаПравни технологии

Правна ПЛИ: Засичане на привилегии

Референтни номера на дела, номера за регистрация в адвокатската колегия, номера на съдебни преписки и идентификатори на клиентски досиета са правно чувствителни идентификатори, които стандартните ПЛИ инструменти пропускат.

June 3, 20267 мин. четене
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "Правна ПЛИ: Засичане на привилегии" description: "Референтни номера на дела, номера за регистрация в адвокатската колегия, номера на съдебни преписки и идентификатори на клиентски досиета са правно чувствителни идентификатори, които стандартните ПЛИ инструменти пропускат." category: legal-tech publishedAt: 2026-06-03 tags:

  • attorney-client privilege
  • legal document review
  • case numbers
  • law firm privacy
  • legal tech readingTime: 7

Адвокатска тайна в ерата на изкуствения интелект: Правна ПЛИ, която вашият инструмент за анонимизиране трябва да засича

Стандартните ПЛИ инструменти засичат имена, имейли и ЕГН. Пропускат референтни идентификатори на дела, номера за регистрация в адвокатската колегия и маркери на клиентски досиета. Те носят сериозни рискове за привилегията. Общите инструменти оставят тази празнина отворена.

Адвокатските кантори изпращат файлове към AI инструменти всеки ден. Тези файлове съдържат маркери, чувствителни от гледна точка на привилегията, които стандартните инструменти не засичат.

Когато адвокатска кантора насочи файлове към AI асистент, те съдържат правни идентификатори наред со стандартната ПЛИ:

  • Маркери на клиентски досиета: Свързват се с пълното досие и назовават клиента
  • Референтни идентификатори на дела: Кодове, присвоени от съда, свързани с публични записи с поверителни данни
  • Номера за регистрация в адвокатската колегия: Идентификатори на адвокати, търсими в публични регистри на щата
  • Кодове на съдебни преписки: Свързват се с публичните системи за подаване на документи с пълна история на делото
  • Кодове за разпределение на съдии: Идентифицират председателстващия съдия в чувствителни случаи

Всеки от тези идентификатори, изпратен до външен AI доставчик, създава потенциален проблем с привилегията.

Защо тези идентификатори се нуждаят от персонализирано засичане

Форматите на съдебните преписки следват модели на ниво районен съд. Нито един модел не обхваща всички федерални и щатски съдилища.

Федералните граждански дела използват двуцифрена година, след това "cv", след това номер на дело. Наказателните дела използват "cr" на същото място. Щатските съдилища варират по региони без общ стандарт.

Номерата за регистрация в адвокатската колегия са специфични за всеки щат. Калифорния използва цифров формат. Ню Йорк използва регистров формат. Тексас използва собствен формат за идентификатор на адвокатската колегия. Не съществува национален формат.

Маркерите на клиентски досиета са специфични за всяка кантора. Всяка кантора изгражда свой собствен формат. Година-клиент-досие. Кодове на практикуващи групи. Последователни идентификатори.

Стандартните ПЛИ инструменти не могат да знаят нито едно от тези неща без персонализирана настройка.

Празнината е реална. Инструментът за документи получава пълен контекст на досието. Кодовете на преписките са свързани с публични записи. Клиентските маркери са налице. Инструментът отчита премахната ПЛИ. Имената и имейлите са премахнати. Идентификаторите, чувствителни от гледна точка на привилегията, не са.

Случаят с правния AI стартъп

Правен AI стартъп изгражда инструмент за документи за адвокатски кантори. Продуктът сканира файлове за разкриване на информация, открива релевантни клаузи и маркира потенциално поверително съдържание. Корпоративните клиенти изискват заличаване на маркерите на клиентски досиета заедно със стандартната ПЛИ преди обработката.

Пречката пред съответствието: AI инструментът обработва данни от файлове, съдържащи маркери на клиентски досиета. Комбинирани с публичните съдебни документи, тези маркери могат да позволят идентифициране на досието. Екипите по правни операции на корпоративно ниво класифицират това като неприемливо.

Преди персонализирано засичане на обекти:

  • При преглед на сделката се открива пропастта в съответствието
  • Опашка за инженерна работа от 3+ месеца за персонализиран NLP модел
  • Корпоративен договор е на изчакване

С персонализиран API за обекти:

  • Служителят по съответствието дефинира формата на маркера на досието при въвеждане
  • Шаблонът е тестван върху примерни файлове: 2 дни
  • Персонализираният обект е добавен към конвейера: още 1 ден
  • Корпоративният договор продължава

Разликата е 3 дни срещу 3+ месеца. Работата е настройка на шаблони и интеграция на API. Не е необходимо обучение на NLP модел.

Общи формати по категория

Федерални съдебни преписки:

Федералните граждански дела използват: двуцифрена година + "cv" + 4-6-цифрен номер на дело. Пример: 24-cv-12345. Наказателните дела използват "cr" на същото място. Делата за несъстоятелност използват "bk". Жалбите използват двуцифрена година и 4-5 цифрен номер, който варира по съдебен окръг.

Формати на щатски съдилища (примери):

Върховният съд на Калифорния използва шестцифрена префиксна система. Ню Йорк използва индексен формат с година и последователност. Тексас използва формат на казус с година, последователност и код на съда.

Маркери на клиентски досиета (типични формати на кантори):

Три общи шаблона се появяват в повечето кантори:

  • Двуцифрена година, идентификатор на клиента, последователност на досието (напр. 24-ACME-001)
  • Инициали на практикуваща група, година, след това четирицифрена последователност (напр. LIT240042)
  • Клиентски префикс с шестцифрен идентификатор (напр. SMITHCO-000123)

Идентификатори за регистрация в US адвокатска колегия:

Повечето щати използват 4-8 цифрени числа, понякога с префикс на ниво щат. Идентификаторите за регистрация в USDC варират по районен съд и не следват общ формат.

Конвейер за обработка с отчитане на привилегиите

За AI за преглед на документи, многопластов конвейер обработва пълния обхват.

Слой 1 - Стандартно засичане на ПЛИ

Имена, имейли, телефонни номера, адреси, ЕГН. Висока точност. Добре установените инструменти обработват добре този слой.

Слой 2 - Засичане на персонализирани кодове

Кодове на досиета, идентификатори на преписки, идентификатори на адвокатската колегия. Специфични за кантората шаблони, зададени при въвеждане. Този слой запълва пропастта, която стандартните инструменти пропускат.

Слой 3 - Преглед на привилегиите (от човек)

След автоматизираното засичане, адвокат преглежда маркираните индикатори. Заглавия ATTORNEY-CLIENT. Етикети WORK PRODUCT. Маркировки CONFIDENTIAL. Човешкият преглед на този слой не е по избор.

Слой 4 - Преглед на изключения от контекста

Преписки от публичния регистър, които не представляват риск за привилегията, срещу маркери на клиентски досиета, които представляват. Това изисква преценката на адвокат. Не може да бъде автоматизирано.

Слоеве 1 и 2 обработват работа с голям обем. Слоеве 3 и 4 запазват преценката на адвоката там, където принадлежат решенията за привилегии. За това, което се случва, когато привилегията вече е отказана чрез използване на AI инструменти, вижте адвокатска тайна и AI.

Настройка за разработчици

Конфигурация при въвеждане

Съберете форматите на маркерите на клиентски досиета по време на корпоративното въвеждане. Всяка кантора използва различен формат. Съхранявайте ги като персонализирани обекти, специфични за кантората. Прилагайте ги към цялата обработка за тази сметка.

Предварително зададени настройки

Предварително изградените настройки покриват общи контексти без персонализирана работа:

  • "Федерални съдебни документи" - федерални шаблони за преписки за граждански, наказателни и несъстоятелностни дела
  • "Щатски съдебни документи (CA/NY/TX)" - специфични за щата формати за три основни юрисдикции
  • "Вътрешни операции" - маркер на досие плюс стандартна ПЛИ
  • "Портал за външни адвокати" - референция за фактура, маркер на досие и стандартна ПЛИ

Одитна документация

Записите за обработка трябва да показват, че персонализираните кодове са включени в всяко засичане. Това подкрепя защитата на работния продукт за метода на анализ.

За по-широк поглед върху начина, по който разходите за заличаване се мащабират в съдебни спорове, вижте автоматизация на ПЛИ в е-разкриване и намаляване на разходите за правен преглед.

Заключение

Идентификаторите, чувствителни от гледна точка на привилегиите, са толкова рискови, колкото стандартната ПЛИ - често по-рискови. Инструментите, които пропускат кодове на преписки и маркери на досиета, оставят реална пропаст в документните работни потоци.

Решението не е NLP модел. Настройката на шаблони е решението. За разработчиците, изграждащи инструменти за адвокатски кантори, това е разликата между 3-дневно и 3-месечно решение. За адвокатските кантори, това е разликата между защитим AI-подпомаган преглед и риск от отказ от привилегия.

Извори

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.