anonym.legal

By · Last updated 2026-06-03

Назад к блогуЮридические технологии

Юридические персональные данные: защита адвокатской тайны

Номера дел, удостоверения адвокатов, номера судебных производств и идентификаторы клиентских дел — юридически чувствительные идентификаторы, которые стандартные инструменты защиты ПДн не распознают.

June 3, 20267 мин чтения
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

title: "Юридические персональные данные: защита адвокатской тайны" description: "Номера дел, удостоверения адвокатов, номера судебных производств и идентификаторы клиентских дел — юридически чувствительные идентификаторы, которые стандартные инструменты защиты ПДн не распознают." category: legal-tech publishedAt: 2026-06-03 tags:

  • адвокатская тайна
  • анализ юридических документов
  • номера дел
  • конфиденциальность в юридических фирмах
  • правовые технологии readingTime: 7

Адвокатская тайна в эпоху ИИ: юридические данные, которые обязан распознавать ваш инструмент анонимизации

Стандартные инструменты защиты ПДн распознают имена, адреса электронной почты и номера СНИЛС. Они пропускают идентификаторы дел, номера адвокатских удостоверений и метки клиентских дел. Всё это несёт серьёзные риски нарушения адвокатской тайны. Универсальные инструменты оставляют эту брешь незакрытой.

Юридические фирмы ежедневно передают файлы в ИИ-инструменты. Эти файлы содержат маркеры, защищённые адвокатской тайной, которые стандартные инструменты не обнаруживают.

Когда юридическая фирма направляет файлы через ИИ-ассистент, те содержат юридические идентификаторы наряду со стандартными персональными данными:

  • Метки клиентских дел: связывают с полным досье и раскрывают имя клиента
  • Идентификаторы судебных дел: коды, присвоенные судом, которые позволяют сопоставить публичные записи с конфиденциальными сведениями
  • Номера адвокатских удостоверений: идентификаторы адвокатов, доступные для поиска в публичных реестрах штатов
  • Коды судебных производств: обеспечивают доступ к публичным системам делопроизводства с полной историей дела
  • Коды назначения судей: позволяют установить председательствующего судью в деликатных ситуациях

Любой из этих идентификаторов, переданный внешнему поставщику ИИ, создаёт потенциальный риск нарушения адвокатской тайны.

Почему эти идентификаторы требуют настраиваемого распознавания

Форматы судебных производств следуют шаблонам окружного уровня. Ни один единый шаблон не охватывает все федеральные и государственные суды.

В федеральных гражданских делах используются двузначный год, затем «cv» и номер дела. В уголовных делах вместо «cv» стоит «cr». Государственные суды варьируются по регионам без единого стандарта.

Номера адвокатских удостоверений специфичны для каждого штата. В Калифорнии — числовой формат. В Нью-Йорке — реестровый формат. В Техасе — собственный формат идентификатора адвоката. Единого национального формата не существует.

Метки клиентских дел специфичны для каждой фирмы. Каждая формирует свой формат: год-клиент-дело, коды практических групп, последовательные идентификаторы.

Стандартные инструменты защиты ПДн не могут знать ни один из этих форматов без индивидуальной настройки.

Пробел вполне реален. Инструмент для работы с документами получает полный контекст дела. Коды производств ссылаются на публичные записи. Метки клиентов присутствуют. Инструмент сообщает об удалении персональных данных. Имена и адреса электронной почты были удалены. Идентификаторы, защищённые адвокатской тайной, — нет.

Кейс юридического ИИ-стартапа

Юридический ИИ-стартап создаёт инструмент для работы с документами в юридических фирмах. Продукт сканирует материалы дела, выявляет релевантные положения и маркирует потенциально привилегированный контент. Корпоративные клиенты требуют редактирования меток клиентских дел наряду со стандартными персональными данными перед обработкой.

Проблема соответствия: ИИ-инструмент обрабатывает файлы, содержащие метки клиентских дел. В сочетании с публичными судебными материалами эти метки могут позволить идентифицировать дело. Юридические операционные команды корпоративных клиентов считают это неприемлемым.

До внедрения распознавания пользовательских сущностей:

  • Проверка сделки выявляет пробел в соответствии
  • Очередь инженеров на 3+ месяца для создания пользовательской NLP-модели
  • Корпоративный контракт заморожен

С API пользовательских сущностей:

  • Сотрудник по соответствию определяет формат меток дел при онбординге
  • Тестирование шаблона на образцах файлов: 2 дня
  • Добавление пользовательской сущности в пайплайн: ещё 1 день
  • Корпоративный контракт подписан

Разница — 3 дня против 3+ месяцев. Работа заключается в настройке шаблонов и интеграции API. Обучение NLP-модели не требуется.

Распространённые форматы по категориям

Федеральные судебные производства:

Федеральные гражданские дела: двузначный год + «cv» + номер дела из 4–6 цифр. Пример: 24-cv-12345. Уголовные дела используют «cr» на том же месте. Дела о банкротстве — «bk». Апелляции используют двузначный год и номер из 4–5 цифр, варьирующийся по округам.

Форматы государственных судов (примеры):

Верховный суд Калифорнии использует шестизначную систему префиксов. Нью-Йорк использует индексный формат с годом и порядковым номером. Техас использует формат причины с годом, порядковым номером и кодом суда.

Метки клиентских дел (типичные форматы фирм):

В большинстве фирм встречаются три распространённых шаблона:

  • Двузначный год, идентификатор клиента, порядковый номер дела (например, 24-ACME-001)
  • Инициалы практической группы, год, четырёхзначный порядковый номер (например, LIT240042)
  • Префикс клиента с шестизначным идентификатором (например, SMITHCO-000123)

Идентификаторы адвокатских удостоверений США:

Большинство штатов используют числа из 4–8 цифр, иногда с префиксом штата. Идентификаторы допуска USDC варьируются по округам и не следуют единому формату.

Пайплайн обработки с учётом адвокатской тайны

Для ИИ в области анализа документов многоуровневый пайплайн охватывает весь спектр задач.

Уровень 1 — Стандартное обнаружение персональных данных

Имена, адреса электронной почты, номера телефонов, адреса, номера СНИЛС. Высокая точность. Устоявшийся инструментарий хорошо справляется с этим уровнем.

Уровень 2 — Обнаружение пользовательских кодов

Коды дел, идентификаторы производств, номера адвокатских удостоверений. Специфичные для фирмы шаблоны, заданные при онбординге. Этот уровень закрывает пробел, который стандартные инструменты пропускают.

Уровень 3 — Проверка адвокатской тайны (человеком)

После автоматического обнаружения адвокат проверяет маркированные идентификаторы. Заголовки ATTORNEY-CLIENT. Метки WORK PRODUCT. Пометки CONFIDENTIAL. Проверка человеком на этом уровне обязательна.

Уровень 4 — Проверка контекстных исключений

Публичные судебные производства, не представляющие риска для адвокатской тайны, в сравнении с метками клиентских дел, которые его представляют. Это требует юридического суждения. Автоматизировать его невозможно.

Уровни 1 и 2 обрабатывают большие объёмы работы. Уровни 3 и 4 сохраняют юридическое суждение там, где принадлежат решения об адвокатской тайне. О том, что происходит при утрате привилегии в результате использования ИИ-инструментов, см. адвокатская тайна и ИИ.

Настройка для разработчиков

Конфигурация при онбординге

Собирайте форматы меток клиентских дел в процессе корпоративного онбординга. Каждая фирма использует свой формат. Храните их как пользовательские сущности, специфичные для фирмы. Применяйте ко всем операциям для данного аккаунта.

Стандартные пресеты

Готовые пресеты охватывают типичные контексты без дополнительной настройки:

  • «Federal Court Documents» — федеральные шаблоны производств для гражданских, уголовных и банкротных дел
  • «State Court Documents (CA/NY/TX)» — специфичные для штатов форматы трёх крупных юрисдикций
  • «Internal Operations» — метка дела плюс стандартные персональные данные
  • «Outside Counsel Portal» — ссылка на счёт, метка дела и стандартные персональные данные

Аудиторская документация

Записи об обработке должны подтверждать, что пользовательские коды включались в каждый проход обнаружения. Это обеспечивает защиту рабочего продукта для метода анализа.

Для более широкого обзора того, как затраты на редактирование масштабируются в судебных разбирательствах, см. автоматизация PII в электронном раскрытии и снижение затрат на юридическую проверку.

Заключение

Идентификаторы, защищённые адвокатской тайной, несут не меньший риск, чем стандартные персональные данные — нередко даже больший. Инструменты, пропускающие коды судебных производств и метки дел, оставляют реальный пробел в документооборотных рабочих процессах.

Решение — не NLP-модель. Это настройка шаблонов. Для разработчиков, создающих инструменты для юридических фирм, это разница между трёхдневным исправлением и трёхмесячным проектом. Для юридических фирм — разница между обоснованной проверкой с помощью ИИ и риском отказа от привилегии.

Источники

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.