title: "Юридические персональные данные: защита адвокатской тайны" description: "Номера дел, удостоверения адвокатов, номера судебных производств и идентификаторы клиентских дел — юридически чувствительные идентификаторы, которые стандартные инструменты защиты ПДн не распознают." category: legal-tech publishedAt: 2026-06-03 tags:
- адвокатская тайна
- анализ юридических документов
- номера дел
- конфиденциальность в юридических фирмах
- правовые технологии readingTime: 7
Адвокатская тайна в эпоху ИИ: юридические данные, которые обязан распознавать ваш инструмент анонимизации
Стандартные инструменты защиты ПДн распознают имена, адреса электронной почты и номера СНИЛС. Они пропускают идентификаторы дел, номера адвокатских удостоверений и метки клиентских дел. Всё это несёт серьёзные риски нарушения адвокатской тайны. Универсальные инструменты оставляют эту брешь незакрытой.
Юридические фирмы ежедневно передают файлы в ИИ-инструменты. Эти файлы содержат маркеры, защищённые адвокатской тайной, которые стандартные инструменты не обнаруживают.
Когда юридическая фирма направляет файлы через ИИ-ассистент, те содержат юридические идентификаторы наряду со стандартными персональными данными:
- Метки клиентских дел: связывают с полным досье и раскрывают имя клиента
- Идентификаторы судебных дел: коды, присвоенные судом, которые позволяют сопоставить публичные записи с конфиденциальными сведениями
- Номера адвокатских удостоверений: идентификаторы адвокатов, доступные для поиска в публичных реестрах штатов
- Коды судебных производств: обеспечивают доступ к публичным системам делопроизводства с полной историей дела
- Коды назначения судей: позволяют установить председательствующего судью в деликатных ситуациях
Любой из этих идентификаторов, переданный внешнему поставщику ИИ, создаёт потенциальный риск нарушения адвокатской тайны.
Почему эти идентификаторы требуют настраиваемого распознавания
Форматы судебных производств следуют шаблонам окружного уровня. Ни один единый шаблон не охватывает все федеральные и государственные суды.
В федеральных гражданских делах используются двузначный год, затем «cv» и номер дела. В уголовных делах вместо «cv» стоит «cr». Государственные суды варьируются по регионам без единого стандарта.
Номера адвокатских удостоверений специфичны для каждого штата. В Калифорнии — числовой формат. В Нью-Йорке — реестровый формат. В Техасе — собственный формат идентификатора адвоката. Единого национального формата не существует.
Метки клиентских дел специфичны для каждой фирмы. Каждая формирует свой формат: год-клиент-дело, коды практических групп, последовательные идентификаторы.
Стандартные инструменты защиты ПДн не могут знать ни один из этих форматов без индивидуальной настройки.
Пробел вполне реален. Инструмент для работы с документами получает полный контекст дела. Коды производств ссылаются на публичные записи. Метки клиентов присутствуют. Инструмент сообщает об удалении персональных данных. Имена и адреса электронной почты были удалены. Идентификаторы, защищённые адвокатской тайной, — нет.
Кейс юридического ИИ-стартапа
Юридический ИИ-стартап создаёт инструмент для работы с документами в юридических фирмах. Продукт сканирует материалы дела, выявляет релевантные положения и маркирует потенциально привилегированный контент. Корпоративные клиенты требуют редактирования меток клиентских дел наряду со стандартными персональными данными перед обработкой.
Проблема соответствия: ИИ-инструмент обрабатывает файлы, содержащие метки клиентских дел. В сочетании с публичными судебными материалами эти метки могут позволить идентифицировать дело. Юридические операционные команды корпоративных клиентов считают это неприемлемым.
До внедрения распознавания пользовательских сущностей:
- Проверка сделки выявляет пробел в соответствии
- Очередь инженеров на 3+ месяца для создания пользовательской NLP-модели
- Корпоративный контракт заморожен
С API пользовательских сущностей:
- Сотрудник по соответствию определяет формат меток дел при онбординге
- Тестирование шаблона на образцах файлов: 2 дня
- Добавление пользовательской сущности в пайплайн: ещё 1 день
- Корпоративный контракт подписан
Разница — 3 дня против 3+ месяцев. Работа заключается в настройке шаблонов и интеграции API. Обучение NLP-модели не требуется.
Распространённые форматы по категориям
Федеральные судебные производства:
Федеральные гражданские дела: двузначный год + «cv» + номер дела из 4–6 цифр. Пример: 24-cv-12345. Уголовные дела используют «cr» на том же месте. Дела о банкротстве — «bk». Апелляции используют двузначный год и номер из 4–5 цифр, варьирующийся по округам.
Форматы государственных судов (примеры):
Верховный суд Калифорнии использует шестизначную систему префиксов. Нью-Йорк использует индексный формат с годом и порядковым номером. Техас использует формат причины с годом, порядковым номером и кодом суда.
Метки клиентских дел (типичные форматы фирм):
В большинстве фирм встречаются три распространённых шаблона:
- Двузначный год, идентификатор клиента, порядковый номер дела (например, 24-ACME-001)
- Инициалы практической группы, год, четырёхзначный порядковый номер (например, LIT240042)
- Префикс клиента с шестизначным идентификатором (например, SMITHCO-000123)
Идентификаторы адвокатских удостоверений США:
Большинство штатов используют числа из 4–8 цифр, иногда с префиксом штата. Идентификаторы допуска USDC варьируются по округам и не следуют единому формату.
Пайплайн обработки с учётом адвокатской тайны
Для ИИ в области анализа документов многоуровневый пайплайн охватывает весь спектр задач.
Уровень 1 — Стандартное обнаружение персональных данных
Имена, адреса электронной почты, номера телефонов, адреса, номера СНИЛС. Высокая точность. Устоявшийся инструментарий хорошо справляется с этим уровнем.
Уровень 2 — Обнаружение пользовательских кодов
Коды дел, идентификаторы производств, номера адвокатских удостоверений. Специфичные для фирмы шаблоны, заданные при онбординге. Этот уровень закрывает пробел, который стандартные инструменты пропускают.
Уровень 3 — Проверка адвокатской тайны (человеком)
После автоматического обнаружения адвокат проверяет маркированные идентификаторы. Заголовки ATTORNEY-CLIENT. Метки WORK PRODUCT. Пометки CONFIDENTIAL. Проверка человеком на этом уровне обязательна.
Уровень 4 — Проверка контекстных исключений
Публичные судебные производства, не представляющие риска для адвокатской тайны, в сравнении с метками клиентских дел, которые его представляют. Это требует юридического суждения. Автоматизировать его невозможно.
Уровни 1 и 2 обрабатывают большие объёмы работы. Уровни 3 и 4 сохраняют юридическое суждение там, где принадлежат решения об адвокатской тайне. О том, что происходит при утрате привилегии в результате использования ИИ-инструментов, см. адвокатская тайна и ИИ.
Настройка для разработчиков
Конфигурация при онбординге
Собирайте форматы меток клиентских дел в процессе корпоративного онбординга. Каждая фирма использует свой формат. Храните их как пользовательские сущности, специфичные для фирмы. Применяйте ко всем операциям для данного аккаунта.
Стандартные пресеты
Готовые пресеты охватывают типичные контексты без дополнительной настройки:
- «Federal Court Documents» — федеральные шаблоны производств для гражданских, уголовных и банкротных дел
- «State Court Documents (CA/NY/TX)» — специфичные для штатов форматы трёх крупных юрисдикций
- «Internal Operations» — метка дела плюс стандартные персональные данные
- «Outside Counsel Portal» — ссылка на счёт, метка дела и стандартные персональные данные
Аудиторская документация
Записи об обработке должны подтверждать, что пользовательские коды включались в каждый проход обнаружения. Это обеспечивает защиту рабочего продукта для метода анализа.
Для более широкого обзора того, как затраты на редактирование масштабируются в судебных разбирательствах, см. автоматизация PII в электронном раскрытии и снижение затрат на юридическую проверку.
Заключение
Идентификаторы, защищённые адвокатской тайной, несут не меньший риск, чем стандартные персональные данные — нередко даже больший. Инструменты, пропускающие коды судебных производств и метки дел, оставляют реальный пробел в документооборотных рабочих процессах.
Решение — не NLP-модель. Это настройка шаблонов. Для разработчиков, создающих инструменты для юридических фирм, это разница между трёхдневным исправлением и трёхмесячным проектом. Для юридических фирм — разница между обоснованной проверкой с помощью ИИ и риском отказа от привилегии.