anonym.legal

By · Last updated 2026-06-05

Назад к блогуGDPR и соблюдение

Фрагментация инструментов защиты персональных данных приводит к провалам на аудитах

Четыре разных инструмента для четырёх разных рабочих процессов означают четыре разных набора покрытия сущностей и четыре разных следственных журнала.

June 5, 20267 мин чтения
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Что аудиторы спрашивают о контроле персональных данных

Аудиторы GDPR и ISO 27001 задают стандартный вопрос: «Какие средства контроля у вас есть для анонимизации персональных данных?»

Они ожидают один чёткий ответ. Одно средство контроля. Применяемое одинаково каждый раз. С документацией и доказательствами.

Опасный ответ звучит примерно так: «Зависит от контекста. Расширение Chrome — для веб-браузинга. Макрос Word — для юридических документов. Python-скрипт — для пакетных файлов. Веб-приложение — для срочных запросов».

Такой ответ влечёт дополнительные вопросы: «Каковы пробелы в покрытии между этими инструментами? Где журнал аудита?»

Фрагментированный набор инструментов не может ответить на эти вопросы. В этом и состоит проблема соответствия.

Проблема единообразия покрытия

Разные инструменты защиты персональных данных используют разные методы обнаружения. Их результаты различаются — иногда значительно.

Инструменты только на основе регулярных выражений ищут фиксированные шаблоны. Формат SSN. Формат электронной почты. Формат номера кредитной карты. Сущности на основе NER они пропускают. Имена людей и форматы, отличные от американских, остаются необнаруженными.

Инструменты только на основе NER обнаруживают типы сущностей с помощью обученных моделей. Сущности на основе шаблонов они пропускают. IBAN и пользовательские идентификаторы остаются незамеченными, если их нет в обучающих данных.

У каждого инструмента разное покрытие сущностей. У каждого разные пороги достоверности. Один и тот же документ через Инструмент A и Инструмент C может дать разные результаты. VERIFIED.

Это создаёт прямой пробел в соответствии. Инструмент A используется для PDF. Инструмент B — для Excel. Инструмент A обнаруживает даты рождения. Инструмент B — нет. Дата рождения одного и того же человека анонимизируется в PDF, но остаётся открытой в файлах Excel.

Пробел определяется форматом файла — а не политикой. Не намерением.

Следователи органов защиты данных могут обнаружить этот пробел в ходе расследования нарушения. Несоответствие инструментов становится фактором уязвимости. VERIFIED — Статья 32 GDPR требует систематических технических мер.

Проблема журнала аудита

Соответствие требованиям предполагает доказательства единообразного применения средств контроля. Для анонимизации персональных данных таким доказательством является журнал аудита.

Четыре инструмента создают четыре разных формата журналов. Некоторые не создают журналов вовсе.

Макрос Word не оставляет записи аудита. Python-скрипт может записывать данные в локальный файл. Этот файл не связан с вашей системой соответствия. Расширение Chrome может записывать журналы на стороне браузера. Эти журналы недоступны для проверки соответствия.

Когда расследование органа защиты данных запрашивает доказательства аудита, работает один ответ: централизованный журнал, охватывающий всю обработку при анонимизации на всех платформах.

Другой ответ не работает. Журналы на локальном компьютере разработчика от макроса Word — недостаточны.

Единая платформа делает возможным единый журнал аудита. Фрагментированный набор инструментов делает это невозможным.

Подробнее о требованиях к журналам аудита — в статье «Объяснимое редактирование и журналы аудита HIPAA».

Проблема дрейфа конфигурации

Со временем разные инструменты приобретают разные конфигурации. Это происходит постепенно и незаметно.

Рассмотрим распространённый сценарий. Расширение Chrome обновляется с добавлением пользовательских типов сущностей. Python-скрипт не обновляется. Макрос Word был настроен сотрудником, который уже уволился. Никто не знает текущих настроек. Пресет веб-приложения изменяется, исключая имена подрядчиков. Это изменение никогда не доходит до других инструментов.

Обновление одного инструмента без обновления остальных приводит к дрейфу. Со временем дрейф создаёт пробелы.

Аудиторы ISO 27001 запрашивают документацию по конфигурации. «У нас четыре инструмента, четыре конфигурации, и мы не уверены, что они актуальны» — неудовлетворительный ответ. VERIFIED — Приложение A 8.11 ISO/IEC 27001:2022 (Маскирование данных) требует задокументированных, единообразных средств контроля; ISO/IEC 27001:2022.

Вывод ISO 27001 на практике

Компания по соблюдению нормативных требований из 15 человек использовала четыре инструмента. Веб-скрапер — для онлайн-данных. Настольный инструмент для Windows — для пакетных файлов. Макрос Word — для юридических документов. Расширение Chrome — для ИИ-инструментов.

Аудит ISO 27001 зафиксировал нарушение. Разные результаты обнаружения на разных платформах. Отсутствие централизованного журнала аудита. Пробел в Приложении A 8.11. Не было продемонстрировано единообразное применение средства контроля. VERIFIED-EXTERNAL — это соответствует задокументированным шаблонам несоответствия ISO 27001 Приложению A 8.11.

Нарушение потребовало плана корректирующих действий. Корректирующим действием стала консолидация платформ.

После консолидации компания использовала единый движок обнаружения на всех четырёх платформах. Одни и те же пресеты применялись в каждом контексте. Вся обработка регистрировалась в одном месте. Нарушение ISO 27001 было закрыто на следующем аудите.

Проект занял шесть недель. Он заменил 12-страничный ответ на корректирующие действия закрытым нарушением.

Подробнее о том, как единообразная анонимизация обеспечивает готовность к аудиту GDPR, — в статье «Единообразие анонимизации, пресеты и аудиты GDPR».

Тест на соответствие требованиям

Можете ли вы ответить на эти четыре вопроса без колебаний?

  1. Какие типы сущностей обнаруживаются на каждой платформе, используемой вашей командой?
  2. Каков порог обнаружения для каждого типа сущностей, единообразный для всех платформ?
  3. Где находится централизованный журнал аудита для всей анонимизации за последние 12 месяцев?
  4. Как вы гарантируете, что изменения конфигурации применяются ко всем платформам?

Если хоть один вопрос вызывает затруднение — фрагментация создаёт риск несоответствия.

Чёткий ответ на все четыре вопроса достижим. Для этого нужен единый движок на всех платформах. Без него каждый инструмент создаёт собственный пробел в покрытии. Собственное изолированное хранилище журнала аудита. Собственный дрейф конфигурации.

Аудиторы замечают эти пробелы. Следователи органов защиты данных могут ими воспользоваться. Консолидация до получения вывода аудита значительно проще, чем после.

Подробнее о влиянии фрагментации инструментов на кросс-платформенный контроль GDPR — в статье «Аудит GDPR и фрагментация инструментов персональных данных между платформами».

Источники

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.