anonym.legal

By · Last updated 2026-06-05

Назад до блогуGDPR та відповідність

Фрагментація інструментів PII призводить до провалу аудитів відповідності

Чотири різних інструменти для чотирьох різних робочих процесів означають чотири різних набори охоплення сутностей і чотири різних журнали аудиту.

June 5, 20267 хв читання
compliance audittool fragmentationISO 27001GDPR controlsPII tools

Що аудитори бачать, коли запитують про засоби контролю PII

Під час аудиту наглядового органу GDPR або оцінки ISO 27001 одним зі стандартних запитань є: «Які технічні засоби контролю у вас є для анонімізації PII?»

Аудитор шукає чітку, обґрунтовану відповідь: конкретний засіб контролю, що застосовується послідовно, з документацією про те, як він працює, та свідченнями його ефективності.

Відповідь, що створює ризик відповідності: «Ми використовуємо різні інструменти залежно від контексту. Для веб-перегляду ми використовуємо розширення Chrome, для документів Word — макрос, для масових файлів наша команда з даних має скрипт Python, що вони написали, а для термінових запитів ми використовуємо веб-застосунок».

Ця відповідь викликає уточнення: «Які відмінності в охопленні між цими інструментами? Як ви забезпечуєте послідовні результати між інструментами? Де журнал аудиту, що демонструє послідовне застосування?»

Це запитання, на які фрагментовані інструменти не можуть відповісти чітко.

Проблема послідовності охоплення

Різні інструменти виявлення PII використовують різні підходи до виявлення:

Інструменти лише на основі regex: Шукають конкретні шаблони (формат ІПН, формат електронної пошти, формат кредитної картки). Пропускають сутності на основі NER (імена людей, організації, що не відповідають відомому списку), контекстуальні ідентифікатори та формати, відмінні від американських.

Інструменти лише на основі NER: Виявляють типи сутностей за допомогою навчених моделей. Пропускають сутності на основі шаблонів (IBAN, номери рахунків зі специфічними форматами), спеціальні організаційні ідентифікатори та сутності, що не входять до навчальних даних.

Інструмент А проти Інструменту Б проти Інструменту В: Кожен має різне охоплення типів сутностей, різні пороги достовірності, різну обробку граничних випадків. Той самий документ, оброблений через Інструмент А та Інструмент В, може дати різні результати виявлення.

Проблема відповідності: якщо Інструмент А (використовується для PDF) виявляє дати народження, а Інструмент Б (використовується для Excel) — ні, то та сама дата народження суб'єкта даних у PDF анонімізується, тоді як його дата народження в електронній таблиці Excel — ні. Системний засіб контролю відповідності має прогалину, що залежить від формату документа.

Для розслідувань органів із захисту даних ця прогалина може бути виявлена. Якщо стався витік даних і розслідування виявляє, що версія записів суб'єкта даних в Excel не була анонімізована, тоді як версія PDF була, непослідовність між інструментами є сприяючим фактором.

Проблема журналу аудиту

Документація відповідності вимагає свідчень того, що засоби контролю застосовуються послідовно. Для анонімізації PII свідченням є журнал аудиту: що було оброблено, коли, ким, за допомогою якого інструменту та який був результат.

Чотири різних інструменти виробляють чотири різних формати журналу аудиту — або взагалі не ведуть журналу аудиту. Макрос Word не веде журналу аудиту. Скрипт Python може записувати в локальний файл, що не інтегрований зі системою управління відповідністю. Розширення Chrome може вести журнали на стороні браузера, що не доступні для документації відповідності. Лише веб-застосунок може вести централізований журнал аудиту.

Для розслідування органу із захисту даних, що вимагає свідчень журналу аудиту, відповідь «ми обробляли цей документ у макросі Word, ці журнали знаходяться на локальній машині розробника» є незадовільною. Відповідь «ось централізований журнал аудиту, що охоплює всю обробку анонімізації на всіх платформах за запитаний період» є задовільною.

Обробка на єдиній платформі забезпечує єдине охоплення журналом аудиту. Фрагментовані інструменти унеможливлюють централізований журнал аудиту.

Проблема дрейфу конфігурації

З часом різні інструменти, що використовуються різними членами команди, розвивають різні конфігурації:

  • Розширення Chrome налаштоване з власними типами сутностей організації
  • Скрипт Python не оновлювався при додаванні власних типів сутностей
  • Макрос Word був налаштований членом команди, що вже пішов, і ніхто не знає поточних налаштувань
  • Пресет веб-застосунку оновлявся минулого місяця для виключення імен підрядників, але це оновлення не було поширено на інші інструменти

Дрейф конфігурації створює проблему непослідовності у зворотному напрямку: навіть якщо всі інструменти спочатку виробляли подібні результати, обслуговування одного інструменту без оновлення інших створює розбіжність з часом.

Для засобів контролю ISO 27001 вимога до документації конфігурації робить це особливо проблематичним. Аудитор ISO, що запитує «покажіть мені конфігурацію для ваших засобів контролю анонімізації PII», не може бути задоволений відповіддю «у нас є чотири інструменти з чотирма різними конфігураціями, і ми не впевнені, що вони всі актуальні».

Висновок ISO 27001

Команда консалтингової компанії з 15 осіб використовувала чотири різних інструменти: інструмент веб-скрапінгу для онлайн-даних, автономний інструмент Windows Desktop для масових файлів, макрос Word для юридичних документів та розширення Chrome для AI-інструментів.

Аудит ISO 27001 виявив: «Непослідовні процедури анонімізації даних на різних платформах. Різні інструменти, що використовуються для різних контекстів, виробляють різні результати виявлення і не мають централізованого журналу аудиту. Це створює прогалину в засобі контролю ISO/IEC 27001:2022 Додаток А 8.11 (Маскування даних) — засіб контролю не може бути продемонстрований як послідовно застосований».

Висновок аудиту вимагав плану коригувальних дій. Впроваджена коригувальна дія: консолідація до єдиної платформи анонімізації для всіх випадків використання.

Результати після консолідації:

  • Той самий рушій виявлення на всіх платформах (веб-застосунок, настільний застосунок, Office Add-in, розширення Chrome)
  • Ті самі пресети, що застосовуються у всіх контекстах
  • Централізований журнал аудиту для всієї обробки
  • Висновок ISO 27001 закрито на наступному наглядовому аудиті

6-тижневий проект консолідації усунув висновок аудиту, що вимагав 12-сторінкової відповіді з коригувальними діями.

Тест наративу відповідності

Корисний тест для оцінки фрагментації інструментів PII: чи можете ви чітко відповісти на такі запитання?

  1. Які типи сутностей виявляються на всіх платформах, що ваша команда використовує для анонімізації PII?
  2. Яким є поріг виявлення (рівень достовірності) для кожного типу сутності, послідовно на всіх платформах?
  3. Де знаходиться централізований журнал аудиту для всієї обробки анонімізації за останні 12 місяців?
  4. Як ви гарантуєте, що зміни конфігурації послідовно застосовуються на всіх платформах?

Якщо будь-яке з цих запитань викликає вагому відповідь, фрагментація створює ризик відповідності. Чітка відповідь на всі чотири запитання є досяжною — але лише за умови єдиного рушія на всіх платформах.

Джерела:

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.