anonym.legal

By · Last updated 2026-06-05

Назад к блогуБезопасность ИИ

Персональные данные во внутренних вики: клиентские данные в Confluence

Команды поддержки документируют процессы с помощью скриншотов клиентских аккаунтов. За три года это тысячи нарушений принципа минимизации данных GDPR в вашей базе знаний.

June 5, 20266 мин чтения
Confluence GDPRinternal wiki PIIcustomer datadocumentation privacydata minimization

Персональные данные на скриншотах во внутренних базах знаний

Внутренние базы знаний — Confluence, Notion, SharePoint, GitBook — содержат специфический тип проблемы с персональными данными, который стандартные инструменты соответствия пропускают: персональные данные клиентов, встроенные в скриншоты для документации процессов.

Эта схема воспроизводится в тысячах команд поддержки и операций.

Агент поддержки обнаруживает необычную настройку аккаунта. Он делает снимок экрана со страницей аккаунта клиента, чтобы задокументировать проблему. На снимке видно имя клиента в заголовке интерфейса, его электронная почта в настройках аккаунта и данные о тарифном плане.

Статья публикуется во внутренней базе знаний. Сто пятьдесят агентов поддержки теперь могут её видеть. Двенадцать подрядчиков внешнего хелпдеска — тоже. Статья полезна: она показывает, как разбирать этот пограничный случай. Каждый агент, столкнувшийся с такой ситуацией в будущем, прочитает её.

Три года спустя база знаний содержит 847 подобных статей. В каждой — скриншоты клиентских аккаунтов. Клиенты, чьи данные там отображены, не давали согласия на такое вторичное использование своих записей. Большинство из них даже не знают, что их данные там хранятся.

Это не мелкая проблема. С каждой новой статьей она растёт.

Уязвимость по GDPR: почему это важно

Анализ базы знаний со скриншотами по GDPR однозначен.

Минимизация данных (Статья 5(1)(c)): Персональные данные должны быть «адекватными, относимыми и ограниченными необходимым». Статья базы знаний о настройке аккаунта не нуждается в реальном имени и электронной почте клиента. Размытый скриншот служит той же цели. Включение реальных данных клиента не является необходимостью.

Ограничение цели (Статья 5(1)(b)): Данные, собранные для одной цели — обслуживания клиентов, — не могут быть использованы для другой цели — внутренней документации процессов — без правового основания. Данные аккаунта были собраны для предоставления услуг, а не для внутренней документации. Это два отдельных вида обработки. Использование одних и тех же данных для обоих требует действительного правового основания, которое большинство команд не установили.

Контроль доступа (Статья 5(1)(f) и Статья 32): Надлежащие технические меры должны защищать персональные данные. Скриншоты клиентских аккаунтов в инструменте, открытом для всех 150 агентов и подрядчиков — в том числе тех, у кого нет доступа к основной системе аккаунтов, — создают чрезмерно широкий доступ.

Право на удаление (Статья 17): Субъект данных, запрашивающий удаление, имеет право на удаление своих данных «без неоправданной задержки». Если его данные присутствуют в 23 статьях базы знаний в виде встроенных скриншотов, запрос требует поиска и обновления всех 23 статей. Без системы это затруднительно. Подробный порядок действий — в нашем руководстве по праву на удаление по GDPR.

Ни одна из этих трактовок не является пограничной. Это прямое применение текста регламента к распространённой практике.

Обход контроля доступа

Наиболее серьёзная проблема соответствия со скриншотами в Confluence — это создаваемый ими обход контроля доступа.

Команды поддержки используют ролевое управление доступом (RBAC) для ограничения круга лиц, имеющих доступ к системам клиентских аккаунтов. Агенты первого уровня видят базовые данные аккаунта. Агенты второго уровня видят записи о выставлении счётов и технические записи. Руководители видят полный профиль аккаунта.

Когда агент второго уровня создаёт статью базы знаний со скриншотом полного клиентского аккаунта, этот снимок становится виден каждому пользователю инструмента. Агенты первого уровня, которым не следует видеть записи о выставлении счётов, теперь могут их видеть. Подрядчики без системного доступа — тоже. Новые сотрудники при введении в должность — тоже.

Скриншот обходит RBAC-контроль системы клиентских аккаунтов. Персональные данные, которые RBAC был призван защищать, теперь открыты всем, у кого есть доступ к базе знаний.

Это не теоретический риск. Это закономерный результат рабочего процесса документирования. Снимок хранится без срока действия, без журнала доступа и без следственной цепочки.

Практические меры по устранению нарушений

Для команд, обнаруживших эту проблему в ходе аудита GDPR:

Ретроспективное устранение:

  1. Определите все страницы базы знаний с прикреплёнными изображениями
  2. Запустите обнаружение персональных данных для каждого вложения
  3. Проверьте помеченные изображения: файлы с высоким уровнем достоверности поступают в очередь проверки
  4. Для каждого помеченного изображения: замените его обезличенной версией или ограничьте доступ к странице
  5. Зафиксируйте действия по устранению нарушений в записях GDPR

Масштаб ретроспективных работ зависит от размера базы знаний. Для трёхлетней базы знаний команды поддержки из 50 человек количество изображений может достигать тысяч. Пакетная обработка изображений делает эту задачу выполнимой. Ручная проверка помеченных изображений — ключевое узкое место.

Превентивные меры:

  1. Обучите всех сотрудников поддержки обезличивать скриншоты перед публикацией в базе знаний
  2. Предоставьте инструменты: средства аннотирования скриншотов, размывающие имена клиентов перед вставкой
  3. Добавьте шаг проверки: назначенный рецензент проверяет статьи перед публикацией, специально проверяя наличие персональных данных клиентов в изображениях
  4. Проводите ежеквартальное пакетное сканирование всех вложений Confluence

Минимально жизнеспособная мера: Контрольный список при публикации: «Удалите или скройте все имена клиентов, адреса электронной почты и идентификаторы аккаунтов со скриншотов перед публикацией». Малотехнологично, без автоматизации, но создаёт задокументированную меру контроля. Для небольших команд это отправная точка.

Общая правовая база — в нашем обзоре соответствия GDPR, а о том, почему политика без технических средств контроля не работает — в статье «Политика без технических мер контроля не работает».

Почему проблема усугубляется со временем

Без системных мер контроля раскрытие персональных данных в базе знаний накапливается.

Объём: Каждая новая статья со скриншотом клиента увеличивает общий масштаб уязвимости. По мере роста команды поддержки и расширения базы знаний накопленный объём персональных данных тоже растёт. Именно те свойства, которые делают эти инструменты полезными, — лёгкость публикации, постоянство, широкий доступ — и усугубляют проблему с персональными данными.

Забытые статьи: Статьи о старых пограничных случаях, которые больше не встречаются, остаются доступными. В них хранятся персональные данные клиентов, которые с тех пор подали запросы на удаление. Никто не проверяет статью, обновлённую в последний раз в 2022 году.

Распространение между командами: Базы знаний нередко становятся кросс-функциональными. Статья поддержки со скриншотами клиентов может быть передана продуктовой команде, команде разработки или внешним подрядчикам для предоставления контекста по запросу на функцию или отчёту об ошибке. Каждая передача расширяет круг получателей персональных данных.

Накопление запросов на удаление: По мере накопления клиентских данных в базе знаний ответы на запросы об удалении становятся всё более сложными. Без системы нет надёжного способа подтвердить, что каждый экземпляр данных субъекта был найден и удалён. Команда не может дать достоверное подтверждение удаления.

Предотвратить проблемы с персональными данными в базе знаний проще, чем исправлять их. Меры контроля, внедрённые сейчас, позволяют избежать накапливающейся проблемы с устранением нарушений. Каждая статья, опубликованная без размытого скриншота, — это задача по устранению нарушений, отложенная на будущее.

Источники

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.