Расширение LibreOffice для анонимизации персональных данных
LibreOffice насчитывает около 200 миллионов пользователей по всему миру. Государственные органы, учебные заведения и предприятия полагаются на него. Многие используют его, чтобы избежать дорогостоящих лицензий. Но до сих пор у пользователей не было встроенного инструмента для поиска и удаления персональных данных из файлов.
Старый подход был болезненным: скопировать текст в веб-приложение, анонимизировать, вставить обратно. Это уничтожает форматирование, ломает таблицы, стили и макет. Для сложных документов Writer это просто не работает.
Расширение anonym.legal решает эту проблему. Оно работает внутри приложения и обнаруживает более 285 типов сущностей в Writer, Calc и Impress.
Установка менее чем за две минуты
Расширение поставляется в виде файла .oxt — стандартного формата для всех расширений.
Быстрая установка:
- Скачайте
.oxtс anonym.legal/api/download/libreoffice - Дважды щёлкните файл
- Подтвердите запрос
- Перезапустите
Ручная установка:
- Откройте приложение
- Перейдите в «Инструменты» → «Менеджер расширений»
- Нажмите «Добавить» и выберите файл
.oxt - Перезапустите
После перезапуска боковая панель anonym.legal появится в «Вид» → «Боковая панель». Войдите в систему, чтобы начать.
Как работает обнаружение
Два движка работают вместе для поиска персональных данных.
| Движок | Находит | Уверенность |
|---|---|---|
| Regex | Электронные адреса, SSN, IBAN, кредитные карты, телефоны | 1,0 |
| spaCy NLP | Имена, организации, местоположения | 0,85+ |
Обнаружение выполняется через API anonym.legal. Текст отправляется на сертифицированные серверы в Германии со статусом ISO 27001. Результаты возвращаются в расширение. Файлы документов не передаются — только текст.
Что делает каждое приложение:
- Writer: извлекает весь текст или только выделение
- Calc: считывает ячейки как значения, разделённые табуляцией, по всем листам
- Impress: считывает текстовые объекты со всех слайдов
Пять методов анонимизации
| Метод | Пример | Обратим? | Класс GDPR |
|---|---|---|---|
| Замена | Иван Петров → PERSON | Нет | Анонимизация (Преамбула 26) |
| Маскировка | ivan@example.com → i***@e***.com | Нет | Анонимизация |
| Редактирование | 555-0123 → [REDACTED] | Нет | Анонимизация |
| Хэширование (SHA-256/512) | ИНН → a1b2c3d4... | Нет | Псевдонимизация (WP29) |
| Шифрование (AES-256-GCM) | Имя → ENC:xyz... | Да | Псевдонимизация (Ст. 4(5)) |
В одном проходе можно сочетать методы. Имена — заменять, электронные адреса — шифровать. Для каждого типа сущности задаётся своё правило.
Форматирование сохраняется в Writer
Это ключевое преимущество перед копированием и вставкой. Расширение сохраняет всё форматирование при замене текста.
Семь сохраняемых свойств шрифта:
- Гарнитура, размер, жирность, курсив, цвет, подчёркивание, зачёркивание
Четыре сохраняемых свойства абзаца:
- Выравнивание, отступ первой строки, левое поле, правое поле
«Иван Петров» жирным шрифтом 14pt Times New Roman становится «PERSON» в том же стиле. Таблицы, заголовки и нижние колонтитулы остаются нетронутыми. Расширение работает внутри модели документа и не экспортирует и не импортирует текст повторно.
Примечание: отслеживание форматирования применяется только к Writer. В Calc и Impress выполняется замена только на уровне текста.
Проверка перед применением
Предпросмотр показывает до 50 найденных сущностей. Каждая строка содержит:
- Тип сущности (PERSON, EMAIL_ADDRESS, PHONE_NUMBER и т. д.)
- Исходный текст
- Предлагаемую замену
- Оценку уверенности
Принимайте или отклоняйте каждую сущность по одной. Выделить все или снять выделение — одним нажатием. Ничего не изменяется до нажатия «Применить». В Writer Ctrl+Z отменяет последнюю операцию.
Предустановки синхронизируются между устройствами
Сохраните настройки как предустановку. Выберите типы сущностей, методы и пороговые значения. Используйте повторно для всех документов — это экономит время.
На платных планах предустановки синхронизируются между всеми продуктами anonym.legal. Создайте в веб-приложении — через пять минут она появится в настольном приложении и надстройке Office. Ключи шифрования используют обёртку с нулевым разглашением. Расшифровать их может только ваш пароль.
Подробнее о том, как надстройка Office обрабатывает тот же рабочий процесс в Word, — в статье Редактирование в надстройке Word для юридических фирм.
LibreOffice против Microsoft Office
Оба расширения используют одинаковый бэкенд. Один и тот же текст даёт одинаковые результаты в Writer и в Word. Движок единый.
| Функция | Расширение LibreOffice | Надстройка Office |
|---|---|---|
| Типы сущностей | 285+ | 285+ |
| Языки | 48 | 48 |
| Методы | 5 | 5 |
| Отслеживание форматирования | Только Writer | Только Word |
| Предпросмотр | До 50 сущностей | До 50 сущностей |
| ZK-аутентификация | Да | Да |
| Синхронизация предустановок | Да (платные планы) | Да (платные планы) |
| Платформы | Windows, macOS, Linux | Windows, Mac, Web, iPad |
Подробнее о соответствии требованиям в отношении персональных данных на разных операционных системах — в статье Кросс-платформенное соответствие требованиям PII: Mac, Linux, Windows.
Системные требования
- LibreOffice 3.0 или новее
- Python 3 (входит в большинство установок)
- Доступ в интернет (для API обнаружения персональных данных)
- Аккаунт anonym.legal (бесплатный уровень: 200 токенов/месяц)
Начало работы
- Скачайте расширение
- Дважды щёлкните для установки, затем перезапустите
- Откройте «Вид» → «Боковая панель» → панель anonym.legal
- Войдите в систему
- Откройте документ, нажмите «Анализировать», проверьте, нажмите «Применить»
Полная документация: Документация расширения LibreOffice
Источники
- The Document Foundation — около 200 млн+ пользователей LibreOffice по всему миру
- Тестирование обнаружения персональных данных anonym.legal — точность 95,5%, 42/44 независимых теста
- GDPR Преамбула 26 — анонимизация выводит данные из сферы действия GDPR; Статья 4(5) — определение псевдонимизации