Проблема змішаного офісного середовища
Більшість організацій не використовують виключно один офісний пакет. Юридичні відділи можуть стандартизуватися на Microsoft Word. Інженерні команди надають перевагу LibreOffice на Linux. Державні підрядники отримують документи у форматах ODF і OOXML. Злиття компаній об'єднує команди з різними програмними стеками.
Коли таким організаціям потрібна анонімізація PII, вони стикаються з проблемою узгодженості: різні інструменти для різних пакетів дають різні результати. Сутність A виявляється у Word, але пропускається у Writer. Порогові значення достовірності відрізняються. Формати заміни не збігаються.
Ця неузгодженість не просто незручна — вона є ризиком для відповідності вимогам. Стаття 32 GDPR вимагає «відповідних технічних заходів» захисту даних. Якщо ваша анонімізація дає різні результати залежно від того, який офісний пакет обробляє документ, такий захід не є послідовно відповідним.
Один рушій, два пакети
anonym.legal надає спеціальні розширення для обох екосистем:
- Office Add-in — для Microsoft Word, Excel і PowerPoint
- Розширення LibreOffice — для Writer, Calc і Impress
Обидва підключаються до одного бекенду:
- Ті самі 285+ типів сутностей
- Те саме гібридне виявлення (шаблони regex + NLP на базі spaCy)
- Ті самі 48 мов
- Ті самі 5 методів анонімізації
- Та сама оцінка достовірності (regex: 1,0, NLP: 0,85+)
Обробіть той самий текст у Word чи Writer — ті самі сутності будуть виявлені з тими самими оцінками.
Спільні пресети усувають розбіжності конфігурацій
Розбіжності конфігурацій — це тихий руйнівник відповідності у змішаних середовищах. Команда A налаштовує свій інструмент Word на виявлення 12 типів сутностей методом Replace. Команда B налаштовує свій інструмент LibreOffice на виявлення 8 типів сутностей методом Redact. Той самий документ — різні результати.
Синхронізація пресетів anonym.legal вирішує цю проблему:
- Створіть пресет на будь-якій платформі (вебзастосунок, настільний застосунок, Office Add-in або розширення LibreOffice)
- Пресет синхронізується до всіх платформ протягом 5 хвилин
- Кожен член команди, незалежно від офісного пакету, застосовує ту саму конфігурацію
Пресети включають:
- Які типи сутностей виявляти
- Який метод анонімізації для кожного типу сутностей
- Порогові значення достовірності
- Визначення спеціальних сутностей
Портативність ключів шифрування
Для організацій, що використовують оборотну псевдонімізацію (метод шифрування AES-256-GCM), ключі шифрування мають бути доступні на всіх платформах. Документ, зашифрований у Word, повинен бути розшифрований за допомогою того самого ключа у вебзастосунку або LibreOffice.
anonym.legal обробляє це за допомогою синхронізації ключів із нульовим розголошенням (ZK-wrapped):
- Ключі шифрування обертаються за допомогою XChaCha20-Poly1305 з використанням ключа, похідного від вашого пароля
- Обернуті ключі синхронізуються на сервер
- Ваш пароль (який ніколи не залишає ваш пристрій) розвертає їх на будь-якій платформі
- Навіть повний злам сервера не може отримати доступ до ваших ключів шифрування
Практичний робочий процес: юридична фірма зі змішаним середовищем
Середня юридична фірма обробляє документи з різних джерел:
Вхідні документи:
- Клієнтські договори (Word .docx)
- Судові документи (PDF, конвертовані в текст)
- Внутрішні меморандуми (LibreOffice Writer .odt — робочі станції Linux фірми)
- Табличні дані (суміш Excel .xlsx і Calc .ods)
Робочий процес анонімізації:
- Старший партнер створює пресет «Редагування справи клієнта» у вебзастосунку — замінити імена, замаскувати дати, відредагувати SSN, зашифрувати адреси електронної пошти
- Пресет синхронізується до всіх платформ
- Помічник A відкриває договір Word, застосовує пресет через Office Add-in
- Помічник B відкриває меморандум Writer, застосовує той самий пресет через розширення LibreOffice
- Паралегал обробляє таблицю Calc із тим самим пресетом
- Усі троє використовують однакові конфігурації виявлення та анонімізації
Аудиторський слід: Коли фірмі потрібно довести відповідність GDPR, вона може показати:
- Той самий пресет, застосований до всіх типів документів
- Те саме виявлення типів сутностей незалежно від формату
- Ті самі методи анонімізації, послідовно застосовані
- Ключі шифрування, керовані з безпекою нульового знання
Міркування щодо розгортання на підприємстві
| Фактор | Office Add-in | Розширення LibreOffice |
|---|---|---|
| Розгортання | Центр адміністрування Microsoft 365 | Розповсюдження файлу .oxt |
| Оновлення | Автооновлення через маніфест | Ручна заміна .oxt |
| Управління користувачами | Інтеграція Azure AD | Облікові записи anonym.legal |
| Платформа | Windows, Mac, Web, iPad | Windows, macOS, Linux |
| Ліцензування | Потрібен Microsoft 365 | Безкоштовно (LibreOffice) |
Для змішаних середовищ розгорніть обидва: Office Add-in на робочих станціях Microsoft 365, розширення LibreOffice на робочих станціях Linux/з відкритим кодом. Спільні пресети та ключі шифрування забезпечують узгоджену поведінку в обох.
Регуляторна узгодженість
Регулятори не приймають «ми використовували різні інструменти» як пояснення непослідовної анонімізації. Якщо відповідь на DSAR редагує ім'я у версії Word, але пропускає його у версії LibreOffice того самого документа, це є порушенням відповідності.
Використання того самого рушія виявлення для всіх типів документів усуває цей ризик. Алгоритм виявлення сутностей не змінюється залежно від клієнтського застосунку — він працює на стороні сервера, однаково, для кожного запиту.
Початок роботи з кросплатформною анонімізацією
- Завантажте розширення LibreOffice — для Writer, Calc, Impress
- Встановіть Office Add-in — для Word, Excel, PowerPoint
- Створіть пресет у вебзастосунку — він синхронізується до обох платформ
- Перегляньте документацію — посібники, специфічні для LibreOffice
Один обліковий запис, одні пресети, одне виявлення, однакові результати.
Джерела:
- Стаття 32 GDPR — відповідні технічні заходи для послідовного захисту даних
- Документація кросплатформної синхронізації anonym.legal — портативність пресетів і ключів шифрування
- Тестування виявлення PII anonym.legal — точність 95,5%, однакова на всіх платформах