Когда сеть не имеет выхода
Аналитик данных работает в оборонной компании. У неё есть 3 000 кадровых записей. Ей нужно удалить имена, номера социального страхования и уровни допуска для передачи данных исследовательскому партнёру в рамках соглашения CUI.
Её сеть не имеет подключения к интернету. Намеренно.
Она тестирует каждый веб-инструмент, который может найти. Каждый отправляет данные на внешний сервер. Каждой облачной платформе нужен аккаунт и активное подключение. Даже «локальные» инструменты зачастую обращаются к удалённому серверу лицензий.
В этом и состоит проблема развёртывания в изолированных сетях. Она затрагивает гораздо больше команд, чем принято считать.
Кому нужна офлайн-анонимизация PII
Оборонные компании и государственные ведомства сталкиваются с этим чаще всего. FedRAMP DISA требует, чтобы данные оставались в утверждённых сетевых границах. ITAR ограничивает технические данные американскими контролируемыми системами. Сети JWICS и SIPRNet физически изолированы по замыслу.
Но потребность в офлайн-режиме выходит далеко за рамки засекреченных объектов:
Больницы с сегментированными сетями. Системы PACS, платформы EHR и исследовательские базы данных часто находятся в сетях без интернета по политике безопасности.
Торговые площадки и клиринговые центры. Проприетарные торговые системы и системы SWIFT применяют строгую сетевую изоляцию.
Промышленные системы управления. Сети SCADA и объекты критической инфраструктуры работают с воздушными зазорами. Ужесточение после Stuxnet сделало это нормой.
Европейские требования к данным. Landesdatenschutzgesetze Германии и аналогичные законы ЕС требуют локальной обработки чувствительных государственных и медицинских данных. Штраф TikTok в размере €530 млн по GDPR в мае 2025 года за передачу данных в Китай подтолкнул ещё больше команд к локальным инструментам. См. наш обзор соответствия.
Почему облачные инструменты не работают в изолированных сетях
Большинство инструментов следуют модели SaaS:
Устройство пользователя → HTTPS → API поставщика → NLP-модели → Ответ
На изолированной сети первый шаг физически невозможен. Для регулируемых сред шаги 2–4 могут нарушать требования соответствия.
Self-hosted Presidio — распространённая запасная опция, но требует навыков Docker, Python, загрузки моделей spaCy (нужен интернет) и постоянной ИТ-поддержки. У большинства команд нет ни того, ни другого.
Как работает локальная анонимизация PII
Хороший офлайн-инструмент поставляется со всем необходимым:
- Встроенные NLP-модели — spaCy и трансформерные модели включены в установщик, загрузка во время работы не нужна
- Полный офлайн-режим — никаких API-вызовов, никакой телеметрии, никаких лицензионных проверок
- Корпоративные форматы — PDF, DOCX, XLSX, обычный текст без внешних зависимостей
Настольное приложение anonym.legal
Настольное приложение разработано для высокобезопасных сценариев:
- Работает полностью без интернета после установки
- Модели NLP включены в пакет установки
- Никаких API-вызовов во время обработки
- Никакой телеметрии и сбора данных об использовании
- Поддерживает Windows, macOS и Linux
Для Air Gap: скачайте установщик на подключённом устройстве, перенесите на изолированный хост и установите. Дополнительного доступа к интернету не требуется.
Начало работы
- Скачать настольное приложение
- Документация по развёртыванию
- Связаться с отделом корпоративных продаж — для FedRAMP и требований ITAR