ЗАЯВЛЕНИЕ ОСНОВАТЕЛЯ
Почему я инициировал эту экосистему — профессиональная убежденность после 28 лет
Ваши данные. Ваши ключи. Ваши правила.
Каждый продукт в этой экосистеме построен на единственном архитектурном обязательстве: ваши данные, ваши ключи, ваш контроль. Ваш пароль никогда не покидает ваше устройство. Ваши документы никогда не хранятся. Ваш ключ шифрования принадлежит только вам. Ни один закон о облачных данных США, ни повестка поставщика, ни брокер данных — не могут достичь того, что никогда не было поделено.
Фон
На протяжении 28 лет я работал на пересечении технологий, безопасности и организационного соблюдения. Я основал curta.solutions в 1998 году. С тех пор я служил регулируемым организациям в 26 странах — в финансовых услугах, здравоохранении, юриспруденции, государственном управлении, производстве и технологиях — как их партнер в области ИТ-архитектуры, безопасности, цифровой трансформации и соблюдения.
То, что я наблюдал за 28 лет, — это не медленная эволюция. Это кризис в замедленном движении — кризис, который достиг критической точки с появлением генеративного ИИ и глобальным распространением пересекающихся норм конфиденциальности.
Моя убежденность
Я верю, что каждый человек, организация и учреждение имеет право делиться информацией выборочно — раскрывать регулятору только то, что регулятор имеет право видеть, сотрудничать с партнером только по данным, которые были явно авторизованы, участвовать в коммерческой и общественной жизни, не сдавая то, что должно оставаться частным.
Я верю, что это право должно быть практически осуществимо для всех — не только для организаций с отделами соблюдения и бюджетами на корпоративное программное обеспечение. Конфиденциальность не может быть привилегией масштаба.
Я верю, что в мире, где закон США может достичь любых данных, хранящихся любой компанией США где угодно на земле, и где 77% сотрудников вводят чувствительные данные в инструменты ИИ, которыми они не управляют, единственная архитектура, которая может обеспечить значительную гарантию конфиденциальности, — это та, где данные никогда не покинут контроль пользователя с самого начала. Не контрактные гарантии. Не политики конфиденциальности. Техническая архитектура.
Аутентификация с нулевым знанием. Обработка на локальном уровне. Обратимое шифрование, где ключ принадлежит пользователю. Офлайн-работа. Юрисдикция ЕС, без исключений. Это не функции продукта. Это минимальный стандарт для любого инструмента, который утверждает, что защищает личные данные.
И я верю, что 28 лет работы внутри организаций, которые обрабатывают самую чувствительную информацию в мире — 28 лет наблюдения за тем, как разрыв между регуляторными намерениями и технической реальностью расширяется — дало мне как понимание, так и ответственность инициировать то, чего все еще не хватает в экосистеме. Определить видение, собрать правильную команду и обеспечить его строительство в соответствии со стандартом, который требует проблема.
Право анонимизировать личную информацию — это не техническая функция. Это фундаментальное право. И право, которое не может быть практически осуществлено, не является правом вообще.
Проблемы, которые я наблюдал
Регуляторная фрагментация: слишком много правил, нет общего языка
Организация среднего размера, работающая на глобальном уровне, должна одновременно ориентироваться в более чем 48 национальных и региональных законах о конфиденциальности — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA и десятках других. 24 национальных DPA в ЕС выдают обязательные рекомендации, которые в принципе согласованы, но различаются на практике. То, что удовлетворяет немецкому BfDI, не обязательно удовлетворяет французскому CNIL, ирландскому DPC или голландскому AP. Секторное наложение — HIPAA, PCI-DSS, NIS2, закон о ИИ — добавляет требования, которые редко согласованы между собой.
Результат — это не рамки соблюдения. Это движущаяся цель с 48 различными мишенями.
Бумажный монстр: соглашения, которые никто не читает, контроль, который никто не проверяет
Организации поддерживают соглашения о обработке данных с сотнями подсубподрядчиков, стандартные контрактные условия, достигающие 30+ страниц на каждое отношение передачи, записи о деятельности по обработке, DPIA, TIA, LIA — каждая требует технического ввода, который большинство юридических команд не может проверить самостоятельно. На практике: организации подписывают то, что должны подписать, подают то, что должны подать, и надеются, что техническая реальность соответствует контрактному описанию. Бумажный монстр создает видимость соблюдения. Он редко создает его суть.
Техническая недостаточность: инструменты не соответствуют обязательству
Обнаружение PII на основе генеративного ИИ не является детерминированным. Один и тот же документ, обработанный дважды, дает разные результаты. Фундаментально несовместимо с соблюдением — где вы должны продемонстрировать, воспроизводимо и проверяемо, что конкретные данные были обнаружены и обработаны правильно.
Microsoft Presidio, spaCy, Stanza — инженерные платформы, а не инструменты соблюдения. Внедрение в продукцию требует написания пользовательских распознавателей для каждого типа сущности и языка, создания пред/постобработки, интеграции с форматами документов, поддержания всего по мере изменения норм. Обычно 30–80 часов специализированного инженерного времени перед обработкой одного документа. Большинство организаций не имеют такой экспертизы в штате.
Персональный номер в шведском трудовом контракте, Steuer-ID в немецкой налоговой форме, PESEL в польском страховом документе, Codice Fiscale в итальянском счете — каждый требует не только обнаружения языка, но и распознавания сущностей, осведомленных о типе документа. Языковые модели, обученные преимущественно на английском, показывают 69% пропусков PII в неанглийском тексте. Закон не делает различий по языку.
Microsoft Purview, AWS Macie, Google Cloud DLP — дорогие, требуют облачной связи, связывают организации. Более критично: все они имеют штаб-квартиру в США. Закон CLOUD 2018 года обязывает их раскрывать данные в любой точке мира по действительному запросу правительства США. Раздел 702 FISA позволяет собирать разведывательную информацию без индивидуальных ордеров. Schrems II аннулировал соглашение о конфиденциальности ЕС-США именно по этой причине. Контракт на шесть цифр в год с поставщиком облачных услуг США не обеспечивает обработку данных в соответствии с GDPR.
Проблема неконтролируемого ИИ: рынок не имеет ответа
77% сотрудников делятся чувствительной рабочей информацией с инструментами ИИ как минимум раз в неделю. 34,8% всех вводов в инструменты ИИ содержат информацию, квалифицируемую как чувствительную по крайней мере в рамках одной из норм конфиденциальности. Сотрудники используют ChatGPT, Copilot, Claude, Gemini для составления контрактов, резюмирования заметок, анализа таблиц — постоянно, автоматически, не осознавая, что они вставляют в подсказку.
Традиционные системы DLP не могут понять семантическое содержание подсказки на естественном языке. Они не могут отличить разработчика, который просит ИИ объяснить шаблон кода, от разработчика, который вставляет базу данных на 50,000 записей в то же окно. Модели ИИ обрабатывают все. Они не предлагают защиты, предупреждений, ни аудиторского следа, на который может полагаться DPO.
То, что отсутствует, — это технический уровень, который делает политику исполнимой на практике. Этот уровень не существует на рынке по любой цене, которую может позволить себе организация среднего размера, в любой форме, которая работает с инструментами ИИ, которые на самом деле используют сотрудники. Это одна из пробелов, которые эта экосистема была создана для закрытия.
Пробел в доступности: соблюдение как привилегия масштаба
Одинокий практик, общественная организация, небольшая государственная власть, исследовательское учреждение — каждый подчиняется тем же нормам GDPR, тому же праву на удаление, той же обязанности уведомления о нарушении, что и глобальный банк — но без юридической команды, инженерных ресурсов или бюджета на корпоративное программное обеспечение для их правильной реализации. Экосистема соблюдения адекватно обслуживала крупные организации, хотя и дорого. Она обслуживала всех остальных с мандатом и без практических средств для его удовлетворения.
Ответ экосистемы — одна платформа, множество выражений
Универсальная платформа и основной точка доступа. Гибридное двойное распознавание PII (260+ сущностей, 48 языков, 121 предустановок соблюдения) по всем моделям развертывания — SaaS, управляемое частное облако и самостоятельное управление. Все производные продукты используют один и тот же движок обнаружения и один и тот же основной принцип: власть в руках пользователя.
Корпоративное издание с воздушным зазором. 390+ сущностей, 317 пользовательских шаблонов regex, 100% офлайн-обработка, OCR изображений на 37 языках. Никакой зависимости от облака — данные никогда не покидают устройство.
Облачная платформа PII с самым широким доступом. Расширение Chrome для реального времени перехвата ИИ, сервер MCP, надстройка Office, обратимое шифрование. Бесплатно до €29/месяц — соблюдение для любого бюджета.
Desktop-first, полностью локально. Presidio sidecar на устройстве, 7 форматов документов + OCR, пакетная обработка, зашифрованный хранилище. Одноразовая бессрочная лицензия — без подписок, без облака, полностью офлайн после активации.
Мгновенная публичная демонстрационная платформа. Учетная запись не требуется — вставьте текст, анонимизируйте немедленно, увидьте движок в действии. Самый быстрый способ испытать, что делает экосистема.
Универсальная платформа — SaaS · Управляемое частное · Самостоятельное управление · 3 модели развертывания
- //Организации сообщают, что 67% разработчиков случайно раскрыли секреты в коде — детерминированный regex ловит то, что пропускает NLP и наоборот
- //Обнаружение общего назначения ИИ достигает 69% пропусков в неанглийском тексте — двойной слой с spaCy + XLM-RoBERTa закрывает пробелы по всем 48 языкам
- //Несогласованное редактирование между командами — это наиболее часто упоминаемая находка аудита ICO и DPA — предустановки обеспечивают идентичное поведение обнаружения для каждого пользователя, каждой сессии
- //95% утечек данных в 2024 году связаны с человеческой ошибкой — общие предустановки устраняют индивидуальные решения по конфигурации, которые создают вариации
- //Многофункциональные стеки PII создают пробелы в аудиторских следах — более 60% организаций, использующих 3+ инструмента PII, сообщают о сбоях согласования между инструментами
- //Фрагментация форматов: организации обрабатывают PDF, DOCX, XLSX, CSV, JSON одновременно — каждый формат ранее требовал отдельного подхода, отдельного инструмента, отдельной записи аудита
- //Корпоративные инструменты PII стоят от $50,000 до $500,000 в год — организации с ограниченными бюджетами исторически не имели никаких вариантов
- //Закон CLOUD + Раздел 702 FISA означают, что обработка, "соответствующая GDPR", размещенная в США, является контрактной фикцией — хостинг только в ЕС полностью устраняет этот риск
Корпоративный с воздушным зазором — 390+ сущностей · 317 пользовательских regex · 100% офлайн · OCR изображений
- //Отраслевые PII — коды ядерных объектов, номера военной службы, внутренние идентификаторы — не охватываются ни одним коммерческим инструментом; пользовательские распознаватели требуют недели специализированной инженерии в сыром Presidio
- //Недостаточность покрытия — это потолок обнаружения: ни один общий инструмент не охватывает все типы PII, все языки, все форматы — 317 кураторских шаблонов закрывают пробелы, которые пропускают стандартные фреймы
- //Парадокс поставщика: чтобы защитить PII, вы должны поделиться ею с поставщиком. Облачная обработка требует доверия к процессору — архитектурное противоречие для организаций, обрабатывающих самые чувствительные данные
- //Окружения с воздушным зазором (оборона, разведка, критическая инфраструктура, исследовательские лаборатории) не могут использовать инструменты, зависящие от облака, ни по какой цене — офлайн-принцип полностью устраняет архитектурный барьер
- //Microsoft Purview явно не может сканировать JPEG/PNG — текст PII в скриншотах полностью невидим для корпоративного стека DLP по замыслу
- //Вредоносное ПО SparkCat (iOS/Android, декабрь 2025) использовало OCR для кражи фраз восстановления криптокошелька из скриншотов — текст PII на изображениях является активной целью атаки, а не теоретическим риском
- //300% увеличение облачных утечек данных между 2022 и 2024 годами — нулевое знание означает, что утечка с наших серверов ничего не раскрывает, потому что ничего не хранится
- //Сертифицировано по ISO 27001:2022 с регулярным полным тестированием на проникновение — уровень безопасности, который требует регулируемая закупка, документирован, проверен и независимо проверен
Облачная платформа PII — Бесплатно до €29/мес · Расширение Chrome · Сервер MCP · Надстройка Office
- //8.5% всех запросов LLM содержат PII — перехват в реальном времени перед отправкой — единственная профилактика, которая работает; постфактум обнаружение пропускает единственное окно, которое имеет значение
- //Традиционный DLP срабатывает после того, как данные покинули организацию — расширение Chrome перехватывает на этапе ввода, до того, как какая-либо модель получит или обработает чувствительное содержимое
- //Обнаружение генеративного ИИ не является детерминированным — один и тот же документ дает разные результаты на разных запусках; ни одна вероятностная система не может стать основой для регуляторной защиты
- //Presidio сам по себе пропускает контекстно зависимые сущности; XLM-RoBERTa сам по себе генерирует ложные срабатывания в формальном юридическом языке — третий слой классификации позиций устраняет ложные срабатывания, которые заставляют команды соблюдения недоверять автоматизированным инструментам
- //Юридическое раскрытие, запросы на доступ к медицинским записям, регуляторный аудит — анонимизированные данные иногда должны быть деанонимизированы уполномоченной стороной и только ею; необратимые методы делают это невозможным
- //Сессионный ключ пользователя никогда не покидает их устройство — ни наши серверы, ни облако, ни какой-либо подсубподрядчик. Право на обратную анонимизацию принадлежит пользователю, а не нам.
- //Одинокий практик сталкивается с той же обязанностью по праву на удаление GDPR, что и глобальный банк — но без отдела соблюдения или бюджета на корпоративное программное обеспечение в €500K/год
- //764 организации ЕС одновременно находятся под расследованием за нарушения права на удаление — не потому, что они намеревались нарушить; потому что инструменты для соблюдения были оценены выше их возможностей
Desktop-First · 100% локальная обработка · 7 форматов документов + OCR · Лицензия на один раз
- //300% увеличение облачных утечек данных между 2022 и 2024 годами — данные, которые никогда не попадают в облако, не могут быть раскрыты в облачной утечке
- //Закон CLOUD + FISA делают обработку, размещенную в США, юридически неопределенной для организаций ЕС — локальная обработка полностью устраняет проблему трансграничной передачи, обеспечивая отсутствие передачи
- //Фрагментация форматов заставляет организации поддерживать несколько инструментов — каждый инструмент создает отдельную политику обнаружения, отдельную запись аудита, отдельный режим сбоя
- //Файлы журналов — это запущенная поверхность PII — разработчики сосредотачиваются на базах данных, но журналы содержат ключи API, идентификаторы пользователей, IP-адреса; CSV и JSON поддерживаются наряду со структурированными документами
- //Окружения с воздушным зазором — производственные площади, защищенные государственные учреждения, исследовательские лаборатории — не могут терпеть проверку лицензии, требующую сетевого доступа; одноразовая активация, затем полностью офлайн-операция — единственная жизнеспособная архитектура
- //Бессрочные лицензии без зависимости от SaaS: пользователь владеет своей установкой; отмена подписки поставщика не может отключить инструмент в критический момент обработки
- //Перестройки конвейера dbt уничтожают политики маскирования на данных CSV/JSON — EDPB 2024 уточняет, что это нарушает статью 5(1)(a) GDPR; хранилище с зашифрованной историей означает, что каждый обработанный файл имеет аудируемую, восстанавливаемую запись
- //Организации, обрабатывающие тысячи устаревших документов для соблюдения права на удаление GDPR, нуждаются в пакетной возможности — а не в ограничении на 5 файлов в день, которое делает задачу операционно невозможной
Масштаб проблемы
Это не исключительные неудачи. Это системные результаты среды соблюдения, которая опередила свою собственную инфраструктуру.