Docs/Glossary

Глосарій конфіденційності та технологій

Визначення всіх термінів, абревіатур та концепцій, що використовуються в анонімізації PII та конфіденційності даних.

Назад до документів

94 терміни

2

2FA

Двофакторна аутентифікація

Шифрування та безпека

Аутентифікація, що вимагає двох різних факторів перевірки: щось, що знає користувач (пароль), і щось, що має користувач (додаток TOTP, апаратний ключ) або є (біометричні дані). Підтримується в anonym.legal як додатковий рівень поверх ZK Auth.

#twofa

А

Анонімізація

Анонімізація даних

Конфіденційність даних та PII

Безповоротний процес видалення або перетворення ідентифікаційної інформації так, щоб особи більше не могли бути ідентифіковані, безпосередньо або опосередковано. Відповідно до GDPR, дійсно анонімізовані дані виходять за межі регулювання.

#anonymization

Аудиторський слід

Незмінний аудиторський слід

Юридичні та аудиторські

Послідовний, доказовий журнал, що фіксує, хто отримував доступ, модифікував або обробляв дані і коли. Вимагається ISO 27001 (A.8.15), Правилом безпеки HIPAA (§164.312(b)) та правилами електронного виявлення. anonym.legal реєструє всі операції анонімізації з часовими мітками, кількістю сутностей та ідентифікаторами операторів.

#audittrail

В

Веб-додаток

анонім.легал Веб-додаток

Платформа та продукти

Браузерний інтерфейс на anonym.legal для аналізу, анонімізації та розшифрування PII. Підтримує текстовий ввід, завантаження файлів (PDF, DOCX, TXT), пакетну обробку, ZK Auth, 48 мов та 285+ типів сутностей. Встановлення не потрібне.

#webapp

Виявлення Мови

Автоматичне Виявлення Мови

Технології виявлення

Автоматична ідентифікація мови вхідного тексту перед аналізом PII. anonym.legal виявляє мову на рівні запиту та маршрутизує до відповідної конвеєрної моделі NER, з англійською як резервною для мов, які не підтримуються.

#languagedetection

Г

Гібридне Виявлення

Гібридне Виявлення NLP + Regex + ML

Технології виявлення

Триступеневий підхід anonym.legal: шаблони regex для структурованих PII (номери телефонів, IBAN, кредитні картки), моделі NLP/NER для контекстуальних об'єктів (імена, організації, локації) та класифікатори ML для неоднозначних випадків. Зменшує як хибнопозитивні, так і хибнонегативні результати.

#hybriddetection

Д

Деанонімізація

Атака повторної ідентифікації

Конфіденційність даних та PII

Процес повторної ідентифікації осіб з нібито анонімізованих наборів даних шляхом перехресного посилання з допоміжною інформацією. Основний ризик при обміні даними з недостатньою глибиною анонімізації.

#deanonymization

Десктопний додаток

анонім.легал Десктопний додаток

Платформа та продукти

Кросплатформений додаток (Windows, macOS, Linux), створений за допомогою Tauri 2.0 та React 18. Має можливість локальної обробки файлів, сховища BIP39 для офлайн ZK Auth, пакетного експорту та синхронізації API. Підтримує розгортання без підключення до Інтернету.

#desktopapp

Диференційна конфіденційність

Диференційна конфіденційність (DP)

Конфіденційність даних та PII

Математична структура для публікації статистичної інформації про набори даних, забезпечуючи доказові гарантії, що дані будь-якої особи не можуть бути відрізнені. Використовується в агрегатній аналітиці для запобігання повторній ідентифікації навіть при запитах до агрегованих виходів.

#differentialprivacy

З

Захищеність

Юридично захищена анонімізація

Юридичні та аудиторські

Здатність продемонструвати регуляторам, судам або аудиторам, що анонімізація була виконана за допомогою документованої, послідовної та технічно обґрунтованої методології. Аудиторські журнали anonym.legal, бали впевненості та налаштування операторів підтримують захищені робочі процеси анонімізації.

#defensibility

І

Ідентифікатори страхування

Типи сутностей страхування

Типи сутностей

Типи сутностей для ідентифікаторів, пов'язаних зі страхуванням: US_NPI (Національний ідентифікатор постачальника для постачальників медичних послуг), HEALTHCARE_PLAN_BENEFICIARY та специфічні для країн номери медичного страхування (наприклад, DE_HEALTH_INSURANCE_NUMBER).

#insuranceidentifiers

Ідентифікатори транспортних засобів

Типи сутностей транспортних засобів

Типи сутностей

Типи сутностей для ідентифікаторів, пов'язаних з транспортними засобами: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (номер ідентифікації транспортного засобу) та специфічні для країн формати номерних знаків транспортних засобів.

#vehicleidentifiers

К

Кодове Перемикання

Багатомовне Кодове Перемикання

Технології виявлення

Феномен змішування двох або більше мов у межах одного тексту або розмови. Поширене в багатомовних документах (наприклад, німецькі юридичні документи з англійськими технічними термінами). Гібридне виявлення anonym.legal обробляє текст з кодовим перемиканням, застосовуючи кілька мовних моделей одночасно.

#codeswitching

Конфіденційність за дизайном

Конфіденційність за дизайном та за замовчуванням

Конфіденційність даних та PII

Принцип, передбачений статтею 25 GDPR, що заходи захисту даних вбудовуються в системи з самого початку, а не додаються як післядумка. Охоплює мінімізацію даних, контроль доступу, шифрування та псевдонімізацію на рівні архітектури.

#privacybydesign

Користувацькі сутності

Визначники користувацьких сутностей

Платформа та продукти

Шаблони PII, визначені користувачем, додані до вбудованих 285+ типів сутностей anonym.legal. Підтримує regex шаблони, списки слів та списки заборонених. Корисно для ідентифікаторів, специфічних для організації, таких як ID співробітників, внутрішні коди проектів або торгові назви продуктів.

#customentities

М

Маскування

Маскування даних

Конфіденційність даних та PII

Замінювання чутливих значень реалістичними, але вигаданими даними, які зберігають формат і структуру. Використовується для тестових середовищ, аналітики та обміну наборами даних без розкриття реальної PII.

#masking

Мінімізація даних

Принцип мінімізації даних GDPR

Конфіденційність даних та PII

Принцип статті 5(1)(c) GDPR, який вимагає, щоб збиралися та оброблялися лише дані, які є адекватними, релевантними та необхідними для визначеної мети. Основне обмеження дизайну для систем, що відповідають вимогам конфіденційності.

#dataminimization

Н

Надмірне редагування

Надмірне редагування (помилкові позитиви)

Юридичні та аудиторські

Видалення більшої кількості інформації, ніж необхідно, що знижує корисність документа та потенційно становить споліацію в юридичних процедурах. Викликане низькими порогами впевненості або надто широким вибором сутностей. Налаштовується через пороги та контролі сутностей anonym.legal.

#overredaction

Недостатнє редагування

Недостатнє редагування (помилкові негативи)

Юридичні та аудиторські

Невиконання видалення всіх PII, що залишає осіб уразливими в спільних документах. Більш поширений ризик відповідності. Викликане високими порогами впевненості, відсутніми типами сутностей або новими форматами PII. Пом'якшується за допомогою гібридного виявлення та підтримки користувацьких сутностей anonym.legal.

#underredaction

Нульове знання

Архітектура нульового знання

Шифрування та безпека

Дизайн системи, в якій постачальник послуг не має доступу до відкритих даних користувачів або ключів шифрування. Весь процес шифрування/дешифрування відбувається на стороні клієнта; сервер ніколи не бачить оригінальний вміст. Запобігає загрозам зсередини та примусовому розкриттю.

#zeroknowledge

О

Обмеження швидкості

Обмеження швидкості API

Інфраструктура

Контроль кількості запитів API, які клієнт може зробити протягом певного часу. Запобігає зловживанням та забезпечує справедливий розподіл ресурсів. anonym.legal застосовує обмеження швидкості для кожного користувача на основі рівня плану, з рекомендованим експоненційним зниженням для логіки повторних спроб.

#ratelimiting

Оператори

Оператори анонімізації

Платформа та продукти

Стратегія заміни, що застосовується до виявлених PII. Веб-застосунок підтримує п'ять операторів. REPLACE вставляє текст-замінник. REDACT записує порожній рядок. MASK відображає зірочки. HASH генерує дайджест SHA-256. ENCRYPT використовує оборотне шифрування AES-256-GCM. Сервер MCP додає шостий оператор, KEEP, який виключає збіг з анонімізації.

#operators

Охорона здоров'я сутності

Типи сутностей PII в охороні здоров'я

Типи сутностей

Типи сутностей для 18 ідентифікаторів HIPAA Safe Harbor та додаткової інформації про здоров'я: US_MRN (номери медичних записів), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY та сутності контексту діагностики/лікування.

#healthcareentities

Оцінка Достовірності

Оцінка Достовірності Виявлення Об'єктів

Технології виявлення

Оцінка від 0 до 1, що вказує, наскільки впевнений модель виявлення, що текстовий фрагмент є об'єктом PII. anonym.legal пропонує налаштовувані пороги достовірності, щоб користувачі могли налаштувати компроміс між точністю та відгуком для своїх конкретних випадків використання.

#confidencescoring

П

Пакетна обробка

Анонімізація пакетних файлів

Платформа та продукти

Обробка кількох файлів одночасно в одній операції. Пакетний режим anonym.legal підтримує файли PDF, DOCX та TXT з конфігурацією сутностей для кожного файлу, порогами впевненості та вибором формату виходу.

#batchprocessing

Правило 26

Федеральні правила цивільного процесу Правило 26

Юридичні та аудиторські

Правило цивільного процесу США, що регулює зобов'язання щодо виявлення. Правило 26(g) вимагає від адвокатів сертифікувати, що запити на виявлення та розкриття не робляться з неналежними цілями — включаючи невдале редагування PII з вироблених документів.

#rule26

Пресети

Пресети анонімізації

Платформа та продукти

Збережені конфігурації вибраних типів сутностей, порогів впевненості та параметрів виходу, які можна застосувати одним клацанням. Пресети синхронізуються між Веб-додатком, Office Add-in та Десктопним додатком через зашифроване хмарне сховище.

#presets

Привілей адвоката-клієнта

Захист привілею адвоката-клієнта

Юридичні та аудиторські

Юридичний захист конфіденційних комунікацій між адвокатами та клієнтами. У перегляді документів та електронному виявленні привілейований контент повинен бути ідентифікований та утриманий або редагований. Користувацькі типи сутностей в anonym.legal можуть бути налаштовані для позначення маркерів привілейованого контенту.

#attorneyclientprivilege

Псевдонімізація

Псевдонімізація даних

Конфіденційність даних та PII

Замінювання прямих ідентифікаторів штучними значеннями (псевдонімами) зберігаючи можливість повторної ідентифікації осіб за допомогою окремого ключа. Стаття 4(5) GDPR визнає це як техніку, що підвищує конфіденційність, але не звільняє псевдонімізовані дані від регулювання.

#pseudonymization

Р

Редагування

Редагування даних

Конфіденційність даних та PII

Постійне видалення або затемнення чутливої інформації з документів, заміна її візуальним маркером, таким як [ВИДАЛЕНО] або чорна смуга. На відміну від шифрування, редагування є одностороннім, і оригінальні дані не можуть бути відновлені.

#redaction

Редактор зображень

Служба редагування зображень Presidio

Інфраструктура

Спеціалізована служба бекенду (порт 8013), яка виявляє та редагує PII з файлів зображень (PNG, JPEG) за допомогою OCR та аналізу Presidio. Застосовує редагування чорними смугами над виявленими областями PII в оригінальному зображенні.

#presidioimageredactor

Резиденція даних

Вимоги до резиденції даних

Відповідність та регуляції

Юридичні або контрактні вимоги, що визначають, в якому географічному місці дані повинні зберігатися та оброблятися. Важливі для GDPR (передача даних за межі ЄЕП), німецького BDSG та галузевих регуляцій у сфері охорони здоров'я та фінансів.

#dataresidency

Резиденція даних ЄС

Резиденція даних Європейського Союзу

Інфраструктура

Гарантія того, що дані зберігаються та обробляються виключно на території ЄС/ЄЕП. Виробничі сервери anonym.legal знаходяться в Німеччині (Hetzner Frankfurt), що забезпечує обробку під юрисдикцією GDPR без наслідків для трансферу даних через кордон.

#eudataresidency

Розширення Chrome

анонім.легал Розширення Chrome

Платформа та продукти

Розширення браузера (Manifest V3), яке перехоплює текст перед його відправкою до AI чат-ботів (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Анонімізує на льоту та за бажанням розшифровує відповіді AI, використовуючи збережені ключі шифрування.

#chromeextension

С

Споліація

Споліація доказів

Юридичні та аудиторські

Знищення, зміна або невиконання збереження доказів, що мають відношення до судового розгляду. Надмірне редагування, яке робить документи нечитаємими, може становити споліацію. Калібрування точності анонімізації (пороги впевненості, вибір сутностей) важливе для юридично захищеного редагування.

#spoliation

Суверенітет даних

Цифровий суверенітет даних

Відповідність та регуляції

Принцип, згідно з яким дані підлягають законам і структурами управління країни, в якій вони були зібрані. Ширший, ніж резиденція даних, він охоплює контроль над тим, хто може отримати доступ до даних і в рамках якої юридичної системи.

#datasovereignty

Сховище

Сховище ключів шифрування

Платформа та продукти

Безпечне локальне сховище для ключів шифрування в Десктопному додатку, захищене методом похідного ключа Argon2id з головної фрази. Ключі зберігаються в зашифрованому вигляді за допомогою AES-256-GCM та резервуються за допомогою мнемонічних фраз BIP39.

#vault

Т

Тип сутності

Тип сутності PII

Типи сутностей

Категорія особистої інформації, яку система виявлення розпізнає та може анонімізувати. Приклади: ОСОБА, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal підтримує понад 285 типів сутностей на 48 мовах.

#entitytype

Токенізація

Токенізація даних

Конфіденційність даних та PII

Замінювання чутливих даних на нечутливий заповнювач (токен), який відображається назад до оригіналу в безпечному сховищі. На відміну від шифрування, сам токен не має математичного зв'язку з оригінальними даними.

#tokenization

Токенна система

анонім.легал Система кредитних токенів

Платформа та продукти

Оплата на основі використання, де виклики API споживають токени, розраховані з урахуванням довжини тексту, кількості сутностей та режиму обробки (аналізувати чи анонімізувати). Вартість токенів налаштовується в базі даних і відображається в реальному часі перед обробкою.

#tokensystem

У

Універсальні сутності

Типи сутностей, універсальні для мов

Типи сутностей

Типи сутностей, які виявляються незалежно від мови тексту, зазвичай через регулярні вирази на основі формату з перевіркою контрольної суми. Приклади: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO адреса.

#universalentities

Урядовий ID

Типи ідентифікаторів, виданих урядом

Типи сутностей

Типи сутностей для національних та урядових ідентифікаторів: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE та понад 50 інших специфічних для країн форматів ID. Виявляються за допомогою специфічних для країни регулярних виразів + шаблонів контрольних сум.

#governmentid

Ф

Фінансові сутності

Типи фінансових сутностей PII

Типи сутностей

Типи сутностей, що охоплюють фінансові ідентифікатори: CREDIT_CARD (контрольна сума Луна), IBAN_CODE (контрольна сума ISO 13616), SWIFT_CODE (формат BIC), US_BANK_NUMBER, NRP (іспанський податковий номер). Виявляються з перевіркою контрольної суми для мінімізації помилкових позитивів.

#financialentities

Х

Хешування

Криптографічне хешування

Конфіденційність даних та PII

Одностороннє перетворення даних у фіксовану довжину дайджесту за допомогою алгоритмів, таких як SHA-256. Використовується для послідовної псевдонімізації, дедуплікації та перевірки цілісності. Хеш-значення не можуть бути повернені, але можуть бути вразливими до атак за допомогою таблиць райдуг, якщо не підсолюються.

#hashing

Ц

Цифрові ідентифікатори

Типи цифрових ідентичностей

Типи сутностей

Типи сутностей для онлайн- та цифрових ідентифікаторів: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 та IPv6), URL, DOMAIN_NAME, CRYPTO (адреси Bitcoin/Ethereum) та специфічні для платформ ідентифікатори.

#digitalidentifiers

A

AES-256-GCM

Стандарт шифрування AES 256-бітний Galois/Counter Mode

Шифрування та безпека

Алгоритм аутентифікованого шифрування, що поєднує AES-256 (256-бітний ключ) з Galois/Counter Mode для забезпечення конфіденційності та цілісності. Використовується в оборотному анонімізації anonym.legal для шифрування замінених сутностей. Забезпечує як секретність, так і виявлення підробок.

#aes256gcm

Argon2id

Функція похідної ключа Argon2id

Шифрування та безпека

Переможець конкурсу з хешування паролів 2015 року. Argon2id поєднує стійкість до атак з боку каналу Argon2i та стійкість до GPU Argon2d. Використовується в anonym.legal та в сховищі настільного додатку для отримання ключів шифрування з паролів користувачів.

#argon2id

B

BIP39

Пропозиція щодо покращення Bitcoin 39 — Мнемонічні фрази

Шифрування та безпека

Стандарт для генерації зрозумілих для людини мнемонічних фраз-насіння (12–24 слова) з криптографічного насіння. Використовується в сховищі настільного додатку anonym.legal як зручний резервний варіант для ключа шифрування, отриманого з Argon2id.

#bip39

C

CCPA

Закон Каліфорнії про конфіденційність споживачів

Відповідність та регуляції

Закон Каліфорнії про конфіденційність, що надає резидентам право знати, видаляти та відмовлятися від продажу своїх особистих даних. Застосовується до бізнесу, що відповідає критеріям доходу, обсягу даних або порогам продажу даних. Значно змінений CPRA (прийнятий у листопаді 2020 року, набирає чинності в січні 2023 року).

#ccpa

CLOUD Act

Закон про законне використання даних за кордоном

Відповідність та регуляції

Федеральний закон США (2018), що дозволяє правоохоронним органам США зобов'язувати постачальників хмарних послуг, що базуються в США, надавати дані, що зберігаються за кордоном. Конфліктує з правилами передачі даних GDPR для резидентів ЄС. Анонімізація даних перед завантаженням у хмару є поширеним заходом пом'якшення.

#cloudact

CSP

Політика безпеки контенту

Шифрування та безпека

Механізм заголовка HTTP-відповіді та мета-тегу, що обмежує, які ресурси (скрипти, стилі, зображення) може завантажити браузер. CSP anonym.legal включає object-src 'none', script-src з nonce та upgrade-insecure-requests для запобігання атакам XSS.

#csp

D

DDoS захист

Захист від розподілених атак відмови в обслуговуванні

Інфраструктура

Інфраструктурні засоби захисту від розподілених атак відмови в обслуговуванні. Інфраструктура серверів anonym.legal включає правила брандмауера (UFW), обмеження з'єднань nginx та захисти, еквівалентні Cloudflare, для підтримки доступності.

#ddosprotection

DLP

Запобігання Втраті Даних

Платформа та продукти

Дисципліна безпеки та категорія програмних інструментів, які виявляють і запобігають несанкціонованій передачі чутливих даних за межі організації. anonym.legal функціонує як рішення DLP для PII на рівні браузера та AI.

#dlp

DPA

Договір на обробку даних

Відповідність та регуляції

Юридично обов'язковий контракт між контролером даних і процесором даних, що вимагається статтею 28 GDPR. Визначає предмет, тривалість, характер, мету та тип обробки особистих даних, а також права та обов'язки обох сторін.

#dpa

DPIA

Оцінка впливу на захист даних

Відповідність та регуляції

Процес оцінки ризиків, що вимагається статтею 35 GDPR для діяльності з обробки, яка, ймовірно, призведе до високих ризиків для прав і свобод осіб. Обов'язковий для систематичного профілювання, обробки PHI в великих обсягах і спостереження в публічних місцях.

#dpia

E

e-Discovery

Електронне виявлення

Юридичні та аудиторські

Процес ідентифікації, збору та виробництва електронно збереженої інформації в юридичних процедурах. Вимагає редагування PII та привілейованої інформації з вироблених документів. Основний випадок використання для юридичних відділів, що використовують anonym.legal.

#ediscovery

E2EE

Шифрування з кінця в кінець

Шифрування та безпека

Шифрування, при якому лише сторони, що спілкуються, можуть читати повідомлення; постачальник послуг не має доступу до відкритого тексту. У режимі ZK Auth anonym.legal ключі шифрування ніколи не залишають пристрій клієнта, досягаючи E2EE для зберігання анонімізованого виходу.

#e2ee

F

FOIA

Закон про свободу інформації

Відповідність та регуляції

Федеральний закон США (та еквівалентні статути в інших юрисдикціях), що надає публічний доступ до урядових записів. Вимагає редагування PII та іншої інформації, що підлягає виключенню, перед розкриттям — основний випадок використання для юридичних та урядових робочих процесів анонімізації.

#foia

G

GDPR Article 25 — Захист даних за замовчуванням та за дизайном

Відповідність та регуляції

Вимагає від контролерів впровадження відповідних технічних та організаційних заходів (таких як псевдонімізація та мінімізація даних) як під час проектування системи, так і за замовчуванням під час обробки.

#gdprarticle25

GDPR Article 32 — Безпека обробки

Відповідність та регуляції

Вимагає від контролерів та процесорів впровадження відповідних технічних та організаційних заходів для забезпечення рівня безпеки, що відповідає ризику, включаючи шифрування, псевдонімізацію, конфіденційність, цілісність, доступність та стійкість систем обробки.

#gdprarticle32

GenAI DLP

Запобігання Втраті Даних Генеративного AI

Платформа та продукти

Спеціалізована категорія DLP, зосереджена на запобіганні включенню PII та конфіденційних даних у запити, що надсилаються до генеративних AI моделей (ChatGPT, Claude, Gemini). Розширення Chrome та MCP Server від anonym.legal вирішують цей ризик на етапі вводу.

#genaidlp

H

Hetzner

Hetzner Online GmbH

Інфраструктура

Німецький постачальник хмарних послуг та хостингу, де працює виробнича інфраструктура anonym.legal. Розташований у Фалькенштайні, Саксонія (центр обробки даних fsn1) з сертифікацією ISO 27001. Обрано для резидентства даних ЄС, позиції відповідності та юрисдикції, дружньої до GDPR, відповідно до німецького законодавства.

#hetzner

HIPAA

Закон про портативність і підзвітність медичного страхування

Відповідність та регуляції

Федеральний закон США, що встановлює стандарти для захисту чутливої інформації про здоров'я пацієнтів. Правило конфіденційності регулює використання PHI; Правило безпеки вимагає адміністративних, фізичних і технічних заходів захисту для електронної PHI (ePHI). Порушення тягне за собою штрафи до 1,9 мільйона доларів США за категорію на рік.

#hipaa

HIPAA Safe Harbor

Метод деідентифікації HIPAA Safe Harbor

Відповідність та регуляції

Один з двох методів деідентифікації, затверджених HIPAA, що вимагає видалення всіх 18 зазначених ідентифікаторів пацієнтів (ім'я, адреса, дати, номери телефонів, SSN, електронна пошта, IP-адреса, біометричні дані тощо), щоб зробити медичні дані неіндивідуально ідентифікованими.

#hipaasafeharbor

HSTS

HTTP Сувора безпека транспорту

Шифрування та безпека

Механізм політики веб-безпеки, що примушує браузери використовувати лише HTTPS-з'єднання. anonym.legal встановлює Strict-Transport-Security: max-age=31536000; includeSubDomains для запобігання атакам зниження протоколу та викрадення куків.

#hsts

I

ISO 27001

ISO/IEC 27001 Управління інформаційною безпекою

Відповідність та регуляції

Міжнародний стандарт для систем управління інформаційною безпекою (ISMS). Сертифікація вимагає документально оформлених політик, оцінок ризиків і контролів. Європейські сервери anonym.legal сертифіковані за стандартом ISO 27001, що забезпечує структуроване управління безпекою.

#iso27001

ISO 27001 SoA

Заява про застосування

Відповідність та регуляції

Обов'язковий документ ISO 27001, що містить усі контролі Додатку A, вказуючи, які з них застосовуються до організації, і надаючи обґрунтування для включень і виключень. Необхідний для сертифікації та аудитів.

#iso27001soa

J

JWT

JSON Web Token

Шифрування та безпека

Компактний, безпечний для URL формат токена, що використовується для передачі заяв між сторонами. anonym.legal використовує JWT, підписані за допомогою HS256 для внутрішньої аутентифікації сервісів (наприклад, фронтенд → API Presidio). Токени мають короткий термін дії та перевіряються на стороні сервера.

#jwt

K

KEK

Ключ шифрування ключа

Шифрування та безпека

Ключ, що використовується для шифрування інших ключів, а не безпосередньо даних. У архітектурі ZK anonym.legal ключ, отриманий з пароля користувача, діє як KEK для захисту ключів шифрування на документ, що зберігаються в зашифрованому сховищі.

#kek

M

MCP

Протокол Модульного Контексту

Платформа та продукти

Відкритий протокол від Anthropic, що дозволяє AI моделям взаємодіяти з зовнішніми інструментами та джерелами даних у стандартизований спосіб. anonym.legal реалізує MCP Server, щоб AI кодувальні інструменти могли викликати анонімізацію, не виходячи зі свого робочого процесу.

#mcp

MCP Server

Сервер Модульного Контексту Протоколу

Платформа та продукти

Інтеграція MCP Server від anonym.legal дозволяє AI кодувальним асистентам (Claude Desktop, Cursor, VS Code Copilot) безпосередньо викликати API анонімізації як інструмент. PII видаляється з коду, запитів та контексту перед відправкою до AI моделі.

#mcpserver

ML Models

Моделі Машинного Навчання для Виявлення PII

Технології виявлення

Статистичні моделі, навчальні на маркованих текстових корпусах для розпізнавання PII в контексті. anonym.legal використовує як трансформерні конвеєри spaCy, так і тонко налаштовану XLM-RoBERTa для багатомовного розпізнавання об'єктів у виробничих масштабах.

#mlmodels

N

NER

Розпізнавання Іменованих Об'єктів

Технології виявлення

Завдання обробки природної мови, яке ідентифікує та класифікує іменовані об'єкти в тексті за попередньо визначеними категоріями, такими як особи, організації, локації, дати та медичні ідентифікатори. Основна технологія машинного навчання, що забезпечує виявлення PII в anonym.legal.

#ner

NIS2

Директива ЄС про безпеку мереж і інформації 2

Відповідність та регуляції

Директива ЄС 2022/2555, що розширює початкову директиву NIS, охоплюючи більше секторів (охорона здоров'я, енергетика, транспорт, цифрова інфраструктура) та зміцнюючи вимоги до кібербезпеки. Термін імплементації закінчився 17 жовтня 2024 року; більшість держав-членів ЄС не встигли, і Європейська комісія відкрила провадження проти держав, які не виконали вимоги.

#nis2

NLP

Обробка Природної Мови

Технології виявлення

Галузь штучного інтелекту, що стосується взаємодії між комп'ютерами та людською мовою. У виявленні PII моделі NLP розуміють контекст, граматику та семантику для ідентифікації об'єктів, які шаблони regex можуть пропустити.

#nlp

O

Office Add-in

анонім.легал Microsoft Office Add-in

Платформа та продукти

Розширення Microsoft Office, яке інтегрує анонімізацію PII безпосередньо у Word, Excel та PowerPoint. Підтримує редагування в документі, управління пресетами, ZK Auth та синхронізацію між пристроями. Доступно в Microsoft AppSource.

#officeaddin

P

PCI DSS

Стандарт безпеки даних платіжної картки

Відповідність та регуляції

Стандарт безпеки для організацій, що обробляють дані платіжних карток, підтримуваний Радою стандартів безпеки PCI. Вимагає шифрування, контролю доступу, ведення журналів і регулярного тестування. Недотримання може призвести до штрафів і втрати привілеїв обробки карток.

#pcidss

PHI

Захищена медична інформація

Конфіденційність даних та PII

Будь-яка інформація, пов'язана зі здоров'ям, що стосується ідентифікованої особи, регулюється HIPAA в США. Включає діагнози, записи про лікування, дані про страхування та будь-які з 18 ідентифікаторів безпеки HIPAA.

#phi

PII

Особисто ідентифікована інформація

Конфіденційність даних та PII

Будь-які дані, які можуть безпосередньо або в поєднанні з іншими даними ідентифікувати конкретну особу. Приклади: імена, електронні адреси, номери соціального страхування, IP-адреси, біометричні записи.

#pii

Presidio

Microsoft Presidio

Технології виявлення

SDK для захисту даних та анонімізації з відкритим кодом від Microsoft. Двигун виявлення anonym.legal побудований на аналізаторі та анонімізаторі Presidio, розширеному на 285+ користувацьких розпізнавачів об'єктів на 48 мовах.

#presidio

Presidio Analyzer

Служба аналізу Microsoft Presidio

Інфраструктура

Компонент виявлення бекенду anonym.legal (порт 8011). Приймає текст і повертає список виявлених сутностей PII з їхніми позиціями, типами та балами впевненості. Розширено на понад 285 користувацьких розпізнавачів на 48 мовах.

#presidioanalyzer

Presidio Anonymizer

Служба анонімізації Microsoft Presidio

Інфраструктура

Компонент трансформації бекенду anonym.legal (порт 8012). Приймає текст та результати аналізу як вхідні дані, застосовує вибраний оператор (REPLACE, REDACT, MASK, HASH, ENCRYPT) до кожної виявленої сутності та повертає анонімізований текст.

#presidioanonymizer

R

Regex

Відповідність Шаблонам Регулярних Виразів

Технології виявлення

Відповідність тексту на основі шаблонів з використанням синтаксису формальної мови. У виявленні PII regex обробляє структурно передбачувані ідентифікатори (номери телефонів, кредитні картки, IBAN, електронні адреси) з валідацією контрольних сум. Доповнює NER для гібридного виявлення.

#regex

REST API

RESTful API

Інфраструктура

anonym.legal надає RESTful HTTP API для програмної інтеграції. Точки доступу включають /api/analyze, /api/anonymize, /api/image та /api/structured. Аутентифікація через JWT bearer tokens. Повна документація OpenAPI доступна в API Reference.

#restapi

S

SCCs

Стандартні контрактні положення

Відповідність та регуляції

Попередньо затверджені положення контракту, що відповідають вимогам GDPR для передачі особистих даних з ЄС/ЄЕП до третіх країн. Оновлені Європейською комісією у 2021 році (2021/914/EU) для врахування вимог Schrems II, включаючи оцінку впливу передачі.

#sccs

Schrems II

Рішення Schrems II (C-311/18)

Відповідність та регуляції

Рішення Суду ЄС 2020 року, яке визнало недійсною рамку EU-US Privacy Shield для трансатлантичних передач даних, посилаючись на недостатній захист законодавства США щодо нагляду. Вимагає додаткових заходів (шифрування, анонімізація) при використанні стандартних контрактних положень.

#schremsii

SHA-256

Алгоритм безпечного хешування 256-бітний

Шифрування та безпека

Криптографічна хеш-функція, що генерує 256-бітний дайджест. Використовується в anonym.legal для HMAC-аутентифікації API запитів, доказів ZK auth та послідовної псевдонімізації сутностей (хешування з сіллю забезпечує однакову заміну для одного й того ж оригінального значення).

#sha256

spaCy

Бібліотека NLP spaCy

Технології виявлення

Потужна бібліотека NLP з відкритим кодом на Python. anonym.legal використовує трансформерні моделі spaCy для 24 мов (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko та інші) для розпізнавання іменованих об'єктів у конвеєрі Presidio.

#spacy

Stanza

Бібліотека NLP Stanza (Stanford NLP)

Технології виявлення

Інструментарій NLP групи Stanford, що підтримує 70+ мов з використанням сучасних нейронних моделей. Використовується як додатковий бекенд NER в anonym.legal для мов, не охоплених моделями spaCy.

#stanza

T

TLS

Безпека транспортного рівня

Шифрування та безпека

Криптографічний протокол, що забезпечує безпеку даних під час передачі. anonym.legal вимагає мінімум TLS 1.2 з перевагою TLS 1.3, HSTS з максимальним терміном дії один рік та HTTP/2. Весь трафік між клієнтами та сервером шифрується під час передачі.

#tls

X

XChaCha20

XChaCha20-Poly1305

Шифрування та безпека

Алгоритм аутентифікованого шифрування, що забезпечує високу продуктивність на системах без апаратного прискорення AES. Використовує 192-бітний nonce (розширений з 96-бітного nonce стандарту IETF ChaCha20 відповідно до RFC 8439), усуваючи ризики колізії nonce. Використовується як альтернативний шифр у шарі шифрування anonym.legal.

#xchacha20

XLM-RoBERTa

Крос-мовна RoBERTa

Технології виявлення

Багатомовна трансформерна мовна модель, навчена на 100 мовах, розроблена Meta AI. Використовується в anonym.legal для крос-мовних завдань NER, особливо для типів об'єктів та мов, де монолінгвальні моделі недоступні.

#xlmroberta

Z

ZK Auth

Аутентифікація нульового знання

Шифрування та безпека

Система аутентифікації anonym.legal, де ключі шифрування отримуються на стороні клієнта з пароля користувача за допомогою Argon2id, ніколи не передаються на сервер або не зберігаються на ньому. Сервер зберігає лише криптографічний доказ, а не ключ або пароль.

#zkauth

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

We follow these rules

GDPR (EU 2016/679).
ISO/IEC 27001:2022.
NIS2 (EU 2022/2555).
HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our company HQ is in Saarbrücken, Germany. Our servers run in Hetzner's Falkenstein datacenter.

Hetzner holds ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

We never sell your information to third parties.
We never train models on what you upload.
We never keep your work after you delete it.
We never share keys with any outside firm.
We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.