Глосарій конфіденційності та технологій
Визначення всіх термінів, абревіатур та концепцій, що використовуються в анонімізації PII та конфіденційності даних.
Назад до документів94 терміни
2
2FA
Двофакторна аутентифікація
Аутентифікація, що вимагає двох різних факторів перевірки: щось, що знає користувач (пароль), і щось, що має користувач (додаток TOTP, апаратний ключ) або є (біометричні дані). Підтримується в anonym.legal як додатковий рівень поверх ZK Auth.
#twofaА
Анонімізація
Анонімізація даних
Безповоротний процес видалення або перетворення ідентифікаційної інформації так, щоб особи більше не могли бути ідентифіковані, безпосередньо або опосередковано. Відповідно до GDPR, дійсно анонімізовані дані виходять за межі регулювання.
#anonymizationАудиторський слід
Незмінний аудиторський слід
Послідовний, доказовий журнал, що фіксує, хто отримував доступ, модифікував або обробляв дані і коли. Вимагається ISO 27001 (A.8.15), Правилом безпеки HIPAA (§164.312(b)) та правилами електронного виявлення. anonym.legal реєструє всі операції анонімізації з часовими мітками, кількістю сутностей та ідентифікаторами операторів.
#audittrailВ
Веб-додаток
анонім.легал Веб-додаток
Браузерний інтерфейс на anonym.legal для аналізу, анонімізації та розшифрування PII. Підтримує текстовий ввід, завантаження файлів (PDF, DOCX, TXT), пакетну обробку, ZK Auth, 48 мов та 285+ типів сутностей. Встановлення не потрібне.
#webappВиявлення Мови
Автоматичне Виявлення Мови
Автоматична ідентифікація мови вхідного тексту перед аналізом PII. anonym.legal виявляє мову на рівні запиту та маршрутизує до відповідної конвеєрної моделі NER, з англійською як резервною для мов, які не підтримуються.
#languagedetectionГ
Гібридне Виявлення
Гібридне Виявлення NLP + Regex + ML
Триступеневий підхід anonym.legal: шаблони regex для структурованих PII (номери телефонів, IBAN, кредитні картки), моделі NLP/NER для контекстуальних об'єктів (імена, організації, локації) та класифікатори ML для неоднозначних випадків. Зменшує як хибнопозитивні, так і хибнонегативні результати.
#hybriddetectionД
Деанонімізація
Атака повторної ідентифікації
Процес повторної ідентифікації осіб з нібито анонімізованих наборів даних шляхом перехресного посилання з допоміжною інформацією. Основний ризик при обміні даними з недостатньою глибиною анонімізації.
#deanonymizationДесктопний додаток
анонім.легал Десктопний додаток
Кросплатформений додаток (Windows, macOS, Linux), створений за допомогою Tauri 2.0 та React 18. Має можливість локальної обробки файлів, сховища BIP39 для офлайн ZK Auth, пакетного експорту та синхронізації API. Підтримує розгортання без підключення до Інтернету.
#desktopappДиференційна конфіденційність
Диференційна конфіденційність (DP)
Математична структура для публікації статистичної інформації про набори даних, забезпечуючи доказові гарантії, що дані будь-якої особи не можуть бути відрізнені. Використовується в агрегатній аналітиці для запобігання повторній ідентифікації навіть при запитах до агрегованих виходів.
#differentialprivacyЗ
Захищеність
Юридично захищена анонімізація
Здатність продемонструвати регуляторам, судам або аудиторам, що анонімізація була виконана за допомогою документованої, послідовної та технічно обґрунтованої методології. Аудиторські журнали anonym.legal, бали впевненості та налаштування операторів підтримують захищені робочі процеси анонімізації.
#defensibilityІ
Ідентифікатори страхування
Типи сутностей страхування
Типи сутностей для ідентифікаторів, пов'язаних зі страхуванням: US_NPI (Національний ідентифікатор постачальника для постачальників медичних послуг), HEALTHCARE_PLAN_BENEFICIARY та специфічні для країн номери медичного страхування (наприклад, DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersІдентифікатори транспортних засобів
Типи сутностей транспортних засобів
Типи сутностей для ідентифікаторів, пов'язаних з транспортними засобами: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (номер ідентифікації транспортного засобу) та специфічні для країн формати номерних знаків транспортних засобів.
#vehicleidentifiersК
Кодове Перемикання
Багатомовне Кодове Перемикання
Феномен змішування двох або більше мов у межах одного тексту або розмови. Поширене в багатомовних документах (наприклад, німецькі юридичні документи з англійськими технічними термінами). Гібридне виявлення anonym.legal обробляє текст з кодовим перемиканням, застосовуючи кілька мовних моделей одночасно.
#codeswitchingКонфіденційність за дизайном
Конфіденційність за дизайном та за замовчуванням
Принцип, передбачений статтею 25 GDPR, що заходи захисту даних вбудовуються в системи з самого початку, а не додаються як післядумка. Охоплює мінімізацію даних, контроль доступу, шифрування та псевдонімізацію на рівні архітектури.
#privacybydesignКористувацькі сутності
Визначники користувацьких сутностей
Шаблони PII, визначені користувачем, додані до вбудованих 285+ типів сутностей anonym.legal. Підтримує regex шаблони, списки слів та списки заборонених. Корисно для ідентифікаторів, специфічних для організації, таких як ID співробітників, внутрішні коди проектів або торгові назви продуктів.
#customentitiesМ
Маскування
Маскування даних
Замінювання чутливих значень реалістичними, але вигаданими даними, які зберігають формат і структуру. Використовується для тестових середовищ, аналітики та обміну наборами даних без розкриття реальної PII.
#maskingМінімізація даних
Принцип мінімізації даних GDPR
Принцип статті 5(1)(c) GDPR, який вимагає, щоб збиралися та оброблялися лише дані, які є адекватними, релевантними та необхідними для визначеної мети. Основне обмеження дизайну для систем, що відповідають вимогам конфіденційності.
#dataminimizationН
Надмірне редагування
Надмірне редагування (помилкові позитиви)
Видалення більшої кількості інформації, ніж необхідно, що знижує корисність документа та потенційно становить споліацію в юридичних процедурах. Викликане низькими порогами впевненості або надто широким вибором сутностей. Налаштовується через пороги та контролі сутностей anonym.legal.
#overredactionНедостатнє редагування
Недостатнє редагування (помилкові негативи)
Невиконання видалення всіх PII, що залишає осіб уразливими в спільних документах. Більш поширений ризик відповідності. Викликане високими порогами впевненості, відсутніми типами сутностей або новими форматами PII. Пом'якшується за допомогою гібридного виявлення та підтримки користувацьких сутностей anonym.legal.
#underredactionНульове знання
Архітектура нульового знання
Дизайн системи, в якій постачальник послуг не має доступу до відкритих даних користувачів або ключів шифрування. Весь процес шифрування/дешифрування відбувається на стороні клієнта; сервер ніколи не бачить оригінальний вміст. Запобігає загрозам зсередини та примусовому розкриттю.
#zeroknowledgeО
Обмеження швидкості
Обмеження швидкості API
Контроль кількості запитів API, які клієнт може зробити протягом певного часу. Запобігає зловживанням та забезпечує справедливий розподіл ресурсів. anonym.legal застосовує обмеження швидкості для кожного користувача на основі рівня плану, з рекомендованим експоненційним зниженням для логіки повторних спроб.
#ratelimitingОператори
Оператори анонімізації
Стратегія заміщення, яка застосовується до виявленого PII. anonym.legal підтримує REPLACE (текст-заповнювач), REDACT (порожній рядок), MASK (зірочки), HASH (SHA-256 дайджест), ENCRYPT (обертовий AES-256-GCM) та CUSTOM (заміщення, визначене користувачем).
#operatorsОхорона здоров'я сутності
Типи сутностей PII в охороні здоров'я
Типи сутностей для 18 ідентифікаторів HIPAA Safe Harbor та додаткової інформації про здоров'я: US_MRN (номери медичних записів), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY та сутності контексту діагностики/лікування.
#healthcareentitiesОцінка Достовірності
Оцінка Достовірності Виявлення Об'єктів
Оцінка від 0 до 1, що вказує, наскільки впевнений модель виявлення, що текстовий фрагмент є об'єктом PII. anonym.legal пропонує налаштовувані пороги достовірності, щоб користувачі могли налаштувати компроміс між точністю та відгуком для своїх конкретних випадків використання.
#confidencescoringП
Пакетна обробка
Анонімізація пакетних файлів
Обробка кількох файлів одночасно в одній операції. Пакетний режим anonym.legal підтримує файли PDF, DOCX та TXT з конфігурацією сутностей для кожного файлу, порогами впевненості та вибором формату виходу.
#batchprocessingПравило 26
Федеральні правила цивільного процесу Правило 26
Правило цивільного процесу США, що регулює зобов'язання щодо виявлення. Правило 26(g) вимагає від адвокатів сертифікувати, що запити на виявлення та розкриття не робляться з неналежними цілями — включаючи невдале редагування PII з вироблених документів.
#rule26Пресети
Пресети анонімізації
Збережені конфігурації вибраних типів сутностей, порогів впевненості та параметрів виходу, які можна застосувати одним клацанням. Пресети синхронізуються між Веб-додатком, Office Add-in та Десктопним додатком через зашифроване хмарне сховище.
#presetsПривілей адвоката-клієнта
Захист привілею адвоката-клієнта
Юридичний захист конфіденційних комунікацій між адвокатами та клієнтами. У перегляді документів та електронному виявленні привілейований контент повинен бути ідентифікований та утриманий або редагований. Користувацькі типи сутностей в anonym.legal можуть бути налаштовані для позначення маркерів привілейованого контенту.
#attorneyclientprivilegeПсевдонімізація
Псевдонімізація даних
Замінювання прямих ідентифікаторів штучними значеннями (псевдонімами) зберігаючи можливість повторної ідентифікації осіб за допомогою окремого ключа. Стаття 4(5) GDPR визнає це як техніку, що підвищує конфіденційність, але не звільняє псевдонімізовані дані від регулювання.
#pseudonymizationР
Редагування
Редагування даних
Постійне видалення або затемнення чутливої інформації з документів, заміна її візуальним маркером, таким як [ВИДАЛЕНО] або чорна смуга. На відміну від шифрування, редагування є одностороннім, і оригінальні дані не можуть бути відновлені.
#redactionРедактор зображень
Служба редагування зображень Presidio
Спеціалізована служба бекенду (порт 8013), яка виявляє та редагує PII з файлів зображень (PNG, JPEG) за допомогою OCR та аналізу Presidio. Застосовує редагування чорними смугами над виявленими областями PII в оригінальному зображенні.
#presidioimageredactorРезиденція даних
Вимоги до резиденції даних
Юридичні або контрактні вимоги, що визначають, в якому географічному місці дані повинні зберігатися та оброблятися. Важливі для GDPR (передача даних за межі ЄЕП), німецького BDSG та галузевих регуляцій у сфері охорони здоров'я та фінансів.
#dataresidencyРезиденція даних ЄС
Резиденція даних Європейського Союзу
Гарантія того, що дані зберігаються та обробляються виключно на території ЄС/ЄЕП. Виробничі сервери anonym.legal знаходяться в Німеччині (Hetzner Frankfurt), що забезпечує обробку під юрисдикцією GDPR без наслідків для трансферу даних через кордон.
#eudataresidencyРозширення Chrome
анонім.легал Розширення Chrome
Розширення браузера (Manifest V3), яке перехоплює текст перед його відправкою до AI чат-ботів (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Анонімізує на льоту та за бажанням розшифровує відповіді AI, використовуючи збережені ключі шифрування.
#chromeextensionС
Споліація
Споліація доказів
Знищення, зміна або невиконання збереження доказів, що мають відношення до судового розгляду. Надмірне редагування, яке робить документи нечитаємими, може становити споліацію. Калібрування точності анонімізації (пороги впевненості, вибір сутностей) важливе для юридично захищеного редагування.
#spoliationСуверенітет даних
Цифровий суверенітет даних
Принцип, згідно з яким дані підлягають законам і структурами управління країни, в якій вони були зібрані. Ширший, ніж резиденція даних, він охоплює контроль над тим, хто може отримати доступ до даних і в рамках якої юридичної системи.
#datasovereigntyСховище
Сховище ключів шифрування
Безпечне локальне сховище для ключів шифрування в Десктопному додатку, захищене методом похідного ключа Argon2id з головної фрази. Ключі зберігаються в зашифрованому вигляді за допомогою AES-256-GCM та резервуються за допомогою мнемонічних фраз BIP39.
#vaultТ
Тип сутності
Тип сутності PII
Категорія особистої інформації, яку система виявлення розпізнає та може анонімізувати. Приклади: ОСОБА, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal підтримує понад 285 типів сутностей на 48 мовах.
#entitytypeТокенізація
Токенізація даних
Замінювання чутливих даних на нечутливий заповнювач (токен), який відображається назад до оригіналу в безпечному сховищі. На відміну від шифрування, сам токен не має математичного зв'язку з оригінальними даними.
#tokenizationТокенна система
анонім.легал Система кредитних токенів
Оплата на основі використання, де виклики API споживають токени, розраховані з урахуванням довжини тексту, кількості сутностей та режиму обробки (аналізувати чи анонімізувати). Вартість токенів налаштовується в базі даних і відображається в реальному часі перед обробкою.
#tokensystemУ
Універсальні сутності
Типи сутностей, універсальні для мов
Типи сутностей, які виявляються незалежно від мови тексту, зазвичай через регулярні вирази на основі формату з перевіркою контрольної суми. Приклади: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO адреса.
#universalentitiesУрядовий ID
Типи ідентифікаторів, виданих урядом
Типи сутностей для національних та урядових ідентифікаторів: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE та понад 50 інших специфічних для країн форматів ID. Виявляються за допомогою специфічних для країни регулярних виразів + шаблонів контрольних сум.
#governmentidФ
Фінансові сутності
Типи фінансових сутностей PII
Типи сутностей, що охоплюють фінансові ідентифікатори: CREDIT_CARD (контрольна сума Луна), IBAN_CODE (контрольна сума ISO 13616), SWIFT_CODE (формат BIC), US_BANK_NUMBER, NRP (іспанський податковий номер). Виявляються з перевіркою контрольної суми для мінімізації помилкових позитивів.
#financialentitiesХ
Хешування
Криптографічне хешування
Одностороннє перетворення даних у фіксовану довжину дайджесту за допомогою алгоритмів, таких як SHA-256. Використовується для послідовної псевдонімізації, дедуплікації та перевірки цілісності. Хеш-значення не можуть бути повернені, але можуть бути вразливими до атак за допомогою таблиць райдуг, якщо не підсолюються.
#hashingЦ
Цифрові ідентифікатори
Типи цифрових ідентичностей
Типи сутностей для онлайн- та цифрових ідентифікаторів: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 та IPv6), URL, DOMAIN_NAME, CRYPTO (адреси Bitcoin/Ethereum) та специфічні для платформ ідентифікатори.
#digitalidentifiersA
AES-256-GCM
Стандарт шифрування AES 256-бітний Galois/Counter Mode
Алгоритм аутентифікованого шифрування, що поєднує AES-256 (256-бітний ключ) з Galois/Counter Mode для забезпечення конфіденційності та цілісності. Використовується в оборотному анонімізації anonym.legal для шифрування замінених сутностей. Забезпечує як секретність, так і виявлення підробок.
#aes256gcmArgon2id
Функція похідної ключа Argon2id
Переможець конкурсу з хешування паролів 2015 року. Argon2id поєднує стійкість до атак з боку каналу Argon2i та стійкість до GPU Argon2d. Використовується в anonym.legal та в сховищі настільного додатку для отримання ключів шифрування з паролів користувачів.
#argon2idB
BIP39
Пропозиція щодо покращення Bitcoin 39 — Мнемонічні фрази
Стандарт для генерації зрозумілих для людини мнемонічних фраз-насіння (12–24 слова) з криптографічного насіння. Використовується в сховищі настільного додатку anonym.legal як зручний резервний варіант для ключа шифрування, отриманого з Argon2id.
#bip39C
CCPA
Закон Каліфорнії про конфіденційність споживачів
Закон Каліфорнії про конфіденційність, що надає резидентам право знати, видаляти та відмовлятися від продажу своїх особистих даних. Застосовується до бізнесу, що відповідає критеріям доходу, обсягу даних або порогам продажу даних. Значно змінений CPRA (прийнятий у листопаді 2020 року, набирає чинності в січні 2023 року).
#ccpaCLOUD Act
Закон про законне використання даних за кордоном
Федеральний закон США (2018), що дозволяє правоохоронним органам США зобов'язувати постачальників хмарних послуг, що базуються в США, надавати дані, що зберігаються за кордоном. Конфліктує з правилами передачі даних GDPR для резидентів ЄС. Анонімізація даних перед завантаженням у хмару є поширеним заходом пом'якшення.
#cloudactCSP
Політика безпеки контенту
Механізм заголовка HTTP-відповіді та мета-тегу, що обмежує, які ресурси (скрипти, стилі, зображення) може завантажити браузер. CSP anonym.legal включає object-src 'none', script-src з nonce та upgrade-insecure-requests для запобігання атакам XSS.
#cspD
DDoS захист
Захист від розподілених атак відмови в обслуговуванні
Інфраструктурні засоби захисту від розподілених атак відмови в обслуговуванні. Інфраструктура серверів anonym.legal включає правила брандмауера (UFW), обмеження з'єднань nginx та захисти, еквівалентні Cloudflare, для підтримки доступності.
#ddosprotectionDLP
Запобігання Втраті Даних
Дисципліна безпеки та категорія програмних інструментів, які виявляють і запобігають несанкціонованій передачі чутливих даних за межі організації. anonym.legal функціонує як рішення DLP для PII на рівні браузера та AI.
#dlpDPA
Договір на обробку даних
Юридично обов'язковий контракт між контролером даних і процесором даних, що вимагається статтею 28 GDPR. Визначає предмет, тривалість, характер, мету та тип обробки особистих даних, а також права та обов'язки обох сторін.
#dpaDPIA
Оцінка впливу на захист даних
Процес оцінки ризиків, що вимагається статтею 35 GDPR для діяльності з обробки, яка, ймовірно, призведе до високих ризиків для прав і свобод осіб. Обов'язковий для систематичного профілювання, обробки PHI в великих обсягах і спостереження в публічних місцях.
#dpiaE
e-Discovery
Електронне виявлення
Процес ідентифікації, збору та виробництва електронно збереженої інформації в юридичних процедурах. Вимагає редагування PII та привілейованої інформації з вироблених документів. Основний випадок використання для юридичних відділів, що використовують anonym.legal.
#ediscoveryE2EE
Шифрування з кінця в кінець
Шифрування, при якому лише сторони, що спілкуються, можуть читати повідомлення; постачальник послуг не має доступу до відкритого тексту. У режимі ZK Auth anonym.legal ключі шифрування ніколи не залишають пристрій клієнта, досягаючи E2EE для зберігання анонімізованого виходу.
#e2eeF
FOIA
Закон про свободу інформації
Федеральний закон США (та еквівалентні статути в інших юрисдикціях), що надає публічний доступ до урядових записів. Вимагає редагування PII та іншої інформації, що підлягає виключенню, перед розкриттям — основний випадок використання для юридичних та урядових робочих процесів анонімізації.
#foiaG
GDPR
Загальний регламент захисту даних
Регламент ЄС 2016/679, основна рамка захисту даних для Європейського Союзу. Застосовується до будь-якої організації, яка обробляє особисті дані резидентів ЄС. Штрафи до 20 мільйонів євро або 4% світового річного доходу. Основні права: доступ, видалення, портативність, обмеження, заперечення.
#gdprGDPR Article 25
GDPR Article 25 — Захист даних за замовчуванням та за дизайном
Вимагає від контролерів впровадження відповідних технічних та організаційних заходів (таких як псевдонімізація та мінімізація даних) як під час проектування системи, так і за замовчуванням під час обробки.
#gdprarticle25GDPR Article 32
GDPR Article 32 — Безпека обробки
Вимагає від контролерів та процесорів впровадження відповідних технічних та організаційних заходів для забезпечення рівня безпеки, що відповідає ризику, включаючи шифрування, псевдонімізацію, конфіденційність, цілісність, доступність та стійкість систем обробки.
#gdprarticle32GenAI DLP
Запобігання Втраті Даних Генеративного AI
Спеціалізована категорія DLP, зосереджена на запобіганні включенню PII та конфіденційних даних у запити, що надсилаються до генеративних AI моделей (ChatGPT, Claude, Gemini). Розширення Chrome та MCP Server від anonym.legal вирішують цей ризик на етапі вводу.
#genaidlpH
Hetzner
Hetzner Online GmbH
Німецький постачальник хмарних послуг та хостингу, де працює виробнича інфраструктура anonym.legal. Розташований у Фалькенштайні, Саксонія (центр обробки даних fsn1) з сертифікацією ISO 27001. Обрано для резидентства даних ЄС, позиції відповідності та юрисдикції, дружньої до GDPR, відповідно до німецького законодавства.
#hetznerHIPAA
Закон про портативність і підзвітність медичного страхування
Федеральний закон США, що встановлює стандарти для захисту чутливої інформації про здоров'я пацієнтів. Правило конфіденційності регулює використання PHI; Правило безпеки вимагає адміністративних, фізичних і технічних заходів захисту для електронної PHI (ePHI). Порушення тягне за собою штрафи до 1,9 мільйона доларів США за категорію на рік.
#hipaaHIPAA Safe Harbor
Метод деідентифікації HIPAA Safe Harbor
Один з двох методів деідентифікації, затверджених HIPAA, що вимагає видалення всіх 18 зазначених ідентифікаторів пацієнтів (ім'я, адреса, дати, номери телефонів, SSN, електронна пошта, IP-адреса, біометричні дані тощо), щоб зробити медичні дані неіндивідуально ідентифікованими.
#hipaasafeharborHSTS
HTTP Сувора безпека транспорту
Механізм політики веб-безпеки, що примушує браузери використовувати лише HTTPS-з'єднання. anonym.legal встановлює Strict-Transport-Security: max-age=31536000; includeSubDomains для запобігання атакам зниження протоколу та викрадення куків.
#hstsI
ISO 27001
ISO/IEC 27001 Управління інформаційною безпекою
Міжнародний стандарт для систем управління інформаційною безпекою (ISMS). Сертифікація вимагає документально оформлених політик, оцінок ризиків і контролів. Європейські сервери anonym.legal сертифіковані за стандартом ISO 27001, що забезпечує структуроване управління безпекою.
#iso27001ISO 27001 SoA
Заява про застосування
Обов'язковий документ ISO 27001, що містить усі контролі Додатку A, вказуючи, які з них застосовуються до організації, і надаючи обґрунтування для включень і виключень. Необхідний для сертифікації та аудитів.
#iso27001soaJ
JWT
JSON Web Token
Компактний, безпечний для URL формат токена, що використовується для передачі заяв між сторонами. anonym.legal використовує JWT, підписані за допомогою HS256 для внутрішньої аутентифікації сервісів (наприклад, фронтенд → API Presidio). Токени мають короткий термін дії та перевіряються на стороні сервера.
#jwtK
KEK
Ключ шифрування ключа
Ключ, що використовується для шифрування інших ключів, а не безпосередньо даних. У архітектурі ZK anonym.legal ключ, отриманий з пароля користувача, діє як KEK для захисту ключів шифрування на документ, що зберігаються в зашифрованому сховищі.
#kekM
MCP
Протокол Модульного Контексту
Відкритий протокол від Anthropic, що дозволяє AI моделям взаємодіяти з зовнішніми інструментами та джерелами даних у стандартизований спосіб. anonym.legal реалізує MCP Server, щоб AI кодувальні інструменти могли викликати анонімізацію, не виходячи зі свого робочого процесу.
#mcpMCP Server
Сервер Модульного Контексту Протоколу
Інтеграція MCP Server від anonym.legal дозволяє AI кодувальним асистентам (Claude Desktop, Cursor, VS Code Copilot) безпосередньо викликати API анонімізації як інструмент. PII видаляється з коду, запитів та контексту перед відправкою до AI моделі.
#mcpserverML Models
Моделі Машинного Навчання для Виявлення PII
Статистичні моделі, навчальні на маркованих текстових корпусах для розпізнавання PII в контексті. anonym.legal використовує як трансформерні конвеєри spaCy, так і тонко налаштовану XLM-RoBERTa для багатомовного розпізнавання об'єктів у виробничих масштабах.
#mlmodelsN
NER
Розпізнавання Іменованих Об'єктів
Завдання обробки природної мови, яке ідентифікує та класифікує іменовані об'єкти в тексті за попередньо визначеними категоріями, такими як особи, організації, локації, дати та медичні ідентифікатори. Основна технологія машинного навчання, що забезпечує виявлення PII в anonym.legal.
#nerNIS2
Директива ЄС про безпеку мереж і інформації 2
Директива ЄС 2022/2555, що розширює початкову директиву NIS, охоплюючи більше секторів (охорона здоров'я, енергетика, транспорт, цифрова інфраструктура) та зміцнюючи вимоги до кібербезпеки. Термін імплементації закінчився 17 жовтня 2024 року; більшість держав-членів ЄС не встигли, і Європейська комісія відкрила провадження проти держав, які не виконали вимоги.
#nis2NLP
Обробка Природної Мови
Галузь штучного інтелекту, що стосується взаємодії між комп'ютерами та людською мовою. У виявленні PII моделі NLP розуміють контекст, граматику та семантику для ідентифікації об'єктів, які шаблони regex можуть пропустити.
#nlpO
Office Add-in
анонім.легал Microsoft Office Add-in
Розширення Microsoft Office, яке інтегрує анонімізацію PII безпосередньо у Word, Excel та PowerPoint. Підтримує редагування в документі, управління пресетами, ZK Auth та синхронізацію між пристроями. Доступно в Microsoft AppSource.
#officeaddinP
PCI DSS
Стандарт безпеки даних платіжної картки
Стандарт безпеки для організацій, що обробляють дані платіжних карток, підтримуваний Радою стандартів безпеки PCI. Вимагає шифрування, контролю доступу, ведення журналів і регулярного тестування. Недотримання може призвести до штрафів і втрати привілеїв обробки карток.
#pcidssPHI
Захищена медична інформація
Будь-яка інформація, пов'язана зі здоров'ям, що стосується ідентифікованої особи, регулюється HIPAA в США. Включає діагнози, записи про лікування, дані про страхування та будь-які з 18 ідентифікаторів безпеки HIPAA.
#phiPII
Особисто ідентифікована інформація
Будь-які дані, які можуть безпосередньо або в поєднанні з іншими даними ідентифікувати конкретну особу. Приклади: імена, електронні адреси, номери соціального страхування, IP-адреси, біометричні записи.
#piiPresidio
Microsoft Presidio
SDK для захисту даних та анонімізації з відкритим кодом від Microsoft. Двигун виявлення anonym.legal побудований на аналізаторі та анонімізаторі Presidio, розширеному на 285+ користувацьких розпізнавачів об'єктів на 48 мовах.
#presidioPresidio Analyzer
Служба аналізу Microsoft Presidio
Компонент виявлення бекенду anonym.legal (порт 8011). Приймає текст і повертає список виявлених сутностей PII з їхніми позиціями, типами та балами впевненості. Розширено на понад 285 користувацьких розпізнавачів на 48 мовах.
#presidioanalyzerPresidio Anonymizer
Служба анонімізації Microsoft Presidio
Компонент трансформації бекенду anonym.legal (порт 8012). Приймає текст та результати аналізу як вхідні дані, застосовує вибраний оператор (REPLACE, REDACT, MASK, HASH, ENCRYPT) до кожної виявленої сутності та повертає анонімізований текст.
#presidioanonymizerR
Regex
Відповідність Шаблонам Регулярних Виразів
Відповідність тексту на основі шаблонів з використанням синтаксису формальної мови. У виявленні PII regex обробляє структурно передбачувані ідентифікатори (номери телефонів, кредитні картки, IBAN, електронні адреси) з валідацією контрольних сум. Доповнює NER для гібридного виявлення.
#regexREST API
RESTful API
anonym.legal надає RESTful HTTP API для програмної інтеграції. Точки доступу включають /api/analyze, /api/anonymize, /api/image та /api/structured. Аутентифікація через JWT bearer tokens. Повна документація OpenAPI доступна в API Reference.
#restapiS
SCCs
Стандартні контрактні положення
Попередньо затверджені положення контракту, що відповідають вимогам GDPR для передачі особистих даних з ЄС/ЄЕП до третіх країн. Оновлені Європейською комісією у 2021 році (2021/914/EU) для врахування вимог Schrems II, включаючи оцінку впливу передачі.
#sccsSchrems II
Рішення Schrems II (C-311/18)
Рішення Суду ЄС 2020 року, яке визнало недійсною рамку EU-US Privacy Shield для трансатлантичних передач даних, посилаючись на недостатній захист законодавства США щодо нагляду. Вимагає додаткових заходів (шифрування, анонімізація) при використанні стандартних контрактних положень.
#schremsiiSHA-256
Алгоритм безпечного хешування 256-бітний
Криптографічна хеш-функція, що генерує 256-бітний дайджест. Використовується в anonym.legal для HMAC-аутентифікації API запитів, доказів ZK auth та послідовної псевдонімізації сутностей (хешування з сіллю забезпечує однакову заміну для одного й того ж оригінального значення).
#sha256spaCy
Бібліотека NLP spaCy
Потужна бібліотека NLP з відкритим кодом на Python. anonym.legal використовує трансформерні моделі spaCy для 24 мов (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko та інші) для розпізнавання іменованих об'єктів у конвеєрі Presidio.
#spacyStanza
Бібліотека NLP Stanza (Stanford NLP)
Інструментарій NLP групи Stanford, що підтримує 70+ мов з використанням сучасних нейронних моделей. Використовується як додатковий бекенд NER в anonym.legal для мов, не охоплених моделями spaCy.
#stanzaT
TLS
Безпека транспортного рівня
Криптографічний протокол, що забезпечує безпеку даних під час передачі. anonym.legal вимагає мінімум TLS 1.2 з перевагою TLS 1.3, HSTS з максимальним терміном дії один рік та HTTP/2. Весь трафік між клієнтами та сервером шифрується під час передачі.
#tlsX
XChaCha20
XChaCha20-Poly1305
Алгоритм аутентифікованого шифрування, що забезпечує високу продуктивність на системах без апаратного прискорення AES. Використовує 192-бітний nonce (розширений з 96-бітного nonce стандарту IETF ChaCha20 відповідно до RFC 8439), усуваючи ризики колізії nonce. Використовується як альтернативний шифр у шарі шифрування anonym.legal.
#xchacha20XLM-RoBERTa
Крос-мовна RoBERTa
Багатомовна трансформерна мовна модель, навчена на 100 мовах, розроблена Meta AI. Використовується в anonym.legal для крос-мовних завдань NER, особливо для типів об'єктів та мов, де монолінгвальні моделі недоступні.
#xlmrobertaZ
ZK Auth
Аутентифікація нульового знання
Система аутентифікації anonym.legal, де ключі шифрування отримуються на стороні клієнта з пароля користувача за допомогою Argon2id, ніколи не передаються на сервер або не зберігаються на ньому. Сервер зберігає лише криптографічний доказ, а не ключ або пароль.
#zkauth