Глосар на Поверителност и Технологии
Определения за всички термини, акроними и концепции, използвани в анонимизацията на PII и поверителността на данните.
Назад към Документите94 термини
2
2FA
Двуфакторна аутентификация
Аутентификация, изискваща два различни фактора за проверка: нещо, което потребителят знае (парола) и нещо, което потребителят има (TOTP приложение, хардуерен ключ) или е (биометрично). Поддържа се в anonym.legal като допълнителен слой над ZK Auth.
#twofaА
Анонимизация
Анонимизация на данни
Необратим процес на премахване или трансформиране на идентифицираща информация, така че индивидите вече да не могат да бъдат идентифицирани, директно или индиректно. Според GDPR, наистина анонимизираните данни попадат извън обхвата на регулацията.
#anonymizationАудитен след
Неизменяем аудитен след
Последователен, видим за манипулация лог, записващ кой е получил достъп, модифицирал или обработил данни и кога. Изисква се от ISO 27001 (A.8.15), HIPAA Security Rule (§164.312(b)) и правила за електронно откритие. anonym.legal записва всички операции по анонимизация с времеви печати, брой субекти и идентификатори на оператори.
#audittrailД
Де-анонимизация
Атака за повторна идентификация
Процесът на повторна идентификация на индивидите от предполагаемо анонимизирани набори от данни чрез кръстосано справяне с допълнителна информация. Основен риск при споделяне на данни с недостатъчна дълбочина на анонимизация.
#deanonymizationДесктоп приложение
anonym.legal Десктоп приложение
Кросплатформено приложение (Windows, macOS, Linux), изградена с Tauri 2.0 и React 18. Включва локална обработка на файлове, BIP39 хранилище за офлайн ZK Auth, партидно експортиране и API синхронизация. Поддържа изолирани внедрения без достъп до интернет.
#desktopappДиференциална конфиденциалност
Диференциална конфиденциалност (DP)
Математическа рамка за публикуване на статистическа информация за набори от данни, като се предоставят доказуеми гаранции, че данните на всеки индивид не могат да бъдат разграничени. Използва се в агрегатни анализи, за да се предотврати повторна идентификация дори при запитвания за агрегатни изходи.
#differentialprivacyДържавен идентификатор
Типове идентификатори, издадени от правителството
Типове субекти за национални и правителствени идентификатори: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE и 50+ други формати на идентификатори, специфични за страната. Откриват се с помощта на специфични за страната regex + шаблони за контролна сума.
#governmentidЗ
Защита
Правно защитима анонимизация
Способността да се демонстрира на регулатори, съдилища или одитори, че анонимизацията е извършена с документиран, последователен и технически обоснован метод. Аудитните журнали на anonym.legal, оценки на увереност и настройки на оператори подкрепят защитими работни потоци за анонимизация.
#defensibilityЗдравни субекти
Типове здравни субекти с лични данни
Типове субекти за 18 идентификатора, защитени от HIPAA Safe Harbor, и допълнителни свързани с здравето лични данни: US_MRN (номера на медицински досиета), МЕДИЦИНСКА_ЛИЦЕНЗИЯ, ЗДРАВЕН_ПЛАН_БЕНЕФИЦИЕНТ и субекти, свързани с диагноза/лечение.
#healthcareentitiesИ
Идентификатори на застраховки
Типове субекти на застраховки
Типове субекти за идентификатори, свързани със застраховки: US_NPI (Национален идентификатор на доставчика за здравни услуги), ЗДРАВЕН_ПЛАН_БЕНЕФИЦИЕНТ и номера на здравни застраховки, специфични за страната (напр. DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersИдентификатори на превозни средства
Типове субекти на превозни средства
Типове субекти за идентификатори, свързани с превозни средства: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (номер на идентификация на превозно средство) и формати на регистрационни номера, специфични за страната.
#vehicleidentifiersК
Конфиденциалност по дизайн
Конфиденциалност по дизайн и по подразбиране
Принцип, предвиден в член 25 на GDPR, че мерките за защита на данните са вградени в системите от самото начало, а не добавени след това. Включва минимизиране на данни, контрол на достъпа, криптиране и псевдонимизация на архитектурно ниво.
#privacybydesignМ
Маскиране
Маскиране на данни
Замяна на чувствителни стойности с реалистични, но фиктивни данни, които запазват формата и структурата. Използва се за тестови среди, анализи и споделяне на набори от данни, без да се разкрива реална PII.
#maskingМинимизиране на данни
Принцип на минимизиране на данни по GDPR
Принцип, посочен в член 5(1)(c) на GDPR, изискващ да се събират и обработват само данни, които са адекватни, релевантни и необходими за определената цел. Основно дизайнерско ограничение за системи, съвместими с конфиденциалността.
#dataminimizationН
Недостатъчна редакция
Недостатъчна редакция (фалшиви отрицателни)
Неспособност да се премахнат всички лични данни, оставяйки индивидите изложени в споделени документи. По-честият риск за съответствие. Причинена от високи прагове на увереност, липсващи типове субекти или нови формати на лични данни. Намалена от хибридното откритие и поддръжката на персонализирани субекти в anonym.legal.
#underredactionНулеви знания
Архитектура с нулеви знания
Дизайн на система, при който доставчикът на услуги няма достъп до оригиналните данни на потребителите или ключовете за криптиране. Всичкото криптиране/декриптиране се извършва на клиентската страна; сървърът никога не вижда оригиналното съдържание. Предотвратява заплахи от вътрешни лица и принудително разкриване.
#zeroknowledgeО
Ограничаване на скоростта
Ограничаване на скоростта на API
Контроли върху броя на API заявките, които клиентът може да направи в рамките на времеви прозорец. Предотвратява злоупотреба и осигурява справедливо разпределение на ресурсите. anonym.legal прилага ограничения на скоростта на потребителите на базата на ниво на план, с препоръчително експоненциално обратно забавяне за логиката на повторно опитване.
#ratelimitingОператори
Оператори за анонимизация
Стратегията за замяна, приложена към открития PII. anonym.legal поддържа REPLACE (текст на заместител), REDACT (празен низ), MASK (звездички), HASH (SHA-256 дайджест), ENCRYPT (обратимо AES-256-GCM) и CUSTOM (замяна, определена от потребителя).
#operatorsОткритие на език
Автоматично откритие на език
Автоматично идентифициране на езика на входния текст преди анализа на PII. anonym.legal открива езика на ниво заявка и го насочва към подходящия поток на NER модел, като английският е резервен за неподдържани езици.
#languagedetectionОценка на увереността
Оценка на увереността при откритие на обекти
Оценка от 0 до 1, която показва колко сигурен е моделът за откритие, че текстовият фрагмент е PII обект. anonym.legal предлага конфигурируеми прагове на увереност, така че потребителите да могат да настроят компромисите между прецизност и припомняне за конкретния си случай на употреба.
#confidencescoringП
Партидна обработка
Партидна анонимизация на файлове
Обработка на множество файлове едновременно в една операция. Партидният режим на anonym.legal поддържа PDF, DOCX и TXT файлове с конфигурация на обектите на файл, прагове на доверие и избор на формат на изхода.
#batchprocessingПерсонализирани обекти
Персонализирани разпознавателни обекти
Потребителски дефинирани PII шаблони, добавени върху вградените 285+ типа обекти на anonym.legal. Поддържа regex шаблони, списъци с думи и списъци с откази. Полезно за организационно специфични идентификатори, като служебни ID, вътрешни проектни кодове или търговски наименования на продукти.
#customentitiesПравило 26
Федерални правила на гражданската процедура Правило 26
Правило на гражданската процедура в САЩ, регулиращо задълженията за откритие. Правило 26(g) изисква адвокатите да удостоверят, че исканията и разкритията за откритие не са направени с неправилни цели — включително неспособността да се редактират правилно лични данни от произведените документи.
#rule26Предварителни настройки
Предварителни настройки за анонимизация
Запазени конфигурации на избрани типове обекти, прагове на доверие и опции за изход, които могат да бъдат приложени с едно кликване. Предварителните настройки синхронизират между Уеб приложението, Office добавката и Десктоп приложението чрез криптирана облачна памет.
#presetsПрекомерна редакция
Прекомерна редакция (фалшиви положителни)
Премахване на повече информация, отколкото е необходимо, намалявайки полезността на документа и потенциално представляваща сполиация в правни производства. Причинена от ниски прагове на увереност или прекалено широк избор на субекти. Регулируема чрез праговете и контролите на субектите в anonym.legal.
#overredactionПривилегия на адвокат-клиент
Защита на привилегията на адвокат-клиент
Правна защита за конфиденциални комуникации между адвокати и клиенти. При преглед на документи и електронно откритие, привилегираното съдържание трябва да бъде идентифицирано и задържано или редактирано. Персонализираните типове субекти в anonym.legal могат да бъдат конфигурирани да маркират индикатори за привилегировано съдържание.
#attorneyclientprivilegeПсевдонимизация
Псевдонимизация на данни
Замяна на директни идентификатори с изкуствени стойности (псевдоними), като се запазва възможността за повторна идентификация на индивидите с помощта на отделен ключ. Член 4(5) от GDPR я признава като техника за подобряване на конфиденциалността, но не освобождава псевдонимизираните данни от регулацията.
#pseudonymizationР
Редактор на изображения
Услуга Presidio Image Redactor
Специализирана бекенд услуга (порт 8013), която открива и редактира лични данни от изображения (PNG, JPEG) с помощта на OCR и анализ на Presidio. Прилага черни ленти за редакция върху откритите области с лични данни в оригиналното изображение.
#presidioimageredactorРедакция
Редакция на данни
Постоянно премахване или затъмняване на чувствителна информация от документи, замествайки я с визуален маркер като [РЕДАКТИРАНО] или черна лента. За разлика от криптиране, редакцията е еднопосочна и оригиналните данни не могат да бъдат възстановени.
#redactionРезиденция на данни в ЕС
Резиденция на данни в Европейския съюз
Гаранцията, че данните се съхраняват и обработват изключително в територията на ЕС/ЕИП. Производствените сървъри на anonym.legal са в Германия (Hetzner Франкфурт), осигурявайки, че цялата обработка се извършва под юрисдикцията на GDPR без последици от трансфер на данни извън границите.
#eudataresidencyС
Смяна на код
Многоезична смяна на код
Феноменът на смесване на два или повече езика в един текст или разговор. Често срещан в многоезични документи (например, немски правни документи с английски технически термини). Хибридното откритие на anonym.legal обработва текст със смяна на код, прилагаща множество езикови модели едновременно.
#codeswitchingСполиация
Сполиация на доказателства
Унищожаване, изменение или неспособност да се запази доказателство, свързано с правен спор. Прекомерната редакция, която прави документите нечетими, може да представлява сполиация. Калибрирането на прецизността на анонимизацията (прагове на увереност, избор на субекти) е важно за правно защитима редакция.
#spoliationТ
Тип на субект
Тип на субект с лични данни
Категория лична информация, която детекционният механизъм разпознава и може да анонимизира. Примери: ЛИЧНО_ИМЕ, ИМЕЙЛ_АДРЕС, ТЕЛЕФОНЕН_НОМЕР, КРЕДИТНА_КАРТА, IBAN_КОД, US_SSN, IP_АДРЕС. anonym.legal поддържа 285+ типа субекти на 48 езика.
#entitytypeТокен система
anonym.legal система за кредитни токени
Таксуване на база употреба, при което API повикванията консумират токени, изчислени от дължината на текста, броя на обектите и режима на обработка (анализиране спрямо анонимизиране). Разходите за токени са конфигурируеми в базата данни и се показват в реално време преди обработката.
#tokensystemТокенизация
Токенизация на данни
Замяна на чувствителни данни с нечувствителен заместител (токен), който се свързва обратно с оригинала в сигурно хранилище. За разлика от криптиране, токенът сам по себе си няма математическа връзка с оригиналните данни.
#tokenizationУ
Уеб приложение
anonym.legal Уеб приложение
Уеб базиран интерфейс на anonym.legal за анализ на PII, анонимизация и декриптиране. Поддържа текстов вход, качване на файлове (PDF, DOCX, TXT), партидна обработка, ZK Auth, 48 езика и 285+ типа обекти. Не е необходима инсталация.
#webappУниверсални субекти
Типове универсални субекти
Типове субекти, които се откриват независимо от езика на текста, обикновено чрез regex на базата на формат с валидация на контролна сума. Примери: КРЕДИТНА_КАРТА, IBAN_КОД, ИМЕЙЛ_АДРЕС, ТЕЛЕФОНЕН_НОМЕР, IP_АДРЕС, URL, КРИПТО адрес.
#universalentitiesФ
Финансови субекти
Типове финансови субекти с лични данни
Типове субекти, обхващащи финансови идентификатори: КРЕДИТНА_КАРТА (контролна сума Luhn), IBAN_КОД (контролна сума ISO 13616), SWIFT_КОД (формат BIC), US_BANK_NUMBER, NRP (испански данъчен идентификатор). Откриват се с валидация на контролна сума, за да се минимизират фалшивите положителни резултати.
#financialentitiesХ
Хеширане
Криптографско хеширане
Еднопосочна трансформация на данни в фиксирана дължина на хеш с помощта на алгоритми като SHA-256. Използва се за последователна псевдонимизация, дублиране и проверка на целостта. Хеш стойностите не могат да бъдат обърнати, но могат да бъдат уязвими на атаки с дъгови таблици, ако не са осолени.
#hashingХибридно откритие
Хибридно откритие с NLP + Regex + ML
Трислойният подход на anonym.legal: регулярни изрази за структурирани PII (телефонни номера, IBAN, кредитни карти), NLP/NER модели за контекстуални обекти (имена, организации, местоположения) и ML класификатори за неясни случаи. Намалява както фалшивите положителни, така и фалшивите отрицателни резултати.
#hybriddetectionХранилище
Хранилище за ключове за криптиране
Сигурно локално хранилище за ключове за криптиране в Десктоп приложението, защитено от Argon2id ключова деривация от основна парола. Ключовете се съхраняват криптирани с AES-256-GCM и се архивират чрез BIP39 мнемонични фрази.
#vaultЦ
Цифрови идентификатори
Типове цифрови идентичности
Типове субекти за онлайн и цифрови идентификатори: ИМЕЙЛ_АДРЕС, ТЕЛЕФОНЕН_НОМЕР, IP_АДРЕС (IPv4 и IPv6), URL, ИМЕ_НА_ДОМЕЙН, КРИПТО (адреси на Bitcoin/Ethereum) и идентификатори, специфични за платформи.
#digitalidentifiersA
AES-256-GCM
Стандарт за напреднала криптиране 256-битова Galois/Counter Mode
Алгоритъм за удостоверено криптиране, който комбинира AES-256 (256-битов ключ) с Galois/Counter Mode за конфиденциалност и интегритет. Използва се в обратимата анонимизация на anonym.legal за криптиране на заменените единици. Осигурява както секретност, така и откриване на манипулации.
#aes256gcmArgon2id
Функция за извличане на ключове Argon2id
Победителят в състезанието за хеширане на пароли през 2015 г. Argon2id комбинира устойчивостта на странични канали на Argon2i и устойчивостта на GPU на Argon2d. Използва се в anonym.legal и в хранилището на настолната апликация за извличане на ключове за криптиране от паролите на потребителите.
#argon2idB
BIP39
Предложение за подобрение на Bitcoin 39 — Мнемонични фрази
Стандарт за генериране на човешки четими мнемонични семена (12–24 думи) от криптографско семе. Използва се в хранилището на настолната апликация на anonym.legal като удобен резервен вариант за ключа за криптиране, извлечен с Argon2id.
#bip39C
CCPA
Закон за защита на личните данни на потребителите в Калифорния
Закон за поверителност в Калифорния, предоставящ на жителите правото да знаят, да изтриват и да се откажат от продажбата на личната си информация. Приложим е за бизнеси, които отговарят на прагове за приходи, обем данни или продажба на данни. Значително изменен от CPRA (приет през ноември 2020 г., в сила от януари 2023 г.).
#ccpaChrome разширение
anonym.legal Chrome разширение
Разширение за браузър (Manifest V3), което прихваща текст преди да бъде изпратен до AI чатботове (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Анонимизира в реално време и по желание декриптира отговорите на AI, използвайки запазени ключове за криптиране.
#chromeextensionCLOUD Act
Закон за разясняване на законното извънтериториално използване на данни
Федерален закон на САЩ (2018), позволяващ на правоприлагащите органи в САЩ да принуждават базираните в САЩ облачни доставчици да предоставят данни, съхранявани в чужбина. Противоречи на правилата за прехвърляне на данни на GDPR за жители на ЕС. Анонимизирането на данни преди качване в облака е често срещана мярка за смекчаване.
#cloudactCSP
Политика за сигурност на съдържанието
Механизъм за HTTP отговори и мета таг, който ограничава кои ресурси (скриптове, стилове, изображения) браузърът може да зарежда. CSP на anonym.legal включва object-src 'none', script-src с nonce и upgrade-insecure-requests, за да предотврати XSS атаки.
#cspD
Data Residency
Изисквания за местоположение на данните
Правни или договорни изисквания, уточняващи в коя географска локация данните трябва да бъдат съхранявани и обработвани. Отнася се за GDPR (прехвърляне на данни извън ЕИП), немския BDSG и специфични за сектора разпоредби в здравеопазването и финансите.
#dataresidencyData Sovereignty
Цифрова суверенитет на данните
Принципът, че данните подлежат на законите и управленските структури на нацията, в която са събрани. По-широк от местоположението на данните, той обхваща контрола върху това, кой може да получи достъп до данните и под какъв правен режим.
#datasovereigntyDDoS защита
Защита от разпределени атаки за отказ на услуга
Защити на инфраструктурно ниво срещу разпределени атаки за отказ на услуга. Сървърната инфраструктура на anonym.legal включва правила за защитна стена (UFW), ограничения на свързването на nginx и защити, еквивалентни на Cloudflare, за поддържане на наличността.
#ddosprotectionDLP
Предотвратяване на загуба на данни
Дисциплина за сигурност и категория софтуерни инструменти, които откриват и предотвратяват неоторизирана трансмисия на чувствителни данни извън организацията. anonym.legal функционира като решение за DLP на ниво браузър и AI за PII.
#dlpDPA
Споразумение за обработка на данни
Юридически обвързващ договор между администратор на данни и обработващ данни, изискван от член 28 на GDPR. Уточнява предмета, продължителността, характера, целта и типа на обработката на лични данни, както и правата и задълженията на двете страни.
#dpaDPIA
Оценка на въздействието върху защитата на данните
Процес на оценка на риска, изискван от член 35 на GDPR за дейности по обработка, които вероятно ще доведат до високи рискове за правата и свободите на индивидите. Задължителен за систематично профилиране, обработка на PHI в голям мащаб и наблюдение в обществени места.
#dpiaE
e-Discovery
Електронно откритие
Процесът на идентифициране, събиране и произвеждане на електронно съхранявана информация в правни производства. Изисква редактиране на лични данни и привилегирована информация от произведените документи. Основен случай на употреба за правни отдели, използващи anonym.legal.
#ediscoveryE2EE
Криптиране от край до край
Криптиране, при което само комуникиращите страни могат да четат съобщенията; доставчикът на услуги няма достъп до оригиналния текст. В режима на ZK Auth на anonym.legal, ключовете за криптиране никога не напускат клиентското устройство, постигаща E2EE за съхранение на анонимизирани изходи.
#e2eeF
FOIA
Закон за свобода на информацията
Федерален закон на САЩ (и еквивалентни разпоредби в други юрисдикции), предоставящ публичен достъп до правителствени записи. Изисква редактиране на PII и друга изключена информация преди разкритие — основен случай на употреба за правни и правителствени анонимизационни работни потоци.
#foiaG
GDPR
Общ регламент за защита на данните
Регламент на ЕС 2016/679, основната рамка за защита на данните в Европейския съюз. Приложим е за всяка организация, която обработва лични данни на жители на ЕС. Глоби до 20 милиона евро или 4% от глобалния годишен приход. Основни права: достъп, изтриване, преносимост, ограничаване, възражение.
#gdprGDPR Article 25
GDPR Член 25 — Защита на данните по дизайн и по подразбиране
Изисква администраторите да прилагат подходящи технически и организационни мерки (като псевдонимизация и минимизиране на данните) както в момента на проектиране на системата, така и по подразбиране по време на обработката.
#gdprarticle25GDPR Article 32
GDPR Член 32 — Сигурност на обработката
Изисква администратори и обработващи да прилагат подходящи технически и организационни мерки, за да осигурят ниво на сигурност, съответстващо на риска, включително криптиране, псевдонимизация, конфиденциалност, интегритет, наличност и устойчивост на системите за обработка.
#gdprarticle32GenAI DLP
Предотвратяване на загуба на данни с генеративен AI
Специализирана категория DLP, фокусирана върху предотвратяване на включването на PII и конфиденциални данни в подканите, изпратени до генеративни AI модели (ChatGPT, Claude, Gemini). Chrome разширението на anonym.legal и MCP сървърът адресират този риск в точката на вход.
#genaidlpH
Hetzner
Hetzner Online GmbH
Немски облачен и хостинг доставчик, където работи производствената инфраструктура на anonym.legal. Намира се в Фалкенщайн, Саксония (център за данни fsn1) с сертификат ISO 27001. Избран за резидентност на данни в ЕС, позиция по съответствие и юрисдикция, приятелска към GDPR, съгласно немското законодателство.
#hetznerHIPAA
Закон за преносимостта и отговорността на здравното осигуряване
Федерален закон на САЩ, установяващ стандарти за защита на чувствителна информация за здравето на пациентите. Правилото за поверителност регулира използването на PHI; Правилото за сигурност изисква административни, физически и технически мерки за защита на електронната PHI (ePHI). Нарушенията носят глоби до 1.9 милиона долара на категория на година.
#hipaaHIPAA Safe Harbor
Метод за деидентификация HIPAA Safe Harbor
Един от двата одобрени метода за деидентификация по HIPAA, изискващи премахване на всички 18 посочени идентификатора на пациента (име, адрес, дати, телефонни номера, ЕГН, имейл, IP адрес, биометрични данни и др.), за да се направят здравните данни недостъпни за индивидуална идентификация.
#hipaasafeharborHSTS
HTTP Строга сигурност на транспорта
Механизъм за уеб сигурност, който принуждава браузърите да използват само HTTPS връзки. anonym.legal задава Strict-Transport-Security: max-age=31536000; includeSubDomains, за да предотврати атаки за понижаване на протокола и кражба на бисквитки.
#hstsI
ISO 27001
ISO/IEC 27001 Управление на информационната сигурност
Международен стандарт за системи за управление на информационната сигурност (ISMS). Сертификацията изисква документирани политики, оценки на риска и контролни мерки. Сървърите на anonym.legal в ЕС са сертифицирани по ISO 27001, осигурявайки структурирано управление на сигурността.
#iso27001ISO 27001 SoA
Декларация за приложимост
Задължителен документ по ISO 27001, който изброява всички контролни мерки от Приложение А, посочвайки кои са приложими за организацията и предоставяйки обосновка за включванията и изключенията. Изисква се за сертификация и одити.
#iso27001soaJ
JWT
JSON Web Token
Компактен, безопасен за URL формат на токен, използван за предаване на твърдения между страни. anonym.legal използва JWT, подписани с HS256 за вътрешна аутентификация между услуги (напр. фронтенд → Presidio API). Токените са с кратък срок на действие и се валидират на сървъра.
#jwtK
KEK
Ключ за криптиране на ключове
Ключ, използван за криптиране на други ключове, а не на данни директно. В архитектурата с нулеви знания на anonym.legal, ключът, извлечен от паролата на потребителя, действа като KEK, за да защити ключовете за криптиране на документите, съхранявани в криптираното хранилище.
#kekM
MCP
Протокол за контекст на модела
Отворен протокол от Anthropic, позволяващ на AI модели да взаимодействат с външни инструменти и източници на данни по стандартизиран начин. anonym.legal реализира MCP сървър, така че AI кодови инструменти да могат да извикват анонимизация без да напускат работния си поток.
#mcpMCP сървър
Сървър на протокола за контекст на модела
Интеграцията на MCP сървър на anonym.legal позволява на AI кодови асистенти (Claude Desktop, Cursor, VS Code Copilot) да извикват анонимизационния API директно като инструмент. PII се премахва от кода, подканите и контекста преди да бъде изпратен до AI модела.
#mcpserverML Models
Модели на машинно обучение за откритие на PII
Статистически модели, обучени на етикетирани текстови корпуси, за да разпознават PII в контекст. anonym.legal използва както трансформаторни потоци на spaCy, така и фино настроен XLM-RoBERTa за многоезично разпознаване на обекти в производствени мащаби.
#mlmodelsN
NER
Разпознаване на именувани обекти
Задача за обработка на естествен език, която идентифицира и класифицира именувани обекти в текст в предварително определени категории като лица, организации, местоположения, дати и медицински идентификатори. Основната ML техника, която захранва откритията на PII в anonym.legal.
#nerNIS2
Директива за мрежова и информационна сигурност 2
Директива на ЕС 2022/2555, разширяваща оригиналната директива NIS, за да обхване повече сектори (здравеопазване, енергетика, транспорт, цифрова инфраструктура) и укрепваща изискванията за киберсигурност. Срокът за транспониране беше 17 октомври 2024 г.; повечето държави членки на ЕС не го спазиха и Европейската комисия започна производства за нарушение срещу несъответстващи държави.
#nis2NLP
Обработка на естествен език
Клон на изкуствения интелект, който се занимава с взаимодействието между компютрите и човешкия език. При откритията на PII, NLP моделите разбират контекста, граматиката и семантиката, за да идентифицират обекти, които само регулярните изрази биха пропуснали.
#nlpO
Office добавка
anonym.legal Microsoft Office добавка
Разширение за Microsoft Office, интегриращо анонимизация на PII директно в Word, Excel и PowerPoint. Поддържа редактиране в документа, управление на предварителни настройки, ZK Auth и синхронизация между устройства. Налична от Microsoft AppSource.
#officeaddinP
PCI DSS
Стандарт за сигурност на данните на индустрията за платежни карти
Стандарт за сигурност за организации, обработващи данни от платежни карти, поддържан от Съвета за стандарти за сигурност на PCI. Изисква криптиране, контрол на достъпа, логване и редовно тестване. Несъответствието може да доведе до глоби и загуба на права за обработка на карти.
#pcidssPHI
Защитена здравна информация
Всяка информация, свързана със здравето, която е свързана с идентифицируемо лице, регулирана от HIPAA в САЩ. Включва диагнози, записи за лечение, данни за застраховка и всяка от 18-те идентификатора на безопасното убежище на HIPAA.
#phiPII
Лично идентифицируема информация
Всяка информация, която може да идентифицира конкретно лице директно или в комбинация с други данни. Примери: имена, имейл адреси, номера на социално осигуряване, IP адреси, биометрични записи.
#piiPresidio
Microsoft Presidio
SDK за защита на данни и анонимизация с отворен код от Microsoft. Двигателят за откритие на anonym.legal е построен на анализатора и услугите за анонимизация на Presidio, разширен с над 285 персонализирани разпознавателя на обекти на 48 езика.
#presidioPresidio Analyzer
Услуга Microsoft Presidio Analyzer
Детекционният компонент на бекенда на anonym.legal (порт 8011). Приема текст и връща списък с открити субекти с лични данни с техните позиции, типове и оценки на увереност. Разширен с 285+ персонализирани разпознавателя на 48 езика.
#presidioanalyzerPresidio Anonymizer
Услуга Microsoft Presidio Anonymizer
Трансформационният компонент на бекенда на anonym.legal (порт 8012). Приема текст и резултати от анализатора като вход, прилага избрания оператор (ЗАМЕНИ, РЕДАКТИРАЙ, ЗАМАСКИРАЙ, ХАШИРАЙ, ШИФРИРАЙ) на всеки открит субект и връща анонимизирания текст.
#presidioanonymizerR
Regex
Съвпадение на регулярни изрази
Съвпадение на текст на базата на шаблони, използващо синтаксис на формален език. При откритията на PII, regex обработва структурно предсказуеми идентификатори (телефонни номера, кредитни карти, IBAN, имейл адреси) с валидация на контролна сума. Допълва NER за хибридно откритие.
#regexREST API
RESTful API
anonym.legal предоставя RESTful HTTP API за програмна интеграция. Точките за достъп включват /api/analyze, /api/anonymize, /api/image и /api/structured. Аутентификация чрез JWT bearer токени. Пълната документация на OpenAPI е налична в API справката.
#restapiS
SCCs
Стандартни договорни клаузи
Предварително одобрени договорни клаузи, съвместими с GDPR, за прехвърляне на лични данни от ЕС/ЕИП към трети държави. Актуализирани от Европейската комисия през 2021 г. (2021/914/EU), за да отговорят на изискванията на Schrems II, включително Оценка на въздействието при прехвърляне.
#sccsSchrems II
Решение Schrems II (C-311/18)
Решение на Съда на Европейския съюз от 2020 г., което обявява за невалидна рамката EU-US Privacy Shield за трансатлантически прехвърляния на данни, позовавайки се на недостатъчни защити в закона за наблюдение в САЩ. Изисква допълнителни мерки (криптиране, анонимизация) при използване на стандартни договорни клаузи.
#schremsiiSHA-256
Алгоритъм за сигурно хеширане 256-битова
Криптографска хеш функция, произвеждаща 256-битов дайджест. Използва се в anonym.legal за HMAC аутентификация на API заявки, доказателства за ZK аутентификация и последователна псевдонимизация на единици (хеширането със сол произвежда същата замяна за същата оригинална стойност).
#sha256spaCy
Библиотека spaCy за NLP
Индустриална библиотека с отворен код за NLP на Python. anonym.legal използва трансформаторните модели на spaCy за 24 езика (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko и др.) за разпознаване на именувани обекти в потока на Presidio.
#spacyStanza
Библиотека Stanza за NLP (Stanford NLP)
Инструментариум за NLP на Stanford NLP Group, поддържащ 70+ езика с най-съвременни невронни модели. Използва се като допълнителен бекенд за NER в anonym.legal за езици, които не са обхванати от моделите на spaCy.
#stanzaT
TLS
Сигурност на транспортния слой
Криптографски протокол, осигуряващ защита на данни в движение. anonym.legal налага минимално TLS 1.2 с предпочитание към TLS 1.3, HSTS с максимален срок на действие от една година и HTTP/2. Всички данни между клиентите и сървъра са криптирани по време на предаване.
#tlsX
XChaCha20
XChaCha20-Poly1305
Алгоритъм за удостоверено криптиране, предлагащ висока производителност на системи без хардуерно ускорение за AES. Използва 192-битов nonce (разширен от 96-битовия nonce на стандарта IETF ChaCha20 съгласно RFC 8439), елиминирайки рисковете от колизия на nonce. Използва се като алтернативен шифър в слоя за криптиране на anonym.legal.
#xchacha20XLM-RoBERTa
Крос-лингвален RoBERTa
Многоезичен трансформаторен езиков модел, обучен на 100 езика, разработен от Meta AI. Използва се в anonym.legal за крос-лингвални задачи по NER, особено за типове обекти и езици, при които моноезичните модели не са налични.
#xlmrobertaZ
ZK Auth
Аутентификация с нулеви знания
Аутентификационната система на anonym.legal, при която ключовете за криптиране се генерират на клиентската страна от паролата на потребителя с помощта на Argon2id, никога не се предават на или съхраняват на сървъра. Сървърът съхранява само криптографско доказателство, а не ключа или паролата.
#zkauth