Глосар за приватност и технологија
Дефиниции за сите термини, акроними и концепти користени во анонимизација на PII и приватност на податоците.
Назад на документи94 термини
2
2FA
Аутентикација со Два Фактора
Аутентикација која бара два различни фактора за верификација: нешто што корисникот го знае (лозинка) и нешто што корисникот го има (TOTP апликација, хардверски клуч) или е (биометрика). Поддржано во anonym.legal како дополнителен слој над ZK Auth.
#twofaА
Анонимизација
Анонимизација на податоци
Необратен процес на отстранување или трансформирање на идентификувачки информации така што индивидулите повеќе не можат да бидат идентификувани, директно или индиректно. Под GDPR, вистински анонимизираните податоци паѓаат надвор од опсегот на регулацијата.
#anonymizationАудит патека
Неизменлива аудит патека
Секвенцијален, видлив за манипулации лог кој запишува кој имал пристап, модифицирал или обработил податоци и кога. Потребно според ISO 27001 (A.8.15), HIPAA Правило за безбедност (§164.312(b)), и правила за електронско откривање. anonym.legal логира сите операции за анонимизација со времеви печати, броеви на ентитети и ID на оператори.
#audittrailБ
Благајна
Благајна за Клучеви за Шифрирање
Безбедно локално складирање за клучеви за шифрирање во Десктоп Апликацијата, заштитено со Argon2id деривација на клучеви од главна лозинка. Клучевите се складираат зашифрени користејќи AES-256-GCM и се прават резервни копии преку BIP39 мнемонички фрази.
#vaultВ
Веб апликација
anonym.legal Веб Апликација
Интерфејс базиран на прелистувач на anonym.legal за анализа на PII, анонимизација и декрипција. Поддржува текстуален внес, прикачување на датотеки (PDF, DOCX, TXT), обработка во серија, ZK Auth, 48 јазици и 285+ типови ентитети. Не е потребна инсталација.
#webappВладин идентификатор
Типови на владин идентификатор
Типови на ентитети за национални и владински издадени идентификатори: US_SSN, US_PASSPORT, UK_NHS, ES_NIF, DE_PERSONALAUSWEIS, FR_INSEE, IT_FISCAL_CODE, и 50+ други формати на ID специфични за земјата. Детектирани со користење на regex специфичен за земјата + образци на контролната сума.
#governmentidД
Де-анонимизација
Напад на повторна идентификација
Процесот на повторна идентификација на индивидулите од наводно анонимизирани сетови на податоци преку крос-референцирање со помошни информации. Клучен ризик при споделување податоци со недоволна длабочина на анонимизација.
#deanonymizationДесктоп апликација
anonym.legal Десктоп Апликација
Крос-платформска апликација (Windows, macOS, Linux) изградена со Tauri 2.0 и React 18. Вклучува локална обработка на датотеки, BIP39 благајна за офлајн ZK Auth, извоз во серија и API синхронизација. Поддржува распоредување без интернет пристап.
#desktopappДетекција на јазик
Автоматска детекција на јазик
Автоматско идентификување на јазикот на влезниот текст пред анализа на PII. anonym.legal ја детектира јазикот на ниво на барање и го насочува кон соодветната NER моделска линија, со англискиот како резервен за неподдржани јазици.
#languagedetectionДигитални идентификатори
Типови на дигитални иденитети
Типови на ентитети за онлајн и дигитални идентификатори: EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS (IPv4 и IPv6), URL, DOMAIN_NAME, CRYPTO (Bitcoin/Ethereum адреси), и идентификатори специфични за платформа.
#digitalidentifiersДиференцијална приватност
Диференцијална приватност (DP)
Математичка рамка за објавување статистички информации за сетови на податоци, додека се обезбедуваат докажливи гаранции дека податоците на било која индивидуа не можат да се разликуваат. Користи во агрегатна аналитика за да се спречи повторна идентификација дури и кога се испитуваат агрегатни излези.
#differentialprivacyЗ
Здравствени ентитети
Типови на здравствени PII ентитети
Типови на ентитети за 18 HIPAA Safe Harbor идентификатори и дополнителни здравствени поврзани PII: US_MRN (броеви на медицински записи), MEDICAL_LICENSE, HEALTHCARE_PLAN_BENEFICIARY, и ентитети за контекст на дијагноза/третман.
#healthcareentitiesИ
Идентификатори на возила
Типови на ентитети на возила
Типови на ентитети за идентификатори поврзани со возила: US_DRIVER_LICENSE, UK_DRIVER_LICENSE, EU_DRIVER_LICENSE, VIN (Број на идентификација на возило), и формати на регистарски таблички специфични за земјата.
#vehicleidentifiersИдентификатори на осигурување
Типови на ентитети на осигурување
Типови на ентитети за идентификатори поврзани со осигурување: US_NPI (Национален идентификатор на провајдер за здравствени услуги), HEALTHCARE_PLAN_BENEFICIARY, и бројки на здравствено осигурување специфични за земјата (на пр. DE_HEALTH_INSURANCE_NUMBER).
#insuranceidentifiersК
Кодно менување
Мултијазично кодно менување
Феноменот на мешање два или повеќе јазици во еден текст или разговор. Често се среќава во мултијазични документи (на пр., германски правни документи со англиски технички термини). Хибридната детекција на anonym.legal се справува со текст со кодно менување применувајќи повеќе јазични модели истовремено.
#codeswitchingМ
Маскирање
Маскирање на податоци
Замена на чувствителни вредности со реални, но фиктивни податоци кои ја задржуваат формата и структурата. Користи за тестни средини, аналитика и споделување на сетови на податоци без изложување на реални PII.
#maskingМинимизирање на податоци
Принцип на минимизирање на податоци според GDPR
Принципот од Член 5(1)(c) на GDPR кој бара да се собираат и обработуваат само податоци кои се адекватни, релевантни и неопходни за одредената цел. Основен дизајнерски ограничувач за системи кои се усогласени со приватноста.
#dataminimizationН
Недостаток на редукција
Недостаток на редукција (Лажни негативи)
Неуспех во отстранување на сите PII, оставајќи ги поединците изложени во споделени документи. Повеќе честа ризик од усогласеност. Предизвикано од високи прагови на доверба, недостиг на типови на ентитети или нови формати на PII. Намалено со хибридното откривање и поддршката за прилагодливи ентитети на anonym.legal.
#underredactionНула-Знаење
Архитектура Нула-Знаење
Дизајн на систем каде што провајдерот на услуга нема пристап до неприфатените податоци на корисниците или клучевите за шифрирање. Сите операции за шифрирање/дешифрирање се извршуваат на клиентската страна; серверот никогаш не ги гледа оригиналните содржини. Превенција на закани од внатре и присилно откривање.
#zeroknowledgeО
Обработка во серија
Анонимизација на Датотеки во Серија
Обработка на повеќе датотеки истовремено во една операција. Режимот за обработка во серија на anonym.legal поддржува PDF, DOCX и TXT датотеки со конфигурација на ентитети по датотека, прагови на доверба и избор на формат на излез.
#batchprocessingОграничување на стапка
Ограничување на стапка на API
Контроли за бројот на API барања што клиентот може да ги направи во времеви рамки. Превенција на злоупотреба и осигурување на фер распределба на ресурси. anonym.legal применува ограничувања по корисник базирани на ниво на план, со експоненцијално назадување препорачано за логика за повторно обидување.
#ratelimitingОдбранливост
Правно одбранлива анонимизација
Способноста да се демонстрира пред регулатори, судови или ревизори дека анонимизацијата е извршена со користење на документирана, конзистентна и технички звучна методологија. Логовите на аудит на anonym.legal, резултатите на доверба и поставките на операторот поддржуваат одбранливи работни текови за анонимизација.
#defensibilityОператори
Оператори за Анонимизација
Стратегијата за замена применета на откриената PII. anonym.legal поддржува REPLACE (текст за замена), REDACT (празен низ), MASK (ѕвездички), HASH (SHA-256 дигест), ENCRYPT (обратен AES-256-GCM) и CUSTOM (замена дефинирана од корисникот).
#operatorsОценка на доверба
Оценка на доверба за детекција на ентитети
Оценка од 0–1 која укажува колку е сигурен моделот за детекција дека текстуалниот сегмент е PII ентитет. anonym.legal нуди конфигурирани прагови на доверба за да корисниците можат да го прилагодат односот помеѓу прецизноста и повратот за нивниот специфичен случај на употреба.
#confidencescoringП
Правило 26
Федерални правила на граѓанска постапка Правило 26
Правило за граѓанска постапка во САД кое управува со обврските за откривање. Правилото 26(g) бара адвокатите да потврдат дека барањата за откривање и откритија не се направени за неправилни цели - вклучувајќи неуспех во правилно редуцирање на PII од произведените документи.
#rule26Прекумерна редукција
Прекумерна редукција (Лажни позитиви)
Отстранување на повеќе информации отколку што е потребно, намалувајќи ја употребливоста на документот и потенцијално constituting сполијација во правни постапки. Предизвикано од ниски прагови на доверба или премногу широк избор на ентитети. Може да се прилагоди преку праговите и контролите на ентитети на anonym.legal.
#overredactionПретходно Поставувања
Претходно Поставувања за Анонимизација
Зачувани конфигурации на избрани типови на ентитети, прагови на доверба и опции за излез кои можат да се применат со едно кликнување. Претходно поставувањата се синхронизираат преку Веб Апликацијата, Office Додатокот и Десктоп Апликацијата преку зашифрено облачно складирање.
#presetsПриватност по дизајн
Приватност по дизајн и подразбирање
Принципот, предвиден од Член 25 на GDPR, дека мерките за заштита на податоците се вградени во системите од самиот почеток, а не додадени како поцрта. Вклучува минимизирање на податоци, контроли на пристап, шифрирање и псевдонимизација на архитектонско ниво.
#privacybydesignПривилегија на адвокат-клиент
Заштита на привилегијата на адвокат-клиент
Правна заштита за доверливи комуникации помеѓу адвокати и клиенти. Во преглед на документи и електронско откривање, доверливото содржина мора да биде идентификувано и задржано или редуцирано. Прилагодливи типови на ентитети во anonym.legal можат да се конфигурираат за означување на маркери за доверлива содржина.
#attorneyclientprivilegeПрилагодливи Ентитети
Прилагодливи Препознавачи на Ентитети
Шаблони на PII дефинирани од корисникот додадени над 285+ вградени типови на ентитети на anonym.legal. Поддржува regex шаблони, листи на зборови и листи за одбивање. Корисно за идентификатори специфични за организацијата како што се идентификациски броеви на вработени, внатрешни кодови на проекти или заштитени имиња на производи.
#customentitiesПсевдонимизација
Псевдонимизација на податоци
Замена на директни идентификатори со вештачки вредности (псевдоними) додека се задржува способноста за повторна идентификација на индивидулите користејќи посебен клуч. Член 4(5) од GDPR го признава како техника за подобрување на приватноста, но не го ослободува псевдонимизираните податоци од регулацијата.
#pseudonymizationР
Редактор на слики
Presidio Image Redactor Service
Специјализирана услуга на задниот дел (порт 8013) која детектира и редуцира PII од слики (PNG, JPEG) користејќи OCR и анализа на Presidio. Применува редукција со црна лента над детектираните PII региони во оригиналната слика.
#presidioimageredactorРедакција
Редакција на податоци
Трајно отстранување или замаглување на чувствителни информации од документи, заменувајќи ги со визуелен маркер како [REDACTED] или црна лента. За разлика од шифрирањето, редакцијата е еднонасочна и оригиналните податоци не можат да се обноват.
#redactionРезиденција на податоци
Захтеви за резиденција на податоци
Правни или договорни барања кои специфицираат во која географска локација податоците мора да се чуваат и обработуваат. Релевантно за GDPR (преноси на податоци надвор од ЕЕА), германскиот BDSG и регулативи специфични за секторот во здравството и финансите.
#dataresidencyРезиденција на податоци во ЕУ
Резиденција на податоци во Европската Унија
Гаранција дека податоците се складираат и обработуваат исклучиво во територијата на ЕУ/ЕЕА. Производствените сервери на anonym.legal се во Германија (Hetzner Франкфурт), осигурувајќи дека целата обработка се одвива под јурисдикцијата на GDPR без импликации за трансфер на податоци преку граница.
#eudataresidencyС
Систем за токени
anonym.legal Систем за Кредитни Токени
Наплата базирана на употреба каде повиците до API консумираат токени пресметани од должината на текстот, бројот на ентитети и режимот на обработка (анализирај против анонимизирај). Трошоците за токени се конфигурираат во базата на податоци и се прикажуваат во реално време пред обработката.
#tokensystemСполијација
Сполијација на докази
Уништување, измена или неуспех во зачувување на докази релевантни за судски постапки. Прекумерно агресивно редуцирање што ги прави документите нечитливи може да се смета за сполијација. Калибрирањето на прецизноста на анонимизацијата (прагови на доверба, избор на ентитети) е важно за правно одбранлива редукција.
#spoliationСуверенитет на податоци
Цифров суверенитет на податоци
Принципот дека податоците подлежат на законите и управувачките структури на нацијата во која се собираат. Поширок од резиденцијата на податоци, опфаќа контрола над тоа кој може да има пристап до податоците и под кој правен рамка.
#datasovereigntyТ
Тип на ентитет
Тип на ентитет PII
Категорија на лични информации која ја препознава и може да анонимизира детекцискиот механизам. Примери: ЛИЧНО_ИМЕ, EMAIL_ADDRESS, PHONE_NUMBER, CREDIT_CARD, IBAN_CODE, US_SSN, IP_ADDRESS. anonym.legal поддржува 285+ типови ентитети на 48 јазици.
#entitytypeТокенизација
Токенизација на податоци
Замена на чувствителни податоци со не-чувствителен заменик (токен) кој се мапира назад на оригиналот во безбедна каса. За разлика од шифрирањето, самиот токен нема математичка врска со оригиналните податоци.
#tokenizationУ
Универзални ентитети
Типови на универзални ентитети
Типови на ентитети детектирани без оглед на јазикот на текстот, обично преку формат-базирани regex со валидација на контролната сума. Примери: CREDIT_CARD, IBAN_CODE, EMAIL_ADDRESS, PHONE_NUMBER, IP_ADDRESS, URL, CRYPTO адреса.
#universalentitiesФ
Финансиски ентитети
Типови на финансиски PII ентитети
Типови на ентитети кои покриваат финансиски идентификатори: CREDIT_CARD (Luhn контрола), IBAN_CODE (ISO 13616 контрола), SWIFT_CODE (BIC формат), US_BANK_NUMBER, NRP (Шпански даночен идентификатор). Детектирани со валидација на контролна сума за минимизирање на лажни позитиви.
#financialentitiesХ
Хецнер
Hetzner Online GmbH
Германски провајдер на облак и хостинг каде што работи производствената инфраструктура на anonym.legal. Се наоѓа во Фалкенштајн, Саксонија (датасентар fsn1) со сертификат ISO 27001. Избран за резиденција на податоци во ЕУ, усогласеност и GDPR-пријателска юрисдикција според германското право.
#hetznerХеширање
Криптографско хеширање
Еднонасочна трансформација на податоците во фиксна должина на хеш користејќи алгоритми како SHA-256. Користи за конзистентна псевдонимизација, дуплирање и верификација на интегритетот. Хеш вредностите не можат да се обратат, но можат да бидат подложни на напади со rainbow table ако не се солени.
#hashingХибридна детекција
Хибридна NLP + Regex + ML детекција
три-слојниот пристап на anonym.legal: регуларни изрази за структурирани PII (броеви на телефони, IBAN-ови, кредитни картички), NLP/NER модели за контекстуални ентитети (имиња, организации, локации) и ML класификатори за амбивалентни случаи. Намалува и лажни позитиви и лажни негативи.
#hybriddetectionA
AES-256-GCM
Напреден Стандард за Шифрирање 256-битен Галоис/Контра Мод
Аутентифициран алгоритам за шифрирање кој комбинира AES-256 (256-битен клуч) со Галоис/Контра Мод за и доверливост и интегритет. Користи во реверзибилната анонимизација на anonym.legal за шифрирање на заменетите ентитети. Обезбедува и тајност и откривање на манипулации.
#aes256gcmArgon2id
Функција за Изведување на Клучеви Argon2id
Победникот на Конкурсот за Хеширање на Лозинки 2015. Argon2id комбинира отпорност на странични канали од Argon2i и отпорност на GPU од Argon2d. Користи во anonym.legal и во складиштето на Desktop App за добивање на клучеви за шифрирање од корисничките лозинки.
#argon2idB
BIP39
Предлог за Подобрување на Биткоин 39 — Мнемонички Фрази
Стандард за генерирање на човечки читливи мнемонички семена фрази (12–24 зборови) од криптографско семе. Користи во складиштето на Desktop App на anonym.legal како кориснички пријателска резервна копија за клучот за шифрирање добиен од Argon2id.
#bip39C
CCPA
Закон за приватност на потрошувачите во Калифорнија
Закон за приватност во Калифорнија кој им дава на жителите право да знаат, да бришат и да се откажат од продажбата на нивните лични информации. Се применува на бизниси кои ги исполнуваат праговите за приход, обем на податоци или продажба на податоци. Значително изменет со CPRA (усвоен ноември 2020, стапува во сила јануари 2023).
#ccpaChrome Додаток
anonym.legal Chrome Додаток
Проширение за прелистувач (Manifest V3) кое пресретнува текст пред да биде испратен до AI чатботови (ChatGPT, Claude, Gemini, Perplexity, DeepSeek). Анонимизира во реално време и опционално декриптира AI одговори користејќи зачувани клучеви за шифрирање.
#chromeextensionCLOUD Act
Закон за разјаснување на законската употреба на податоци во странство
Федерален закон на САД (2018) кој им овозможува на органите за спроведување на законот во САД да принудат облачни провајдери со седиште во САД да произведат податоци складирани во странство. Се судира со правилата за пренос на податоци според GDPR за жители на ЕУ. Анонимизирањето на податоците пред поставување во облак е вообичаено решение.
#cloudactCSP
Политика за Безбедност на Содржината
Механизам за HTTP одговорен хедер и мета таг кој ограничува кои ресурси (скрипти, стилови, слики) прелистувачот може да ги вчита. CSP на anonym.legal вклучува object-src 'none', script-src со nonce, и upgrade-insecure-requests за да спречи XSS напади.
#cspD
DDoS Защита
Заштита од распределени напади на одбивање на услуга
Одбрани на ниво на инфраструктура против распределени напади на одбивање на услуга. Серверската инфраструктура на anonym.legal вклучува правила за заштита од пожар (UFW), ограничувања на конекции на nginx и Cloudflare-еквивалентни заштити за одржување на достапност.
#ddosprotectionDLP
Превенција на Загуба на Податоци
Безбедносна дисциплина и категорија на софтверски алатки кои откриваат и спречуваат неовластена трансмисија на чувствителни податоци надвор од организацијата. anonym.legal функционира како решение за DLP на ниво на прелистувач и AI за PII.
#dlpDPA
Договор за обработка на податоци
Правно обврзувачки договор помеѓу контролор на податоци и обработувач на податоци, потребен според член 28 од GDPR. Специфицира предмет, траење, природа, цел и вид на обработка на лични податоци, како и правата и обврските на двете страни.
#dpaDPIA
Процена на влијанието на заштитата на податоците
Процес на проценка на ризикот потребен според член 35 од GDPR за активности на обработка кои веројатно ќе резултираат со високи ризици за правата и слободите на поединците. Задолжителен за систематско профилирање, обработка на PHI на голема скала и надзор на јавни области.
#dpiaE
e-Откривање
Електронско откривање
Процесот на идентификување, собирање и производство на електронски складирани информации во правни постапки. Потребно е да се редуцираат PII и доверливи информации од произведените документи. Главен случај на употреба за правни оддели кои користат anonym.legal.
#ediscoveryE2EE
Шифрирање од Крај до Крај
Шифрирање во кое само комуницирачките страни можат да ги читаат пораките; провајдерот на услуга нема пристап до неприфатените податоци. Во режимот на ZK Auth на anonym.legal, клучевите за шифрирање никогаш не ја напуштаат клиентската уред, постигнувајќи E2EE за складирање на анонимизирани излези.
#e2eeF
FOIA
Закон за слобода на информации
Федерален закон на САД (и соодветни статути во други юрисдикции) кој им дава на јавноста пристап до владините записи. Бара редакција на PII и друга исклучена информација пред откривање — примарна употреба за правни и владински работни процеси за анонимизација.
#foiaG
GDPR
Општа регулатива за заштита на податоци
ЕУ регулатива 2016/679, основната рамка за заштита на податоци за Европската унија. Се применува на секоја организација што обработува лични податоци на жители на ЕУ. Казни до 20 милиони евра или 4% од глобалниот годишен приход. Клучни права: пристап, бришење, преносливост, ограничување, приговор.
#gdprGDPR Член 25
GDPR Член 25 — Заштита на податоците по дизајн и по подразбирање
Бара контролорите да имплементираат соодветни технички и организациски мерки (како што се псевдонимизација и минимизација на податоци) и во времето на дизајн на системот и по подразбирање за време на обработката.
#gdprarticle25GDPR Член 32
GDPR Член 32 — Безбедност на обработката
Бара контролорите и обработувачите да имплементираат соодветни технички и организациски мерки за да осигураат соодветно ниво на безбедност на ризикот, вклучувајќи шифрирање, псевдонимизација, доверливост, интегритет, достапност и отпорност на системите за обработка.
#gdprarticle32GenAI DLP
Превенција на Загуба на Податоци за Генеративен AI
Специјализирана категорија DLP фокусирана на спречување на вклучување на PII и доверливи податоци во упатствата испратени до генеративни AI модели (ChatGPT, Claude, Gemini). Chrome Додатокот на anonym.legal и MCP серверот се справуваат со овој ризик во моментот на внес.
#genaidlpH
HIPAA
Закон за преносливост и одговорност на здравственото осигурување
Федерален закон на САД кој воспоставува стандарди за заштита на чувствителни информации за здравјето на пациентите. Правилото за приватност управува со користењето на PHI; Правилото за безбедност бара административни, физички и технички мерки за заштита на електронски PHI (ePHI). Прекршувањата носат казни до 1,9 милиони долари по категорија годишно.
#hipaaHIPAA Safe Harbor
Метод за деидентификација HIPAA Safe Harbor
Еден од двата метода за деидентификација одобрени од HIPAA кои бараат отстранување на сите 18 специфицирани идентификатори на пациентите (име, адреса, датуми, телефонски броеви, SSN, е-пошта, IP адреса, биометрика итн.) за да се направат здравствените податоци неиндивидуално идентификувани.
#hipaasafeharborHSTS
HTTP Строга Безбедност на Транспортот
Механизам за веб безбедност кој принудува прелистувачите да користат само HTTPS конекции. anonym.legal поставува Strict-Transport-Security: max-age=31536000; includeSubDomains за да спречи напади на пониски протоколи и кражба на колачиња.
#hstsI
ISO 27001
ISO/IEC 27001 Управување со безбедноста на информациите
Меѓународен стандард за системи за управување со безбедноста на информациите (ISMS). Сертификацијата бара документирани политики, проценки на ризик и контроли. Серверите на anonym.legal во ЕУ се сертифицирани според ISO 27001, што гарантира структурирано управување со безбедноста.
#iso27001ISO 27001 SoA
Изјава за применливост
Задолжителен документ според ISO 27001 кој ги наведува сите контроли од Анекс А, укажувајќи кои се применливи за организацијата и давајќи оправдување за вклучувања и исклучувања. Потребен за сертификација и ревизии.
#iso27001soaJ
JWT
JSON Web Token
Компактен, безбеден формат на токен за пренос на тврдења помеѓу страни. anonym.legal користи JWT потпишани со HS256 за внатрешна аутентикација помеѓу услуги (на пример, фронтенд → Presidio API). Токените се краткотрајни и се валидираат на серверот.
#jwtK
KEK
Клуч за Шифрирање на Клучеви
Клуч кој се користи за шифрирање на други клучеви наместо директно на податоците. Во ZK архитектурата на anonym.legal, клучот добиен од лозинката на корисникот функционира како KEK за заштита на клучевите за шифрирање по документите складирани во шифрираното складиште.
#kekM
MCP
Моделен Контекст Протокол
Отворен протокол од Anthropic кој им овозможува на AI модели да взаимодействуваат со надворешни алатки и извори на податоци на стандарден начин. anonym.legal имплементира MCP сервер за да AI кодни алатки можат да повикуваат анонимизација без да излезат од нивниот работен тек.
#mcpMCP сервер
Сервер за Моделен Контекст Протокол
Интеграцијата на MCP серверот на anonym.legal им овозможува на AI кодни асистенти (Claude Desktop, Cursor, VS Code Copilot) да го повикаат анонимизацискиот API директно како алатка. PII се отстранува од кодот, упатствата и контекстот пред да биде испратен до AI моделот.
#mcpserverML Models
Модели на машинско учење за детекција на PII
Статистички модели обучени на обележани текстуални корпуси за препознавање на PII во контекст. anonym.legal користи и spaCy трансформаторски линии и фино подесени XLM-RoBERTa за многујазична препознавање на ентитети на производствена скала.
#mlmodelsN
NER
Препознавање на именувани ентитети
Задача за обработка на природен јазик која идентификува и класифицира именувани ентитети во текст во претходно дефинирани категории како што се лица, организации, локации, датуми и медицински идентификатори. Основната ML техника која ја поддржува детекцијата на PII во anonym.legal.
#nerNIS2
Директива за безбедност на мрежи и информации 2
ЕУ директива 2022/2555 која ја проширува оригиналната NIS директива за да опфати повеќе сектори (здравство, енергија, транспорт, дигитална инфраструктура) и ја зајакнува безбедноста на кибернетичките системи. Рокот за трансформација беше 17 октомври 2024; повеќето земји-членки на ЕУ го пропуштија и Европската комисија отвори постапки за прекршување против непочитувачките држави.
#nis2NLP
Обработка на природен јазик
Гранка на вештачка интелигенција која се занимава со интеракцијата помеѓу компјутерите и човечкиот јазик. Во детекцијата на PII, NLP моделите разбираат контекст, граматика и семантика за да идентификуваат ентитети кои само регуларните изрази би ги пропуштиле.
#nlpO
Office додаток
anonym.legal Microsoft Office Додаток
Проширение за Microsoft Office кое интегрира анонимизација на PII директно во Word, Excel и PowerPoint. Поддржува редакција во документот, управување со претходно поставени конфигурации, ZK Auth и синхронизација преку уреди. Достапно од Microsoft AppSource.
#officeaddinP
PCI DSS
Стандард за безбедност на податоци на индустријата за платни картички
Стандард за безбедност за организации кои ракуваат со податоци за платни картички, одржуван од PCI Security Standards Council. Бара шифрирање, контроли на пристап, логирање и редовно тестирање. Непочитувањето може да резултира со казни и губење на привилегиите за обработка на картички.
#pcidssPHI
Заштитени здравствени информации
Секои информации поврзани со здравјето кои се поврзани со идентификувана индивидуа, регулирани под HIPAA во САД. Вклучува дијагнози, записи за третман, податоци за осигурување и било кој од 18-те идентификатори на HIPAA Safe Harbor.
#phiPII
Лично идентификувани информации
Секои податоци кои можат да идентификуваат конкретна индивидуа директно или во комбинација со други податоци. Примери: имиња, адреси на електронска пошта, броеви на социјално осигурување, IP адреси, биометриски записи.
#piiPresidio
Microsoft Presidio
SDK за заштита на податоци и анонимизација со отворен код од Microsoft. Моторот за детекција на anonym.legal е изграден на анализаторот и анонимизаторот на Presidio, проширен со 285+ прилагодливи препознавачи на ентитети на 48 јазици.
#presidioPresidio Analyzer
Microsoft Presidio Analyzer Service
Детекцискиот компонент на задниот дел на anonym.legal (порт 8011). Прифаќа текст и враќа список на детектирани PII ентитети со нивните позиции, типови и резултати на доверба. Проширен со 285+ прилагодливи препознавачи на 48 јазици.
#presidioanalyzerPresidio Anonymizer
Microsoft Presidio Anonymizer Service
Трансформацискиот компонент на задниот дел на anonym.legal (порт 8012). Прифаќа текст и резултати од анализаторот како влез, применува избраниот оператор (REPLACE, REDACT, MASK, HASH, ENCRYPT) на секој детектиран ентитет и враќа анонимизиран текст.
#presidioanonymizerR
Regex
Совпадение на регуларни изрази
Совпадение на текст базирано на образци користејќи формална синтакса на јазикот. Во детекцијата на PII, regex се справува со структурно предвидливи идентификатори (броеви на телефони, кредитни картички, IBAN-ови, адреси на електронска пошта) со валидација на контролната сума. Дополнува NER за хибридна детекција.
#regexREST API
RESTful API
anonym.legal изложува RESTful HTTP API за програматска интеграција. Ендпоинти вклучуваат /api/analyze, /api/anonymize, /api/image, и /api/structured. Аутентификувано преку JWT bearer токени. Полната OpenAPI документација е достапна во API Референца.
#restapiS
SCCs
Стандардни договорни клаузи
Предодобрени клаузи за договори кои се усогласени со GDPR за пренос на лични податоци од ЕУ/ЕЕА во трети земји. Ажурирани од Европската комисија во 2021 година (2021/914/EU) за да ги задоволат барањата на Schrems II, вклучувајќи Проценка на влијанието на преносот.
#sccsSchrems II
Одлука Schrems II (C-311/18)
Одлука на Судот на правдата на ЕУ од 2020 година која ја поништува рамката за приватност на ЕУ-САД за трансакции на податоци, наведувајќи недостаточни заштити на законот за надзор во САД. Бара дополнителни мерки (шифрирање, анонимизација) при користење на Стандардни договорни клаузи.
#schremsiiSHA-256
Безбедна Хеш Функција 256-битна
Криптографска хеш функција која произведува 256-битен дигест. Користи во anonym.legal за HMAC аутентикација на API барања, ZK аутентикациски докази и конзистентна псевдонимизација на ентитети (хеширање со сол произведува истата замена за истата оригинална вредност).
#sha256spaCy
spaCy NLP библиотека
Индустриска библиотека за обработка на природен јазик со отворен код во Python. anonym.legal користи трансформаторски модели на spaCy за 24 јазици (en, de, fr, es, it, pt, nl, pl, ru, zh, ja, ko и повеќе) за препознавање на именувани ентитети во линијата на Presidio.
#spacyStanza
Stanza NLP библиотека (Stanford NLP)
Python алатка за обработка на природен јазик од групата Stanford NLP која поддржува 70+ јазици со најсовремени невронски модели. Користи се како дополнителен NER позадински сервис во anonym.legal за јазици кои не се покриени од моделите на spaCy.
#stanzaT
TLS
Безбедност на Транспортниот Слој
Криптографски протокол кој обезбедува податоци во транзит. anonym.legal спроведува минимален TLS 1.2 со префериран TLS 1.3, HSTS со максимален век на траење од една година, и HTTP/2. Сите податоци помеѓу клиентите и серверот се шифрирани во транзит.
#tlsX
XChaCha20
XChaCha20-Poly1305
Аутентифициран алгоритам за шифрирање кој нуди висока перформанса на системи без хардверска акцелерација за AES. Користи 192-битен nonce (проширен од 96-битниот nonce на стандардот IETF ChaCha20 по RFC 8439), елиминирајќи ги ризиците од колизија на nonce. Користи како алтернативен шифар во слојот за шифрирање на anonym.legal.
#xchacha20XLM-RoBERTa
Крос-јазичен RoBERTa
Мултијазичен трансформаторски јазичен модел обучен на 100 јазици, развиен од Meta AI. Користи се во anonym.legal за крос-јазични NER задачи, особено за типови на ентитети и јазици каде монолингвалните модели не се достапни.
#xlmrobertaZ
ZK Auth
Аутентикација Нула-Знаење
Аутентикацискиот систем на anonym.legal каде што клучевите за шифрирање се добиваат на клиентската страна од корисничката лозинка користејќи Argon2id, никогаш не се пренесуваат или складираат на серверот. Серверот чува само криптографски доказ, а не клучот или лозинката.
#zkauth