Кога мрежата нема излез
Научник за податоци работи во одбранбена фирма. Таа има 3.000 персонални записи. Треба да ги отстрани имињата, броевите за социјално осигурување и нивоата на дозволи. Потоа може да ги сподели податоците со истражувачки партнер под договор за CUI.
Нејзината мрежа нема интернет. По дизајн.
Таа тестира секоја веб-базирана алатка кај ја наоѓа. Секоја испраќа податоци до надворешен сервер. Секоја платформа за облак потребува сметка и жива врска. Дури и "on-premises" алатките честопати повикуваат оддалечен сервер за лиценца.
Ова е проблемот со распоредувањето со воздушна изолација. Погодува многу повеќе тимови отколку повеќето луѓе очекуваат.
Кому му треба офлајн отстранување на PII
Одбранбени фирми и владини агенции најчесто се соочуваат со ова. Програмата FedRAMP на DISA бара податоците да останат во рамките на одобрени мрежни граници. ITAR ги ограничува техничките податоци на системи контролирани од САД. Мрежи како JWICS и SIPRNet се физички одвоени по дизајн.
Но потребата за офлајн оди далеку надвор од класифицираните места:
Болници со сегментирани мрежи. Системите за снимање PACS, платформите за EHR и истражувачките бази на податоци честопати седат на мрежи без интернет по политика.
Трговски подови и клириншки куќи. Сопствените трговски системи и системите поврзани со SWIFT користат строги мрежни прекини.
Индустриски контролни системи. Мрежите SCADA и критичната инфраструктура работат со воздушни изолации како основна безбедносна мерка. Зацврстувањето по Stuxnet го направи ова норма.
Европски правила за податоци. Германскиот Landesdatenschutzgesetze и слични закони на ЕУ бараат локална обработка на чувствителни владини и здравствени записи. Казната за GDPR на TikTok од 530 милиони евра пристигна во мај 2025 година. Покри пренос на податоци во Кина. Таа казна натера повеќе тимови кон локални алатки. Видете го нашиот преглед на усогласеноста за правилата за пренос на GDPR кои се применуваат.
Зошто алатките за облак не успеваат во мрежи со воздушна изолација
Повеќето алатки за отстранување на податоци следат SaaS модел:
Кориснички уред → HTTPS → API на продавачот → NLP модели → Одговор → Кориснички уред
Овој дизајн потребува интернет пристап на уредот за обработка. Потребна е доверба во серверите на продавачот. Значи дека податоците минуваат надвор од мрежата.
На мрежа со воздушна изолација, чекор еден е физичка невозможност. За регулирани средини, чекори два до четири секој може да ги прекрши правилата за усогласеност.
Президио со самостојно хостирање е вообичаената резервна опција. Но потребуваат Docker вештини и поставување Python. Исто така потребуваат преземање на спaCy модели, кое бара интернет пристап. И потребуваат тековна ИТ поддршка. Повеќето тимови немаат сè ова.
Јазот помеѓу леснотија на облак и сложеноста на самостојно хостирање е токму она што локалните десктоп алатки го пополнуваат.
Kako функционира локалното отстранување на PII
Добра офлајн алатка доаѓа со сè што е потребно:
Пакувани NLP модели. Моделите на spaCy (40-80 MB секој) и трансформерски модели за именување на ентитети се дел од инсталаторот. Не е потребно преземање при работа.
Локален пајплајн за детекција. Regex, NLP и ML сите работат на локалниот CPU — или GPU ако е достапен. Моторот базиран на Presidio внатре во anonym.legal не прави мрежни повици за време на работа.
Локален шифриран трезор. Конфигурации, предодредени поставки и клучеви се складирани локално. Трезорот користи шифрирање AES-256-GCM и изведување клуч Argon2id. Без синхронизација во облак. Без оддалечена резервна копија. Трезорот останува на уредот.
Локален I/O на датотеки. Влезните датотеки доаѓаат од локalno складирање. Излезните датотеки одат назад во локално складирање. Никакви податоци не минуваат низ кој и да е мрежен интерфејс.
Мал напаѓачки површ. Десктоп апликацијата користи Tauri 2.0 (базирана на Rust). Tauri има многу помал напаѓачки површ отколку алатките базирани на Electron (Chromium). Нејзиниот бинарен файл е приближно една десетина од големината. Исто така повикува помалку OS API-и по стандард.
Три реални сценарија за усогласеност
ITAR документи — 500 датотеки
Одбранбена фирма треба да сподели технички документи со странски партнер под исклучок за лиценца. Датотеките содржат американски лични имиња и персонални податоци. И двете мора да се отстранат прво.
Клучни потреби: обработка само на исчистени работни станици. Без податоци испратени надвор од исчистената мрежа. Ревизорска трага покажувајќи дека работата е завршена. Групна поддршка за 500+ датотеки.
Десктоп апликацијата ракува со сите 500+ DOCX датотеки локално во групен режим. Не е направен мрежен повик за време на работа. Дневникот за ревизија останува во локалниот трезор. Излезот ги задоволува потребите на исклучокот за лиценца на ITAR.
Германска федерална агенција — Записи за жалби
Германска федерална агенција мора да отстрани лични податоци од записи за жалби на граѓани. Потоа ги испраќа записите до истражувачки институт. Насоките на BfDI забрануваат обработка на невладини системи.
Десктоп апликацијата работи на Windows 11 работни станици на агенцијата. Сета обработка е локална. Тимот за ИТ безбедност го потврдува ова со мониторинг на сообраќај — нула надворешни врски за време на работа.
Болничко истражување — EHR де-идентификација
Истражувачки тим во болница треба да ги отстрани записите на пациентите за клиничко испитување. HIPAA Safe Harbor бара отстранување на 18 типа идентификатори. Клиничката мрежа нема интернет пристап.
Десктоп апликацијата ракува со групна обработка на извози на EHR во CSV и JSON формат. Службеникот за приватност го прегледува излезот во споредба со правилата на Safe Harbor пред наборот на податоци да оди до истражувачки партнери.
Что да барате во офлајн алатка
| Можност | Зошто е важно |
|---|---|
| Целосно офлајн по инсталацијата | Без зависност од интернет за време на обработка |
| Пакувани NLP модели | Без потреба за чекор за преземање |
| Групна обработка | Ракување со голем обем без рачна работа |
| Локален шифриран трезор | Безбедно складирање на конфигурации и клучеви |
| Дневник за ревизија | Записи потребни за прегледи на усогласеноста |
| Поддршка за Windows, macOS, Linux | Покрива типови на класифицирани работни станици |
| Опција без телеметрија | Спречете ги податоците да излезат преку телеметрија |
| Поддршка за формат на датотеки | DOCX, PDF, TXT, CSV, JSON, Excel |
Правилата за податоци ги туркаат тимовите кон локални алатки
Казната за TikTok од 530 милиони евра предизвика поширок бран на казни. Тимовите во ЕУ кои користеле алатки за облак сега поставуваат ново прашање. Дали обработката на серверите на продавачот ги задоволува GDPR Поглавје V и националните закони за податоци?
Најчистиот одговор на "каде одат вашите податоци?" е ова: никаде — никогаш не го напушта уредот. Локалната обработка го отстранува прашањето за пренос на GDPR целосно.
За германски тимови, строгото читање на DSGVO на членови 44-46 го прави локалната обработка паметен избор. Ова се применува дури и без строги ограничувања на мрежата. Нашиот преглед на безбедноста objasni kako локалната обработка го отсекува синџирот на податоци на трети страни.
Практични белешки за распоредување
Инсталирајте на системи со воздушна изолација. Инсталаторот — Windows .exe или .msi, macOS .dmg, Linux .AppImage или .deb — се пренесува на мрежата со воздушна изолација преку USB или безбеден пренос на датотеки. Интернетот не е потребен по инсталацијата.
Јазична поддршка. 24 специфични модели за јазик се испорачуваат со апликацијата. Целосниот сет е достапен офлајн без дополнително преземање.
Хардверски барања. Пајплајнот на NLP работи на современи работни станици без GPU. Групната обработка на 1.000 документи обично трае 5-15 минути. Брзината зависи од големината на документот и брзината на CPU.
Офлајн поставување на лиценца. За мрежи каде серверот за лиценца е надвор од дофат, офлајн поставувањето на лиценца е достапно.
Кога воздушната изолација не е вистинскиот избор
Системите со воздушна изолација решаваат специфични проблеми. Исто така додаваат реален товар.
Триење при ажурирање. Одржувањето на моделите и софтверот во тековна состојба потребува рачни чекори. Тимови кои заостануваат можат да пропуштат нови обрасци на PII.
Надоглавина за поврзување. Системите со воздушна изолација не можат да се поврзат со алатки за SIEM во облак или оддалечени контролни табли за ревизија. Потребни се приспособени решенија со диоди за податоци. Ова ги зголемува трошоците.
Компромиси во точноста. Алатките за облак континуирано ги ажурираат податоците за обука. Офлајн моделите се снимок. Можат да заостанат зад новите јазични обрасци со текот на времето.
Не е потребно за секој модел на закана. Тимовите без владини, здравствени или правни мандати можат да најдат алатките за облак попрактични. Силното шифрирање, ревизиите SOC 2 Тип II и договорите за обработка на податоци покриваат повеќето случаи. Воздушната изолација исплаќа само кога моделот на закана навистина вклучува кражба на податоци базирана на мрежа од страна на вешт противник.
За повеќето МСП и стандардни тимови на претпријатија, силното шифрирање во транзит и во мирување дава соодветна заштита. Додадете солидни договорни контроли и ги покривате повеќето случаи на употреба — без надоглавина на целосна воздушна изолација. Видете го нашиот FAQ за повеќе за избор на вистинскиот модел за распоредување.
Десктоп апликацијата на anonym.legal (Windows, macOS, Linux) ги обработува PII целосно локално со пакувани NLP модели. Не е потребна интернет врска по инсталацијата. Групната обработка поддржува 1-5.000 датотеки по работа во зависност од нивото на план.