anonym.legal

By · Last updated 2026-03-03

Назад на блоготТехнички

Со воздушна изолација PII: Офлајн-прво за одбраната

41% од политиките за безбедност на претпријатија забрануваат обработка на класифицирани документи во облак. Дознајте kako офлајн-прво анонимизација функционира за мрежи со строги безбедносни барања.

March 3, 20268 мин читање
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Кога мрежата нема излез

Научник за податоци работи во одбранбена фирма. Таа има 3.000 персонални записи. Треба да ги отстрани имињата, броевите за социјално осигурување и нивоата на дозволи. Потоа може да ги сподели податоците со истражувачки партнер под договор за CUI.

Нејзината мрежа нема интернет. По дизајн.

Таа тестира секоја веб-базирана алатка кај ја наоѓа. Секоја испраќа податоци до надворешен сервер. Секоја платформа за облак потребува сметка и жива врска. Дури и "on-premises" алатките честопати повикуваат оддалечен сервер за лиценца.

Ова е проблемот со распоредувањето со воздушна изолација. Погодува многу повеќе тимови отколку повеќето луѓе очекуваат.

Кому му треба офлајн отстранување на PII

Одбранбени фирми и владини агенции најчесто се соочуваат со ова. Програмата FedRAMP на DISA бара податоците да останат во рамките на одобрени мрежни граници. ITAR ги ограничува техничките податоци на системи контролирани од САД. Мрежи како JWICS и SIPRNet се физички одвоени по дизајн.

Но потребата за офлајн оди далеку надвор од класифицираните места:

Болници со сегментирани мрежи. Системите за снимање PACS, платформите за EHR и истражувачките бази на податоци честопати седат на мрежи без интернет по политика.

Трговски подови и клириншки куќи. Сопствените трговски системи и системите поврзани со SWIFT користат строги мрежни прекини.

Индустриски контролни системи. Мрежите SCADA и критичната инфраструктура работат со воздушни изолации како основна безбедносна мерка. Зацврстувањето по Stuxnet го направи ова норма.

Европски правила за податоци. Германскиот Landesdatenschutzgesetze и слични закони на ЕУ бараат локална обработка на чувствителни владини и здравствени записи. Казната за GDPR на TikTok од 530 милиони евра пристигна во мај 2025 година. Покри пренос на податоци во Кина. Таа казна натера повеќе тимови кон локални алатки. Видете го нашиот преглед на усогласеноста за правилата за пренос на GDPR кои се применуваат.

Зошто алатките за облак не успеваат во мрежи со воздушна изолација

Повеќето алатки за отстранување на податоци следат SaaS модел:

Кориснички уред → HTTPS → API на продавачот → NLP модели → Одговор → Кориснички уред

Овој дизајн потребува интернет пристап на уредот за обработка. Потребна е доверба во серверите на продавачот. Значи дека податоците минуваат надвор од мрежата.

На мрежа со воздушна изолација, чекор еден е физичка невозможност. За регулирани средини, чекори два до четири секој може да ги прекрши правилата за усогласеност.

Президио со самостојно хостирање е вообичаената резервна опција. Но потребуваат Docker вештини и поставување Python. Исто така потребуваат преземање на спaCy модели, кое бара интернет пристап. И потребуваат тековна ИТ поддршка. Повеќето тимови немаат сè ова.

Јазот помеѓу леснотија на облак и сложеноста на самостојно хостирање е токму она што локалните десктоп алатки го пополнуваат.

Kako функционира локалното отстранување на PII

Добра офлајн алатка доаѓа со сè што е потребно:

Пакувани NLP модели. Моделите на spaCy (40-80 MB секој) и трансформерски модели за именување на ентитети се дел од инсталаторот. Не е потребно преземање при работа.

Локален пајплајн за детекција. Regex, NLP и ML сите работат на локалниот CPU — или GPU ако е достапен. Моторот базиран на Presidio внатре во anonym.legal не прави мрежни повици за време на работа.

Локален шифриран трезор. Конфигурации, предодредени поставки и клучеви се складирани локално. Трезорот користи шифрирање AES-256-GCM и изведување клуч Argon2id. Без синхронизација во облак. Без оддалечена резервна копија. Трезорот останува на уредот.

Локален I/O на датотеки. Влезните датотеки доаѓаат од локalno складирање. Излезните датотеки одат назад во локално складирање. Никакви податоци не минуваат низ кој и да е мрежен интерфејс.

Мал напаѓачки површ. Десктоп апликацијата користи Tauri 2.0 (базирана на Rust). Tauri има многу помал напаѓачки површ отколку алатките базирани на Electron (Chromium). Нејзиниот бинарен файл е приближно една десетина од големината. Исто така повикува помалку OS API-и по стандард.

Три реални сценарија за усогласеност

ITAR документи — 500 датотеки

Одбранбена фирма треба да сподели технички документи со странски партнер под исклучок за лиценца. Датотеките содржат американски лични имиња и персонални податоци. И двете мора да се отстранат прво.

Клучни потреби: обработка само на исчистени работни станици. Без податоци испратени надвор од исчистената мрежа. Ревизорска трага покажувајќи дека работата е завршена. Групна поддршка за 500+ датотеки.

Десктоп апликацијата ракува со сите 500+ DOCX датотеки локално во групен режим. Не е направен мрежен повик за време на работа. Дневникот за ревизија останува во локалниот трезор. Излезот ги задоволува потребите на исклучокот за лиценца на ITAR.

Германска федерална агенција — Записи за жалби

Германска федерална агенција мора да отстрани лични податоци од записи за жалби на граѓани. Потоа ги испраќа записите до истражувачки институт. Насоките на BfDI забрануваат обработка на невладини системи.

Десктоп апликацијата работи на Windows 11 работни станици на агенцијата. Сета обработка е локална. Тимот за ИТ безбедност го потврдува ова со мониторинг на сообраќај — нула надворешни врски за време на работа.

Болничко истражување — EHR де-идентификација

Истражувачки тим во болница треба да ги отстрани записите на пациентите за клиничко испитување. HIPAA Safe Harbor бара отстранување на 18 типа идентификатори. Клиничката мрежа нема интернет пристап.

Десктоп апликацијата ракува со групна обработка на извози на EHR во CSV и JSON формат. Службеникот за приватност го прегледува излезот во споредба со правилата на Safe Harbor пред наборот на податоци да оди до истражувачки партнери.

Что да барате во офлајн алатка

МожностЗошто е важно
Целосно офлајн по инсталацијатаБез зависност од интернет за време на обработка
Пакувани NLP моделиБез потреба за чекор за преземање
Групна обработкаРакување со голем обем без рачна работа
Локален шифриран трезорБезбедно складирање на конфигурации и клучеви
Дневник за ревизијаЗаписи потребни за прегледи на усогласеноста
Поддршка за Windows, macOS, LinuxПокрива типови на класифицирани работни станици
Опција без телеметријаСпречете ги податоците да излезат преку телеметрија
Поддршка за формат на датотекиDOCX, PDF, TXT, CSV, JSON, Excel

Правилата за податоци ги туркаат тимовите кон локални алатки

Казната за TikTok од 530 милиони евра предизвика поширок бран на казни. Тимовите во ЕУ кои користеле алатки за облак сега поставуваат ново прашање. Дали обработката на серверите на продавачот ги задоволува GDPR Поглавје V и националните закони за податоци?

Најчистиот одговор на "каде одат вашите податоци?" е ова: никаде — никогаш не го напушта уредот. Локалната обработка го отстранува прашањето за пренос на GDPR целосно.

За германски тимови, строгото читање на DSGVO на членови 44-46 го прави локалната обработка паметен избор. Ова се применува дури и без строги ограничувања на мрежата. Нашиот преглед на безбедноста objasni kako локалната обработка го отсекува синџирот на податоци на трети страни.

Практични белешки за распоредување

Инсталирајте на системи со воздушна изолација. Инсталаторот — Windows .exe или .msi, macOS .dmg, Linux .AppImage или .deb — се пренесува на мрежата со воздушна изолација преку USB или безбеден пренос на датотеки. Интернетот не е потребен по инсталацијата.

Јазична поддршка. 24 специфични модели за јазик се испорачуваат со апликацијата. Целосниот сет е достапен офлајн без дополнително преземање.

Хардверски барања. Пајплајнот на NLP работи на современи работни станици без GPU. Групната обработка на 1.000 документи обично трае 5-15 минути. Брзината зависи од големината на документот и брзината на CPU.

Офлајн поставување на лиценца. За мрежи каде серверот за лиценца е надвор од дофат, офлајн поставувањето на лиценца е достапно.

Кога воздушната изолација не е вистинскиот избор

Системите со воздушна изолација решаваат специфични проблеми. Исто така додаваат реален товар.

Триење при ажурирање. Одржувањето на моделите и софтверот во тековна состојба потребува рачни чекори. Тимови кои заостануваат можат да пропуштат нови обрасци на PII.

Надоглавина за поврзување. Системите со воздушна изолација не можат да се поврзат со алатки за SIEM во облак или оддалечени контролни табли за ревизија. Потребни се приспособени решенија со диоди за податоци. Ова ги зголемува трошоците.

Компромиси во точноста. Алатките за облак континуирано ги ажурираат податоците за обука. Офлајн моделите се снимок. Можат да заостанат зад новите јазични обрасци со текот на времето.

Не е потребно за секој модел на закана. Тимовите без владини, здравствени или правни мандати можат да најдат алатките за облак попрактични. Силното шифрирање, ревизиите SOC 2 Тип II и договорите за обработка на податоци покриваат повеќето случаи. Воздушната изолација исплаќа само кога моделот на закана навистина вклучува кражба на податоци базирана на мрежа од страна на вешт противник.

За повеќето МСП и стандардни тимови на претпријатија, силното шифрирање во транзит и во мирување дава соодветна заштита. Додадете солидни договорни контроли и ги покривате повеќето случаи на употреба — без надоглавина на целосна воздушна изолација. Видете го нашиот FAQ за повеќе за избор на вистинскиот модел за распоредување.


Десктоп апликацијата на anonym.legal (Windows, macOS, Linux) ги обработува PII целосно локално со пакувани NLP модели. Не е потребна интернет врска по инсталацијата. Групната обработка поддржува 1-5.000 датотеки по работа во зависност од нивото на план.

Извори

Подготвени да ги заштитите вашите податоци?

Започнете со анонимизација на PII со 285+ типови на ентитети на 48 јазици.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.