By · Last updated 2026-03-03

Atgal į BlogąTechninė

Oro tarpo ADA anoniminimas: neprisijungęs pirmiausia gynybai

41 % įmonių saugumo politikų draudžia debesies klasifikuotų dokumentų apdorojimą.

March 3, 20268 min skaityti
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Kai tinklas neturi išėjimo

Duomenų mokslininkė dirba gynybos įmonėje. Ji turi 3 000 personalo įrašų. Jai reikia pašalinti vardus, socialinio draudimo numerius ir saugumo leidimų lygius. Tada ji gali pasidalyti duomenimis su tyrimų partneriu pagal CUI susitarimą.

Jos tinklas neturi interneto. Tyčia.

Ji išbando kiekvieną interneto pagrindu veikiantį įrankį, kurį gali rasti. Kiekvienas siunčia duomenis į išorinį serverį. Kiekvienam debesies platformai reikia paskyros ir aktyvaus ryšio. Net "vietiniai" įrankiai dažnai skambina nuotoliniam licencijų serveriui.

Tai yra oro tarpo diegimo problema. Ji paveikia daug daugiau komandų, nei dauguma žmonių tikisi.

Kam reikia ADA pašalinimo neprisijungus

Gynybos įmonės ir vyriausybinės agentūros su tuo susiduria dažniausiai. DISA FedRAMP programa reikalauja, kad duomenys liktų patvirtintų tinklo ribose. ITAR riboja techninius duomenis iki JAV kontroliuojamų sistemų. Tinklai kaip JWICS ir SIPRNet yra fiziškai atskirti pagal dizainą.

Tačiau neprisijungusio darbo poreikis toli gražu neapsiriboja slaptaisiais objektais:

Ligoninės su segmentuotais tinklais. PACS vaizdinimo sistemos, EHR platformos ir tyrimų duomenų bazės dažnai yra tinkluose be interneto pagal politiką.

Prekybos aikštynai ir kliringas namai. Patentuotos prekybos sistemos ir SWIFT prijungtos sistemos naudoja griežtus tinklo atjungimus.

Pramoninės valdymo sistemos. SCADA tinklai ir kritinė infrastruktūra veikia su oro tarpais kaip pagrindine saugumo priemone. Post-Stuxnet grūdinimas tai padarė norma.

Europos duomenų taisyklės. Vokietijos Landesdatenschutzgesetze ir panašūs ES įstatymai reikalauja vietinio duomenų apdorojimo jautriems vyriausybės ir sveikatos įrašams. TikTok 530 mln. € BDAR bauda atėjo 2025 m. gegužę. Ji apėmė duomenų perdavimą į Kiniją. Ši bauda paskatino daugiau komandų rinktis vietinius įrankius. Žr. mūsų atitikties apžvalgą dėl BDAR perdavimo taisyklių.

Kodėl debesies įrankiai nepasiteisina oro tarpo tinkluose

Dauguma duomenų pašalinimo įrankių naudoja SaaS modelį:

Vartotojo įrenginys → HTTPS → Tiekėjo API → NLP modeliai → Atsakymas → Vartotojo įrenginys

Šiam dizainui reikia interneto prieigos apdorojimo įrenginyje. Reikia pasitikėjimo tiekėjo serveriais. Duomenys kerta išorinius tinklus.

Oro tarpo tinkle pirmasis žingsnis yra fizinė neįmanomybė. Reguliuojamose aplinkose antrasis–ketvirtasis žingsniai kiekvienas gali pažeisti atitikties taisykles.

Savarankiškai talpinamas Presidio yra įprasta atsarginė priemonė. Tačiau jai reikia Docker įgūdžių ir Python sąrankos. Ji taip pat reikalauja spaCy modelių atsisiuntimo, kuriems reikia interneto prieigos. Ir jai reikia nuolatinės IT paramos. Daugeliui komandų trūksta viso to.

Spraga tarp debesies patogumo ir savarankiško talpinimo sudėtingumo yra tiksliai tai, ką užpildo vietiniai darbalaukio įrankiai.

Kaip veikia vietinis ADA pašalinimas

Geras neprisijungęs įrankis ateina su viskuo, ko jam reikia:

Sujungti NLP modeliai. spaCy modeliai (40–80 MB kiekvienas) ir transformerių modeliai pavadinimų esybių aptikimui yra dalis diegimo programos. Paleidimo metu atsisiuntimas nereikalingas.

Vietinis aptikimo konvejeris. Regex, NLP ir ML visi veikia vietiniame CPU – arba GPU, jei yra. Presidio pagrįstas variklis anonym.legal viduje atlikdamas paleidimą nesiunčia jokių tinklo skambučių.

Šifruotas vietinis sandėlis. Konfigūracijos, iš anksto nustatyti nustatymai ir raktai saugomi vietiniame. Sandėlis naudoja AES-256-GCM šifravimą ir Argon2id rakto išvedimą. Nėra debesies sinchronizavimo. Nėra nuotolinės atsarginės kopijos. Sandėlis lieka įrenginyje.

Vietinis failų I/O. Įvesties failai ateina iš vietinio saugojimo. Išvesties failai grįžta į vietinį saugojimą. Jokie duomenys nekerta jokio tinklo sąsajos.

Maža atakos paviršius. Programos kompiuteryje versija naudoja Tauri 2.0 (Rust pagrįstą). Tauri turi daug mažesnį atakos paviršių nei Electron (Chromium pagrįstų) įrankiai. Jo dvejetainis failas yra maždaug dešimtadalis dydžio. Jis taip pat pagal nutylėjimą iškviečia mažiau OS API.

Trys realūs atitikties scenarijai

ITAR dokumentai – 500 failų

Gynybos įmonė turi pasidalyti techniniais dokumentais su užsienio partneriu pagal licencijų išimtį. Failuose yra JAV asmenų vardai ir personalo duomenys. Abu turi būti pašalinti pirmiausia.

Pagrindiniai poreikiai: apdorojimas tik pašvęstose darbo vietose. Jokie duomenys nesiunčiami už pašvęsto tinklo. Audito kelias, rodantis, kad darbas atliktas. Paketinis palaikymas 500+ failams.

Programos kompiuteryje versija tvarko visus 500+ DOCX failus vietiniame paketiniame režime. Paleidimo metu nesiunčiami jokie tinklo skambučiai. Audito žurnalas lieka vietiniame sandėlyje. Rezultatai atitinka ITAR licencijų išimties reikalavimus.

Vokietijos federalinė agentūra – skundų įrašai

Vokietijos federalinė agentūra turi pašalinti asmens duomenis iš piliečių skundų įrašų. Ji tuomet siunčia įrašus tyrimų institutui. BfDI gairės draudžia apdorojimą ne vyriausybinėse sistemose.

Programos kompiuteryje versija veikia agentūros Windows 11 darbo vietose. Visas apdorojimas yra vietinis. IT saugumo komanda tai patvirtina su srauto stebėjimu – nulinis išorinis ryšys paleidimo metu.

Ligoninės tyrimai – EHR de-ID

Ligoninės tyrimų komanda turi ištrinti pacientų įrašus klinikiniam tyrimui. HIPAA Saugaus Uosto metodas reikalauja pašalinti 18 identifikatorių tipų. Klinikinis tinklas neturi interneto prieigos.

Programos kompiuteryje versija tvarko EHR eksportų paketinį apdorojimą CSV ir JSON formatu. Privatumo pareigūnas peržiūri rezultatus pagal Saugaus Uosto taisykles prieš duomenų rinkiniui einant pas tyrimų partnerius.

Ko ieškoti neprisijungusiame įrankyje

GalimybėKodėl tai svarbu
Visiškai neprisijungęs po diegimoNėra priklausomybės nuo interneto apdorojimo metu
Sujungti NLP modeliaiNereikalingas atsisiuntimo žingsnis
Paketinis apdorojimasTvarkyti dideles apimtis be rankinio darbo
Vietinis šifruotas sandėlisSaugus konfigūracijų ir raktų saugojimas
Audito žurnalasAtitikties peržiūroms reikalingi įrašai
Windows, macOS, Linux palaikymasApima pašvęstų darbo vietų tipus
Nėra telemetrijos parinktisSustabdyti duomenis, išeinančius per telemetriją
Failų formatų palaikymasDOCX, PDF, TXT, CSV, JSON, Excel

Duomenų taisyklės stumia komandas prie vietinių įrankių

TikTok 530 mln. € bauda sukėlė platesnę baudų bangą. ES komandos, naudojusios debesies įrankius, dabar užduoda naują klausimą. Ar apdorojimas tiekėjo serveriuose atitinka BDAR V skyrių ir nacionalinius duomenų įstatymus?

Aiškiausias atsakymas į klausimą "kur patenka jūsų duomenys?" yra toks: niekur – jie niekada nepalieka įrenginio. Vietinis apdorojimas visiškai pašalina BDAR perdavimo klausimą.

Vokietijos komandoms DSGVO griežtas BDAR 44–46 straipsnių skaitymas daro vietinį apdorojimą išmintingu pasirinkimu. Tai taikoma net be griežtų tinklo apribojimų. Mūsų saugumo apžvalga paaiškina, kaip vietinis apdorojimas pašalina trečiųjų šalių duomenų grandinę.

Praktinės diegimo pastabos

Diegimas oro tarpo sistemose. Diegimo programa – Windows .exe arba .msi, macOS .dmg, Linux .AppImage arba .deb – perduodama į oro tarpo tinklą per USB arba saugų failų perdavimą. Internetas nereikalingas po diegimo.

Kalbų palaikymas. 24 kalbai skirti modeliai pateikiami su programa. Visas rinkinys prieinamas neprisijungus be papildomo atsisiuntimo.

Aparatinės įrangos poreikiai. NLP konvejeris veikia moderniose darbo vietose be GPU. 1 000 dokumentų paketinis apdorojimas paprastai trunka 5–15 minučių. Greitis priklauso nuo dokumento dydžio ir CPU greičio.

Neprisijungusi licencijų sąranka. Tinklams, kur licencijų serveris nepasiekiamas, galima naudoti neprisijungusią licencijų sąranką.

Kada oro tarpas nėra tinkamas

Oro tarpo sistemos sprendžia konkrečias problemas. Jos taip pat kuria realią naštą.

Atnaujinimų trintis. Modelių ir programinės įrangos atnaujinimas reikalauja rankinio žingsniai. Komandos, vėluojančios su atnaujinimais, gali praleisti naujus ADA šablonus.

Susiejimo papildomos išlaidos. Oro tarpo sistemos negali prisijungti prie debesies SIEM įrankių ar nuotolinių audito prietaisų skydelių. Reikalingi pasirinktiniai duomenų diodų sprendimai. Tai didina išlaidas.

Tikslumo kompromisai. Debesies įrankiai nuolat atnaujina mokymo duomenis. Neprisijungę modeliai yra momentinė nuotrauka. Jie gali atsilikti nuo naujų kalbos šablonų laikui bėgant.

Nereikalinga kiekvienam grėsmių modeliui. Komandos be vyriausybinių, sveikatos ar teisinių mandatų gali rasti debesies įrankius praktiškesnius. Stiprus šifravimas, SOC 2 Type II auditai ir duomenų apdorojimo susitarimai apima daugumą atvejų. Oro tarpas atsiperka tik tada, kai grėsmių modelis tikrai apima tinklo pagrįstą duomenų vagystę įgudusio priešininko.

Dauguma MVĮ ir standartinių įmonių komandų stiprus šifravimas tranzito ir poilsio metu suteikia tinkamą apsaugą. Pridėkite stiprius sutartinius valdiklius ir apimsite daugumą naudojimo atvejų – be visiško oro tarpo papildomų išlaidų. Žr. mūsų DUK dėl tinkamo diegimo modelio pasirinkimo.


anonym.legal programos kompiuteryje versija (Windows, macOS, Linux) apdoroja ADA visiškai vietiniame su sujungtais NLP modeliais. Interneto ryšys nereikalingas po diegimo. Paketinis apdorojimas palaiko 1–5 000 failų per paleidimą priklausomai nuo plano pakopas.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.