By · Last updated 2026-03-03

Tagasi BlogisseTehniline

Isoleeritud võrgu isikuandmed: offline-esmane lähenemine kaitsetööstusele

41% ettevõtete turvapoliitikatest keelab salastatud dokumentide pilvtöötluse. Vaata, kuidas offline-esmased tööriistad lahendavad isikuandmete anonümiseerimise isoleeritud keskkondades.

March 3, 20268 min lugemist
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Kui võrgul pole väljapääsu

Andmeteadlane töötab kaitsefirmas. Tal on 3000 personalitoimikut. Ta peab eemaldama nimed, sotsiaalkindlustuse numbrid ja lubadetasemed. Seejärel saab ta andmed CUI-lepingu alusel uurimispartneriga jagada.

Tema võrgul pole internetti. See on kavandlik.

Ta testib kõiki veebipõhiseid tööriistu, mida leiab. Iga tööriist saadab andmeid välisserverisse. Iga pilvplatvorm nõuab kontot ja otseühendust. Isegi "kohapeal" tööriistad helistavad sageli kaugele litsentsiserverile.

See on isoleeritud võrgu paigaldamise probleem. See mõjutab palju rohkem meeskondi, kui enamik inimesi arvab.

Kes vajab offline isikuandmete eemaldamist

Kaitsefirmad ja valitsusasutused seisavad sellega kõige sagedamini silmitsi. DISA FedRAMP-i programm nõuab, et andmed jääksid heakskiidetud võrgupiiridesse. ITAR piirab tehnilisi andmeid USA-kontrollitud süsteemidele. Võrgud nagu JWICS ja SIPRNet on füüsiliselt kavandatult välja lõigatud.

Kuid offline-vajadus ulatub kaugelt üle salastatud saitide:

Haiglad segmenteeritud võrkudega. PACS-i pildistussüsteemid, EHR-platvormid ja uuringute andmebaasid asuvad sageli võrkudes, mis on poliitikat alusel ilma internetita.

Kauplemispõrandad ja kliiringuasutused. Patenteeritud kauplemissüsteemid ja SWIFT-ühendusega süsteemid kasutavad rangeid võrgukatkestusi.

Tööstusliku juhtimise süsteemid. SCADA-võrgud ja kriitiline infrastruktuur töötavad isoleeritud võrkudega kui põhilise turvameetmega. Stuxneti-järgne karastamine muutis selle normiks.

Euroopa andmeeeskirjad. Saksamaa Landesdatenschutzgesetze ja sarnased EL-i seadused nõuavad tundlike valitsuse ja terviseandmete kohalikku töötlemist. TikToki 530 miljoni euro GDPR-i trahv saabus mais 2025. See hõlmas andmete edastamist Hiinasse. See trahv suunas rohkem meeskondi kohalike tööriistade poole. Vaata meie vastavuse ülevaadet kohalduvate GDPR edastamisreeglite jaoks.

Miks pilvitööriistad ebaõnnestuvad isoleeritud võrkudes

Enamik andmete eemaldamise tööriistu järgib SaaS-mudelit:

Kasutaja seade → HTTPS → Müüja API → NLP mudelid → Vastus → Kasutaja seade

See kujundus vajab internetiühendust töötlemisseadmel. See vajab usaldust müüja serverite vastu. See tähendab, et andmed ületavad väliseid võrke.

Isoleeritud võrgus on esimene samm füüsiliselt võimatu. Reguleeritud keskkondades võib iga teine kuni neljas samm eraldiseisvalt rikkuda vastavuseeskirju.

Ise majutatud Presidio on tavaline tagavaralahendus. Kuid see nõuab Dockeri oskusi ja Pythoni seadistust. See vajab ka spaCy mudeli allalaadimisi, mis vajavad internetiühendust. Ja see nõuab jätkuvat IT-tuge. Enamikul meeskondadel puudub kõik see.

Lõhe pilvmugavuse ja ise majutatud keerukuse vahel on täpselt see, mida kohalikud desktop-tööriistad täidavad.

Kuidas kohalik isikuandmete eemaldamine töötab

Hea offline-tööriist laieneb koos kõige vajalikuga:

Lisatud NLP mudelid. spaCy mudelid (40–80 MB igaüks) ja transformer mudelid nimetatud entiteedi tuvastamiseks on osa installerist. Käitamise ajal allalaadimist pole vaja.

Kohalik tuvastamise pipeline. Regex, NLP ja ML töötavad kõik kohalikul protsessoril — või GPU-l, kui see on saadaval. anonym.legal-i sees olev Presidio-põhine mootor ei tee töötluse ajal võrguühendusi.

Krüpteeritud kohalik hoidla. Konfiguratsioone, eelseadeid ja võtmeid hoitakse kohalikult. Hoidla kasutab AES-256-GCM krüptimist ja Argon2id võtme tuletamist. Pilvsünkroonimist pole. Kaugvarukoopiat pole. Hoidla jääb seadmele.

Kohalik faili I/O. Sisendfailid tulevad kohalikust salvestusruumist. Väljundfailid lähevad tagasi kohalikku salvestusruumi. Andmed ei ületa ühtegi võrguliidesest.

Väike rünnakupind. Desktop App kasutab Tauri 2.0 (Rust-põhist). Tauril on palju väiksem rünnakupind kui Electronil (Chromium-põhiselt) tööriistadel. Selle binaarfail on ligikaudu kümnendik suurusest. See helistab ka vaikimisi vähemate OS-i API-dega.

Kolm reaalset vastavuse stsenaariumi

ITAR dokumendid — 500 faili

Kaitsefirma peab litsentsierandi alusel tehnilisi dokumente välispartneriäiga jagama. Failid sisaldavad USA isikute nimesid ja personaliteavet. Mõlemad tuleb esmalt eemaldada.

Peamised vajadused: töötlemine ainult lubatud tööjaamadel. Andmeid ei saadeta väljaspool lubatud võrku. Auditirada, mis näitab, et töö tehti. Pakktoe tugi 500+ failile.

Desktop App käsitleb kõiki 500+ DOCX-faili lokaalselt partiirežiimis. Töötluse ajal ei tehta võrguühendust. Auditilogi jääb kohalikku hoidlasse. Väljund vastab ITAR litsentsierandi nõuetele.

Saksa föderaalagentuur — kaebuste andmed

Saksa föderaalagentuuri peab eemaldama isikuandmed kodanike kaebuste andmetest. Seejärel saadab ta andmed uurimisinstituuti. BfDI juhised keelavad töötlemise valitsusvälistes süsteemides.

Desktop App töötab agentuuri Windows 11 tööjaamadel. Kogu töötlemine on kohalik. IT-turvameeskond kinnitab seda liiklusseire abil — töötluse ajal pole välisühendusi.

Haigla uuringud — EHR de-identifitseerimine

Haigla uurimismeeskond peab eemaldama patsiendi andmed kliinilise uuringu jaoks. HIPAA Safe Harbor nõuab 18 tunnuse tüübi eemaldamist. Kliiniline võrk pole internetiühendusega.

Desktop App käsitleb EHR-ekspordite pakktöötlust CSV- ja JSON-formaadis. Privaatsusametniku ülevaatab väljundi Safe Harbori reeglite alusel enne, kui andmestik läheb uurimispartneritele.

Mida otsida offline-tööriistast

VõimalusMiks see on oluline
Täielikult offline pärast installimistTöötluse ajal pole internetisõltuvust
Lisatud NLP mudelidAllalaadimist pole vaja
PakktöötlusKäsitle suuri mahte käsitsi töö tegemata
Kohalik krüpteeritud hoidlaKonfiguratsioonide ja võtmete turvaline hoidla
AuditilogiVastavuse ülevaateks vajalikud andmed
Windowsi, macOS-i, Linuxi tugiKatab lubatud tööjaama tüübid
Telemetria puuduminePea andmed seadmelt telemetria kaudu lahkumas
Failivormingu tugiDOCX, PDF, TXT, CSV, JSON, Excel

Andmeeeskirjad suunavad meeskondi kohalike tööriistade poole

TikToki 530 miljoni euro trahv käivitas laiema trahvide laine. EL-i meeskonnad, kes kasutasid pilvitööriistu, esitavad nüüd uue küsimuse. Kas töötlemine müüja serverites rahuldab GDPR-i 5. peatükki ja riiklikke andmeseadusi?

Kõige selgem vastus küsimusele "kuhu sinu andmed lähevad?" on: kuhugi — need ei lahku seadmest kunagi. Kohalik töötlemine eemaldab GDPR edastamise küsimuse täielikult.

Saksa meeskondadele teeb DSGVO range tõlgendus artiklitele 44–46 kohaliku töötlemise arukaks valikuks. See kehtib isegi ilma rangete võrgupiiranguteta. Meie turvalisuse ülevaade selgitab, kuidas kohalik töötlemine lõikab välja kolmanda osapoole andmeahela.

Praktilised paigaldusmärkused

Installi isoleeritud süsteemidesse. Installer — Windowsi .exe või .msi, macOS-i .dmg, Linuxi .AppImage või .deb — kantakse isoleeritud võrku USB-lt või turvalise failiedastuse kaudu. Pärast installimist pole internetti vaja.

Keeletugi. 24 keelepõhist mudelit tarnitakse koos rakendusega. Täielik komplekt on saadaval offline ilma täiendavate allalaadimisteta.

Riistvaranõuded. NLP pipeline töötab kaasaegsetes tööjaamades ilma GPU-ta. 1000 dokumendi pakktöötlus võtab tavaliselt 5–15 minutit. Kiirus sõltub dokumendi suurusest ja protsessori kiirusest.

Offline litsentsi seadistamine. Võrkude jaoks, kus litsentsiserverile pole võimalik ligi pääseda, on saadaval offline litsentsi seadistus.

Millal isoleeritud võrk pole õige lahendus

Isoleeritud süsteemid lahendavad konkreetseid probleeme. Need lisavad ka reaalset koormust.

Uuendamise hõõrdumine. Mudelite ja tarkvara ajakohane hoidmine nõuab käsitsi samme. Meeskonnad, kes maha jäävad, võivad jätta uued isikuandmete mustrid vahele.

Sidumisprobleem. Isoleeritud süsteemid ei suuda ühendada pilv-SIEM tööriistu ega kaugauditiga armatuurlauad. Vajalikud on kohandatud andmedioodilahendused. See tõstab kulusid.

Täpsuse kompromissid. Pilvetööriistad uuendavad treeningandmeid jooksvalt. Offline mudelid on hetktõmmis. Nad võivad aja jooksul uute keelemustrile maha jääda.

Pole vajalik iga ohumudeli jaoks. Meeskonnad ilma valitsuse, tervishoiu või juriidiliste volitusteta võivad leida pilvetööriistad praktilisemad. Tugev krüptimine transiidis ja puhkeolekus, SOC 2 Type II auditid ja andmetöötluslepingud katavad enamiku juhtumeid. Isoleeritud võrk tasub ennast ära ainult siis, kui ohumudel tõeliselt hõlmab oskusliku vastase võrgupõhist andmevargust.

Enamiku VKEde ja standardsete ettevõtete meeskondade jaoks annab tugev transiit- ja puhkeoleku krüptimine piisava kaitse. Lisa kindlad lepingulised kontrollid ja katad enamiku kasutusjuhtudest — ilma täisliku isoleerimise ülekoormamata. Vaata meie KKK-d õige paigaldamisrežiimi valimise kohta.


anonym.legal-i Desktop App (Windows, macOS, Linux) töötleb isikuandmeid täielikult kohalikult lisatud NLP mudelitega. Pärast installimist pole internetiühendust vaja. Pakktöötlus toetab 1–5000 faili ühe käivituse kohta sõltuvalt plaanist.

Allikad

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.