Kui võrgul pole väljapääsu
Andmeteadlane töötab kaitsefirmas. Tal on 3000 personalitoimikut. Ta peab eemaldama nimed, sotsiaalkindlustuse numbrid ja lubadetasemed. Seejärel saab ta andmed CUI-lepingu alusel uurimispartneriga jagada.
Tema võrgul pole internetti. See on kavandlik.
Ta testib kõiki veebipõhiseid tööriistu, mida leiab. Iga tööriist saadab andmeid välisserverisse. Iga pilvplatvorm nõuab kontot ja otseühendust. Isegi "kohapeal" tööriistad helistavad sageli kaugele litsentsiserverile.
See on isoleeritud võrgu paigaldamise probleem. See mõjutab palju rohkem meeskondi, kui enamik inimesi arvab.
Kes vajab offline isikuandmete eemaldamist
Kaitsefirmad ja valitsusasutused seisavad sellega kõige sagedamini silmitsi. DISA FedRAMP-i programm nõuab, et andmed jääksid heakskiidetud võrgupiiridesse. ITAR piirab tehnilisi andmeid USA-kontrollitud süsteemidele. Võrgud nagu JWICS ja SIPRNet on füüsiliselt kavandatult välja lõigatud.
Kuid offline-vajadus ulatub kaugelt üle salastatud saitide:
Haiglad segmenteeritud võrkudega. PACS-i pildistussüsteemid, EHR-platvormid ja uuringute andmebaasid asuvad sageli võrkudes, mis on poliitikat alusel ilma internetita.
Kauplemispõrandad ja kliiringuasutused. Patenteeritud kauplemissüsteemid ja SWIFT-ühendusega süsteemid kasutavad rangeid võrgukatkestusi.
Tööstusliku juhtimise süsteemid. SCADA-võrgud ja kriitiline infrastruktuur töötavad isoleeritud võrkudega kui põhilise turvameetmega. Stuxneti-järgne karastamine muutis selle normiks.
Euroopa andmeeeskirjad. Saksamaa Landesdatenschutzgesetze ja sarnased EL-i seadused nõuavad tundlike valitsuse ja terviseandmete kohalikku töötlemist. TikToki 530 miljoni euro GDPR-i trahv saabus mais 2025. See hõlmas andmete edastamist Hiinasse. See trahv suunas rohkem meeskondi kohalike tööriistade poole. Vaata meie vastavuse ülevaadet kohalduvate GDPR edastamisreeglite jaoks.
Miks pilvitööriistad ebaõnnestuvad isoleeritud võrkudes
Enamik andmete eemaldamise tööriistu järgib SaaS-mudelit:
Kasutaja seade → HTTPS → Müüja API → NLP mudelid → Vastus → Kasutaja seade
See kujundus vajab internetiühendust töötlemisseadmel. See vajab usaldust müüja serverite vastu. See tähendab, et andmed ületavad väliseid võrke.
Isoleeritud võrgus on esimene samm füüsiliselt võimatu. Reguleeritud keskkondades võib iga teine kuni neljas samm eraldiseisvalt rikkuda vastavuseeskirju.
Ise majutatud Presidio on tavaline tagavaralahendus. Kuid see nõuab Dockeri oskusi ja Pythoni seadistust. See vajab ka spaCy mudeli allalaadimisi, mis vajavad internetiühendust. Ja see nõuab jätkuvat IT-tuge. Enamikul meeskondadel puudub kõik see.
Lõhe pilvmugavuse ja ise majutatud keerukuse vahel on täpselt see, mida kohalikud desktop-tööriistad täidavad.
Kuidas kohalik isikuandmete eemaldamine töötab
Hea offline-tööriist laieneb koos kõige vajalikuga:
Lisatud NLP mudelid. spaCy mudelid (40–80 MB igaüks) ja transformer mudelid nimetatud entiteedi tuvastamiseks on osa installerist. Käitamise ajal allalaadimist pole vaja.
Kohalik tuvastamise pipeline. Regex, NLP ja ML töötavad kõik kohalikul protsessoril — või GPU-l, kui see on saadaval. anonym.legal-i sees olev Presidio-põhine mootor ei tee töötluse ajal võrguühendusi.
Krüpteeritud kohalik hoidla. Konfiguratsioone, eelseadeid ja võtmeid hoitakse kohalikult. Hoidla kasutab AES-256-GCM krüptimist ja Argon2id võtme tuletamist. Pilvsünkroonimist pole. Kaugvarukoopiat pole. Hoidla jääb seadmele.
Kohalik faili I/O. Sisendfailid tulevad kohalikust salvestusruumist. Väljundfailid lähevad tagasi kohalikku salvestusruumi. Andmed ei ületa ühtegi võrguliidesest.
Väike rünnakupind. Desktop App kasutab Tauri 2.0 (Rust-põhist). Tauril on palju väiksem rünnakupind kui Electronil (Chromium-põhiselt) tööriistadel. Selle binaarfail on ligikaudu kümnendik suurusest. See helistab ka vaikimisi vähemate OS-i API-dega.
Kolm reaalset vastavuse stsenaariumi
ITAR dokumendid — 500 faili
Kaitsefirma peab litsentsierandi alusel tehnilisi dokumente välispartneriäiga jagama. Failid sisaldavad USA isikute nimesid ja personaliteavet. Mõlemad tuleb esmalt eemaldada.
Peamised vajadused: töötlemine ainult lubatud tööjaamadel. Andmeid ei saadeta väljaspool lubatud võrku. Auditirada, mis näitab, et töö tehti. Pakktoe tugi 500+ failile.
Desktop App käsitleb kõiki 500+ DOCX-faili lokaalselt partiirežiimis. Töötluse ajal ei tehta võrguühendust. Auditilogi jääb kohalikku hoidlasse. Väljund vastab ITAR litsentsierandi nõuetele.
Saksa föderaalagentuur — kaebuste andmed
Saksa föderaalagentuuri peab eemaldama isikuandmed kodanike kaebuste andmetest. Seejärel saadab ta andmed uurimisinstituuti. BfDI juhised keelavad töötlemise valitsusvälistes süsteemides.
Desktop App töötab agentuuri Windows 11 tööjaamadel. Kogu töötlemine on kohalik. IT-turvameeskond kinnitab seda liiklusseire abil — töötluse ajal pole välisühendusi.
Haigla uuringud — EHR de-identifitseerimine
Haigla uurimismeeskond peab eemaldama patsiendi andmed kliinilise uuringu jaoks. HIPAA Safe Harbor nõuab 18 tunnuse tüübi eemaldamist. Kliiniline võrk pole internetiühendusega.
Desktop App käsitleb EHR-ekspordite pakktöötlust CSV- ja JSON-formaadis. Privaatsusametniku ülevaatab väljundi Safe Harbori reeglite alusel enne, kui andmestik läheb uurimispartneritele.
Mida otsida offline-tööriistast
| Võimalus | Miks see on oluline |
|---|---|
| Täielikult offline pärast installimist | Töötluse ajal pole internetisõltuvust |
| Lisatud NLP mudelid | Allalaadimist pole vaja |
| Pakktöötlus | Käsitle suuri mahte käsitsi töö tegemata |
| Kohalik krüpteeritud hoidla | Konfiguratsioonide ja võtmete turvaline hoidla |
| Auditilogi | Vastavuse ülevaateks vajalikud andmed |
| Windowsi, macOS-i, Linuxi tugi | Katab lubatud tööjaama tüübid |
| Telemetria puudumine | Pea andmed seadmelt telemetria kaudu lahkumas |
| Failivormingu tugi | DOCX, PDF, TXT, CSV, JSON, Excel |
Andmeeeskirjad suunavad meeskondi kohalike tööriistade poole
TikToki 530 miljoni euro trahv käivitas laiema trahvide laine. EL-i meeskonnad, kes kasutasid pilvitööriistu, esitavad nüüd uue küsimuse. Kas töötlemine müüja serverites rahuldab GDPR-i 5. peatükki ja riiklikke andmeseadusi?
Kõige selgem vastus küsimusele "kuhu sinu andmed lähevad?" on: kuhugi — need ei lahku seadmest kunagi. Kohalik töötlemine eemaldab GDPR edastamise küsimuse täielikult.
Saksa meeskondadele teeb DSGVO range tõlgendus artiklitele 44–46 kohaliku töötlemise arukaks valikuks. See kehtib isegi ilma rangete võrgupiiranguteta. Meie turvalisuse ülevaade selgitab, kuidas kohalik töötlemine lõikab välja kolmanda osapoole andmeahela.
Praktilised paigaldusmärkused
Installi isoleeritud süsteemidesse. Installer — Windowsi .exe või .msi, macOS-i .dmg, Linuxi .AppImage või .deb — kantakse isoleeritud võrku USB-lt või turvalise failiedastuse kaudu. Pärast installimist pole internetti vaja.
Keeletugi. 24 keelepõhist mudelit tarnitakse koos rakendusega. Täielik komplekt on saadaval offline ilma täiendavate allalaadimisteta.
Riistvaranõuded. NLP pipeline töötab kaasaegsetes tööjaamades ilma GPU-ta. 1000 dokumendi pakktöötlus võtab tavaliselt 5–15 minutit. Kiirus sõltub dokumendi suurusest ja protsessori kiirusest.
Offline litsentsi seadistamine. Võrkude jaoks, kus litsentsiserverile pole võimalik ligi pääseda, on saadaval offline litsentsi seadistus.
Millal isoleeritud võrk pole õige lahendus
Isoleeritud süsteemid lahendavad konkreetseid probleeme. Need lisavad ka reaalset koormust.
Uuendamise hõõrdumine. Mudelite ja tarkvara ajakohane hoidmine nõuab käsitsi samme. Meeskonnad, kes maha jäävad, võivad jätta uued isikuandmete mustrid vahele.
Sidumisprobleem. Isoleeritud süsteemid ei suuda ühendada pilv-SIEM tööriistu ega kaugauditiga armatuurlauad. Vajalikud on kohandatud andmedioodilahendused. See tõstab kulusid.
Täpsuse kompromissid. Pilvetööriistad uuendavad treeningandmeid jooksvalt. Offline mudelid on hetktõmmis. Nad võivad aja jooksul uute keelemustrile maha jääda.
Pole vajalik iga ohumudeli jaoks. Meeskonnad ilma valitsuse, tervishoiu või juriidiliste volitusteta võivad leida pilvetööriistad praktilisemad. Tugev krüptimine transiidis ja puhkeolekus, SOC 2 Type II auditid ja andmetöötluslepingud katavad enamiku juhtumeid. Isoleeritud võrk tasub ennast ära ainult siis, kui ohumudel tõeliselt hõlmab oskusliku vastase võrgupõhist andmevargust.
Enamiku VKEde ja standardsete ettevõtete meeskondade jaoks annab tugev transiit- ja puhkeoleku krüptimine piisava kaitse. Lisa kindlad lepingulised kontrollid ja katad enamiku kasutusjuhtudest — ilma täisliku isoleerimise ülekoormamata. Vaata meie KKK-d õige paigaldamisrežiimi valimise kohta.
anonym.legal-i Desktop App (Windows, macOS, Linux) töötleb isikuandmeid täielikult kohalikult lisatud NLP mudelitega. Pärast installimist pole internetiühendust vaja. Pakktöötlus toetab 1–5000 faili ühe käivituse kohta sõltuvalt plaanist.