Ang Panuntunan sa Air-Gap
Ang ilang network ay walang internet. Hindi ayon sa patakaran — ayon sa disenyo.
Ang isang SCIF (Sensitive Compartmented Information Facility) ay isang silid na nakabalot ng Faraday cage. Walang wireless signal na pumapasok o lumalabas. Ipinagbabawal ng ITAR (International Traffic in Arms Regulations) ang pagpapadala ng saklaw na teknikal na nilalaman sa mga hindi naaprubahang partido. Ang mga cloud provider ay hindi ITAR-cleared. Para sa mga grupong ito, ang "cloud SaaS" ay hindi isang panganib na dapat pamahalaan.
Para sa mga site na ito, ang mga tool sa cloud ay hindi gumagana. Ganap na pagtanggal.
Ang isang tool na nangangailangan ng live na network link ay hindi maaaring tumakbo dito. Ang isang tool na tumatawag sa isang license server ay nabo-block. Ang isang tool na nagpapadala ng mga file sa isang cloud API para sa deteksyon ay hindi maaaring gumana sa loob ng isang SCIF. Hindi ito mga edge case. Ito ay mga araw-araw na hadlang para sa mga koponan ng depensa.
Ang Kaso ng ITAR
Ang isang data scientist sa isang kumpanya ng depensa ay may mga talaan ng tauhan sa ilalim ng ITAR. Kailangan niyang alisin ang mga pangalan at ID bago ibahagi ang mga file. Ang kanyang network ay air-gapped.
Walang solusyon sa cloud. Ang tanging landas ay isang tool na tumatakbo sa lokal na device. Dapat itong mag-imbak ng mga modelo nito nang lokal. Dapat itong gumawa ng malinis na output nang walang mga panlabas na tawag.
Ginagawa ito ng Desktop App na batay sa Tauri 2.0. Pagkatapos ng pag-install, walang mga network call na nangyayari sa panahon ng isang run. Ang mga modelo ng spaCy NER at mga pattern ng regex ay tumatakbo sa lokal na CPU. Ang output ay nananatili sa device hanggang i-export ito ng gumagamit.
Bakit Mahalaga ang Reversibility
Kadalasan ay nangangailangan ng reversible na pseudonymization ang classified na trabaho. Ang mga koponan ay nagpapalit ng mga tunay na pangalan ng mga code. Pinapanatili nilang kapaki-pakinabang ang mga talaan. Pinoprotektahan nila ang mga tunay na pagkakakilanlan.
Tinutukoy ng GDPR Article 4(5) ang pseudonymization bilang isang pormal na hakbang sa privacy. Nagpapababa ito ng panganib. Ang mga pseudonymized na talaan ay nagdadala ng mas kaunting mga legal na obligasyon — kung ang lookup token ay nakaimbak nang hiwalay mula sa dataset.
Natuklasan ng pananaliksik ng IAPP (2024) na tanging 23% ng mga tool lamang ang sumusuporta sa tunay na reversibility. Karamihan ay gumagawa ng isang-daan na masking o ganap na pagpapalit. Kapag na-overwrite ang isang talaan, ito ay wala na.
Ang ilang koponan ng gobyerno ay hinihiwalay ang kanilang trabaho ayon sa compartment. Ang isang koponan ay nakakakuha ng mga pseudonymized na file. Ginagawa nila ang pagsusuri. Ang isang pangalawang koponan ay may hawak ng lookup token. Muling kinikikilala nila ang mga talaan lamang kapag kinakailangan ng batas. Ang split na disenyo na ito ay ang tanging ligtas na diskarte para sa multi-team na classified na workflow.
Ang zero-knowledge na modelo ay isa pang hakbang pa. Ang lookup token ay nililikha sa client device. Hindi ito kailanman ipinapadala palabas. Kung ang vendor ay sumubpoena, hindi nila maaaring ibigay ang token. Hindi nila ito nagkaroon. Natutugunan nito ang mga panuntunan sa chain-of-custody sa maraming classified na kapaligiran.
Paghihiwalay ng Token ng EDPB
Ang EDPB Guidelines 05/2022 ay nagsasabing ang pseudonymization token ay dapat na hawakan nang hiwalay. Hindi ito dapat makasama sa parehong partido na humahawak ng mga pseudonymized na talaan. O dapat itong naka-lock sa likod ng mga kontrol na pumipigil sa partidong iyon sa pagbabasa ng parehong talaan at token nang sabay.
Tatlong bagay na magkasama ang nakakatugon sa panuntunang ito:
- Token na nililikha sa client device — hindi kailanman ipinapadala palabas
- Lahat ng pagproseso ay ginagawa nang lokal — walang anumang lumalabas sa air-gapped na site
- Output at token ay ini-export nang hiwalay — dalawang hiwalay na file, dalawang hiwalay na landas
Ang disenyong ito ay nakakatugon sa panuntunan ng EDPB at sa hadlang ng air-gap nang sabay-sabay.
Para sa buong larawan, ipinapakita ng aming pangkalahatang-ideya ng seguridad kung paano nagbabawas ang lokal na pagproseso sa third-party na chain. Ang aming gabay sa compliance ay sumasaklaw sa mga panuntunan sa paglilipat ng GDPR. Tingnan ang aming FAQ para sa tulong sa setup.
Angkinakatawan ng anonym.legal Desktop App ang lahat ng PII detection sa lokal na device. Hindi kailangan ng internet pagkatapos ng pag-install. Sinusuportahan nito ang Windows, macOS, at Linux. Ang mga bundled na modelo ng NLP ay sumasaklaw ng 24 na wika.
Na-update para sa 2026
Mga Pinagmulan
- EDPB Guidelines 05/2022: Pseudonymization and token separation — VERIFIED-EXTERNAL
- IAPP 2024: Anonymization tool reversibility survey — FLAGGED
- LocalAI Master: Air-gapped AI for sensitive environments — VERIFIED-EXTERNAL