By · Last updated 2026-03-03

Bumalik sa BlogTeknikal

PII na Air-Gapped: Offline-First para sa Depensa

41% ng mga patakaran sa seguridad ng enterprise ay nagbabawal sa cloud na pagproseso ng mga classified na dokumento. Alamin kung paano gumagana ang lokal na pag-alis ng PII para sa mga air-gapped na network.

March 3, 20268 min basahin
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Kapag Walang Labasan ang Network

Isang data scientist ang nagtatrabaho sa isang kumpanya ng depensa. Mayroon siyang 3,000 rekord ng mga tauhan. Kailangan niyang alisin ang mga pangalan, Social Security Number, at mga antas ng clearance. Pagkatapos ay maaari niyang ibahagi ang datos sa isang kasosyo sa pananaliksik sa ilalim ng isang kasunduan ng CUI.

Ang kanyang network ay walang internet. Sa disenyo.

Sinubukan niya ang bawat web-based na tool na mahanap niya. Ang bawat isa ay nagpapadala ng datos sa isang panlabas na server. Ang bawat cloud platform ay nangangailangan ng isang account at isang live na koneksyon. Kahit ang mga "on-premises" na tool ay madalas na tumatawag sa isang remote na server ng lisensya.

Ito ang problema sa deployment ng air-gapped. Tumatalab ito sa higit pang maraming koponan kaysa sa inaasahan ng karamihan sa mga tao.

Sino ang Nangangailangan ng Offline na Pag-alis ng PII

Mga kumpanya ng depensa at ahensya ng gobyerno ang pinakamalimit na nakaharap dito. Ang programang FedRAMP ng DISA ay nangangailangan na ang datos ay manatili sa loob ng mga aprubadong hangganan ng network. Nilililimitahan ng ITAR ang teknikal na datos sa mga US-controlled na sistema. Ang mga network tulad ng JWICS at SIPRNet ay pisikal na pinutol sa disenyo.

Ngunit ang pangangailangan sa offline ay lampas pa sa mga classified na site:

Mga ospital na may mga segmented na network. Ang mga sistema ng imahen ng PACS, mga platform ng EHR, at mga database ng pananaliksik ay madalas na nasa mga network na walang internet ayon sa patakaran.

Mga trading floor at clearing house. Ang mga proprietary trading system at mga sistema na konektado sa SWIFT ay gumagamit ng mahigpit na mga network cutoff.

Mga industrial control system. Ang mga network ng SCADA at kritikal na imprastraktura ay tumatakbo na may mga air gap bilang isang pangunahing hakbain sa seguridad. Ginawa ito ng hardening pagkatapos ng Stuxnet bilang pamantayan.

Mga panuntunan ng datos ng European. Ang Landesdatenschutzgesetze ng Germany at katulad na mga batas ng EU ay nangangailangan ng lokal na pagproseso ng datos para sa sensitibong rekord ng gobyerno at kalusugan. Dumating ang €530M na multa ng TikTok sa GDPR noong Mayo 2025. Sumasaklaw ito sa mga paglipat ng datos sa China. Ang multang iyon ay nagtulak sa higit pang mga koponan tungo sa mga lokal na tool. Tingnan ang aming pangkalahatang-ideya ng pagsunod para sa mga panuntunan ng paglipat ng GDPR na naaangkop.

Bakit Nabibigo ang mga Cloud Tool sa mga Air-Gapped na Network

Karamihan sa mga tool sa pag-alis ng datos ay sumusunod sa isang modelo ng SaaS:

User Device → HTTPS → Vendor API → NLP Models → Tugon → User Device

Ang disenyong ito ay nangangailangan ng internet access sa device ng pagproseso. Nangangailangan ito ng tiwala sa mga server ng vendor. Ibig sabihin nito ay tumatawid ang datos sa labas ng mga network.

Sa isang air-gapped na network, ang hakbang isa ay isang pisikal na imposibilidad. Para sa mga regulated na kapaligiran, ang bawat isa sa mga hakbang dalawa hanggang apat ay maaaring lumabag sa mga panuntunan ng pagsunod.

Ang self-hosted na Presidio ang karaniwang fallback. Ngunit nangangailangan ito ng mga kasanayan sa Docker at setup ng Python. Nangangailangan din ito ng mga pag-download ng modelo ng spaCy, na nangangailangan ng internet access. At nangangailangan ito ng patuloy na suporta ng IT. Karamihan sa mga koponan ay kulang sa lahat ng ito.

Ang agwat sa pagitan ng kaginhawahan ng cloud at kumplikasyon ng self-hosted ay eksaktong pinupunan ng mga lokal na desktop tool.

Paano Gumagana ang Lokal na Pag-alis ng PII

Isang magandang offline na tool ang may kasamang lahat ng kailangan nito:

Mga bundled na modelo ng NLP. Ang mga modelo ng spaCy (40-80 MB bawat isa) at mga transformer model para sa detection ng named entity ay bahagi ng installer. Walang pag-download ang kailangan sa oras ng pagtakbo.

Lokal na pipeline ng detection. Ang Regex, NLP, at ML ay lahat ay tumatakbo sa lokal na CPU — o GPU kung available. Ang engine na nakabatay sa Presidio sa loob ng anonym.legal ay walang ginagawang mga tawag sa network sa panahon ng isang run.

Naka-encrypt na lokal na vault. Ang mga config, preset, at susi ay nakaimbak nang lokal. Ang vault ay gumagamit ng AES-256-GCM encryption at Argon2id key derivation. Walang cloud sync. Walang remote na backup. Nananatili ang vault sa device.

Lokal na file I/O. Ang mga input na file ay nagmumula sa lokal na imbakan. Ang mga output na file ay bumabalik sa lokal na imbakan. Walang datos ang tumatawid sa anumang interface ng network.

Maliit na attack surface. Gumagamit ang Desktop App ng Tauri 2.0 (nakabatay sa Rust). Ang Tauri ay may mas maliit na attack surface kaysa sa mga tool na nakabatay sa Electron (Chromium). Ang binary nito ay halos sampung beses na mas maliit. Tumatawag din ito ng mas kaunting OS API sa pamamagitan ng default.

Tatlong Tunay na Senaryo ng Pagsunod

Mga Dokumento ng ITAR — 500 File

Isang kumpanya ng depensa ang kailangang ibahagi ang mga teknikal na dokumento sa isang dayuhang kasosyo sa ilalim ng isang license exception. Ang mga file ay naglalaman ng mga pangalan ng US person at datos ng tauhan. Parehong dapat alisin muna.

Mga pangunahing pangangailangan: pagproseso sa mga cleared na workstation lamang. Walang datos na ipinapadala sa labas ng cleared na network. Isang audit trail na nagpapakita na ang trabaho ay nagawa. Suporta ng batch para sa 500+ na mga file.

Hinahawakan ng Desktop App ang lahat ng 500+ na DOCX file nang lokal sa batch mode. Walang tawag sa network ang ginawa sa panahon ng run. Ang audit log ay nananatili sa lokal na vault. Ang output ay natutugunan ang mga pangangailangan ng ITAR license exception.

German Federal Agency — Mga Rekord ng Reklamo

Isang German federal agency ang kailangang alisin ang personal na datos mula sa mga rekord ng reklamo ng mamamayan. Pagkatapos ay ipinapadala nito ang mga rekord sa isang research institute. Ang gabay ng BfDI ay nagbabawal sa pagproseso sa mga sistema na hindi ng gobyerno.

Ang Desktop App ay tumatakbo sa mga workstation ng Windows 11 ng ahensya. Lahat ng pagproseso ay lokal. Kinukumpirma ito ng koponan sa seguridad ng IT gamit ang pagsubaybay ng trapiko — zero na mga panlabas na koneksyon sa panahon ng run.

Pananaliksik sa Ospital — EHR De-ID

Isang koponan ng pananaliksik ng ospital ang kailangang alisin ang mga rekord ng pasyente para sa isang klinikal na pagsubok. Ang HIPAA Safe Harbor ay nangangailangan ng pag-alis ng 18 uri ng identifier. Ang klinikal na network ay walang internet access.

Hinahawakan ng Desktop App ang batch na pagproseso ng mga pag-export ng EHR sa format na CSV at JSON. Sinusuri ng Privacy Officer ang output laban sa mga panuntunan ng Safe Harbor bago pumunta ang dataset sa mga kasosyo sa pananaliksik.

Ano ang Hahanapin sa isang Offline na Tool

KakayahanBakit Mahalaga
Ganap na offline pagkatapos ng pag-installWalang dependency sa internet sa panahon ng pagproseso
Mga bundled na modelo ng NLPWalang kailangang hakbang ng pag-download
Batch na pagprosesoHawakan ang malalaking dami nang walang manu-manong trabaho
Lokal na naka-encrypt na vaultLigtas na imbakan ng mga config at susi
Audit logMga rekord na kailangan para sa mga pagsusuri ng pagsunod
Suporta sa Windows, macOS, LinuxSumasaklaw sa mga uri ng classified na workstation
Walang opsyon ng telemetryPigilan ang datos na umalis sa pamamagitan ng telemetry
Suporta sa format ng fileDOCX, PDF, TXT, CSV, JSON, Excel

Ang Mga Panuntunan ng Datos ay Nagtutulak sa mga Koponan Patungo sa mga Lokal na Tool

Ang multa ng TikTok na €530M ay nagpasimula ng mas malawak na alon ng mga multa. Ang mga koponan ng EU na gumamit ng mga cloud tool ay nagtatanong na ngayon ng isang bagong tanong. Nasisiyahan ba ang pagproseso sa mga server ng vendor sa GDPR Chapter V at mga pambansang batas ng datos?

Ang pinakamalinis na sagot sa "saan napupunta ang iyong datos?" ay ito: kahit saan — hindi ito kailanman umaalis sa device. Ang lokal na pagproseso ay ganap na inaalis ang tanong ng paglipat ng GDPR.

Para sa mga koponan sa Germany, ang mahigpit na pagbabasa ng DSGVO ng mga Artikulo 44-46 ay nagpapaging lokal na pagproseso bilang isang matalinong pagpipilian. Naaangkop ito kahit walang mahigpit na mga paghihigpit sa network. Ipinapaliwanag ng aming pangkalahatang-ideya ng seguridad kung paano inililimita ng lokal na pagproseso ang third-party na data chain.

Mga Praktikal na Tala sa Deployment

Mag-install sa mga air-gapped na sistema. Ang installer — Windows .exe o .msi, macOS .dmg, Linux .AppImage o .deb — ay inililipat sa air-gapped na network sa pamamagitan ng USB o secure na paglipat ng file. Hindi kailangan ng internet pagkatapos ng pag-install.

Suporta ng wika. 24 na language-specific na modelo ang kasama sa app. Ang buong set ay available offline nang walang karagdagang pag-download.

Mga pangangailangan ng hardware. Ang NLP pipeline ay tumatakbo sa mga modernong workstation nang walang GPU. Ang batch na pagproseso ng 1,000 dokumento ay karaniwang tumatagal ng 5-15 minuto. Depende ang bilis sa laki ng dokumento at bilis ng CPU.

Setup ng offline na lisensya. Para sa mga network kung saan ang isang server ng lisensya ay hindi maabot, available ang offline na setup ng lisensya.

Kapag Ang Air-Gapping ay Hindi Angkop

Nilulutas ng mga air-gapped na sistema ang mga tiyak na problema. Nagdaragdag din sila ng tunay na pasanin.

Alitan sa pag-update. Ang pagpapanatiling napapanahon ang mga modelo at software ay nangangailangan ng mga manu-manong hakbang. Ang mga koponan na nahuhuli ay maaaring mapalampas ang mga bagong pattern ng PII.

Overhead sa pagtutugma. Hindi makakakonekta ang mga air-gapped na sistema sa mga cloud SIEM tool o mga remote na audit dashboard. Ang mga custom na solusyon ng data-diode ay kailangan. Nagpapataas ito ng mga gastos.

Mga trade-off sa katumpakan. Ang mga cloud tool ay nag-a-update ng datos ng pagsasanay nang patuloy. Ang mga offline na modelo ay isang snapshot. Maaari silang mahuli laban sa mga bagong pattern ng wika sa paglipas ng panahon.

Hindi kailangan para sa bawat modelo ng banta. Ang mga koponan na walang mandato ng gobyerno, kalusugan, o legal ay maaaring matuklasan na ang mga cloud tool ay mas praktikal. Ang malakas na encryption, mga audit ng SOC 2 Type II, at mga kasunduan sa pagproseso ng datos ay sumasaklaw sa karamihan ng mga kaso. Ang air-gapping ay nagbubunga lamang kapag ang modelo ng banta ay tunay na kinabibilangan ng pagnanakaw ng datos na nakabatay sa network ng isang mahusay na kalaban.

Para sa karamihan ng mga SMB at karaniwang mga koponan ng enterprise, ang malakas na encryption sa transit at sa pahinga ay nagbibigay ng sapat na proteksyon. Magdagdag ng matibay na mga kontrol sa kontrakto at susaklawin mo ang karamihan ng mga kaso ng paggamit — nang walang overhead ng ganap na air-gapping. Tingnan ang aming FAQ para sa higit pa sa pagpili ng tamang modelo ng deployment.


Pinoproseso ng Desktop App ng anonym.legal (Windows, macOS, Linux) ang PII nang ganap nang lokal na may mga bundled na modelo ng NLP. Hindi kailangan ng koneksyon sa internet pagkatapos ng pag-install. Sinusuportahan ng batch na pagproseso ang 1-5,000 na file bawat run depende sa antas ng plano.

Mga Pinagmulan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.