By · Last updated 2026-03-03

Kembali ke BlogTeknikal

PII Terasing Udara: Luar Talian-Dahulu untuk Pertahanan

41% dasar keselamatan perusahaan melarang pemprosesan awan dokumen terperingkat. Ketahui cara alat luar talian memenuhi keperluan ITAR, HIPAA, dan DSGVO tanpa sebarang sambungan rangkaian.

March 3, 20268 min baca
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

Apabila Rangkaian Tiada Jalan Keluar

Seorang saintis data bekerja di firma pertahanan. Beliau mempunyai 3,000 rekod kakitangan. Beliau perlu membuang nama, Nombor Jaminan Sosial, dan tahap kelulusan. Kemudian beliau boleh berkongsi data dengan rakan penyelidik di bawah perjanjian CUI.

Rangkaiannya tidak mempunyai internet. Mengikut reka bentuk.

Beliau menguji setiap alat berasaskan web yang boleh ditemuinya. Setiap satunya menghantar data ke pelayan luar. Setiap platform awan memerlukan akaun dan pautan aktif. Walaupun alat "di premis" sering memanggil pelayan lesen jauh.

Inilah masalah penggunaan terasing udara. Ia mengenai lebih banyak pasukan daripada yang kebanyakan orang jangkakan.

Siapa yang Memerlukan Penyingkiran PII Luar Talian

Firma pertahanan dan agensi kerajaan menghadapi ini paling kerap. Program FedRAMP DISA memerlukan data kekal dalam sempadan rangkaian yang diluluskan. ITAR mengehadkan data teknikal kepada sistem yang dikawal AS. Rangkaian seperti JWICS dan SIPRNet dipotong secara fizikal mengikut reka bentuk.

Tetapi keperluan luar talian jauh melampaui tapak terperingkat:

Hospital dengan rangkaian tersegmen. Sistem pengimejan PACS, platform EHR, dan pangkalan data penyelidikan sering berada dalam rangkaian tanpa internet mengikut dasar.

Lantai dagangan dan rumah penjelasan. Sistem dagangan proprietari dan sistem yang disambungkan SWIFT menggunakan penutupan rangkaian yang ketat.

Sistem kawalan perindustrian. Rangkaian SCADA dan infrastruktur kritikal berjalan dengan jurang udara sebagai langkah keselamatan teras. Pengerasan pasca-Stuxnet menjadikan ini norma.

Peraturan data Eropah. Landesdatenschutzgesetze Jerman dan undang-undang EU yang serupa memerlukan pemprosesan data tempatan untuk rekod kerajaan dan kesihatan yang sensitif. Denda GDPR €530 juta TikTok tiba pada Mei 2025. Ia meliputi pemindahan data ke China. Denda itu mendorong lebih banyak pasukan ke arah alat tempatan. Lihat gambaran keseluruhan pematuhan kami untuk peraturan pemindahan GDPR yang terpakai.

Mengapa Alat Awan Gagal dalam Rangkaian Terasing Udara

Kebanyakan alat penyingkiran data mengikut model SaaS:

Peranti Pengguna → HTTPS → API Vendor → Model NLP → Tindak Balas → Peranti Pengguna

Reka bentuk ini memerlukan akses internet di peranti pemprosesan. Ia memerlukan kepercayaan pada pelayan vendor. Ia bermakna data melepasi rangkaian luar.

Pada rangkaian terasing udara, langkah pertama adalah kemustahilan fizikal. Untuk persekitaran terkawal, langkah dua hingga empat masing-masing mungkin melanggar peraturan pematuhan.

Presidio yang dihoskan sendiri adalah alternatif biasa. Tetapi ia memerlukan kemahiran Docker dan persediaan Python. Ia juga memerlukan muat turun model spaCy, yang memerlukan akses internet. Dan ia memerlukan sokongan IT yang berterusan. Kebanyakan pasukan kekurangan semua ini.

Jurang antara kemudahan awan dan kerumitan dihoskan sendiri adalah tepat apa yang diisi oleh alat desktop tempatan.

Cara Penyingkiran PII Tempatan Berfungsi

Alat luar talian yang baik dihantar dengan semua yang diperlukan:

Model NLP tergabung. Model spaCy (40–80 MB setiap satu) dan model transformer untuk pengesanan entiti bernama adalah sebahagian daripada pemasang. Tiada muat turun diperlukan semasa masa jalan.

Saluran paip pengesanan tempatan. Regex, NLP, dan ML semuanya berjalan pada CPU tempatan — atau GPU jika tersedia. Enjin berasaskan Presidio di dalam anonym.legal tidak membuat panggilan rangkaian semasa menjalankan.

Peti kunci tempatan yang disulitkan. Konfigurasi, pratetap, dan kunci disimpan secara tempatan. Peti kunci menggunakan penyulitan AES-256-GCM dan terbitan kunci Argon2id. Tiada penyegerakan awan. Tiada sandaran jauh. Peti kunci kekal pada peranti.

I/O fail tempatan. Fail input datang dari storan tempatan. Fail output kembali ke storan tempatan. Tiada data melepasi sebarang antara muka rangkaian.

Permukaan serangan kecil. Aplikasi Desktop menggunakan Tauri 2.0 (berasaskan Rust). Tauri mempunyai permukaan serangan yang jauh lebih kecil berbanding alat Electron (berasaskan Chromium). Binarinya kira-kira sepersepuluh saiznya. Ia juga memanggil lebih sedikit API OS secara lalai.

Tiga Senario Pematuhan Sebenar

Dokumen ITAR — 500 Fail

Sebuah firma pertahanan perlu berkongsi dokumen teknikal dengan rakan asing di bawah pengecualian lesen. Fail mengandungi nama orang AS dan data kakitangan. Kedua-duanya mesti dibuang dahulu.

Keperluan utama: pemprosesan pada stesen kerja yang telah diperiksa sahaja. Tiada data dihantar di luar rangkaian yang diperiksa. Jejak audit yang menunjukkan kerja telah dilakukan. Sokongan kelompok untuk 500+ fail.

Aplikasi Desktop mengendalikan semua 500+ fail DOCX secara tempatan dalam mod kelompok. Tiada panggilan rangkaian dibuat semasa menjalankan. Log audit kekal dalam peti kunci tempatan. Output memenuhi keperluan pengecualian lesen ITAR.

Agensi Persekutuan Jerman — Rekod Aduan

Sebuah agensi persekutuan Jerman mesti membuang data peribadi dari rekod aduan warganegara. Ia kemudian menghantar rekod kepada institut penyelidikan. Panduan BfDI melarang pemprosesan pada sistem bukan kerajaan.

Aplikasi Desktop berjalan pada stesen kerja Windows 11 agensi. Semua pemprosesan adalah tempatan. Pasukan keselamatan IT mengesahkan ini dengan pemantauan trafik — sifar sambungan luar semasa menjalankan.

Penyelidikan Hospital — Penyah-ID EHR

Passukan penyelidikan hospital perlu menanggalkan rekod pesakit untuk percubaan klinikal. HIPAA Safe Harbor memerlukan penyingkiran 18 jenis pengecam. Rangkaian klinikal tidak mempunyai akses internet.

Aplikasi Desktop mengendalikan pemprosesan kelompok eksport EHR dalam format CSV dan JSON. Pegawai Privasi menyemak output berbanding peraturan Safe Harbor sebelum set data pergi kepada rakan penyelidikan.

Apa yang Perlu Dicari dalam Alat Luar Talian

KeupayaanMengapa Ia Penting
Sepenuhnya luar talian selepas pemasanganTiada kebergantungan internet semasa pemprosesan
Model NLP tergabungTiada langkah muat turun diperlukan
Pemprosesan kelompokKendalikan volum besar tanpa kerja manual
Peti kunci tempatan yang disulitkanStoran selamat konfigurasi dan kunci
Log auditRekod yang diperlukan untuk semakan pematuhan
Sokongan Windows, macOS, LinuxMeliputi jenis stesen kerja terperingkat
Pilihan tanpa telemetriHentikan data keluar melalui telemetri
Sokongan format failDOCX, PDF, TXT, CSV, JSON, Excel

Peraturan Data Mendorong Pasukan ke Arah Alat Tempatan

Denda €530 juta TikTok mencetuskan gelombang denda yang lebih luas. Pasukan EU yang menggunakan alat awan kini bertanya soalan baru. Adakah pemprosesan pada pelayan vendor memenuhi GDPR Bab V dan undang-undang data nasional?

Jawapan terbersih kepada "ke mana data anda pergi?" adalah ini: ke mana-mana pun — ia tidak pernah meninggalkan peranti. Pemprosesan tempatan menghapuskan sepenuhnya soalan pemindahan GDPR.

Untuk pasukan Jerman, pembacaan ketat DSGVO mengenai Artikel 44–46 menjadikan pemprosesan tempatan pilihan bijak. Ini terpakai walaupun tanpa sekatan rangkaian yang ketat. Gambaran keseluruhan keselamatan kami menerangkan cara pemprosesan tempatan memotong rantaian data pihak ketiga.

Nota Penggunaan Praktikal

Pasang pada sistem terasing udara. Pemasang — Windows .exe atau .msi, macOS .dmg, Linux .AppImage atau .deb — dipindahkan ke rangkaian terasing udara melalui USB atau pemindahan fail selamat. Internet tidak diperlukan selepas pemasangan.

Sokongan bahasa. 24 model khusus bahasa dihantar bersama aplikasi. Set penuh tersedia secara luar talian tanpa muat turun tambahan.

Keperluan perkakasan. Saluran paip NLP berjalan pada stesen kerja moden tanpa GPU. Pemprosesan kelompok 1,000 dokumen biasanya mengambil masa 5–15 minit. Kelajuan bergantung pada saiz dokumen dan kelajuan CPU.

Persediaan lesen luar talian. Untuk rangkaian di mana pelayan lesen tidak dapat dicapai, persediaan lesen luar talian tersedia.

Apabila Pengasingan Udara Bukan Pilihan Tepat

Sistem terasing udara menyelesaikan masalah tertentu. Mereka juga menambah beban sebenar.

Geseran kemas kini. Memastikan model dan perisian terkini memerlukan langkah manual. Pasukan yang ketinggalan mungkin terlepas corak PII baharu.

Overhead penyambungan. Sistem terasing udara tidak boleh bersambung dengan alat SIEM awan atau papan pemuka audit jauh. Penyelesaian data-diod tersuai diperlukan. Ini meningkatkan kos.

Pertukaran nilai ketepatan. Alat awan mengemas kini data latihan secara berterusan. Model luar talian adalah gambar snep. Mereka boleh ketinggalan berbanding corak bahasa baharu dari semasa ke semasa.

Tidak diperlukan untuk setiap model ancaman. Pasukan tanpa mandat kerajaan, kesihatan, atau undang-undang mungkin mendapati alat awan lebih praktikal. Penyulitan yang kukuh, audit SOC 2 Jenis II, dan perjanjian pemprosesan data meliputi kebanyakan kes. Pengasingan udara hanya berbaloi apabila model ancaman benar-benar merangkumi kecurian data berasaskan rangkaian oleh musuh yang mahir.

Untuk kebanyakan PKS dan pasukan perusahaan standard, penyulitan yang kukuh dalam transit dan pada rehat memberikan perlindungan yang mencukupi. Tambah kawalan kontraktual yang kukuh dan anda meliputi kebanyakan kes penggunaan — tanpa overhead pengasingan udara penuh. Lihat FAQ kami untuk lebih lanjut tentang memilih model penggunaan yang betul.


Aplikasi Desktop anonym.legal (Windows, macOS, Linux) memproses PII sepenuhnya secara tempatan dengan model NLP tergabung. Tiada sambungan internet diperlukan selepas pemasangan. Pemprosesan kelompok menyokong 1–5,000 fail setiap jalan bergantung pada tahap pelan.

Sumber

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.