By · Last updated 2026-04-13

Quay lại BlogKỹ Thuật

Bảo Mật Cách Ly Mạng: Ẩn Danh Hóa Ngoại Tuyến

Môi trường FedRAMP và ITAR có một điểm chung — đám mây không phải là lựa chọn. Giả danh hóa có thể đảo ngược theo Điều 4(5) GDPR.

April 13, 20269 phút đọc
air-gapped anonymizationSCIF document processingITAR complianceFedRAMP offline toolsoffline PII detection

Yêu Cầu Cách Ly Mạng

Nhà thầu quốc phòng, cơ quan tình báo chính phủ và nhà vận hành cơ sở hạ tầng quan trọng quản lý các mạng nơi kết nối internet bên ngoài là điều vật lý không thể, không chỉ bị cấm bởi chính sách. SCIF (Cơ sở Thông tin Được Phân loại Nhạy cảm) là một phòng hoặc cơ sở được thiết kế để ngăn chặn nghe trộm điện tử và thu thập tín hiệu tình báo — nó được bao bọc bởi lồng Faraday, không có tín hiệu không dây vào hoặc ra. Mạng chính phủ được phân loại theo kiểm soát ITAR (Quy định Buôn bán Vũ khí Quốc tế) không thể truyền dữ liệu kỹ thuật được bảo vệ đến các bên chưa được phê duyệt — một danh mục bao gồm các nhà cung cấp dịch vụ đám mây chưa được cấp phép theo ITAR.

Đối với các tổ chức trong những môi trường này, "SaaS đám mây" không phải là rủi ro cần quản lý — đó là điều kỹ thuật không thể. Bất kỳ công cụ ẩn danh hóa nào yêu cầu kết nối mạng đang hoạt động đều không thể triển khai. Bất kỳ công cụ nào gọi về nhà để xác minh giấy phép đều không phù hợp. Bất kỳ công cụ nào có mô hình phát hiện yêu cầu các cuộc gọi API đám mây để suy luận đều không thể hoạt động.

Cộng đồng Ollama đặc biệt nêu triển khai cách ly mạng là lý do chính đáng chính cho công cụ AI cục bộ: "Tất cả dữ liệu ở lại trên thiết bị của bạn với Ollama, không có thông tin nào được gửi đến máy chủ bên ngoài — đặc biệt quan trọng cho công việc nhạy cảm như bác sĩ xử lý ghi chú bệnh nhân hoặc luật sư xem xét hồ sơ vụ án." Cùng cơ sở lập luận áp dụng ở cấp độ tổ chức cho các môi trường được phân loại và kiểm soát theo ITAR.

Trường Hợp Sử Dụng ITAR

Một nhà khoa học dữ liệu tại nhà thầu quốc phòng xử lý hồ sơ nhân sự theo yêu cầu ITAR cần khử nhận dạng các file trước khi chia sẻ với một nhà báo đang yêu cầu FOIA. Mạng của nhà thầu được cách ly. Việc xử lý phải xảy ra trên máy cách ly và phải tạo ra các đầu ra phù hợp để phát hành công khai.

Trường hợp sử dụng này không có giải pháp đám mây. Con đường duy nhất là một công cụ chạy hoàn toàn trên máy cục bộ, áp dụng các mô hình phát hiện được lưu trữ cục bộ và tạo ra các đầu ra ẩn danh hóa mà không cần bất kỳ giao tiếp bên ngoài nào. Ứng dụng Desktop dựa trên Tauri 2.0 chạy chính xác trong cấu hình này: sau khi tải xuống và cài đặt, không có cuộc gọi mạng nào được thực hiện trong quá trình xử lý tài liệu. Các mô hình NER của spaCy, các mẫu regex và suy luận transformer chạy cục bộ. Đầu ra xử lý không bao giờ rời khỏi máy trừ khi người dùng xuất rõ ràng.

Giả Danh Hóa Có Thể Đảo Ngược cho Hoạt Động Mật

Một yêu cầu liên quan trong bối cảnh mật và chính phủ: giả danh hóa có thể đảo ngược duy trì tiện ích phân tích trong khi bảo vệ danh tính thực. Điều 4(5) GDPR chính thức công nhận giả danh hóa là biện pháp bảo vệ dữ liệu giảm thiểu rủi ro tuân thủ — dữ liệu được giả danh hóa phải chịu các nghĩa vụ giảm bớt so với dữ liệu có thể nhận dạng đầy đủ, miễn là các khóa giả danh hóa được lưu giữ riêng biệt với bộ dữ liệu đã giả danh hóa.

Nghiên cứu IAPP (2024) cho thấy chỉ 23% công cụ ẩn danh hóa cung cấp khả năng đảo ngược thực sự — khả năng giải mã dữ liệu đã giả danh hóa trở lại giá trị gốc sử dụng khóa được lưu giữ riêng biệt với đầu ra. Phần lớn các công cụ triển khai thay thế vĩnh viễn (dữ liệu gốc bị ghi đè và không thể phục hồi) hoặc che giấu (hiển thị một phần giá trị gốc).

Đối với các hoạt động chính phủ nơi các bộ dữ liệu đã giả danh hóa phải có thể chia sẻ giữa các khu vực — một nhóm nhận bộ dữ liệu đã giả danh hóa để phân tích, một nhóm khác giữ khóa giải mã để tái nhận dạng khi có yêu cầu pháp lý — mã hóa có thể đảo ngược với phân tách khóa là kiến trúc tuân thủ duy nhất.

Cách tiếp cận không có kiến thức mở rộng điều này hơn nữa: khóa mã hóa được tạo ra phía máy khách và không bao giờ được truyền đi. Ngay cả khi nhà cung cấp công cụ ẩn danh hóa bị triệu tập, họ không thể cung cấp khóa giải mã vì họ chưa bao giờ nhận nó. Đối với các môi trường mật nơi chuỗi bảo quản cho các khóa mã hóa tự nó là yêu cầu bảo mật, kiến trúc này cung cấp đảm bảo cần thiết.

Tuân Thủ Hướng Dẫn EDPB

Hướng dẫn EDPB 05/2022 về giả danh hóa yêu cầu phân tách khóa: khóa giả danh hóa phải được lưu giữ bởi một bên khác với bên nhận bộ dữ liệu đã giả danh hóa, hoặc được lưu trữ với các biện pháp kiểm soát kỹ thuật ngăn bên nhận truy cập cả dữ liệu và khóa cùng lúc.

Sự kết hợp giữa tạo khóa phía máy khách (khóa không bao giờ rời thiết bị người dùng), xử lý cục bộ (dữ liệu không bao giờ rời môi trường cách ly mạng) và xuất riêng biệt các đầu ra đã giả danh hóa và khóa giải mã đáp ứng yêu cầu phân tách khóa của EDPB trong khi đáp ứng ràng buộc vận hành cách ly mạng.

Nguồn:

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.