Yêu Cầu Cách Ly Mạng
Nhà thầu quốc phòng, cơ quan tình báo chính phủ và nhà vận hành cơ sở hạ tầng quan trọng quản lý các mạng nơi kết nối internet bên ngoài là điều vật lý không thể, không chỉ bị cấm bởi chính sách. SCIF (Cơ sở Thông tin Được Phân loại Nhạy cảm) là một phòng hoặc cơ sở được thiết kế để ngăn chặn nghe trộm điện tử và thu thập tín hiệu tình báo — nó được bao bọc bởi lồng Faraday, không có tín hiệu không dây vào hoặc ra. Mạng chính phủ được phân loại theo kiểm soát ITAR (Quy định Buôn bán Vũ khí Quốc tế) không thể truyền dữ liệu kỹ thuật được bảo vệ đến các bên chưa được phê duyệt — một danh mục bao gồm các nhà cung cấp dịch vụ đám mây chưa được cấp phép theo ITAR.
Đối với các tổ chức trong những môi trường này, "SaaS đám mây" không phải là rủi ro cần quản lý — đó là điều kỹ thuật không thể. Bất kỳ công cụ ẩn danh hóa nào yêu cầu kết nối mạng đang hoạt động đều không thể triển khai. Bất kỳ công cụ nào gọi về nhà để xác minh giấy phép đều không phù hợp. Bất kỳ công cụ nào có mô hình phát hiện yêu cầu các cuộc gọi API đám mây để suy luận đều không thể hoạt động.
Cộng đồng Ollama đặc biệt nêu triển khai cách ly mạng là lý do chính đáng chính cho công cụ AI cục bộ: "Tất cả dữ liệu ở lại trên thiết bị của bạn với Ollama, không có thông tin nào được gửi đến máy chủ bên ngoài — đặc biệt quan trọng cho công việc nhạy cảm như bác sĩ xử lý ghi chú bệnh nhân hoặc luật sư xem xét hồ sơ vụ án." Cùng cơ sở lập luận áp dụng ở cấp độ tổ chức cho các môi trường được phân loại và kiểm soát theo ITAR.
Trường Hợp Sử Dụng ITAR
Một nhà khoa học dữ liệu tại nhà thầu quốc phòng xử lý hồ sơ nhân sự theo yêu cầu ITAR cần khử nhận dạng các file trước khi chia sẻ với một nhà báo đang yêu cầu FOIA. Mạng của nhà thầu được cách ly. Việc xử lý phải xảy ra trên máy cách ly và phải tạo ra các đầu ra phù hợp để phát hành công khai.
Trường hợp sử dụng này không có giải pháp đám mây. Con đường duy nhất là một công cụ chạy hoàn toàn trên máy cục bộ, áp dụng các mô hình phát hiện được lưu trữ cục bộ và tạo ra các đầu ra ẩn danh hóa mà không cần bất kỳ giao tiếp bên ngoài nào. Ứng dụng Desktop dựa trên Tauri 2.0 chạy chính xác trong cấu hình này: sau khi tải xuống và cài đặt, không có cuộc gọi mạng nào được thực hiện trong quá trình xử lý tài liệu. Các mô hình NER của spaCy, các mẫu regex và suy luận transformer chạy cục bộ. Đầu ra xử lý không bao giờ rời khỏi máy trừ khi người dùng xuất rõ ràng.
Giả Danh Hóa Có Thể Đảo Ngược cho Hoạt Động Mật
Một yêu cầu liên quan trong bối cảnh mật và chính phủ: giả danh hóa có thể đảo ngược duy trì tiện ích phân tích trong khi bảo vệ danh tính thực. Điều 4(5) GDPR chính thức công nhận giả danh hóa là biện pháp bảo vệ dữ liệu giảm thiểu rủi ro tuân thủ — dữ liệu được giả danh hóa phải chịu các nghĩa vụ giảm bớt so với dữ liệu có thể nhận dạng đầy đủ, miễn là các khóa giả danh hóa được lưu giữ riêng biệt với bộ dữ liệu đã giả danh hóa.
Nghiên cứu IAPP (2024) cho thấy chỉ 23% công cụ ẩn danh hóa cung cấp khả năng đảo ngược thực sự — khả năng giải mã dữ liệu đã giả danh hóa trở lại giá trị gốc sử dụng khóa được lưu giữ riêng biệt với đầu ra. Phần lớn các công cụ triển khai thay thế vĩnh viễn (dữ liệu gốc bị ghi đè và không thể phục hồi) hoặc che giấu (hiển thị một phần giá trị gốc).
Đối với các hoạt động chính phủ nơi các bộ dữ liệu đã giả danh hóa phải có thể chia sẻ giữa các khu vực — một nhóm nhận bộ dữ liệu đã giả danh hóa để phân tích, một nhóm khác giữ khóa giải mã để tái nhận dạng khi có yêu cầu pháp lý — mã hóa có thể đảo ngược với phân tách khóa là kiến trúc tuân thủ duy nhất.
Cách tiếp cận không có kiến thức mở rộng điều này hơn nữa: khóa mã hóa được tạo ra phía máy khách và không bao giờ được truyền đi. Ngay cả khi nhà cung cấp công cụ ẩn danh hóa bị triệu tập, họ không thể cung cấp khóa giải mã vì họ chưa bao giờ nhận nó. Đối với các môi trường mật nơi chuỗi bảo quản cho các khóa mã hóa tự nó là yêu cầu bảo mật, kiến trúc này cung cấp đảm bảo cần thiết.
Tuân Thủ Hướng Dẫn EDPB
Hướng dẫn EDPB 05/2022 về giả danh hóa yêu cầu phân tách khóa: khóa giả danh hóa phải được lưu giữ bởi một bên khác với bên nhận bộ dữ liệu đã giả danh hóa, hoặc được lưu trữ với các biện pháp kiểm soát kỹ thuật ngăn bên nhận truy cập cả dữ liệu và khóa cùng lúc.
Sự kết hợp giữa tạo khóa phía máy khách (khóa không bao giờ rời thiết bị người dùng), xử lý cục bộ (dữ liệu không bao giờ rời môi trường cách ly mạng) và xuất riêng biệt các đầu ra đã giả danh hóa và khóa giải mã đáp ứng yêu cầu phân tách khóa của EDPB trong khi đáp ứng ràng buộc vận hành cách ly mạng.
Nguồn: