By · Last updated 2026-06-05

Quay lại BlogBảo Mật AI

Ngăn Chặn PII Thời Gian Thực Để Chống Rò Rỉ Dữ Liệu AI

Khi nhân viên gõ tên khách hàng vào ChatGPT, dữ liệu đã rời khỏi tầm kiểm soát của tổ chức ngay lập tức. DLP hậu kiểm không thể thu hồi những gì đã xảy ra.

June 5, 20267 phút đọc
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Ngăn Chặn PII Thời Gian Thực: Chặn Đứng Rò Rỉ Dữ Liệu AI Trước Khi Xảy Ra.

Cập nhật cho 2026.

Vào tháng 3 năm 2023, một kỹ sư Samsung đã dán mã nguồn vào ChatGPT. Mã đó lập tức thoát khỏi tầm kiểm soát của Samsung. Không có công cụ nào kịp phát hiện. Các biện pháp bảo mật hậu kiểm không thể ngăn chặn rò rỉ dữ liệu AI. Sự việc đó đã chứng minh điều này.

Các công cụ phát hiện chỉ cho bạn biết chuyện gì đã xảy ra sau sự việc. Kiểm tra log, DLP endpoint, và nhật ký kiểm toán đều hoạt động theo cách này. Với rò rỉ AI, sau sự việc là quá muộn. Dữ liệu đã đến tay mô hình AI rồi.

Quy Mô Của Vấn Đề

Một nghiên cứu của Cyberhaven năm 2025 đã xem xét cách các doanh nghiệp sử dụng AI. Kết quả rất đáng chú ý.

  • 11% tất cả các prompt ChatGPT chứa dữ liệu riêng tư hoặc nhạy cảm.
  • Nhân viên trung bình sử dụng công cụ AI 14 lần mỗi ngày.
  • Nhân viên sử dụng nhiều tương tác 30 đến 50 lần mỗi ngày.
  • Với tỷ lệ 11%, điều đó có nghĩa là 3 đến 5 lần gửi dữ liệu nhạy cảm mỗi nhân viên mỗi ngày.

Tại một công ty có 500 nhân viên sử dụng nhiều, con số này lên đến hơn 2.000 lần gửi dữ liệu nhạy cảm mỗi ngày. Mỗi lần có thể là vi phạm theo Điều 83 GDPR. Rủi ro không chỉ là pháp lý. Uy tín và niềm tin cũng bị ảnh hưởng.

Các loại nội dung nhạy cảm phổ biến trong prompt AI bao gồm:

  • Tên và thông tin liên lạc của khách hàng.
  • Số tài khoản và hồ sơ thanh toán.
  • Ghi chú y tế từ nhân viên y tế.
  • Chi tiết vụ án từ luật sư.
  • Ghi chú đánh giá nhân viên từ bộ phận HR.
  • Dự báo doanh thu hoặc bán hàng nội bộ.

Nghiên cứu không phân biệt chia sẻ cố ý với vô ý. Cả hai đều tạo ra rủi ro pháp lý như nhau. Nhân viên quên xóa tên khách hàng gây ra vi phạm tương tự như người phớt lờ quy tắc. Ý định không thay đổi kết quả.

Tại Sao Phát Hiện Không Đủ

Kiểm tra mạng không thể đọc lưu lượng HTTPS mà không chặn TLS. Chặn TLS thêm chi phí và gây lo ngại về quyền riêng tư. Các trình duyệt hiện đại thường từ chối nó.

DLP Endpoint theo dõi clipboard và đầu vào bàn phím. Nhưng chúng có độ trễ. Khi agent gắn cờ một mẫu, prompt có thể đã được gửi rồi.

Nhật ký kiểm toán của nhà cung cấp ghi lại những gì đã được chia sẻ sau khi đã chia sẻ. Chúng hỗ trợ phản ứng sự cố. Chúng không ngăn chặn rò rỉ.

Đào tạo nhân viên là chính sách, không phải biện pháp kiểm soát. Nghiên cứu Cyberhaven cho thấy 11% prompt vẫn chứa nội dung nhạy cảm tại các công ty có chính sách rõ ràng. Đào tạo không ngăn được chia sẻ vô ý hoặc lơ đãng trong lúc làm việc.

Chặn công cụ AI loại bỏ lợi ích năng suất. Nhân viên sau đó sử dụng thiết bị hoặc tài khoản cá nhân. Điều đó đặt công việc ngoài mọi sự giám sát.

Không có phương pháp nào trong số này ngăn nội dung nhạy cảm đến hệ thống AI trong thời gian thực.

Ngăn Chặn Tại Điểm Nhập

Biện pháp bảo vệ an toàn duy nhất là che giấu trước khi prompt được gửi. Tên khách hàng được thay thế bằng [PERSON_1] trước khi rời khỏi trình duyệt sẽ không bao giờ được mô hình AI nhìn thấy.

Dưới đây là cách che giấu nội tuyến hoạt động:

  1. Nhân viên gõ email khách hàng vào Claude hoặc ChatGPT.
  2. Tiện ích mở rộng trình duyệt phát hiện dữ liệu cá nhân trong thời gian thực.
  3. Các thực thể được đánh dấu với nhãn loại: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. Nhân viên xem xét các mục được đánh dấu.
  5. Một cú nhấp chuột thay thế tất cả thực thể bằng token.
  6. Prompt đã che giấu được gửi đi.

AI nhận được prompt như thế này: "Khách hàng [PERSON_1] tại [EMAIL_1] có tài khoản [ACCOUNT_1]."

AI xử lý yêu cầu. Nó không bao giờ thấy tên hoặc số thật. Nhân viên biết khách hàng thực sự từ ngữ cảnh.

Cách tiếp cận này có những lợi ích rõ ràng:

  • Dữ liệu cá nhân không đến hệ thống AI bên ngoài.
  • Thông tin khách hàng không được thêm vào bộ dữ liệu huấn luyện AI.
  • Nhân viên vẫn có quyền truy cập vào công cụ AI. Năng suất được duy trì.

Nó không ngăn chặn chia sẻ cố ý nếu nhân viên bỏ qua công cụ. Tải lên tệp cần quy trình riêng. Không có biện pháp kiểm soát nào hoàn hảo. Nhưng che giấu nội tuyến loại bỏ nhóm vô ý. Nhóm đó chiếm phần lớn các sự cố. Kết quả là giảm đáng kể rủi ro mà không thay đổi quy trình làm việc hàng ngày.

Nghiên Cứu Trường Hợp: Công Ty Luật

Nhân viên của một công ty luật đã sử dụng Claude để soạn thảo ghi chú hợp đồng. Phương pháp của họ: sao chép các phần hợp đồng, dán vào Claude, yêu cầu tóm tắt.

Trước khi sử dụng Chrome Extension — 6 tháng đầu:

  • 3 sự cố dữ liệu khách hàng được phát hiện trong quá trình xem xét.
  • Mỗi sự cố: tên khách hàng cộng số tham chiếu vụ án xuất hiện trong prompt.
  • Tất cả 3 đều là vô ý.

Sau khi sử dụng Chrome Extension — 6 tháng tiếp theo:

  • Không có sự cố dữ liệu khách hàng nào.
  • Nhân viên nhận được cảnh báo thời gian thực khi dán các phần có tên khách hàng.
  • Một cú nhấp chuột thay thế "Johnson Controls Matter 2024-0347" bằng "[PERSON_1] Matter [REFERENCE_1]."
  • Phương pháp vẫn giữ nguyên.

Quản lý đối tác cho biết: "Nhân viên của chúng tôi đã biết chính sách trước khi có tiện ích. Tiện ích mở rộng đã biến tuân thủ thành con đường dễ dàng nhất."

Xem cách các công ty khác xử lý vấn đề này trong nghiên cứu trường hợp của chúng tôi. Xem xét các biện pháp kiểm soát trong tổng quan bảo mật.

Hồ Sơ GDPR Cho Nhóm Tuân Thủ

Các công ty sử dụng che giấu AI dựa trên trình duyệt phải ghi lại nó như một biện pháp kiểm soát kỹ thuật.

Hồ sơ xử lý (ROPA): Nêu rõ các prompt AI đi qua che giấu phía máy khách trước khi đến nhà cung cấp. Liệt kê các loại thực thể, phiên bản engine, và nhật ký triển khai làm bằng chứng.

Thỏa thuận xử lý dữ liệu: Khi không có dữ liệu cá nhân nào đến nhà cung cấp AI, nghĩa vụ DPA đơn giản hơn. Dữ liệu cá nhân bạn nắm giữ không bao giờ rời khỏi hệ thống của bạn.

Nhật ký kiểm toán: Nhật ký tiện ích ghi lại số lượng thực thể mỗi phiên, tỷ lệ che giấu, và các loại thực thể theo khối lượng. Các chỉ số này đưa vào báo cáo tuân thủ.

Xem xét các quy tắc GDPR cho công cụ AI trong hướng dẫn tuân thủ pháp lýbảng thuật ngữ. Các câu hỏi thường gặp có trong FAQ của chúng tôi.

Kết Luận

Sự cố Samsung cho thấy rò rỉ AI xảy ra nhanh hơn bất kỳ biện pháp kiểm soát hậu kiểm nào có thể phản ứng. Nghiên cứu Cyberhaven đã định lượng nó: 11% prompt, nhiều lần mỗi nhân viên, mỗi ngày.

Che giấu thời gian thực trước khi gửi giải quyết nguyên nhân gốc rễ. Khi dữ liệu cá nhân không bao giờ đến AI, không có gì để phát hiện, ghi nhật ký, hoặc dọn dẹp. Nhân viên vẫn có công cụ AI của họ. Các công ty vẫn giữ trạng thái tuân thủ.

Phát hiện cho bạn biết khi nào ngăn chặn đã thất bại. Với rò rỉ dữ liệu AI, chi phí thất bại — phạt tiền, tổn hại uy tín, mất niềm tin — biện minh cho ngăn chặn trước.

Khám phá giá cả cho công ty của bạn. Đọc tuyên bố của người sáng lập về lý do tại sao ngăn chặn trước là nguyên tắc thiết kế cốt lõi của chúng tôi.

Nguồn

  • Cyberhaven: Nghiên Cứu Phơi Lộ Dữ Liệu AI Doanh Nghiệp 2025 — cyberhaven.com.
  • Vi Phạm Dữ Liệu Samsung ChatGPT, tháng 3 năm 2023 — Bloomberg.
  • GDPR Điều 4 và 32: Dữ liệu cá nhân và các biện pháp kỹ thuật — gdpr-info.eu.

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.