By · Last updated 2026-04-05

Quay lại BlogBảo Mật AI

Sử dụng Cursor & Claude mà không để lộ mã nguồn

Cursor tải các tệp .env vào ngữ cảnh AI theo mặc định. Một công ty dịch vụ tài chính mất 12 triệu USD sau khi các thuật toán giao dịch độc quyền được gửi đến trợ lý AI.

April 5, 20269 phút đọc
Cursor AI securitydeveloper credential leakMCP Server protectionClaude Code securitycodebase privacy

Cursor Tải Gì Vào Ngữ Cảnh AI

Cursor tải các tệp cấu hình JSON và YAML vào ngữ cảnh AI theo mặc định. Những tệp đó thường chứa token đám mây, mật khẩu cơ sở dữ liệu và cài đặt triển khai.

Rủi ro không phải là sử dụng bất cẩn. Đó là thiết lập mặc định. Mỗi phiên lập trình AI chạm đến các tệp cấu hình có thể gửi những tệp đó đến máy chủ của Anthropic hoặc OpenAI.

Ý định của nhà phát triển là tốt. Họ yêu cầu AI sửa một truy vấn cơ sở dữ liệu. Truy vấn có một chuỗi kết nối. AI thấy nó. Đó là sự rò rỉ. Đây là tác dụng phụ của công việc bình thường. Các quy tắc chính sách đơn thuần không thể ngăn chặn nó một cách đáng tin cậy.

Đó là lý do tại sao việc áp dụng công cụ Model Context Protocol tăng 340% trong các môi trường doanh nghiệp trong Q4 2025. Các nhóm cần một giải pháp kỹ thuật. Một tài liệu chính sách mới là không đủ.

Hậu Quả 12 Triệu USD

Một công ty dịch vụ tài chính mất quyền kiểm soát các thuật toán giao dịch độc quyền của mình. Các thuật toán đã đến máy chủ của trợ lý AI trong một phiên đánh giá mã.

Chi phí ước tính: 12 triệu USD (IBM Cost of Data Breach 2025, tổ chức có >10.000 nhân viên). Công ty không thể thu hồi dữ liệu đã tiết lộ. Họ phải kiểm toán mọi tệp đã truyền. Họ thuê luật sư tư vấn về rủi ro bí mật thương mại. Họ thực hiện đánh giá thiệt hại cạnh tranh.

Đó là trường hợp xấu nhất. Trường hợp phổ biến nhỏ hơn nhưng cộng lại rất nhanh. Các khóa API được xoay vòng sau khi chúng xuất hiện trong nhật ký trò chuyện AI. Mật khẩu cơ sở dữ liệu được thay đổi sau khi xuất hiện trong bản ghi công cụ. Token OAuth bị thu hồi sau khi bản ghi màn hình chụp lại chúng. Mỗi bước tốn thời gian nhân viên. Chi phí là thực và hiếm khi được theo dõi.

Cách Lớp Ẩn Danh Hoạt Động

Model Context Protocol (MCP) thêm một lớp giữa máy khách AI và API mô hình AI. Mọi câu lệnh đều đi qua công cụ ẩn danh trước khi chạm đến mô hình.

Không có bảo vệ: Một nhà phát triển viết script di chuyển. Nó có chuỗi kết nối: postgres://admin:password@host:5432/db. Mô hình AI nhận chuỗi đó nguyên trạng.

Với lớp ẩn danh: Công cụ phát hiện chuỗi. Nó thay thế bằng token — [DB_CONN_1]. Mô hình thấy cấu trúc và logic của script. Thông tin xác thực ở lại cục bộ.

Tùy chọn mã hóa có thể đảo ngược đi xa hơn. ID khách hàng và mã sản phẩm được mã hóa và thay thế bằng token tất định. AI trả về phản hồi sử dụng những token đó. Máy chủ giải mã phản hồi và hoán đổi token lại thành giá trị thực. Nhà phát triển đọc các định danh thực tế. Mô hình AI không bao giờ thấy chúng.

Thiết Lập và Trải Nghiệm Nhà Phát Triển

Đối với các nhóm phát triển, thiết lập là một lần. Cursor và Claude Code được cấu hình để định tuyến qua một máy chủ proxy cục bộ. Cấu hình máy chủ xác định loại thực thể nào cần chặn:

  • Khóa API
  • Chuỗi kết nối cơ sở dữ liệu
  • Token xác thực
  • Thông tin xác thực AWS, Azure và GCP
  • Tiêu đề khóa riêng

Các nhóm có thể thêm mẫu tùy chỉnh cho tên dịch vụ nội bộ hoặc định dạng định danh độc quyền.

Từ phía nhà phát triển, không có gì thay đổi. Tự động hoàn thành, đánh giá mã, trợ giúp gỡ lỗi và tạo tài liệu đều hoạt động như trước. Proxy chạy lặng lẽ ở nền.

Phân tích năm 2025 của Checkpoint Research đã gắn cờ lộ thông tin xác thực nhà phát triển là rủi ro tác động cao nhất trong các triển khai công cụ lập trình AI. Đó chính xác là vấn đề mà kiến trúc này giải quyết. Đây là giải pháp kỹ thuật, không phải lời nhắc nhở chính sách.

Tìm hiểu thêm trong tổng quan bảo mậttài liệu tuân thủ của chúng tôi. Xem thêm hướng dẫn phát hiện thực thể để có danh sách đầy đủ các loại dữ liệu bị chặn.

Nguồn

Sẵn sàng bảo vệ dữ liệu của bạn?

Bắt đầu ẩn danh PII với 285+ loại thực thể trên 48 ngôn ngữ.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.