By · Last updated 2026-06-05

بازگشت به وبلاگامنیت هوش مصنوعی

پیشگیری بلادرنگ از نشت PII در ابزارهای هوش مصنوعی

وقتی کارمندی نام مشتری را در ChatGPT تایپ می‌کند، داده فوری از کنترل سازمان خارج می‌شود. ابزارهای DLP پس از وقوع نمی‌توانند این زنگ را خاموش کنند.

June 5, 20267 دقیقه مطالعه
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

پیشگیری بلادرنگ از نشت PII: توقف نشت داده قبل از وقوع

به‌روزرسانی برای ۲۰۲۶.

در مارس ۲۰۲۳، یک مهندس سامسونگ کد منبع را در ChatGPT جای‌گذاری کرد. داده بلافاصله از کنترل سامسونگ خارج شد. هیچ ابزاری آن را به موقع متوقف نکرد. کنترل‌های امنیتی پس از وقوع نمی‌توانند نشت داده هوش مصنوعی را متوقف کنند. این یک رویداد واحد این واقعیت را ثابت کرد.

ابزارهای تشخیص به شما می‌گویند بعد از وقوع چه اتفاقی افتاده. بررسی لاگ‌ها، DLP اِندپوینت و لاگ‌های حسابرسی همه به همین شکل کار می‌کنند. برای نشت هوش مصنوعی، بعد از وقوع خیلی دیر است. داده از قبل به مدل هوش مصنوعی رسیده است.

ابعاد مشکل

مطالعه Cyberhaven در سال ۲۰۲۵ بررسی کرد که شرکت‌ها چگونه از هوش مصنوعی استفاده می‌کنند. یافته‌ها چشمگیر بود.

  • ۱۱٪ از تمام درخواست‌های ChatGPT حاوی داده خصوصی یا حساس هستند.
  • میانگین کارگر روزانه ۱۴ بار از ابزارهای هوش مصنوعی استفاده می‌کند.
  • کارکنان پرمصرف روزانه ۳۰ تا ۵۰ بار با آن‌ها تعامل دارند.
  • با نرخ ۱۱٪، این یعنی ۳ تا ۵ ارسال حساس برای هر کارگر در روز.

در شرکتی با ۵۰۰ کارمند پرمصرف، این به بیش از ۲٬۰۰۰ ارسال حساس در روز می‌رسد. هر کدام می‌تواند یک نقض ماده ۸۳ GDPR باشد. خطر فقط حقوقی نیست. اعتبار و شهرت نیز در معرض خطر قرار دارند.

انواع رایج محتوای حساس در درخواست‌های هوش مصنوعی عبارتند از:

  • نام و اطلاعات تماس مشتریان.
  • شماره حساب‌ها و سوابق پرداخت.
  • یادداشت‌های پزشکی از کارکنان بهداشتی.
  • جزئیات پرونده از وکلا.
  • یادداشت‌های ارزیابی کارکنان از تیم‌های منابع انسانی.
  • پیش‌بینی‌های داخلی درآمد یا فروش.

مطالعه اشتراک عمدی و تصادفی را از هم جدا نمی‌کند. هر دو خطر حقوقی یکسانی ایجاد می‌کنند. کارمندی که فراموش می‌کند نام مشتری را حذف کند همان نقض را ایجاد می‌کند که کسی که از قانون آگاه است اما رعایت نمی‌کند. نیت نتیجه را تغییر نمی‌دهد.

چرا تشخیص کافی نیست

بررسی شبکه نمی‌تواند ترافیک HTTPS را بدون بلاک TLS بخواند. بلاک TLS سربار اضافه می‌کند و نگرانی‌های حریم خصوصی ایجاد می‌کند. مرورگرهای مدرن اغلب آن را رد می‌کنند.

DLP اِندپوینت نظارت بر ورودی کلیپ‌بورد و صفحه‌کلید می‌کند. اما تأخیر دارد. تا زمانی که یک عامل الگویی را شناسایی کند، ممکن است درخواست از قبل ارسال شده باشد.

لاگ‌های حسابرسی فروشنده پس از اشتراک‌گذاری ثبت می‌کنند. در پاسخ کمک می‌کنند. جلوی نشت را نمی‌گیرند.

آموزش کارکنان یک سیاست است، نه یک کنترل. مطالعه Cyberhaven نشان می‌دهد ۱۱٪ از درخواست‌ها هنوز حاوی محتوای حساس در شرکت‌هایی با سیاست‌های واضح هستند. آموزش از اشتراک‌گذاری تصادفی یا خطاهای لحظه‌ای جلوگیری نمی‌کند.

مسدود کردن ابزارهای هوش مصنوعی بهره‌وری را کاهش می‌دهد. کارکنان سپس از دستگاه‌ها یا حساب‌های شخصی استفاده می‌کنند. این کار را خارج از هر نظارتی می‌برد.

هیچ‌کدام از این روش‌ها از رسیدن محتوای حساس به سیستم‌های هوش مصنوعی در زمان واقعی جلوگیری نمی‌کنند.

پیشگیری در نقطه ورود

تنها دفاع مطمئن، ماسک‌گذاری قبل از ارسال درخواست است. نام مشتری که با [PERSON_1] قبل از خروج از مرورگر جایگزین می‌شود، هرگز توسط مدل هوش مصنوعی دیده نمی‌شود.

نحوه عملکرد ماسک‌گذاری درون‌خطی:

  1. کارمند یک ایمیل مشتری را در Claude یا ChatGPT تایپ می‌کند.
  2. افزونه مرورگر داده شخصی را در زمان واقعی تشخیص می‌دهد.
  3. موجودیت‌ها با برچسب نوع مشخص می‌شوند: PERSON، EMAIL_ADDRESS، ACCOUNT_NUMBER.
  4. کارمند آیتم‌های علامت‌گذاری‌شده را بررسی می‌کند.
  5. با یک کلیک همه موجودیت‌ها با توکن جایگزین می‌شوند.
  6. درخواست ماسک‌شده ارسال می‌شود.

هوش مصنوعی درخواستی این‌گونه دریافت می‌کند: «مشتری [PERSON_1] در [EMAIL_1] حساب [ACCOUNT_1] دارد.»

هوش مصنوعی درخواست را پردازش می‌کند. هرگز نام یا شماره واقعی نمی‌بیند. کارمند مشتری واقعی را از زمینه می‌شناسد.

این رویکرد مزایای روشنی دارد:

  • داده شخصی خارج از سیستم‌های هوش مصنوعی خارجی می‌ماند.
  • جزئیات مشتری به مجموعه‌های آموزشی هوش مصنوعی اضافه نمی‌شود.
  • کارکنان دسترسی به ابزارهای هوش مصنوعی را حفظ می‌کنند. بهره‌وری بالا می‌ماند.

این رویکرد از اشتراک‌گذاری عمدی در صورت دور زدن ابزار توسط کارمند جلوگیری نمی‌کند. بارگذاری فایل‌ها به جریان کاری جداگانه نیاز دارد. هیچ کنترلی کامل نیست. اما ماسک‌گذاری درون‌خطی گروه تصادفی را حذف می‌کند. آن گروه بیشترین حوادث را تشکیل می‌دهد. نتیجه کاهش قابل توجه خطر بدون تغییر در جریان کاری روزانه است.

مطالعه موردی یک دفتر حقوقی

کارکنان یک دفتر حقوقی از Claude برای نوشتن یادداشت‌های قرارداد استفاده می‌کردند. روش آن‌ها: کپی بخش‌هایی از قرارداد، جای‌گذاری در Claude، درخواست خلاصه.

قبل از استفاده از افزونه Chrome — ۶ ماه اول:

  • ۳ حادثه داده مشتری در بررسی شناسایی شد.
  • هر حادثه: نام مشتری به علاوه شماره پرونده در درخواست.
  • هر ۳ تصادفی بودند.

بعد از استفاده از افزونه Chrome — ۶ ماه بعد:

  • صفر حادثه داده مشتری.
  • کارکنان هنگام جای‌گذاری بخش‌های حاوی نام مشتری هشدار بلادرنگ دریافت کردند.
  • یک کلیک «Johnson Controls پرونده ۲۰۲۴-۰۳۴۷» را به «[PERSON_1] پرونده [REFERENCE_1]» تبدیل کرد.
  • روش کار یکسان ماند.

مدیر ارشد گفت: «کارکنان ما قبل از افزونه هم از سیاست باخبر بودند. افزونه انطباق را ساده‌ترین مسیر کرد.»

ببینید چگونه سایر شرکت‌ها با این موضوع کنار آمدند در مطالعات موردی ما. کنترل‌ها را در نمای کلی امنیت بررسی کنید.

سوابق GDPR برای تیم‌های انطباق

شرکت‌هایی که از ماسک‌گذاری مرورگری هوش مصنوعی استفاده می‌کنند باید آن را به عنوان یک اقدام فنی مستند کنند.

سوابق پردازش (ROPA): بیان کنید که درخواست‌های هوش مصنوعی قبل از رسیدن به فروشندگان از طریق ماسک‌گذاری سمت مشتری عبور می‌کنند. انواع موجودیت، نسخه موتور و لاگ‌های استقرار را به عنوان شواهد فهرست کنید.

قراردادهای پردازشگر داده: وقتی هیچ داده شخصی به فروشنده هوش مصنوعی نمی‌رسد، وظایف DPA ساده می‌شوند. داده شخصی که نگه می‌دارید هرگز از سیستم شما خارج نمی‌شود.

لاگ‌های حسابرسی: لاگ‌های افزونه تعداد موجودیت در هر جلسه، نرخ ماسک و انواع موجودیت بر حسب حجم را ضبط می‌کنند. این معیارها در گزارش‌های انطباق تغذیه می‌شوند.

قوانین GDPR برای ابزارهای هوش مصنوعی را در راهنمای انطباق حقوقی و واژه‌نامه ما بررسی کنید. سوالات رایج در FAQ ما هستند.

نتیجه‌گیری

حادثه سامسونگ نشان داد که نشت هوش مصنوعی سریع‌تر از هر کنترل پس از وقوعی اتفاق می‌افتد. مطالعه Cyberhaven عدد آن را ثبت کرد: ۱۱٪ از درخواست‌ها، بارها در روز، برای هر کارمند.

ماسک‌گذاری بلادرنگ قبل از ارسال علت ریشه‌ای را برطرف می‌کند. وقتی داده شخصی هرگز به هوش مصنوعی نرسد، چیزی برای تشخیص، ثبت یا پاک‌سازی وجود ندارد. کارکنان ابزارهای هوش مصنوعی را حفظ می‌کنند. شرکت‌ها وضعیت انطباق خود را حفظ می‌کنند.

تشخیص به شما می‌گوید پیشگیری کِی شکست خورده. برای نشت داده هوش مصنوعی، هزینه شکست — جریمه، آسیب به شهرت، از دست دادن اعتماد — پیشگیری اول را ضروری می‌کند.

قیمت‌گذاری برای شرکتتان را بررسی کنید. بیانیه بنیان‌گذار ما را بخوانید که چرا پیشگیری-اول اصل طراحی اصلی ماست.

منابع

  • Cyberhaven: مطالعه قرار گرفتن داده هوش مصنوعی در معرض خطر ۲۰۲۵ — cyberhaven.com.
  • نقض داده ChatGPT سامسونگ، مارس ۲۰۲۳ — Bloomberg.
  • مواد ۴ و ۳۲ GDPR: داده شخصی و اقدامات فنی — gdpr-info.eu.

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.