به‌روزرسانی برای ۲۰۲۶

ماده ۵(۱)(ج) GDPR می‌گوید فقط آنچه نیاز دارید جمع‌آوری کنید. این قانون به حداقل رساندن داده است. اکثر تیم‌ها از طریق طراحی فرم، نه قصد بد، آن را نقض می‌کنند. فیلدهای متن آزاد نام‌ها، آدرس‌ها و شماره‌های شناسایی را که هیچ‌کس برنامه‌ریزی نکرده بود جذب می‌کنند.

پاک کردن پایگاه داده بعداً آن را درست نمی‌کند. تخلف هنگام جمع‌آوری داده اتفاق افتاد. توقف آن در منبع تنها راه حقیقی است. یک بررسی API بلادرنگ در ارسال فرم جمع‌آوری بیش از حد را قبل از شروع متوقف می‌کند.

نمای کلی انطباق و اقدامات امنیتی ما را برای اینکه چطور از ماده ۵ GDPR پشتیبانی می‌کنیم ببینید.

چرا فرم‌ها بیش از حد جمع می‌کنند

فیلدهای متن آزاد در برنامه‌های وب PII که هیچ‌کس برنامه‌ریزی نکرده جمع می‌کنند:

فیلدهای «دلیل» تیکت پشتیبانی پر از تاریخچه‌های پزشکی و شماره بیمه
بخش‌های «توضیحات دیگر» نظرسنجی حاوی نام‌های کامل و شماره تلفن
ستون‌های «یادداشت‌ها» منابع انسانی با سال‌ها جزئیات شخصی ساختارنیافته
فیلدهای «یادداشت» سفارش حاوی شماره‌های شناسایی مشتری که برای کمک با مشکلات وارد شده‌اند

قانون به حداقل رساندن الزامی می‌کند که این PII هرگز وارد سیستم‌های شما نشود. پاک‌سازی گذشته‌نگر علائم را درمان می‌کند. تشخیص بلادرنگ علت را حذف می‌کند.

چرا پاک‌سازی گذشته‌نگر ناکافی است

تیم‌هایی که PII ذخیره‌شده را پاک می‌کنند با چهار مشکل روبرو هستند.

کامل بودن. تطابق الگو PII آشکار مانند آدرس‌های ایمیل و شماره‌های شناسایی را پیدا می‌کند. ارجاعات مبتنی بر زمینه را از دست می‌دهد. «خواهرم سوفی هم همین مشکل را داشت» حاوی نامی است که اکثر اسکن‌ها رد می‌کنند.

زمان‌بندی حقوقی. تخلف در جمع‌آوری اتفاق می‌افتد. پاک کردن داده ماه‌ها بعد آن را درست نمی‌کند. اگر یک نهاد نظارتی دوره‌ای را که داده نگهداری شد بررسی کند، نقض از قبل ثبت شده است.

حذف ناقص. پایگاه داده‌ها پشتیبان می‌گیرند. سیستم‌ها لاگ می‌نویسند. ابزارهای تحلیل داده را صادر می‌کنند. حتی بعد از حذف از پایگاه داده اصلی، نسخه‌ها می‌توانند در فایل‌های پشتیبان و لاگ‌های حسابرسی بمانند.

قرار گرفتن در معرض خطر نقض. بین جمع‌آوری و پاک‌سازی، PII اضافی در سیستم‌های شما نشسته است. یک نقض در آن پنجره PII بیش از حد جمع‌آوری‌شده را در محدوده قرار می‌دهد.

توقف جمع‌آوری در منبع همه چهار مورد را حل می‌کند. داده‌ای که هرگز وارد نشود نمی‌تواند نقض شود، نیازی به حذف ندارد و به عنوان تخلف محسوب نمی‌شود.

الگوهای تشخیص برای اعتبارسنجی فرم

سه روش برای افزودن تشخیص PII بلادرنگ به یک فرم وجود دارد.

سمت مشتری (افزونه Chrome). افزونه رویدادهای جای‌گذاری را در فیلدهای مرورگر مراقبت می‌کند. وقتی کاربر متنی با PII جای‌گذاری می‌کند، موجودیت‌ها را فوری برجسته می‌کند. کاربر آن‌ها را قبل از ارسال حذف می‌کند. هیچ فراخوان API نیازی نیست — تشخیص محلی اجرا می‌شود. برای تعاریف انواع موجودیت واژه‌نامه را ببینید.

سمت سرور (یکپارچه‌سازی API). فرم به سرور شما ارسال می‌شود. قبل از نوشتن پایگاه داده، کد شما API تشخیص را فراخوانی می‌کند. API انواع موجودیت را با امتیازهای اطمینان برمی‌گرداند. تطابق‌های با اطمینان بالا ارسال را با یک پیام واضح مسدود می‌کنند. تطابق‌های با اطمینان متوسط یک مرحله بررسی درخواست می‌کنند. داده قبل از ذخیره تمیز است.

هیبرید (توصیه‌شده). برجسته‌سازی سمت مشتری بازخورد سریع به کاربران می‌دهد. بررسی‌های سمت سرور ضمانت انطباق را فراهم می‌کنند. اگر کاربر هشدار مشتری را نادیده بگیرد، بررسی سرور هنوز PII را می‌گیرد. هیچ چیزی بدون بررسی به پایگاه داده نمی‌رسد. برای سوالات رایج درباره آستانه‌های تشخیص FAQ ما را ببینید.

مثال: پورتال بیمار بهداشتی

یک پورتال بیمار به بیماران اجازه می‌دهد قبل از رزرو علائم را در یک فیلد متن آزاد توصیف کنند. فیلد به طور منظم ورودی‌هایی دریافت می‌کند که شامل نام‌های بیماران دیگر، شماره‌های شناسایی و آدرس‌های منزل می‌شود. هیچ‌کدام از این‌ها به سیستم زمان‌بندی تعلق ندارند.

قبل از تشخیص بلادرنگ:

PII در فیلد علائم: حدود ۱۲٪ از ارسال‌ها
روش پاک‌سازی: فرآیند دسته‌ای هفتگی
وضعیت انطباق: واکنشی — تخلف ماده ۵(۱)(ج) در جمع‌آوری اتفاق افتاد

بعد از یکپارچه‌سازی API در ارسال:

API PII با اطمینان بالا را قبل از هر نوشتن به پایگاه داده تشخیص می‌دهد
بیمار می‌بیند: «به نظر می‌رسد پیام شما حاوی اطلاعات شخصی است. لطفاً قبل از ارسال آن را حذف کنید.»
بیمار ویرایش می‌کند و دوباره ارسال می‌کند
پایگاه داده فقط توضیح علائم دریافت می‌کند

در این سناریو، PII در فیلد از حدود ۱۲٪ به زیر ۱٪ از ارسال‌ها کاهش یافت. انطباق اکنون از طریق لاگ‌های تشخیص سمت سرور نشان داده می‌شود نه از طریق اجراهای پاک‌سازی گذشته‌نگر.

سوابق حسابرسی در نقطه جمع‌آوری

نهادهای نظارتی با تیم‌های واکنشی متفاوت از کسانی با کنترل‌های موجود رفتار می‌کنند. ماده ۲۵ GDPR — حفاظت از طریق طراحی و پیش‌فرض — دومی را پاداش می‌دهد.

تشخیص نقطه جمع‌آوری سوابق حسابرسی مفیدی ایجاد می‌کند:

لاگ تشخیص. هر اسکن فرم با انواع موجودیت پیداشده، امتیازهای اطمینان، اقدام انجام‌شده و نتیجه ذخیره می‌شود.
گزارش‌های ماهانه. خلاصه‌ها نرخ تشخیص بر حسب فیلد و نوع موجودیت، و نحوه پاسخ کاربران را نشان می‌دهند.
سوابق پیکربندی. تنظیمات آستانه، فیلدهای پوشش‌داده‌شده و انواع موجودیت تحت نظر — این یک سیاست واضح و مدیریت‌شده را نشان می‌دهد.

این سوابق در بررسی‌های نظارتی کمک می‌کنند. همچنین از حسابرسی داخلی و سوابق پردازش حمایت می‌کنند. برای مثال‌های کنترل‌های نقطه جمع‌آوری در عمل مطالعات موردی ما را ببینید.

ابزارهای هوش مصنوعی و به حداقل رساندن داده

عوامل پشتیبانی اغلب ایمیل‌های مشتری را در ابزارهای پیش‌نویس هوش مصنوعی جای‌گذاری می‌کنند. آن ایمیل‌ها می‌توانند حاوی نام‌ها، آدرس‌ها و شماره‌های حساب باشند. ارسال آن به یک مدل هوش مصنوعی ممکن است فراتر از آنچه لازم است برود.

سرور MCP یک مرحله تشخیص قبل از رسیدن متن به مدل اضافه می‌کند. نام‌های مشتری [CUSTOMER] می‌شوند. جزئیات خاص پاک می‌شوند. هوش مصنوعی با استفاده از متن تمیزشده پاسخ را پیش‌نویس می‌کند. عامل فقط آنچه پاسخ نیاز دارد را برمی‌گرداند.

این قانون به حداقل رساندن داده را برای استفاده هوش مصنوعی برآورده می‌کند. مدل فقط آنچه لازم است دریافت می‌کند — که معمولاً هیچ PII نیست. برای فهرست کامل انواع موجودیت که تشخیص می‌دهیم موجودیت‌ها را ببینید.

منابع

مقالات مرتبط

GDPR و انطباق

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

آغاز دوره آزمایشی رایگان مشاهده ویژگی‌ها

به حداقل رساندن داده GDPR: API بلادرنگ