به حداقل رساندن داده GDPR: API بلادرنگ
بهروزرسانی برای ۲۰۲۶
ماده ۵(۱)(ج) GDPR میگوید فقط آنچه نیاز دارید جمعآوری کنید. این قانون به حداقل رساندن داده است. اکثر تیمها از طریق طراحی فرم، نه قصد بد، آن را نقض میکنند. فیلدهای متن آزاد نامها، آدرسها و شمارههای شناسایی را که هیچکس برنامهریزی نکرده بود جذب میکنند.
پاک کردن پایگاه داده بعداً آن را درست نمیکند. تخلف هنگام جمعآوری داده اتفاق افتاد. توقف آن در منبع تنها راه حقیقی است. یک بررسی API بلادرنگ در ارسال فرم جمعآوری بیش از حد را قبل از شروع متوقف میکند.
نمای کلی انطباق و اقدامات امنیتی ما را برای اینکه چطور از ماده ۵ GDPR پشتیبانی میکنیم ببینید.
چرا فرمها بیش از حد جمع میکنند
فیلدهای متن آزاد در برنامههای وب PII که هیچکس برنامهریزی نکرده جمع میکنند:
- فیلدهای «دلیل» تیکت پشتیبانی پر از تاریخچههای پزشکی و شماره بیمه
- بخشهای «توضیحات دیگر» نظرسنجی حاوی نامهای کامل و شماره تلفن
- ستونهای «یادداشتها» منابع انسانی با سالها جزئیات شخصی ساختارنیافته
- فیلدهای «یادداشت» سفارش حاوی شمارههای شناسایی مشتری که برای کمک با مشکلات وارد شدهاند
قانون به حداقل رساندن الزامی میکند که این PII هرگز وارد سیستمهای شما نشود. پاکسازی گذشتهنگر علائم را درمان میکند. تشخیص بلادرنگ علت را حذف میکند.
چرا پاکسازی گذشتهنگر ناکافی است
تیمهایی که PII ذخیرهشده را پاک میکنند با چهار مشکل روبرو هستند.
کامل بودن. تطابق الگو PII آشکار مانند آدرسهای ایمیل و شمارههای شناسایی را پیدا میکند. ارجاعات مبتنی بر زمینه را از دست میدهد. «خواهرم سوفی هم همین مشکل را داشت» حاوی نامی است که اکثر اسکنها رد میکنند.
زمانبندی حقوقی. تخلف در جمعآوری اتفاق میافتد. پاک کردن داده ماهها بعد آن را درست نمیکند. اگر یک نهاد نظارتی دورهای را که داده نگهداری شد بررسی کند، نقض از قبل ثبت شده است.
حذف ناقص. پایگاه دادهها پشتیبان میگیرند. سیستمها لاگ مینویسند. ابزارهای تحلیل داده را صادر میکنند. حتی بعد از حذف از پایگاه داده اصلی، نسخهها میتوانند در فایلهای پشتیبان و لاگهای حسابرسی بمانند.
قرار گرفتن در معرض خطر نقض. بین جمعآوری و پاکسازی، PII اضافی در سیستمهای شما نشسته است. یک نقض در آن پنجره PII بیش از حد جمعآوریشده را در محدوده قرار میدهد.
توقف جمعآوری در منبع همه چهار مورد را حل میکند. دادهای که هرگز وارد نشود نمیتواند نقض شود، نیازی به حذف ندارد و به عنوان تخلف محسوب نمیشود.
الگوهای تشخیص برای اعتبارسنجی فرم
سه روش برای افزودن تشخیص PII بلادرنگ به یک فرم وجود دارد.
سمت مشتری (افزونه Chrome). افزونه رویدادهای جایگذاری را در فیلدهای مرورگر مراقبت میکند. وقتی کاربر متنی با PII جایگذاری میکند، موجودیتها را فوری برجسته میکند. کاربر آنها را قبل از ارسال حذف میکند. هیچ فراخوان API نیازی نیست — تشخیص محلی اجرا میشود. برای تعاریف انواع موجودیت واژهنامه را ببینید.
سمت سرور (یکپارچهسازی API). فرم به سرور شما ارسال میشود. قبل از نوشتن پایگاه داده، کد شما API تشخیص را فراخوانی میکند. API انواع موجودیت را با امتیازهای اطمینان برمیگرداند. تطابقهای با اطمینان بالا ارسال را با یک پیام واضح مسدود میکنند. تطابقهای با اطمینان متوسط یک مرحله بررسی درخواست میکنند. داده قبل از ذخیره تمیز است.
هیبرید (توصیهشده). برجستهسازی سمت مشتری بازخورد سریع به کاربران میدهد. بررسیهای سمت سرور ضمانت انطباق را فراهم میکنند. اگر کاربر هشدار مشتری را نادیده بگیرد، بررسی سرور هنوز PII را میگیرد. هیچ چیزی بدون بررسی به پایگاه داده نمیرسد. برای سوالات رایج درباره آستانههای تشخیص FAQ ما را ببینید.
مثال: پورتال بیمار بهداشتی
یک پورتال بیمار به بیماران اجازه میدهد قبل از رزرو علائم را در یک فیلد متن آزاد توصیف کنند. فیلد به طور منظم ورودیهایی دریافت میکند که شامل نامهای بیماران دیگر، شمارههای شناسایی و آدرسهای منزل میشود. هیچکدام از اینها به سیستم زمانبندی تعلق ندارند.
قبل از تشخیص بلادرنگ:
- PII در فیلد علائم: حدود ۱۲٪ از ارسالها
- روش پاکسازی: فرآیند دستهای هفتگی
- وضعیت انطباق: واکنشی — تخلف ماده ۵(۱)(ج) در جمعآوری اتفاق افتاد
بعد از یکپارچهسازی API در ارسال:
- API PII با اطمینان بالا را قبل از هر نوشتن به پایگاه داده تشخیص میدهد
- بیمار میبیند: «به نظر میرسد پیام شما حاوی اطلاعات شخصی است. لطفاً قبل از ارسال آن را حذف کنید.»
- بیمار ویرایش میکند و دوباره ارسال میکند
- پایگاه داده فقط توضیح علائم دریافت میکند
در این سناریو، PII در فیلد از حدود ۱۲٪ به زیر ۱٪ از ارسالها کاهش یافت. انطباق اکنون از طریق لاگهای تشخیص سمت سرور نشان داده میشود نه از طریق اجراهای پاکسازی گذشتهنگر.
سوابق حسابرسی در نقطه جمعآوری
نهادهای نظارتی با تیمهای واکنشی متفاوت از کسانی با کنترلهای موجود رفتار میکنند. ماده ۲۵ GDPR — حفاظت از طریق طراحی و پیشفرض — دومی را پاداش میدهد.
تشخیص نقطه جمعآوری سوابق حسابرسی مفیدی ایجاد میکند:
- لاگ تشخیص. هر اسکن فرم با انواع موجودیت پیداشده، امتیازهای اطمینان، اقدام انجامشده و نتیجه ذخیره میشود.
- گزارشهای ماهانه. خلاصهها نرخ تشخیص بر حسب فیلد و نوع موجودیت، و نحوه پاسخ کاربران را نشان میدهند.
- سوابق پیکربندی. تنظیمات آستانه، فیلدهای پوششدادهشده و انواع موجودیت تحت نظر — این یک سیاست واضح و مدیریتشده را نشان میدهد.
این سوابق در بررسیهای نظارتی کمک میکنند. همچنین از حسابرسی داخلی و سوابق پردازش حمایت میکنند. برای مثالهای کنترلهای نقطه جمعآوری در عمل مطالعات موردی ما را ببینید.
ابزارهای هوش مصنوعی و به حداقل رساندن داده
عوامل پشتیبانی اغلب ایمیلهای مشتری را در ابزارهای پیشنویس هوش مصنوعی جایگذاری میکنند. آن ایمیلها میتوانند حاوی نامها، آدرسها و شمارههای حساب باشند. ارسال آن به یک مدل هوش مصنوعی ممکن است فراتر از آنچه لازم است برود.
سرور MCP یک مرحله تشخیص قبل از رسیدن متن به مدل اضافه میکند. نامهای مشتری [CUSTOMER] میشوند. جزئیات خاص پاک میشوند. هوش مصنوعی با استفاده از متن تمیزشده پاسخ را پیشنویس میکند. عامل فقط آنچه پاسخ نیاز دارد را برمیگرداند.
این قانون به حداقل رساندن داده را برای استفاده هوش مصنوعی برآورده میکند. مدل فقط آنچه لازم است دریافت میکند — که معمولاً هیچ PII نیست. برای فهرست کامل انواع موجودیت که تشخیص میدهیم موجودیتها را ببینید.