صفحات گسترده اسناد متنی نیستند
یک فایل Word یک جریان متنی است. فایل Excel چیز دیگری است. سلولها به سلولهای دیگر اشاره میکنند. فرمولها بر روی محدودهها اجرا میشوند. جداول محوری دادههای نامگذاریشده را گروهبندی میکنند. ماکروها در کل کارپوشه حرکت میکنند. بیشتر ابزارهای ویرایش، Excel را مثل یک سند متنی در نظر میگیرند. این مدل غلط است.
مثالی ساده: ستون A نام مشتریان را دارد. ستون D این فرمول را دارد: =VLOOKUP(A2, CustomerTable, 5, FALSE). این فرمول موجودی حساب را بر اساس نام جستجو میکند. شما نام موجود در ستون A را جایگزین میکنید ولی فرمول یا جدول جستجو را بهروز نمیکنید. فرمول همچنان موجودی واقعی نام اصلی را برمیگرداند. فایل ظاهراً پاک به نظر میرسد ولی نیست.
این وضعیت در فایلهای Excel سازمانی رایج است. داده در روابط زندگی میکند — نه فقط در سلولها. جایگزین کردن مقادیر سلولی بدون ردیابی این روابط، اطلاعات شخصی را در معرض خطر باقی میگذارد.
ماده ۲۸ GDPR و اشتراکگذاری خارجی
ماده ۲۸ GDPR اشتراکگذاری داده با پردازشکنندگان را پوشش میدهد. اگر داده شخصی را به یک مشاور، فروشنده یا حسابرس ارسال میکنید، باید تضمینهای فنی برقرار باشد.
فرض کنید باید یک فایل ۵۰٬۰۰۰ ردیفی مشتری را با یک فروشنده تحلیل اشتراک بگذارید. صادرات PDF فرمولها را حذف میکند و فایلهای بزرگ با قالببندی پیچیده را خراب میکند. CSV هم فرمولها و جداول محوری را حذف میکند. هیچکدام به فروشنده یک فایل قابل استفاده نمیدهند.
تنها گزینهای که کار میکند: ناشناسسازی در داخل قالب بومی Excel. جایگزین کردن مقادیر شناسنده با حفظ ساختار. فروشنده یک فایل کاربردی دریافت میکند و شما الزام تضمین GDPR را رعایت میکنید.
محیطهای ایرگپ
۶۷ درصد از RFPهای دولتی و دفاعی الزامات محیط ایرگپ را ذکر میکنند (DISA 2024). پیمانکاران دفاعی دادههای پرسنلی، سوابق لجستیکی و پروندههای تدارکاتی را در Excel مدیریت میکنند. آنها نمیتوانند از ابزارهای ابری استفاده کنند. دادهها نمیتوانند از شبکه کنترلشده خارج شوند.
اپلیکیشن دسکتاپ این مشکل را حل میکند. فایلهای Excel را روی دستگاه محلی پردازش میکند. هیچ فراخوانی شبکهای در حین پردازش انجام نمیشود. فایل خروجی هرگز از محیط ایرگپ خارج نمیشود. تیمهای داخلی میتوانند فایلهای پاک را در شبکه کنترلشده به اشتراک بگذارند.
این با پروفایل فنی مورد نیاز برای انطباق قراردادهای دولتی همخوانی دارد.
سه سطح از هوش سلولی
ناشناسسازی مناسب Excel در سه سطح همزمان عمل میکند.
سطح مقدار: پیدا کردن و جایگزین کردن اطلاعات شخصی در سلولهای جداگانه. نامها، ایمیلها، شمارههای تلفن و شناسههای ملی با همان موتور تشخیص مورد استفاده در پردازش اسناد علامتگذاری میشوند.
سطح فرمول: پیدا کردن سلولهایی که فرمولهایشان به سلولهای حاوی اطلاعات شخصی ارجاع میدهند. بهروزرسانی آن ارجاعها برای اشاره به مقادیر ناشناسشده. یا جایگزین کردن فرمول با نتیجه آن برای جلوگیری از افشای اطلاعات شخصی از طریق فرمول.
سطح ساختار: پاک کردن حافظه پنهان داده جداول محوری. پردازش ردیفها و ستونهای مخفی. مدیریت کد ماکرو VBA که از آدرسها یا مقادیر سلولی خاص استفاده میکند.
هر سه سطح باید با هم اجرا شوند. رفع مشکل مقادیر بدون رفع مشکل فرمولها، اطلاعات شخصی را در محل باقی میگذارد. رفع مشکل فرمولها بدون پاک کردن حافظه پنهان نیز همین نتیجه را دارد.
این چالش شامل تمام قالبهای فایل میشود. برای دیدگاهی گستردهتر نحوه تأثیر تکهتکهشدگی قالب بر تشخیص اطلاعات شخصی را ببینید.
برای تیمهایی که با دادههای ساختاریافته در سطح API کار میکنند، کمینهسازی داده GDPR در APIهای بلادرنگ را مطالعه کنید.
اگر تیم شما صادراتهای دستهای بزرگ DSAR را مدیریت میکند، پردازش دستهای GDPR DSAR در مقیاس را ببینید.