وقتی شبکه هیچ خروجی ندارد
یک دانشمند داده در یک شرکت دفاعی کار میکند. او 3,000 پرونده پرسنلی دارد. باید نامها، شمارههای تأمین اجتماعی و سطوح مجوز را حذف کند. سپس میتواند دادهها را با یک شریک تحقیقاتی تحت یک توافقنامه CUI به اشتراک بگذارد.
شبکه او هیچ اینترنتی ندارد. به طور عمدی.
هر ابزار مبتنی بر وب که میتواند پیدا کند را آزمایش میکند. هر کدام داده را به یک سرور خارجی ارسال میکنند. هر پلتفرم ابری به یک حساب کاربری و یک لینک زنده نیاز دارد. حتی ابزارهای «on-premises» اغلب با یک سرور مجوز راه دور تماس میگیرند.
این مشکل استقرار air-gapped است. بر بسیاری بیشتر از آنچه اکثر مردم انتظار دارند تأثیر میگذارد.
چه کسی به حذف PII آفلاین نیاز دارد
شرکتهای دفاعی و آژانسهای دولتی بیشتر با این مواجه میشوند. برنامه FedRAMP دیسا نیاز دارد دادهها در مرزهای شبکه تأیید شده باقی بمانند. ITAR دادههای فنی را به سیستمهای کنترل شده توسط ایالات متحده محدود میکند. شبکههایی مانند JWICS و SIPRNet به طور فیزیکی قطع هستند.
اما نیاز آفلاین بسیار فراتر از سایتهای طبقهبندی شده میرود:
بیمارستانهایی با شبکههای تقسیمشده. سیستمهای تصویربرداری PACS، پلتفرمهای EHR و پایگاه دادههای تحقیقاتی اغلب روی شبکههایی بدون اینترنت بر اساس سیاست هستند.
کفهای معاملاتی و اتاقهای پایاپای. سیستمهای معاملاتی اختصاصی و سیستمهای متصل به SWIFT از قطعیهای شبکه سخت استفاده میکنند.
سیستمهای کنترل صنعتی. شبکههای SCADA و زیرساختهای حیاتی با air gapها به عنوان یک اقدام امنیتی اصلی اجرا میشوند.
قوانین داده اروپایی. Landesdatenschutzgesetze آلمان و قوانین مشابه اتحادیه اروپا پردازش محلی دادهها را برای سوابق حساس دولتی و بهداشتی الزامی میکنند.
چرا ابزارهای ابری در شبکههای Air-Gapped شکست میخورند
اکثر ابزارهای حذف داده از مدل SaaS پیروی میکنند:
دستگاه کاربر → HTTPS → API فروشنده → مدلهای NLP → پاسخ → دستگاه کاربر
این طراحی به دسترسی اینترنت در دستگاه پردازش نیاز دارد. در یک شبکه air-gapped، مرحله اول یک غیرممکن فیزیکی است.
Presidio self-hosted جایگزین رایج است. اما به مهارتهای Docker و راهاندازی Python نیاز دارد. همچنین به دانلود مدلهای spaCy نیاز دارد که به دسترسی اینترنت نیاز دارد. و به پشتیبانی مداوم IT نیاز دارد. اکثر تیمها فاقد همه اینها هستند.
شکاف بین سهولت ابر و پیچیدگی self-hosted دقیقاً همان چیزی است که ابزارهای دسکتاپ محلی پر میکنند.
چگونه حذف PII محلی کار میکند
یک ابزار آفلاین خوب با همه چیزی که نیاز دارد ارائه میشود:
مدلهای NLP بستهبندی شده. مدلهای spaCy (هر 40–80 MB) و مدلهای transformer برای تشخیص موجودیت نامگذاری شده بخشی از نصبکننده هستند. در زمان اجرا دانلود لازم نیست.
خط لوله تشخیص محلی. Regex، NLP و ML همه روی CPU محلی اجرا میشوند — یا GPU در صورت دسترسی. موتور مبتنی بر Presidio داخل anonym.legal در طول یک اجرا هیچ تماس شبکهای برقرار نمیکند.
vault محلی رمزگذاری شده. تنظیمات، presetها و کلیدها به صورت محلی ذخیره میشوند. vault از رمزگذاری AES-256-GCM و مشتقسازی کلید Argon2id استفاده میکند. هیچ همگامسازی ابری وجود ندارد. vault روی دستگاه باقی میماند.
I/O فایل محلی. فایلهای ورودی از ذخیرهسازی محلی میآیند. فایلهای خروجی به ذخیرهسازی محلی برمیگردند. هیچ دادهای از هیچ رابط شبکهای عبور نمیکند.
سه سناریوی انطباق واقعی
اسناد ITAR — 500 فایل
یک شرکت دفاعی باید اسناد فنی را تحت یک استثنای مجوز با یک شریک خارجی به اشتراک بگذارد. فایلها حاوی نامهای اشخاص ایالات متحده و دادههای پرسنلی هستند. هر دو باید ابتدا حذف شوند.
برنامه دسکتاپ همه 500+ فایل DOCX را به صورت محلی در حالت دستهای مدیریت میکند. در طول اجرا هیچ تماس شبکهای انجام نمیشود. گزارش حسابرسی در vault محلی باقی میماند.
آژانس فدرال آلمان — سوابق شکایات
یک آژانس فدرال آلمانی باید دادههای شخصی را از سوابق شکایات شهروندان حذف کند. راهنمایی BfDI پردازش روی سیستمهای غیردولتی را ممنوع میکند.
برنامه دسکتاپ روی ایستگاههای کاری Windows 11 آژانس اجرا میشود. همه پردازشها محلی هستند. تیم امنیت IT این را با نظارت بر ترافیک تأیید میکند — صفر اتصال خارجی در طول اجرا.
تحقیقات بیمارستانی — شناساییزدایی EHR
یک تیم تحقیقاتی بیمارستانی باید پروندههای بیماران را برای یک کارآزمایی بالینی حذف کند. HIPAA Safe Harbor نیاز به حذف 18 نوع شناسه دارد. شبکه بالینی هیچ دسترسی به اینترنتی ندارد.
برنامه دسکتاپ پردازش دستهای صادرات EHR را در فرمت CSV و JSON مدیریت میکند. مسئول حریم خصوصی خروجی را در برابر قوانین Safe Harbor بررسی میکند.
چه چیزی را در یک ابزار آفلاین جستجو کنید
| قابلیت | چرا اهمیت دارد |
|---|---|
| کاملاً آفلاین بعد از نصب | هیچ وابستگی اینترنتی در طول پردازش |
| مدلهای NLP بستهبندی شده | هیچ مرحله دانلود لازم نیست |
| پردازش دستهای | مدیریت حجمهای بزرگ بدون کار دستی |
| vault محلی رمزگذاری شده | ذخیرهسازی امن تنظیمات و کلیدها |
| گزارش حسابرسی | سوابق لازم برای بررسیهای انطباق |
| پشتیبانی Windows، macOS، Linux | پوشش انواع ایستگاههای کاری طبقهبندی شده |
| بدون گزینه تلهمتری | جلوگیری از خروج داده از طریق تلهمتری |
| پشتیبانی فرمت فایل | DOCX، PDF، TXT، CSV، JSON، Excel |
یادداشتهای استقرار عملی
نصب روی سیستمهای air-gapped. نصبکننده — Windows exe. یا msi.، macOS dmg.، Linux AppImage. یا deb. — از طریق USB یا انتقال فایل امن به شبکه air-gapped منتقل میشود. بعد از نصب اینترنت لازم نیست.
پشتیبانی زبان. 24 مدل زبانی خاص با برنامه ارائه میشوند. مجموعه کامل به صورت آفلاین بدون دانلود اضافی در دسترس است.
نیازهای سختافزاری. خط لوله NLP روی ایستگاههای کاری مدرن بدون GPU اجرا میشود. پردازش دستهای 1,000 سند معمولاً 5-15 دقیقه طول میکشد.
برنامه دسکتاپ anonym.legal (Windows، macOS، Linux) PII را کاملاً به صورت محلی با مدلهای NLP بستهبندی شده پردازش میکند. بعد از نصب نیازی به اتصال اینترنت نیست. پردازش دستهای بسته به سطح طرح از 1 تا 5,000 فایل را پشتیبانی میکند.