قانون ایرگپ
برخی شبکهها هیچ اینترنتی ندارند. نه از روی سیاست — بلکه از روی طراحی.
یک SCIF (تأسیسات اطلاعاتی محرمانه حساس) یک اتاق دارای قفس فاراده است. هیچ سیگنال بیسیمی وارد یا خارج نمیشود. ITAR (مقررات ترافیک بینالمللی سلاح) ارسال محتوای فنی پوششدادهشده به طرفهای غیرمجاز را ممنوع میکند. ارائهدهندگان ابر ITAR-تاییدشده نیستند. برای این گروهها، «SaaS ابری» یک ریسکی نیست که باید مدیریت شود.
برای این سایتها، ابزارهای ابری اصلاً کار نمیکنند.
ابزاری که به یک اتصال شبکه زنده نیاز دارد نمیتواند اینجا اجرا شود. ابزاری که با سرور مجوز تماس میگیرد مسدود میشود. ابزاری که فایلها را برای تشخیص به یک API ابری میفرستد نمیتواند در داخل یک SCIF عمل کند. اینها موارد استثنایی نیستند. این محدودیتهای روزانه تیمهای دفاعی هستند.
پرونده ITAR
یک دانشمند داده در یک شرکت دفاعی سوابق پرسنلی تحت ITAR دارد. او باید نامها و شناسهها را قبل از به اشتراک گذاشتن فایلها حذف کند. شبکه او ایرگپ است.
هیچ راهحل ابری وجود ندارد. تنها مسیر ابزاری است که روی دستگاه محلی اجرا میشود. باید مدلهایش را به صورت محلی ذخیره کند. باید خروجی پاک بدون فراخوانیهای خارجی تولید کند.
اپلیکیشن دسکتاپ مبتنی بر Tauri 2.0 این کار را میکند. پس از نصب، هیچ فراخوانی شبکهای در حین اجرا انجام نمیشود. مدلهای spaCy NER و الگوهای regex همه روی CPU محلی اجرا میشوند. خروجی روی دستگاه باقی میماند تا زمانی که کاربر آن را صادر کند.
چرا برگشتپذیری اهمیت دارد
کار طبقهبندیشده اغلب به شبهناشناسسازی برگشتپذیر نیاز دارد. تیمها نامهای واقعی را با کدها عوض میکنند. سوابق را قابل استفاده نگه میدارند. هویتهای واقعی را محافظت میکنند.
ماده ۴(۵) GDPR شبهناشناسسازی را به عنوان یک معیار حریم خصوصی رسمی تعریف میکند. ریسک را کاهش میدهد. سوابق شبهناشناسشده تکالیف حقوقی کمتری دارند — اگر توکن جستجو جدا از مجموعه داده ذخیره شود.
تحقیق IAPP (2024) نشان داد تنها ۲۳ درصد از ابزارها از برگشتپذیری واقعی پشتیبانی میکنند. بیشتر ماسکسازی یکطرفه یا جایگزینی کامل انجام میدهند. وقتی یک سابقه بازنویسی شد، از بین رفته است.
برخی از تیمهای دولتی کارشان را بر اساس بخش تقسیم میکنند. یک تیم فایلهای شبهناشناسشده را دریافت میکند و تحلیل را انجام میدهد. یک تیم دیگر توکن جستجو را نگه میدارد و فقط زمانی که قانون آن را میطلبد سوابق را شناساییمجدد میکند. این طراحی تقسیمشده تنها رویکرد امن برای جریانهای کاری طبقهبندیشده چندتیمی است.
مدل دانش صفر یک گام بیشتر پیش میرود. توکن جستجو روی دستگاه مشتری ایجاد میشود. هرگز ارسال نمیشود. اگر فروشنده احضار شود، نمیتواند توکن را تحویل دهد. هرگز آن را نداشته. این قوانین زنجیره حضانت را در بسیاری از محیطهای طبقهبندیشده برآورده میکند.
جداسازی توکن EDPB
دستورالعملهای EDPB 05/2022 میگویند توکن شبهناشناسسازی باید جدا نگه داشته شود. نباید نزد همان طرفی باشد که سوابق شبهناشناسشده را نگه میدارد. یا باید پشت کنترلهایی قفل باشد که از دسترسی همزمان آن طرف به هر دو سابقه و توکن جلوگیری کند.
سه چیز با هم این قانون را برآورده میکنند:
- توکن روی دستگاه مشتری ایجاد شده — هرگز ارسال نشده
- تمام پردازش به صورت محلی انجام شده — هیچ چیز سایت ایرگپ را ترک نکرده
- خروجی و توکن جداگانه صادر شده — دو فایل جداگانه، دو مسیر جداگانه
این طراحی قانون EDPB و محدودیت ایرگپ را همزمان برآورده میکند.
برای تصویر کامل، مرور امنیت ما نشان میدهد چگونه پردازش محلی زنجیره شخص ثالث را کوتاه میکند. راهنمای انطباق ما قوانین انتقال GDPR را پوشش میدهد. سوالات متداول را برای کمک در راهاندازی ببینید.
اپلیکیشن دسکتاپ anonym.legal تمام تشخیص PII را روی دستگاه محلی اجرا میکند. پس از نصب نیازی به اینترنت نیست. از Windows، macOS و Linux پشتیبانی میکند. مدلهای NLP همراه ۲۴ زبان را پوشش میدهند.
بهروز شده برای ۲۰۲۶
منابع
- دستورالعملهای EDPB 05/2022: شبهناشناسسازی و جداسازی توکن — تاییدشده-خارجی
- IAPP 2024: نظرسنجی برگشتپذیری ابزارهای ناشناسسازی — علامتگذاریشده
- LocalAI Master: هوش مصنوعی ایرگپ برای محیطهای حساس — تاییدشده-خارجی