Presidio بیش از ۲۲۰ موجودیت GDPR را نادیده میگیرد: شکاف پوشش اتحادیه اروپا
بهروزشده برای ۲۰۲۶
Microsoft Presidio با حدود ۴۰ تشخیصدهنده موجودیت پیشفرض ارسال میشود. برای استقرارهای آمریکایی این کار میکند. SSNها، پاسپورتهای آمریکایی، گواهینامههای رانندگی، کارتهای اعتباری، و ایمیلها را پوشش میدهد.
برای استقرارهای اتحادیه اروپا، شکاف بزرگ است. GDPR تمام دادههای شخصی اتحادیه اروپا را پوشش میدهد. این بدون توجه به ملیت موضوع داده اعمال میشود. تیمهای اتحادیه اروپا به تشخیصدهندههایی نیاز دارند که Presidio ارسال نمیکند.
Presidio چه چیزی شامل میشود
موارد پیشفرض Presidio در چهار گروه قرار میگیرند.
شناسههای محوری آمریکا:
- شماره تامین اجتماعی آمریکا (SSN)
- شماره پاسپورت آمریکا
- شماره گواهینامه رانندگی آمریکا
- شماره حساب بانکی آمریکا
- ITIN آمریکا
- شماره مجوز پزشکی آمریکا
شناسههای جهانی:
- آدرس ایمیل
- شماره تلفن
- آدرس IP
- شماره کارت اعتباری
- آدرس کیف پول رمزارز
- URL
موجودیتهای متنی (مبتنی بر NER):
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
بینالمللی محدود:
- شماره NHS UK
- شماره بیمه ملی UK (NINO)
- برخی شناسههای مالی
مجموع: حدود ۴۰ تشخیصدهنده.
تیمهای اتحادیه اروپا به چه چیزی نیاز دارند
شناسههای مالی
IBAN در اکثر فایلهای تجاری اتحادیه اروپا ظاهر میشود. در پرداختها، فاکتورها، و حقوق وجود دارد. IBAN از ISO 13616 پیروی میکند. Presidio هیچ تشخیصدهنده IBAN ندارد.
یک شرکت فینتک آلمانی را در نظر بگیرید. هر فایل پرداخت یک IBAN دارد. بدون تشخیص IBAN، ابزار فقط به دنبال شماره کارت اعتباری میگردد. شناسه پرداخت اصلی اتحادیه اروپا نادیده گرفته میشود. این یعنی یک قطعه کلیدی داده تحت پوشش GDPR هرگز پیدا نمیشود.
شمارههای مالیاتی ملی
هیچکدام از اینها در موارد پیشفرض Presidio نیستند:
- Steueridentifikationsnummer آلمان: ۱۱ رقم
- NIR فرانسه: ۱۵ رقم با یک کلید کنترلی
- Codice Fiscale ایتالیا: ۱۶ کاراکتر با جمع بررسی
- NIF/NIE اسپانیا: ۹ کاراکتر با یک حرف
- BSN هلند: ۹ رقم با اعتبارسنجی elfproef
یک تیم حقوق و دستمزد اتحادیه اروپا فایلهایی از کشورهای عضو مختلف را مدیریت میکند. بدون اینها، حساسترین شناسههای آن رکوردها را از دست میدهد.
شناسههای ملی بهداشتی
شماره NHS UK پوشش دارد. اینها ندارند:
- NIR فرانسه (همچنین شناسه بهداشتی است)
- Krankenkassennummer آلمان
- Codice Fiscale ایتالیا (همچنین شناسه بهداشتی است)
- BSN هلند (برای بیمه درمانی استفاده میشود)
تیمهای بهداشتی اتحادیه اروپا برای حفاظت از داده در سطح GDPR به اینها نیاز دارند.
گواهینامههای رانندگی اتحادیه اروپا
گواهینامههای رانندگی اتحادیه اروپا تحت دستورالعمل 2006/126/EC هستند. هر کشور عضو فرمت خاص خود را دارد. ساختار حروف-اعداد بر اساس کشور متفاوت است. Presidio تشخیصدهندههای گواهینامه رانندگی فقط برای آمریکا دارد. پشتیبانی از گواهینامه رانندگی اتحادیه اروپا ندارد. این یعنی داده گواهینامه رانندگی اتحادیه اروپا بدون تشخیص از کنار میرود.
شمارههای VAT
شمارههای VAT اتحادیه اروپا در هر معامله B2B ظاهر میشوند. فرمت: کد کشور ۲ حرفی به علاوه ۸ تا ۱۲ رقم. Presidio هیچ تشخیصدهنده VAT ندارد. شمارههای VAT به شرکتها و صاحبانشان مرتبط هستند. آنها تحت GDPR داده شخصی هستند.
برای اطلاعات بیشتر درباره تعهدات GDPR، منابع انطباق GDPR را ببینید.
هزینه تشخیصدهندههای سفارشی
وقتی تیمهای اتحادیه اروپا شکاف را پیدا میکنند، تشخیصدهندههای سفارشی میسازند. این زمان واقعی میبرد.
زمان به ازای هر تشخیصدهنده (تخمین تقریبی):
- تحقیق فرمت: ۱ تا ۲ ساعت
- نوشتن کلاس Python: ۲ تا ۴ ساعت
- ساخت regex و اعتبارسنجی: ۲ تا ۴ ساعت
- اضافه کردن کلمات زمینه: ۱ تا ۲ ساعت
- نوشتن آزمایشها: ۲ تا ۳ ساعت
- استقرار و بررسی: ۱ تا ۲ ساعت
این ۹ تا ۱۷ ساعت به ازای هر تشخیصدهنده است. اینها فقط تخمینهای تقریبی هستند.
مثال: یک شرکت فینتک آلمانی به چهار تشخیصدهنده نیاز دارد.
IBAN، Steuer-ID، گواهینامه رانندگی اتحادیه اروپا، VAT آلمان.
- ۴ تشخیصدهنده در ۱۳ ساعت هر کدام = ۵۲ ساعت کار
- در €۱۰۰ در ساعت: حدود €۵٬۲۰۰
این فقط ساخت اولیه را پوشش میدهد. فرمتها با گذر زمان تغییر میکنند. موارد لبه جدید پیش میآیند. بهروزرسانیهای API Presidio میتوانند چیزها را بشکنند. هر تغییر به یک توسعهدهنده نیاز دارد تا آن را بررسی و رفع کند. کار جاری سال به سال به هزینه اضافه میکند.
کتابخانه مدیریتشده
anonym.legal Presidio را با ۲۸۵+ نوع موجودیت گسترش میدهد. تیم کتابخانه را بهروز نگه میدارد. شناسههای اتحادیه اروپا از روز اول گنجانده شدهاند.
آنچه فراتر از موارد پیشفرض Presidio است:
- IBAN در تمام فرمتهای کشورهای عضو اتحادیه اروپا
- شناسههای مالیاتی ملی کشورهای عضو: Steuer-ID، NIR، Codice Fiscale، NIF/NIE، BSN، PESEL، و بیشتر
- شناسههای بهداشتی ملی اتحادیه اروپا
- شمارههای VAT (فرمت اتحادیه اروپا)
- فرمتهای گواهینامه رانندگی اتحادیه اروپا
- فرمتهای پاسپورت اروپایی
- گونههای موجودیت در ۴۸ زبان پشتیبانیشده
وقتی آلمان فرمت شناسه مالیاتی را بهروز میکند، بهروزرسانی با سرویس ارسال میشود. هیچ pull request از تیم شما لازم نیست.
برای شناسههایی که در کتابخانه نیستند، سازنده موجودیت سفارشی به شما اجازه میدهد الگوها را اضافه کنید. هیچ کد Python لازم نیست.
برای نحوه کار بهروزرسانیها و مسیرهای حسابرسی، جزئیات امنیت و انطباق را ببینید.
مثال فینتک آلمانی
یک شرکت فینتک آلمانی باید IBAN، BIC، Steuer-ID، و Handelsregisternummer را در فایلهای مشتری تشخیص دهد.
نرخ تشخیص پیشفرض Presidio برای این چهار نوع: ۰٪.
هیچکدام در کتابخانه پیشفرض نیستند. این دقت ضعیف نیست. صفر تشخیص است. ابزار بخشی از آنها را از دست نمیدهد. اصلاً آنها را نمیبیند.
مقایسه هزینه:
| رویکرد | هزینه سال اول |
|---|---|
| تشخیصدهندههای سفارشی (۴ × ۱۳ ساعت در €۱۰۰ در ساعت) | ~€۵٬۲۰۰ به علاوه نگهداری جاری |
| کتابخانه موجودیت مدیریتشده (پلن Pro) | €۱۸۰ در سال، هر چهار مورد پوشش دارد |
این شکاف در سال اول حدود ۲۹ برابر است. هر سال پس از آن، نگهداری سفارشی هزینه بیشتری اضافه میکند. قیمت سرویس مدیریتشده ثابت میماند.
نتیجهگیری
موارد پیشفرض Presidio موارد استفاده آمریکایی را خوب خدمت میکند. برای استقرارهای اتحادیه اروپا تحت GDPR، کوتاهی دارند. این شکاف نیازمند کار تشخیصدهنده سفارشی یا یک سرویس مدیریتشده است.
برای تیمهای اتحادیه اروپایی که انطباق الزامی است و زمان مهندسی محدود است، یک کتابخانه موجودیت اتحادیه اروپا از پیشساخته یک پروژه ساخت ۵۰+ ساعته را حذف میکند. فایلها میتوانند از روز اول پردازش شوند. هیچ کد سفارشی از ابتدا لازم نیست.