Presidio ২২০টিরও বেশি GDPR এন্টিটি মিস করে: EU কভারেজ গ্যাপ
২০২৬ সালের জন্য আপডেট করা হয়েছে
Microsoft Presidio প্রায় ৪০টি ডিফল্ট এন্টিটি রিকগনাইজার নিয়ে আসে। US ডিপ্লয়মেন্টের জন্য এটি কাজ করে। SSN, US পাসপোর্ট, ড্রাইভিং লাইসেন্স, ক্রেডিট কার্ড এবং ইমেইল কভার করে।
EU ডিপ্লয়মেন্টের জন্য, ব্যবধানটি বড়। GDPR সমস্ত EU ব্যক্তিগত ডেটা কভার করে। ডেটা সাবজেক্টের জাতীয়তা নির্বিশেষে এটি প্রযোজ্য। EU দলগুলির এমন রিকগনাইজার দরকার যা Presidio শিপ করে না।
Presidio কী অন্তর্ভুক্ত করে
Presidio-এর ডিফল্টগুলি চারটি গ্রুপে পড়ে।
US-কেন্দ্রিক আইডি:
- US সোশ্যাল সিকিউরিটি নম্বর (SSN)
- US পাসপোর্ট নম্বর
- US ড্রাইভার লাইসেন্স নম্বর
- US ব্যাংক অ্যাকাউন্ট নম্বর
- US ITIN
- US মেডিকেল লাইসেন্স নম্বর
সার্বজনীন আইডি:
- ইমেইল ঠিকানা
- ফোন নম্বর
- IP ঠিকানা
- ক্রেডিট কার্ড নম্বর
- ক্রিপ্টো ওয়ালেট ঠিকানা
- URL
টেক্সট এন্টিটি (NER-ভিত্তিক):
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
সীমিত আন্তর্জাতিক:
- UK NHS নম্বর
- UK ন্যাশনাল ইন্স্যুরেন্স নম্বর (NINO)
- কিছু আর্থিক পরিচয়কারক
মোট: প্রায় ৪০টি রিকগনাইজার।
EU দলগুলির কী দরকার
আর্থিক আইডি
IBAN বেশিরভাগ EU ব্যবসায়িক ফাইলে দেখা যায়। এটি পেমেন্ট, ইনভয়েস এবং পেরোলে দেখা যায়। IBAN ISO 13616 অনুসরণ করে। Presidio-এর কোনো IBAN রিকগনাইজার নেই।
একটি জার্মান ফিনটেকের কথা ভাবুন। প্রতিটি পেমেন্ট ফাইলে একটি IBAN আছে। IBAN ডিটেকশন ছাড়া, টুল শুধুমাত্র ক্রেডিট কার্ড নম্বর খোঁজে। প্রধান EU পেমেন্ট আইডি মিস হয়। মানে GDPR-কভার করা ডেটার একটি মূল অংশ কখনও পাওয়া যায় না।
জাতীয় ট্যাক্স আইডি
Presidio-এর ডিফল্টে এগুলির কোনোটিই নেই:
- জার্মান Steueridentifikationsnummer: ১১ সংখ্যা
- ফরাসি NIR: চেক কী সহ ১৫ সংখ্যা
- ইতালীয় Codice Fiscale: চেকসাম সহ ১৬ অক্ষর
- স্প্যানিশ NIF/NIE: একটি অক্ষর সহ ৯ অক্ষর
- ডাচ BSN: elfproef যাচাইকরণ সহ ৯ সংখ্যা
একটি EU পেরোল দল অনেক সদস্য রাষ্ট্রের ফাইল পরিচালনা করে। এগুলি ছাড়া, সেই রেকর্ডগুলির সবচেয়ে সংবেদনশীল আইডি মিস হয়।
জাতীয় স্বাস্থ্য আইডি
UK NHS নম্বর কভার করা হয়েছে। এগুলি নয়:
- ফরাসি NIR (স্বাস্থ্য আইডিও)
- জার্মান Krankenkassennummer
- ইতালীয় Codice Fiscale (স্বাস্থ্য আইডিও)
- ডাচ BSN (স্বাস্থ্য বিমার জন্য ব্যবহৃত)
EU স্বাস্থ্য দলগুলির GDPR-স্তরের ডেটা সুরক্ষার জন্য এগুলি দরকার।
EU ড্রাইভিং লাইসেন্স
EU ড্রাইভিং লাইসেন্স Directive 2006/126/EC-এর অধীনে পড়ে। প্রতিটি সদস্য রাষ্ট্রের নিজস্ব ফরম্যাট আছে। আলফানিউমেরিক কাঠামো দেশ অনুযায়ী আলাদা। Presidio-এর শুধুমাত্র US ড্রাইভার লাইসেন্স রিকগনাইজার আছে। EU ড্রাইভিং লাইসেন্সের কোনো সহায়তা নেই। মানে EU ড্রাইভিং লাইসেন্স ডেটা অসনাক্তভাবে পার হয়ে যায়।
VAT নম্বর
EU VAT নম্বর প্রতিটি B2B চুক্তিতে দেখা যায়। ফরম্যাট: ২-অক্ষরের দেশ কোড এবং ৮–১২ সংখ্যা। Presidio-এর কোনো VAT রিকগনাইজার নেই। VAT নম্বর কোম্পানি এবং তাদের মালিকদের সাথে সংযুক্ত। GDPR-এর অধীনে এগুলি ব্যক্তিগত ডেটা।
GDPR বাধ্যবাধকতা সম্পর্কে আরও তথ্যের জন্য, GDPR compliance resources দেখুন।
কাস্টম রিকগনাইজারের খরচ
EU দলগুলি যখন ব্যবধান খুঁজে পায়, তারা কাস্টম রিকগনাইজার তৈরি করে। এতে বাস্তব সময় লাগে।
প্রতিটি রিকগনাইজারের সময় (আনুমানিক):
- ফরম্যাট গবেষণা: ১–২ ঘণ্টা
- Python ক্লাস লেখা: ২–৪ ঘণ্টা
- Regex এবং যাচাইকরণ তৈরি: ২–৪ ঘণ্টা
- প্রসঙ্গ শব্দ যোগ করা: ১–২ ঘণ্টা
- পরীক্ষা লেখা: ২–৩ ঘণ্টা
- ডিপ্লয় এবং পরীক্ষা করা: ১–২ ঘণ্টা
প্রতিটি রিকগনাইজারে ৯–১৭ ঘণ্টা। এগুলি কেবল আনুমানিক।
উদাহরণ: একটি জার্মান ফিনটেকের চারটি রিকগনাইজার দরকার।
IBAN, Steuer-ID, EU ড্রাইভিং লাইসেন্স, জার্মান VAT।
- প্রতিটিতে ১৩ ঘণ্টায় ৪টি রিকগনাইজার = ৫২ ঘণ্টার কাজ
- €১০০/ঘণ্টায়: প্রায় €৫,২০০
এটি কেবল প্রথম নির্মাণ কভার করে। ফরম্যাট সময়ের সাথে পরিবর্তন হয়। নতুন এজ কেস আসে। Presidio API আপডেট জিনিস ভাঙতে পারে। প্রতিটি পরিবর্তনে একজন ডেভেলপারকে পর্যালোচনা এবং ঠিক করতে হবে। চলমান কাজ বছরের পর বছর খরচ যোগ করে।
ম্যানেজড লাইব্রেরি
anonym.legal Presidio-কে ২৮৫টিরও বেশি এন্টিটি টাইপ দিয়ে প্রসারিত করে। দল লাইব্রেরি আপ টু ডেট রাখে। EU পরিচয়কারক প্রথম দিন থেকে অন্তর্ভুক্ত।
Presidio ডিফল্টের বাইরে কী যায়:
- সমস্ত EU সদস্য রাষ্ট্রের ফরম্যাটে IBAN
- সদস্য রাষ্ট্রের ট্যাক্স আইডি: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL এবং আরও
- EU জাতীয় স্বাস্থ্য আইডি
- VAT নম্বর (EU ফরম্যাট)
- EU ড্রাইভিং লাইসেন্স ফরম্যাট
- ইউরোপীয় পাসপোর্ট ফরম্যাট
- ৪৮টি সমর্থিত ভাষায় এন্টিটি ভেরিয়েন্ট
জার্মানি যখন একটি ট্যাক্স আইডি ফরম্যাট আপডেট করে, আপডেটটি সার্ভিসের সাথে শিপ হয়। আপনার দলের পক্ষ থেকে কোনো পুল রিকোয়েস্ট দরকার নেই।
লাইব্রেরিতে নেই এমন আইডির জন্য, কাস্টম এন্টিটি বিল্ডার আপনাকে প্যাটার্ন যোগ করতে দেয়। কোনো Python কোড দরকার নেই।
আপডেট এবং অডিট ট্রেইল কীভাবে কাজ করে তার জন্য security and compliance details দেখুন।
জার্মান ফিনটেকের উদাহরণ
একটি জার্মান ফিনটেককে গ্রাহক ফাইলে IBAN, BIC, Steuer-ID এবং Handelsregisternummern সনাক্ত করতে হবে।
এই চারটি টাইপের জন্য Presidio ডিফল্ট ডিটেকশন হার: ০%।
কোনোটিই ডিফল্ট লাইব্রেরিতে নেই। এটি দুর্বল প্রিসিশন নয়। শূন্য ডিটেকশন। টুল এগুলি আংশিকভাবে মিস করে না। এটি এগুলি মোটেই দেখে না।
খরচ তুলনা:
| পদ্ধতি | প্রথম বছরের খরচ |
|---|---|
| কাস্টম রিকগনাইজার (৪ × ১৩ ঘণ্টা এ €১০০/ঘণ্টা) | ~€৫,২০০ এবং চলমান রক্ষণাবেক্ষণ |
| ম্যানেজড এন্টিটি লাইব্রেরি (Pro প্ল্যান) | €১৮০/বছর, সব চারটি কভার |
প্রথম বছরে ব্যবধান প্রায় ২৯ গুণ। প্রতিটি পরবর্তী বছর, কাস্টম রক্ষণাবেক্ষণ আরও খরচ যোগ করে। ম্যানেজড সার্ভিসের মূল্য স্থির থাকে।
উপসংহার
Presidio-এর ডিফল্টগুলি US ব্যবহার ক্ষেত্রে ভালো কাজ করে। GDPR-এর অধীনে EU ডিপ্লয়মেন্টের জন্য, এগুলি অপর্যাপ্ত। ব্যবধান পূরণে হয় কাস্টম রিকগনাইজার কাজ বা একটি ম্যানেজড সার্ভিস দরকার।
EU দলগুলির জন্য যেখানে কমপ্লায়েন্স প্রয়োজন এবং ইঞ্জিনিয়ারিং সময় সীমিত, একটি পূর্ব-নির্মিত EU এন্টিটি লাইব্রেরি ৫০+ ঘণ্টার বিল্ড প্রজেক্ট দূর করে। ফাইলগুলি প্রথম দিন থেকে প্রক্রিয়া করা যায়। প্রথমে কোনো কাস্টম কোড দরকার নেই।