اطلاعات شخصی جهانی: SSN، CPF، Aadhaar و بیشتر
مشکل ابزارهای اطلاعات شخصی متمرکز بر آمریکا
اکثر ابزارهای اطلاعات شخصی در ایالات متحده ساخته شدهاند. فرمتهای داده آمریکایی را هدف قرار میدهند. شماره تأمین اجتماعی نه رقم در فرمت AAA-BB-CCCC دارد. بخشهای ناحیه، گروه، و سریال آن قوانین مستند دارند. ابزارهای متمرکز بر آمریکا آن را بهخوبی تشخیص میدهند. همچنین شماره تلفنهای آمریکایی، آدرسهای ایمیل، و گواهینامههای رانندگی آمریکایی را تشخیص میدهند. هر شناسه ملی استفادهشده خارج از آمریکا را از دست میدهند.
GDPR یک معافیت فقط-آمریکایی اجازه نمیدهد. Steuer-ID آلمان را در نظر بگیرید. این یک شناسه مالیاتی ۱۱ رقمی است. Bundeszentralamt für Steuern آن را صادر میکند. رقم آخر آن یک جمع کنترلی است. این یک ساکن آلمانی را همانطوری شناسایی میکند که SSN یک آمریکایی را شناسایی میکند. ماده ۴ GDPR «هر اطلاعاتی مربوط به یک شخص طبیعی شناساییشده یا قابل شناسایی» را پوشش میدهد. یک Steuer-ID با این تعریف مطابقت دارد. این داده شخصی است. این درست است چه ابزار شما فرمت را بداند یا نه.
جریمههای GDPR در پی افشای اطلاعات شخصی خاص اتحادیه اروپا در سیستمهایی که از ابزارهای فقط-آمریکایی استفاده میکنند دنبال شدهاند. شکاف انطباق واقعی است. اقدامات اجرایی صورت گرفته است. برای زمینه به راهنمای انطباق GDPR ما مراجعه کنید.
چشمانداز شناسه اروپایی
شکاف پوشش بزرگ است. اینجا یک تفکیک کشور به کشور است.
آلمان: Steuer-ID — ۱۱ رقم، اعتبارسنجی جمع کنترلی. Sozialversicherungsnummer — ۱۲ فیلد، ساختاریافته. Reisepass — ۱۰ کاراکتر با کدهای مقامی.
فرانسه: NIR شناسه تأمین اجتماعی ملی است. ۱۵ رقم دارد. آنها جنسیت، سال تولد، ماه تولد، استان، شهرداری، و یک کلید کنترلی را کد میکنند. SIRET 14 رقم دارد. SIREN نه رقم دارد.
سوئد: Personnummer از فرمت YYMMDD-XXXX استفاده میکند. Samordningsnummer برای غیر ساکنان استفاده میشود. مقدار روز ۶۰ واحد افزایش مییابد.
نروژ: Fødselsnummer 11 مقدار در فرمت DDMMYYNNNKK دارد. جنسیت در گروه میانی کد میشود. D-nummer مقدار روز را ۴۰ واحد افزایش میدهد.
برزیل: CPF — Cadastro de Pessoas Físicas — 11 رقم با دو مقدار کنترلی دارد. CNPJ شناسه تجاری ۱۴ رقمی است.
هند: Aadhaar یک شناسه بیومتریک ۱۲ رقمی است. از یک کنترل Verhoeff استفاده میکند. PAN یک شناسه مالیاتی ۱۰ رقمی با حروف و اعداد است.
امارات: شناسه اماراتی 15 عدد در فرمت 784-سال تولد-دنباله-کنترل دارد.
یک تیم HR جهانی که ۱۲ کشور را پوشش میدهد به یک ابزار نیاز دارد. باید هر ۱۲ فرمت شناسه ملی را در یک عبور مدیریت کند. نگهداری کتابخانههای regex جداگانه برای هر کشور عملی نیست.
معماری ۲۸۵+ نوع موجودیت
کتابخانه ۲۸۵+ نوع موجودیت همه فرمتهای کشورهای عضو اتحادیه اروپا را پوشش میدهد. همچنین شناسههای اصلی آسیا-اقیانوسیه را پوشش میدهد. آنها شامل Aadhaar، PAN، CPF، CNPJ، شناسه اماراتی، و شناسه ملی تایلندی میشوند. فرمتهای آمریکایی — SSN، EIN، گواهینامههای رانندگی ایالتی — نیز گنجانده شدهاند. یک موتور همه آنها را مدیریت میکند. کتابخانه با تغییر فرمتها بهروزرسانی میشود.
این شکافی است که اکثر ابزارها باز میگذارند. برای بررسی آنچه پوشش داده شده مرجع موجودیتها را ببینید. برای قیمتگذاری API بر اساس حجم به قیمتگذاری مراجعه کنید.