ÚOOÚ و Rodné Číslo: کدگذاری جنسیت تحت GDPR
بروزرسانی برای ۲۰۲۶
سازمان داده چک ÚOOÚ است. نام کامل: Úřad pro ochranu osobních údajů. در سال ۲۰۲۴ ۵۸ حکم صادر کرد. یک یافته در بسیاری از پروندهها ظاهر میشود. rodné číslo (شماره تولد) بدون شناسایی پردازش شد. ابزار PII مورد استفاده برای آلمانی یا انگلیسی ساخته شده بود. هیچ منطقی برای این نوع شناسه نداشت. ÚOOÚ روشن است: ابزارها باید rodné číslo را با اعتبارسنجی چکسام و رسیدگی صحیح به انتقال جنسیت شناسایی کنند.
Rodné Číslo: داده دسته خاص از طریق ساختار
rodné číslo یا RČ از قالب RRMMDD/XXXX استفاده میکند.
- RR — دو رقم آخر سال تولد.
- MM — ماه تولد. برای زنان، ۵۰ اضافه میشود. ماه ۰۱ به ۵۱ تبدیل میشود. ماه ۱۲ به ۶۲ تبدیل میشود.
- DD — روز تولد.
- XXXX — یک توالی کوتاه از ۳–۴ رقم به علاوه یک مقدار کنترلی (modulus 11).
انتقال ماه زنان این عدد را به نشانگر جنس بیولوژیکی تبدیل میکند. این انتقال تصادفی نیست. سیستم ثبت مدنی از آن برای جستجوی اداری استفاده میکند. ماده ۹ GDPR دادههایی را که ویژگیهای شخصی را آشکار میکند پوشش میدهد. جنس یکی از آنهاست. دیدگاه ÚOOÚ: هر سندی با rodné číslo داده مجاور دسته خاص حمل میکند. حفاظت قویتری اعمال میشود.
نحوه کارکرد مقدار کنترلی: برای اعداد ۱۰ کاراکتری (صادرشده پس از ۱۹۵۴)، پایه ۹ کاراکتری کامل باید بر ۱۱ بخشپذیر باشد. برای اعداد ۹ کاراکتری (صادرشده قبل از ۱۹۵۴)، هیچ مقدار کنترلی وجود ندارد. ابزارها باید هر دو را مدیریت کنند.
آنچه ÚOOÚ شناسایی کافی مینامد
راهنمای فنی ۲۰۲۴ ÚOOÚ برای ابزارهای PII سه الزام تعیین میکند.
رسیدگی به انتقال جنسیت: اعدادی با مقادیر ماه ۵۱–۶۲ شناسههای معتبر برای زنان هستند. ابزاری که اینها را به عنوان تاریخهای نامعتبر تلقی میکند، تقریباً نیمی از شناسه اصلی جمعیت زنان بزرگسال را از دست میدهد.
قالبهای مختلف: تولدهای قبل از ۱۹۵۴ اعداد ۹ کاراکتری بدون مقدار کنترلی میدهند. تولدهای بعد از ۱۹۵۴ اعداد ۱۰ کاراکتری با یکی میدهند. هر دو باید پشتیبانی شوند.
سیگنالهای زمینه: در اسناد به زبان بومی، شناسه در نزدیکی برچسبهایی مانند «Rodné číslo:»، «RČ:»، یا «r.č.:» ظاهر میشود. NER زبانآگاه به یافتن این سیگنالها حتی در متن آزاد کمک میکند.
مشکل شرکت مادر آلمانی
۶۷٪ از شرکتها در این کشور ابزارهای PII پیکربندیشده برای آلمانی یا انگلیسی را مستقر میکنند. ÚOOÚ این را در یک نظرسنجی یافت. زنجیره شکست در تولید قابل پیشبینی است.
یک شرکت مادر آلمانی یک ابزار اسکن مستقر میکند. برای شناسههای آلمانی تنظیم شده است. دادههای HR — قراردادها، سوابق بهداشتی، حقوق — شامل شمارههای تولد است. ابزار هیچ منطقی برای این نوع شناسه ندارد. هر شماره تولد از دست میرود. داده بهداشتی و حقوقی کارمندان بدون کنترلهایی که ÚOOÚ نیاز دارد جابهجا میشود. در یک حسابرسی یا نقض، شرکت محلی نمیتواند «اقدامات فنی مناسب» را طبق ماده ۳۲ GDPR نشان دهد.
UOOU کنترلکننده محلی را مسئول میداند. «شرکت مادر ما ابزار را انتخاب کرد» یک دفاع معتبر نیست. قانون مسئولیتپذیری GDPR آن را نمیپذیرد.
چکلیست انطباق برای شرکتهای تولیدی
این کنترلها برای شرکتهای صنعتی با ابزار شرکت مادر آلمانی اعمال میشود.
- شناسایی شماره تولد: هر دو قالب ۹ کاراکتری و ۱۰ کاراکتری. رسیدگی به ماه با انتقال جنسیت (۵۰+). مقدار کنترلی modulus-11 برای قالبهای ۱۰ کاراکتری.
- NER به زبان بومی: spaCy
cs_core_newsیا یک مدل معادل. ابزارهای عمومی دقت NER ۲۳٪ کمتر برای این زبان دارند. مدلهای محلی شکاف را میبندند. - شناسایی Číslo OP: شناسه کارت ملی (občanský průkaz) یک عدد ۹ کاراکتری است. در بسیاری از انواع اسناد در کنار شماره تولد ظاهر میشود.
- IČO و DIČ: شناسه تجاری و شمارههای مالیاتی در قراردادها ظاهر میشوند. هر دو به پوشش نیاز دارند.
- خط لوله چندزبانه: محیطهای ترکیبی اسنادی به زبان محلی، آلمانی، و انگلیسی دارند. یک خط لوله تکزبانه همکاری متقاطع زبانی را از دست میدهد.
اجرای ÚOOÚ ثابت است. شرکتهایی که شواهد فنی را در یک حسابرسی نشان میدهند با جریمههای بسیار کمتری مواجه میشوند. شرکتهایی که نمیتوانند آن را نشان دهند در معرض ریسک بالاتری قرار دارند.
برای دیدی گستردهتر از نحوه ایجاد معرض GDPR توسط شناسههای ملی، راهنمای شناسایی شماره مالیاتی ملی اتحادیه اروپا ما را ببینید.
برای یک شناسه نوردیک مشابه، راهنمای فنی CPR Datatilsynet ما را ببینید.