ÚOOÚ ומספר הלידה: קידוד מגדר תחת GDPR
עדכון ל-2026
גוף הנתונים הצ'כי הוא ÚOOÚ. בשמו המלא: Úřad pro ochranu osobních údajů. הוא הוציא 58 פסיקות ב-2024. ממצא אחד מופיע בפרשות רבות. ה-rodné číslo (מספר לידה) עובד ללא זיהוי. כלי ה-PII שנמצא בשימוש נבנה לגרמנית או לאנגלית. לא הייתה לו לוגיקה למזהה זה. ÚOOÚ ברור: כלים חייבים לזהות את ה-rodné číslo עם אימות סכום ביקורת וטיפול נכון בהיסט מגדר.
Rodné Číslo: נתוני קטגוריה מיוחדת לפי מבנה
ה-rodné číslo, או RČ, משתמש בפורמט RRMMDD/XXXX.
- RR — שתי הספרות האחרונות של שנת הלידה.
- MM — חודש הלידה. עבור נשים, מתווסף 50. חודש 01 הופך ל-51. חודש 12 הופך ל-62.
- DD — יום הלידה.
- XXXX — רצף קצר של 3–4 ספרות ועוד ערך ביקורת (מודולוס 11).
היסט החודש של נשים הופך מספר זה לסמן של מין ביולוגי. היסט זה אינו אקראי. מערכת רישום האוכלוסין משתמשת בו לחיפוש מנהלי. סעיף 9 ל-GDPR מכסה נתונים המגלים תכונות אישיות. מין הוא אחד מהם. עמדת ÚOOÚ: כל מסמך עם rodné číslo מכיל נתונים הסמוכים לקטגוריה מיוחדת. חלה הגנה חזקה יותר.
כיצד ערך הביקורת עובד: עבור מספרים בני 10 תווים (שהונפקו לאחר 1954), הבסיס המלא בן 9 תווים חייב להתחלק ב-11. עבור מספרים בני 9 תווים (שהונפקו לפני 1954), אין ערך ביקורת. כלים חייבים לטפל בשניהם.
מה ÚOOÚ מגדיר כזיהוי נאות
הנחיות ÚOOÚ הטכניות לשנת 2024 עבור כלי PII קובעות שלוש דרישות.
טיפול בהיסט מגדר: מספרים עם ערכי חודש 51–62 הם מזהים תקינים לנשים. כלי שמתייחס לאלה כתאריכים לא תקינים מפספס בערך חצי מהאוכלוסייה הנשית הבוגרת.
גרסאות פורמט: לידות לפני 1954 נותנות מספרים בני 9 תווים ללא ערך ביקורת. לידות לאחר 1954 נותנות מספרים בני 10 תווים עם ערך ביקורת. שניהם חייבים להיות נתמכים.
אותות הקשר: במסמכים בשפה המקורית, המזהה מופיע ליד תוויות כמו "Rodné číslo:", "RČ:", או "r.č.:". NER מודע לשפה עוזר למצוא אותות אלה גם בטקסט חופשי.
בעיית חברת האם הגרמנית
67% מהחברות במדינה פורסות כלי PII שמוגדרים לגרמנית או לאנגלית. ÚOOÚ מצא זאת בסקר. שרשרת הכישלון בייצור היא צפויה.
חברת אם גרמנית פורסת כלי סריקה. הוא מוגדר למזהים גרמניים. נתוני HR — חוזים, רשומות בריאות, שכר — מכילים מספרי לידה. לכלי אין לוגיקה לסוג מזהה זה. כל מספר לידה נפספס. נתוני בריאות ושכר של עובדים עוברים ללא הבקרות שה-ÚOOÚ מחייב.
ÚOOÚ מחזיק את הבקר המקומי אחראי. "חברת האם שלנו בחרה בכלי" אינה הגנה תקינה. כלל האחריות של GDPR אינו מאפשר זאת.
רשימת תיוג לציות עבור חברות ייצור
אמצעות אלה חלות על חברות תעשייתיות עם כלי חברת האם הגרמנית.
- זיהוי מספר לידה: גם בפורמט 9-תווים וגם 10-תווים. טיפול בהיסט חודש מגדר (50+). בדיקת ערך מודולוס-11 לגרסאות 10-תווים.
- NER בשפה המקומית: spaCy
cs_core_newsאו מודל שווה ערך. כלים גנריים מראים דיוק NER נמוך ב-23% לשפה זו. - זיהוי Číslo OP: ה-občanský průkaz (תעודת זהות לאומית) הוא מספר בן 9 תווים. הוא מופיע לצד מספר הלידה בסוגי מסמכים רבים.
- IČO ו-DIČ: מספרי זיהוי עסקי ומס מופיעים בחוזים. שניהם זקוקים לכיסוי.
- צינור רב-שפתי: סביבות מעורבות מכילות מסמכים בשפה המקומית, גרמנית ואנגלית. צינור חד-שפתי מפספס מופעים חוצי-שפות.
אכיפת ÚOOÚ עקבית. חברות שמציגות ראיות טכניות בביקורת מתמודדות עם קנסות נמוכים בהרבה.