הרשות Autoriteit Persoonsgegevens (AP) קנסה את Uber ב-€290 מיליון באוגוסט 2024. הסיבה: העברת נתוני נהגים לשרתים בארה"ב ללא הסכם העברה תקף. שום מקרה GDPR לא הביא לקנס גבוה יותר על העברה חוצת גבולות. ה-AP טיפל ביותר מ-21,400 תלונות ב-2023 — מה שהופך אותו לאחד מרגולטורי הנתונים הפעילים ביותר באירופה.
מה מצאה ה-AP בפרשת Uber
Uber אספה נתונים מנהגים בהולנד ובצרפת. הנתונים כללו היסטוריית מיקום, מסמכי זהות, רשומות שכר, רשומות נהיגה וקבצי מס. כל הנתונים הועברו לשרתים בארה"ב. ה-AP קבעה שאמצעי ההעברה לא היה תקף.
שלושה ממצאים עמדו בבסיס ההחלטה:
- אמצעי העברה חלש: Uber השתמשה בכללים ארגוניים מחייבים (BCRs). ה-AP מצאה שאלה לא כיסו את היקף הנתונים ורגישותם.
- העדר הערכת השפעת העברה (TIA): Uber לא הוכיחה שהמשפט האמריקני מאפשר את ההגנות המוסכמות.
- נתונים רגישים בשילוב: נתוני מיקום, שכר וציוני ביצוע יחד מציירים תמונה מפורטת של כל נהג. ה-AP התייחסה לשילוב זה כשווה ערך לנתונים אישיים רגישים.
פרשת Uber קובעת כלל ברור. נתוני עובדים וקבלנים המועברים לארה"ב זקוקים לאותה TIA ולאמצעים נוספים כמו נתוני צרכנים.
תחומי אכיפה של AP לשנת 2025
עדכון ל-2026
ה-AP ציינה שלושה תחומים שהיא עוקבת אחריהם מקרוב ב-2025.
מעקב עובדים: כלי מעקב בעבודה מרחוק הם המטרה המרכזית. זה כולל יומני פרודוקטיביות, צילומי מסך, מעקב הקלדות וכלי מיקום מרחוק. לפני פריסת כל כלי כזה, חברות חייבות לתעד מדוע דחו אפשרויות פחות פולשניות.
העברות נתונים חוצות גבולות: לאחר פסיקת Uber, ה-AP בוחנת שיטות העברה. חברות המסתמכות על שירותים בארה"ב, אסיה ומדינות לא-מספקות אחרות — בסיכון. כל חברה המשתמשת בכלי תוכנה אמריקניים לצרכי HR, ניהול פרויקטים או נתוני לקוחות חייבת להחזיק TIA עדכנית.
החלטות אוטומטיות: ניקוד אשראי בינה מלאכותית, מסנני גיוס ומערכות ביצועים מפעילות חובות לפי סעיף 22. ה-AP מכוונת לארגונים המקבלים החלטות אוטומטיות ללא שלב בדיקה אנושי אמיתי.
BSN: מזהה לאומי מוגן
הBurgerservicenummer (BSN) הוא מספר זיהוי בן 9 ספרות המשמש בהולנד. הוא מאומת באמצעות בדיקת Elfproef (אחד-עשר). לביצוע הבדיקה: הכפל כל ספרה במשקל מ-9 עד −1, חבר את התוצאות — הסכום חייב להתחלק ב-11.
חוק ה-BSN מגביל את השימוש ל-BSN להקשרים חוקיים ספציפיים: מס, בריאות, ממשל ושכר מעביד. שימוש ב-BSN מחוץ להקשרים אלה מפעיל אכיפת חוק BSN, ובנוסף חבות GDPR.
מדוע כלים גנריים מפספסים BSN: כלים רבים אינם כוללים את בדיקת Elfproef. ללא בדיקה זו, כל מחרוזת בת 9 ספרות מסומנת כ-BSN אפשרי — דבר המייצר התרעות שווא. BSN שגוי גם נפספס — הוא נכשל בבדיקה אך עדיין נראה כתבנית תקינה.
זיהוי NER בטקסט הולנדי
להולנדית (Nederlands) יש מאפיינים שמבלבלים מודלים שאומנו על אנגלית.
מילים מורכבות: ההולנדית מחברת מילים. Persoonsgegevens (נתונים אישיים) ו-Burgerservicenummer (מספר זהות אזרח) הם כל אחד מילה אחת. מודלים שנבנו לאנגלית לרוב מפצלים אותם בנקודה הלא נכונה.
סיומות שמות: הסיומות -je ו--tje מופיעות בשמות פרטיים כמו Annetje, Hansje. מודלי שמות צריכים להתמודד עם צורה הבסיס ועם צורת הקיצור.
פורמטי כתובות: סוגי רחובות כוללים Straat, Laan, Weg, Plein ו-Gracht. מיקודים משתמשים בארבע ספרות ועוד שתי אותיות (דוגמה: 1234 AB). כל קוד ממופה לרחוב יחיד, כך שהוא חושף יותר ממיקודים אירופיים רגילים.
פורמט IBAN: IBAN הולנדי כולל 18 תווים: NL + 2 ספרות בדיקה + קוד בנק בן 4 אותיות + מספר חשבון בן 10 ספרות.
רשימת תיוג טכנית לציות ל-AP
לעמוד בסטנדרטים הנוכחיים של AP, מערכות נתונים זקוקות ל:
- זיהוי BSN עם Elfproef — התאמת תבנית בלבד אינה מספיקה
- NER בהולנדית — מודל כמו spaCy
nl_core_newsמטפל במילים מורכבות ושמות קצרים - זיהוי IBAN — עם מודעות לפורמט, לא גנרי
- רשומות מעבד-משנה לכל ההעברות החוצות גבולות
- TIA עבור ספקים אמריקניים — דרישת בסיס לאחר פסיקת Uber