Presidio מפספס 220+ ישויות GDPR: פער הכיסוי האירופי
עודכן ל-2026
Microsoft Presidio מגיע עם כ-40 מזהי ישות ברירת מחדל. לפריסות אמריקאיות, זה עובד. הוא מכסה SSN, דרכונים אמריקאיים, רישיונות נהיגה, כרטיסי אשראי ואימיילים.
לפריסות אירופיות, הפער גדול. GDPR מכסה את כל הנתונים האישיים של האיחוד האירופי. זה חל ללא קשר ללאומיות של נושא הנתונים. צוותים אירופיים זקוקים למזהים שPresidio לא מגיע איתם.
מה Presidio כולל
ברירות המחדל של Presidio נחלקות לארבע קבוצות.
מזהים אמריקאיים:
- מספר ביטוח לאומי אמריקאי (SSN)
- מספר דרכון אמריקאי
- מספר רישיון נהיגה אמריקאי
- מספר חשבון בנק אמריקאי
- ITIN אמריקאי
- מספר רישיון רפואי אמריקאי
מזהים אוניברסליים:
- כתובת אימייל
- מספר טלפון
- כתובת IP
- מספר כרטיס אשראי
- כתובת ארנק קריפטו
- URL
ישויות טקסט (מבוסס NER):
- PERSON
- LOCATION
- ORGANIZATION
- DATE_TIME
בינלאומי מוגבל:
- מספר NHS בריטי
- מספר ביטוח לאומי בריטי (NINO)
- חלק ממזהים פיננסיים
סה"כ: כ-40 מזהים.
מה צוותים אירופיים זקוקים לו
מזהים פיננסיים
IBAN מופיע ברוב הקבצים העסקיים האירופיים. הוא מופיע בתשלומים, חשבוניות ושכר. IBAN עוקב אחר ISO 13616. ל-Presidio אין מזהה IBAN.
דוגמה לחברת פינטק גרמנית: כל קובץ תשלום מכיל IBAN. ללא זיהוי IBAN, הכלי מחפש רק מספרי כרטיס אשראי. מזהה התשלום האירופי העיקרי מפוספס. כלומר פיסת נתונים מכוסה GDPR מרכזית לא נמצאת לעולם.
מזהי מס לאומיים
אף אחד מאלה אינו בברירות המחדל של Presidio:
- Steueridentifikationsnummer גרמני: 11 ספרות
- NIR צרפתי: 15 ספרות עם מפתח בדיקה
- Codice Fiscale איטלקי: 16 תווים עם סיכום בדיקה
- NIF/NIE ספרדי: 9 תווים עם אות
- BSN הולנדי: 9 ספרות עם אימות elfproef
צוות שכר אירופי מטפל בקבצים ממדינות חברות רבות. ללא אלה, הוא מפספס את המזהים הרגישים ביותר בתיעוד הזה.
מזהי בריאות לאומיים
מספר NHS הבריטי מכוסה. אלה לא:
- NIR צרפתי (גם מזהה בריאות)
- Krankenkassennummer גרמני
- Codice Fiscale איטלקי (גם מזהה בריאות)
- BSN הולנדי (משמש לביטוח בריאות)
צוותי בריאות אירופיים זקוקים לאלה לצורך הגנת נתונים ברמת GDPR.
רישיונות נהיגה אירופיים
רישיונות נהיגה אירופיים נופלים תחת Directive 2006/126/EC. לכל מדינה חברה יש פורמט משלה. המבנה האלפאנומרי שונה לפי מדינה. ל-Presidio יש מזהי רישיון נהיגה אמריקאיים בלבד. אין לו תמיכה ברישיון נהיגה אירופי. כלומר נתוני רישיון נהיגה אירופיים עוברים ללא זיהוי.
מספרי מע"מ
מספרי מע"מ אירופיים מופיעים בכל עסקה B2B. פורמט: קוד מדינה בן 2 אותיות ועוד 8–12 ספרות. ל-Presidio אין מזהה מע"מ. מספרי מע"מ מקשרים לחברות ולבעליהן. הם נתונים אישיים תחת GDPR.
למידע נוסף על חובות GDPR, ראו משאבי ציות GDPR.
עלות מזהים מותאמים אישית
כשצוותים אירופיים מגלים את הפער, הם בונים מזהים מותאמים אישית. זה לוקח זמן אמיתי.
זמן לכל מזהה (הערכה גסה):
- מחקר הפורמט: 1–2 שעות
- כתיבת מחלקת Python: 2–4 שעות
- בניית regex ואימות: 2–4 שעות
- הוספת מילות הקשר: 1–2 שעות
- כתיבת בדיקות: 2–3 שעות
- פריסה ובדיקה: 1–2 שעות
זה 9–17 שעות לכל מזהה. אלה הערכות גסות בלבד.
דוגמה: חברת פינטק גרמנית זקוקה לארבעה מזהים.
IBAN, Steuer-ID, רישיון נהיגה אירופי, מע"מ גרמני.
- 4 מזהים × 13 שעות = 52 שעות עבודה
- בתעריף €100 לשעה: כ-€5,200
זה מכסה רק את הבנייה הראשונית. פורמטים משתנים עם הזמן. מקרים חדשים צצים. עדכוני Presidio API יכולים לשבור דברים. כל שינוי דורש מפתח לסקור ולתקן. עבודה שוטפת מוסיפה לעלות שנה אחר שנה.
ספריית הישויות המנוהלת
anonym.legal מרחיבה את Presidio עם 285+ סוגי ישויות. הצוות שומר את הספרייה מעודכנת. מזהים אירופיים כלולים מהיום הראשון.
מה עולה מעבר לברירות המחדל של Presidio:
- IBAN בכל פורמטי מדינות האיחוד האירופי
- מזהי מס לאומיים: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL ועוד
- מזהי בריאות לאומיים אירופיים
- מספרי מע"מ (פורמט אירופי)
- פורמטי רישיון נהיגה אירופיים
- פורמטי דרכון אירופיים
- וריאנטים של ישויות ב-48 שפות נתמכות
כשגרמניה מעדכנת פורמט מזהה מס, העדכון נשלח עם השירות. אין צורך בבקשת pull מהצוות שלכם.
למזהים שאינם בספרייה, בונה הישויות המותאם אישית מאפשר הוספת תבניות. אין צורך בקוד Python.
ראו פרטי אבטחה וציות לגבי כיצד עדכונים ורשימות ביקורת עובדים.
דוגמה: פינטק גרמני
חברת פינטק גרמנית צריכה לזהות IBAN, BIC, Steuer-ID ו-Handelsregisternummer בקבצי לקוחות.
שיעור זיהוי ברירת מחדל של Presidio לארבעת הסוגים הללו: 0%.
אף אחד מהם אינו בספרייה ברירת המחדל. זו לא בעיה של דיוק ירוד. זה אפס זיהויים. הכלי לא מפספס אותם חלקית. הוא פשוט לא רואה אותם כלל.
השוואת עלויות:
| גישה | עלות שנה ראשונה |
|---|---|
| מזהים מותאמים אישית (4 × 13 שעות ב-€100/שעה) | ~€5,200 בתוספת תחזוקה שוטפת |
| ספריית ישויות מנוהלת (תוכנית Pro) | €180/שנה, כל ארבעת הסוגים מכוסים |
הפער הוא כ-29 פעמים בשנה הראשונה. כל שנה שאחרי, תחזוקת מותאם אישית מוסיפה עלות נוספת. מחיר השירות המנוהל נשאר קבוע.
סיכום
ברירות המחדל של Presidio משרתות מקרי שימוש אמריקאיים היטב. לפריסות אירופיות תחת GDPR, הן אינן מספיקות. הפער דורש עבודת מזהים מותאמת אישית או שירות מנוהל.
לצוותים אירופיים שבהם ציות נדרש וזמן הנדסה מוגבל, ספריית ישויות אירופית מובנית מראש מסירה פרויקט בנייה של 50+ שעות. ניתן לעבד קבצים מהיום הראשון. אין צורך בקוד מותאם אישית.