By · Last updated 2026-06-05

חזרה לבלוגGDPR ועמידה

Presidio מפספס 220+ ישויות GDPR

Presidio מגיע עם כ-40 מזהי ישות ברירת מחדל המתמקדים במזהים אמריקאיים. ארגונים אירופיים זקוקים ל-IBAN, Codice Fiscale ועוד.

June 5, 20267 דקות קריאה
Presidio entity coverageEU GDPR PIIIBAN detectionEuropean identifiersPresidio vs managed

Presidio מפספס 220+ ישויות GDPR: פער הכיסוי האירופי

עודכן ל-2026

Microsoft Presidio מגיע עם כ-40 מזהי ישות ברירת מחדל. לפריסות אמריקאיות, זה עובד. הוא מכסה SSN, דרכונים אמריקאיים, רישיונות נהיגה, כרטיסי אשראי ואימיילים.

לפריסות אירופיות, הפער גדול. GDPR מכסה את כל הנתונים האישיים של האיחוד האירופי. זה חל ללא קשר ללאומיות של נושא הנתונים. צוותים אירופיים זקוקים למזהים שPresidio לא מגיע איתם.

מה Presidio כולל

ברירות המחדל של Presidio נחלקות לארבע קבוצות.

מזהים אמריקאיים:

  • מספר ביטוח לאומי אמריקאי (SSN)
  • מספר דרכון אמריקאי
  • מספר רישיון נהיגה אמריקאי
  • מספר חשבון בנק אמריקאי
  • ITIN אמריקאי
  • מספר רישיון רפואי אמריקאי

מזהים אוניברסליים:

  • כתובת אימייל
  • מספר טלפון
  • כתובת IP
  • מספר כרטיס אשראי
  • כתובת ארנק קריפטו
  • URL

ישויות טקסט (מבוסס NER):

  • PERSON
  • LOCATION
  • ORGANIZATION
  • DATE_TIME

בינלאומי מוגבל:

  • מספר NHS בריטי
  • מספר ביטוח לאומי בריטי (NINO)
  • חלק ממזהים פיננסיים

סה"כ: כ-40 מזהים.

מה צוותים אירופיים זקוקים לו

מזהים פיננסיים

IBAN מופיע ברוב הקבצים העסקיים האירופיים. הוא מופיע בתשלומים, חשבוניות ושכר. IBAN עוקב אחר ISO 13616. ל-Presidio אין מזהה IBAN.

דוגמה לחברת פינטק גרמנית: כל קובץ תשלום מכיל IBAN. ללא זיהוי IBAN, הכלי מחפש רק מספרי כרטיס אשראי. מזהה התשלום האירופי העיקרי מפוספס. כלומר פיסת נתונים מכוסה GDPR מרכזית לא נמצאת לעולם.

מזהי מס לאומיים

אף אחד מאלה אינו בברירות המחדל של Presidio:

  • Steueridentifikationsnummer גרמני: 11 ספרות
  • NIR צרפתי: 15 ספרות עם מפתח בדיקה
  • Codice Fiscale איטלקי: 16 תווים עם סיכום בדיקה
  • NIF/NIE ספרדי: 9 תווים עם אות
  • BSN הולנדי: 9 ספרות עם אימות elfproef

צוות שכר אירופי מטפל בקבצים ממדינות חברות רבות. ללא אלה, הוא מפספס את המזהים הרגישים ביותר בתיעוד הזה.

מזהי בריאות לאומיים

מספר NHS הבריטי מכוסה. אלה לא:

  • NIR צרפתי (גם מזהה בריאות)
  • Krankenkassennummer גרמני
  • Codice Fiscale איטלקי (גם מזהה בריאות)
  • BSN הולנדי (משמש לביטוח בריאות)

צוותי בריאות אירופיים זקוקים לאלה לצורך הגנת נתונים ברמת GDPR.

רישיונות נהיגה אירופיים

רישיונות נהיגה אירופיים נופלים תחת Directive 2006/126/EC. לכל מדינה חברה יש פורמט משלה. המבנה האלפאנומרי שונה לפי מדינה. ל-Presidio יש מזהי רישיון נהיגה אמריקאיים בלבד. אין לו תמיכה ברישיון נהיגה אירופי. כלומר נתוני רישיון נהיגה אירופיים עוברים ללא זיהוי.

מספרי מע"מ

מספרי מע"מ אירופיים מופיעים בכל עסקה B2B. פורמט: קוד מדינה בן 2 אותיות ועוד 8–12 ספרות. ל-Presidio אין מזהה מע"מ. מספרי מע"מ מקשרים לחברות ולבעליהן. הם נתונים אישיים תחת GDPR.

למידע נוסף על חובות GDPR, ראו משאבי ציות GDPR.

עלות מזהים מותאמים אישית

כשצוותים אירופיים מגלים את הפער, הם בונים מזהים מותאמים אישית. זה לוקח זמן אמיתי.

זמן לכל מזהה (הערכה גסה):

  • מחקר הפורמט: 1–2 שעות
  • כתיבת מחלקת Python: 2–4 שעות
  • בניית regex ואימות: 2–4 שעות
  • הוספת מילות הקשר: 1–2 שעות
  • כתיבת בדיקות: 2–3 שעות
  • פריסה ובדיקה: 1–2 שעות

זה 9–17 שעות לכל מזהה. אלה הערכות גסות בלבד.

דוגמה: חברת פינטק גרמנית זקוקה לארבעה מזהים.

IBAN, Steuer-ID, רישיון נהיגה אירופי, מע"מ גרמני.

  • 4 מזהים × 13 שעות = 52 שעות עבודה
  • בתעריף €100 לשעה: כ-€5,200

זה מכסה רק את הבנייה הראשונית. פורמטים משתנים עם הזמן. מקרים חדשים צצים. עדכוני Presidio API יכולים לשבור דברים. כל שינוי דורש מפתח לסקור ולתקן. עבודה שוטפת מוסיפה לעלות שנה אחר שנה.

ספריית הישויות המנוהלת

anonym.legal מרחיבה את Presidio עם 285+ סוגי ישויות. הצוות שומר את הספרייה מעודכנת. מזהים אירופיים כלולים מהיום הראשון.

מה עולה מעבר לברירות המחדל של Presidio:

  • IBAN בכל פורמטי מדינות האיחוד האירופי
  • מזהי מס לאומיים: Steuer-ID, NIR, Codice Fiscale, NIF/NIE, BSN, PESEL ועוד
  • מזהי בריאות לאומיים אירופיים
  • מספרי מע"מ (פורמט אירופי)
  • פורמטי רישיון נהיגה אירופיים
  • פורמטי דרכון אירופיים
  • וריאנטים של ישויות ב-48 שפות נתמכות

כשגרמניה מעדכנת פורמט מזהה מס, העדכון נשלח עם השירות. אין צורך בבקשת pull מהצוות שלכם.

למזהים שאינם בספרייה, בונה הישויות המותאם אישית מאפשר הוספת תבניות. אין צורך בקוד Python.

ראו פרטי אבטחה וציות לגבי כיצד עדכונים ורשימות ביקורת עובדים.

דוגמה: פינטק גרמני

חברת פינטק גרמנית צריכה לזהות IBAN, BIC, Steuer-ID ו-Handelsregisternummer בקבצי לקוחות.

שיעור זיהוי ברירת מחדל של Presidio לארבעת הסוגים הללו: 0%.

אף אחד מהם אינו בספרייה ברירת המחדל. זו לא בעיה של דיוק ירוד. זה אפס זיהויים. הכלי לא מפספס אותם חלקית. הוא פשוט לא רואה אותם כלל.

השוואת עלויות:

גישהעלות שנה ראשונה
מזהים מותאמים אישית (4 × 13 שעות ב-€100/שעה)~€5,200 בתוספת תחזוקה שוטפת
ספריית ישויות מנוהלת (תוכנית Pro)€180/שנה, כל ארבעת הסוגים מכוסים

הפער הוא כ-29 פעמים בשנה הראשונה. כל שנה שאחרי, תחזוקת מותאם אישית מוסיפה עלות נוספת. מחיר השירות המנוהל נשאר קבוע.

סיכום

ברירות המחדל של Presidio משרתות מקרי שימוש אמריקאיים היטב. לפריסות אירופיות תחת GDPR, הן אינן מספיקות. הפער דורש עבודת מזהים מותאמת אישית או שירות מנוהל.

לצוותים אירופיים שבהם ציות נדרש וזמן הנדסה מוגבל, ספריית ישויות אירופית מובנית מראש מסירה פרויקט בנייה של 50+ שעות. ניתן לעבד קבצים מהיום הראשון. אין צורך בקוד מותאם אישית.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.