By · Last updated 2026-02-24

חזרה לבלוגבריאות

זיהוי PHI: Snow Labs עם 96% לעומת GPT-4o

לא כל כלי ה-de-identification שווים. מדדי ECIR 2025 מציגים ציוני F1 בין 79% ל-96%. למדו מדוע הדיוק חשוב וכיצד להעריך כלים.

February 24, 20267 דקות קריאה
PHI detectionde-identificationNER accuracyHIPAAbenchmarks

עודכן ל-2026

לא כל כלי ה-De-Identification שווים

דיוק הוא המדד היחיד שחשוב לזיהוי PHI. פער של 4% נראה קטן. על מיליון רשומות, מדובר ב-40,000 מטופלים חשופים.

מדדי ECIR 2025 מראים פערי דיוק גדולים בין הכלים המובילים. תוצאות אלו צריכות לעצב כל החלטת רכישה בתחום הבריאות.

תוצאות המדד של ECIR 2025

<!-- VERIFIED-EXTERNAL: John Snow Labs ECIR 2025 Text2Story Workshop paper -->
כליציון F1דיוקהיקף
John Snow Labs96%95%97%
Azure AI91%90%92%
AWS Comprehend Medical83%81%85%
GPT-4o79%82%76%

ציון F1 משלב שני דברים. דיוק: כמה פריטים מסומנים היו PHI אמיתי. היקף: כמה פריטי PHI אמיתיים נמצאו.

  • דיוק נמוך פירושו חסימה יתרה ואובדן הקשר.
  • היקף נמוך פירושו PHI שפוספס — דליפת מידע.

מדוע קיים הפער

נתוני אימון חשובים

John Snow Labs מאמן על רשימות קליניות. רשימות אלו מכילות שפה לא מסודרת ומלאות בקיצורים. GPT-4o מאמן על מגוון רחב של טקסטים. הוא לא נבנה עבור נתונים קליניים.

כלימיקוד האימון
John Snow Labsממוקד בריאות, רשימות קליניות
Azure AIרפואי כללי + קליני
AWS Comprehend Medicalישויות רפואיות כלליות
GPT-4oאימון רחב, לא ממוקד בריאות

כיסוי הישויות משתנה

לא כל כלי מוצא את אותם סוגי PHI.

ישותJohn SnowAzureAWSGPT-4o
שמות מטופליםכןכןכןכן
מספרי רשומות רפואיותכןכןמוגבלמוגבל
מינוני תרופותכןכןכןחלקי
קודי פרוצדורותכןכןמוגבללא
קיצורים קלינייםכןחלקילאחלקי
שמות בני משפחהכןכןחלקיחלקי

הקשר קשה להבנה

דוגמה מרשומה קלינית:

"המטופל מדווח על נטילת תרופת Smith. ד"ר Johnson ממליץ להגדיל את המינון."

כלי PHI טוב חייב לבצע שלושה דברים:

  1. לקרוא את "Smith" כשם מותג, לא כמטופל.
  2. לסמן "ד"ר Johnson" כשם רופא לחסימה.
  3. להבין ש"המטופל" הוא תיוג תפקיד, לא שם.

GPT-4o מפספס מקרים אלו. זה מוריד את ההיקף ל-76%.

עלות הדיוק הנמוך

מעבר מ-79% ל-96% מצמצם חשיפה ב-170,000 רשומות למיליון שעובדו.

<!-- VERIFIED: arithmetic derived from ECIR 2025 benchmark figures -->
דיוקרשומותחשיפת PHI
96%1,000,00040,000
91%1,000,00090,000
83%1,000,000170,000
79%1,000,000210,000

עונשי HIPAA גדלים עם החשיפה

<!-- VERIFIED-EXTERNAL: HIPAA Journal penalty tiers / 45 CFR 160.404 -->
רמהסיבהעונש לכל הפרה
1לא מודע$100–$50,000
2סיבה סבירה$1,000–$50,000
3הזנחה מכוונת, תוקנה$10,000–$50,000
4הזנחה מכוונת, לא תוקנה$50,000+

בחירה בכלי של 79% כשקיימים כלים של 96% עשויה להיחשב הזנחה מכוונת לפי כללי HHS. הפער ידוע. כלי טוב יותר קיים בשוק.

כיצד מסלול היברידי מעלה את הדיוק

אין שיטה בודדת שמוצאת את כל סוגי PHI. מסלול היברידי מחבר שיטות. כל שיטה ממלאת את הפערים שהאחרות משאירות.

טקסט קלט
    ↓
[תבניות Regex] — נתונים מובנים: SSN, MRN, תאריכים
    ↓
[spaCy NER] — שמות, מיקומים, ארגונים
    ↓
[מודלי Transformer] — ישויות תלויות הקשר
    ↓
[מילונים רפואיים] — מונחים ספציפיים לבריאות
    ↓
תוצאות ממוזגות (הרמה הגבוהה ביותר מנצחת)
שיטהחוזקותחולשות
Regexמושלם לנתונים מובניםללא טיפול בהקשר
spaCyמהיר, ישויות נפוצותאוצר מילים רפואי מוגבל
Transformersמודע להקשר, היקף גבוהאיטי יותר
מילוניםמונחים רפואיים מלאיםסטטי, דורש עדכונים

כל שיטה תופסת את מה שהאחרות מפספסות. ראו כיצד זה פועל בדף תאימות האבטחה ומסמכי ציות משפטי.

שאלות לשאול כל ספק

לפני חתימה, שאלו חמישה דברים:

  1. מהו ציון F1 על רשומות קליניות? קבלו נתונים מגורם שלישי. דחו טענות מעורפלות.
  2. אילו סוגי ישויות? כל 18 מזהי HIPAA Safe Harbor חייבים להיות מכוסים.
  3. כיצד אתם מטפלים בקיצורים? "Pt," "Dx," ו-"Hx" דורשים פתרון נכון.
  4. האם אתם תופסים PHI של בני משפחה? "לאמא יש סוכרת" הוא PHI. כלים רבים מפספסים זאת.
  5. האם אתם תומכים בכל פורמטי הרשומות? רשומות התקדמות, סיכומי שחרור ודוחות רדיולוגיה שונים מאוד.

דגלים אדומים לשים לב אליהם:

  • אין מספרי דיוק ספציפיים
  • בדיקה רק על נתונים נקיים ומובנים
  • אין נתוני אימון ספציפיים לבריאות
  • מעט סוגי ישויות
  • אין אימות HIPAA Safe Harbor

בדיקת כלים בעצמכם

הריצו בדיקה משלכם בארבעה שלבים.

שלב 1 — בנו מאגר נתונים. השתמשו ברשומות שעברו de-identification ממגוון מומחיויות. כסו את כל 18 סוגי HIPAA בנוסף לקצוות קשים כמו קיצורים ושמות משפחה.

שלב 2 — קבעו תקן זהב. מומחים מסמנים כל פריט PHI עם סוג וטווח מדויק.

שלב 3 — הריצו כל כלי. השוו פלט לתקן הזהב. דרגו דיוק, היקף ו-F1.

שלב 4 — פרקו את הכישלונות. קבצו פספוסים לפי סוג, הקשר ופורמט. זה מראה היכן כל כלי נכשל.

סיכום

נתוני ECIR 2025 ברורים. פער של 17 נקודות — 96% לעומת 79% — פירושו 170,000 רשומות חשופות נוספות למיליון. בחירת הכלי היא משתנה הסיכון הגדול ביותר בקנה מידה.

כשאתם בוחרים כלי לזיהוי PHI:

  • דרשו נתוני דיוק ספציפיים על טקסט קליני
  • אמתו כיסוי מלא של HIPAA Safe Harbor
  • בדקו על פורמטי המסמכים שלכם
  • בחרו מסלולים היברידיים על פני כלים חד-שיטתיים

קראו כיצד פועלת tokenization במסמכי מערכת הטוקנים. שאלות נפוצות בFAQ.


anonym.legal מחליף PHI בטוקנים לפני שמסמכים מגיעים לכל כלי AI. שמות, תאריכים ומספרי רשומות מוחלפים בצדכם. התוצאות מגיעות בחזרה עם הפרטים האמיתיים שוחזרו — רק עבורכם. חקרו את התמחור.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.