By · Last updated 2026-03-23

العودة إلى المدونةتقني

الإيجابيات الكاذبة: لماذا يُخفق الحجب بالتعلم الآلي

كشف اختبار معياري أجري عام 2024 أن Presidio أنتج 13,536 اكتشافاً إيجابياً كاذباً للأسماء عبر 4,434 عينة — إذ صنّف الضمائر وأسماء السفن والدول كأسماء أشخاص. إليك ما يُكلّفه ذلك في البيئات القانونية والرعاية الصحية.

March 23, 20268 دقيقة قراءة
Presidio false positive ratePII detection precisionautomated redaction costlegal document reviewhybrid PII detection

محدَّث لعام 2026

مشكلة الدقة 22.7%

اختبرت دراسة أُجريت عام 2024 أداة Microsoft Presidio على الملفات التجارية. Presidio هي أداة PII مفتوحة المصدر تستخدمها على نطاق واسع الفرق القانونية والمجموعات الصحية.

قاست الدراسة مدى صحة نتائج Presidio. من بين جميع البنود التي صنّفتها كأسماء أشخاص، كم منها كان فعلاً أسماء أشخاص؟

كانت الإجابة 22.7%. نحو 77 من كل 100 تنبيه كانت خاطئة. أحصت الدراسة 13,536 تنبيهاً كاذباً عبر 4,434 ملف عينة.

لم تكن الأخطاء عشوائية. اتبعت أنماطاً واضحة:

  • ضمائر صُنِّفت كأشخاص ("أنا" في بداية الجملة)
  • تسميات سفن صُنِّفت كأشخاص ("ASL Scorpio")
  • تسميات شركات صُنِّفت كأشخاص ("Deloitte & Touche")
  • مصطلحات دول صُنِّفت كأشخاص ("Argentina" و"Singapore")

لا شيء من هذه حالات حافة نادرة. تظهر كلما واجه نموذج معالجة لغوية طبيعية عاماً نصوصاً متخصصة. لم يُبنَ النموذج للتمييز بينها.

ما تُكلّفه التنبيهات الكاذبة

في العمل القانوني والصحي، كل تنبيه يستلزم استجابة. تواجه الفرق ثلاثة خيارات، وكلها ذات تكاليف حقيقية.

الخيار 1: مراجعة بشرية لكل تنبيه. وقت المحامين والخبراء يتراوح بين 200 و800 دولار في الساعة. بدقة 22.7%، الحجم ضخم جداً. هذا غير قابل للتطبيق على نطاق واسع. راجع أتمتة PII في الاكتشاف الإلكتروني وتقليل تكاليف المراجعة القانونية لمعرفة كيفية نمو تكاليف المراجعة مع الحجم.

الخيار 2: تجاوز المراجعة والوثوق بالمخرجات. هذا أيضاً محفوف بالمخاطر. حين يكون 77% من البنود "المحجوبة" غير حساسة، تُفضي إلى مخاطر قانونية. غرّمت المحاكم محامين بسبب الحجب المفرط. راجع عقوبات الحجب المفرط في الاكتشاف الإلكتروني لحالات موثقة.

الخيار 3: رفع حد درجة النقاط. تتيح Presidio للمستخدمين ضبط score_threshold للتخلص من التنبيهات الضعيفة. اختبرت دراسة DICOM عام 2024 هذا عند مستوى 0.7 — وهو حد مرتفع نسبياً. كانت النتيجة: 38 من أصل 39 صورة DICOM لا تزال تحتوي على تنبيهات كاذبة. الحدود مفيدة، لكنها لا تُعالج السبب الجذري.

لماذا تُكافح معالجة اللغات الطبيعية العامة هنا

تنبع الفجوة في Presidio من التعارض بين بيانات التدريب والاستخدام الحقيقي.

الملفات القانونية مليئة بالمصطلحات بالأحرف الكبيرة. أسماء القضايا وعناوين القوانين ورموز المعروضات تبدو جميعها كبيانات شخصية لنموذج عام. فيُعلّم عليها. لكن معظمها ليس بيانات شخصية.

تُضيف الملفات الصحية أسماء الأدوية ورموز الأجهزة والاختصارات السريرية. "Pt." تعني مريض. "Dr." تعني طبيب. هذه تُعيق اكتشاف الكيانات بطرق يصعب التنبؤ بها.

تحتوي الملفات المالية على رموز منتجات وسلاسل كيانات ومعرّفات حسابات تتشارك أنماطاً سطحية مع السجلات الشخصية.

ضبط نموذج على بيانات خاصة بنطاق معين يُساعد. لكنه يستلزم وقتاً وجهداً للبناء والمتابعة المستمرة.

كيف يُحل الاكتشاف الهجين هذه المشكلة

لمشكلة التنبيهات الكاذبة حل واضح: قسّم العمل حسب نوع البيانات.

قواعد أنماط للبيانات المنظمة. أرقام الضمان الاجتماعي وأرقام الهاتف وعناوين البريد الإلكتروني وتنسيقات وثائق الهوية تتبع قواعد ثابتة. إما أن تطابق السلسلة النمط وتجتاز اختبار خانة الضبط، وإما لا. صفر من التنبيهات الكاذبة لمجموعات القواعد الصالحة.

نماذج اللغة للنص الحر. أسماء الأشخاص وتسميات الشركات والمواقع في النصوص السردية تفتقر إلى بنية صارمة. تكتشفها معالجة اللغات الطبيعية حين تعجز القواعد. درجات الثقة وفحوصات السياق تُقلّص معدل التنبيهات الكاذبة.

إعدادات درجات نقاط لكل نوع للتحكم الدقيق. الفرق القانونية التي لا تتحمل مخاطر الحجب المفرط تضبط حدوداً عالية للمطابقات الغامضة. أما فرق البحث التي تحتاج إلى استرجاع عالٍ فتضبط حدوداً أدنى. راجع اكتشاف PII الثنائي وتسجيل الثقة للامتثال لمعرفة كيفية عمل تدرجات النقاط عملياً.

النتيجة: أخطاء أقل بكثير من الإعدادات الافتراضية لـ Presidio. ويبقى الاسترجاع قوياً في الحالات التي ستُفوّتها القواعد وحدها.

بالنسبة للفرق القانونية والصحية، السؤال المحوري ليس ما إذا كانت التنبيهات الكاذبة موجودة. إنها دائماً موجودة في أنظمة معالجة اللغات الطبيعية. السؤال هو: هل تُتيح الأداة ضبط المفاضلة وقياسها وتوثيقها؟

المصادر

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.