By · Last updated 2026-03-12

חזרה לבלוגטכנולוגיה משפטית

סנקציות גילוי אלקטרוני: כישלון עריכה בבינה מלאכותית

בתיק Athletics Investment Group נגד Schnitzer Steel (2024), גרמה עריכה לקויה לסנקציות גילוי. כאשר כלי בינה מלאכותית משיגים דיוק של 22.7% בלבד, צוותים משפטיים מתמודדים עם אחריות ממשית.

March 12, 202610 דקות קריאה
e-discovery sanctionsredaction liabilityAI redaction precisiondocument reviewlegal technology

מעודכן ל-2026

שני אופני כישלון של עריכה

צוותים משפטיים ניצבים בפני שני אופני כישלון. שניהם יוצרים אחריות ממשית.

עריכת חסר חושפת נתונים חסויים או מידע אישי שחייב להישאר מוסתר. הצד מגלה חומרים שהיה לו הזכות — ולעתים קרובות החובה — להגן עליהם.

עריכת יתר מסתירה עובדות שלצד שכנגד יש זכות לראות. בתי המשפט מתייחסים לכך כהסתרה. זוהי הפרת גילוי הכפופה לסנקציות.

כלי בינה מלאכותית המעדיפים היקף זכירה על פני דיוק גורמים לבעיה השנייה בעיצוב. מנוע בינה מלאכותית שמשחיר 80% ממסמך נמנע מלהחמיץ דבר. אך התוצאה חסרת תועלת. היא עשויה גם למשוך סנקציות בית משפט.

שני אופני הכישלון מובילים לאותו מקום: שופט, הסבר והוצאות.

תיק Schnitzer Steel (2024)

תיק Athletics Investment Group v. Schnitzer Steel משנת 2024 מדגים כיצד בתי משפט מתמודדים עם עריכת מסמכים לקויה.

צד אחד הגיש מסמכים עם סימוני עריכה רחבים. עורך הדין שכנגד הגיש התנגדות. בית המשפט עיין בחומרים. הוא מצא שהסימונים חרגו ממה שהחוק מתיר.

התוצאה: סנקציות לפי כלל 37 של כללי הפרוצדורה האזרחית הפדרלית. הצד המגיש שילם על תהליך פגום.

סנקציות כאלו אינן חדשות. בתי משפט השתמשו בהן שנים. מה שמייחד תיק זה הוא התזמון. סקירה בסיוע בינה מלאכותית נפוצה כיום בהליכים משפטיים. התיק מעלה שאלה מרכזית: האם צוותים משפטיים בדקו את דיוק כלי הבינה המלאכותית שלהם לפני השימוש בהם בייצור?

התשובה חשובה. כלי עם דיוק נמוך יסמן הרבה יותר מדי. עורך הדין שמסתמך עליו ללא בדיקה נושא בסיכון.

לניתוח מקיף של התיק, ראו ניתוח E-Discovery LLC של מניעה מבוססת רלוונטיות.

בעיית הדיוק של 22.7%

Presidio הוא מנוע גילוי PII קוד-פתוח שנבנה על ידי Microsoft. הוא נמצא בשימוש נרחב בכלי סקירת מסמכים. בדיקות על הגשות לבית משפט וחוזים מניבות לו שיעור דיוק של 22.7%.

הדיוק מודד כמה פעמים סימון חיובי נכון. ב-22.7%, כ-77 מכל 100 סימונים הם חיוביים כוזבים. אותם פריטים אינם רגישים לפי שום סטנדרט רלוונטי.

לגילוי אלקטרוני, המתמטיקה ישירה. קבוצה של 10,000 מסמכים שעובדו בשיעור זה תכלול אלפי סימונים חסרי בסיס. הצד המגיש ניצב בפני אותו סיכון כמו הנתבע ב-Schnitzer Steel: ייצור מוטל בספק, סקירה של בית המשפט וסנקציות אפשריות.

נתון זה מתייחס להגדרה מהקופסה של Presidio על תוכן משרדי משפטי. לא כל כלי הבינה המלאכותית מתפקדים ברמה זו. אך מנוע זה הוא אפשרות הקוד-פתוח הנמצאת בשימוש הרחב ביותר בתחום.

הסיבה מבנית. מערכות NLP מאומנות על טקסט כללי. שפת אולם בית המשפט שונה. היא משתמשת בטרמינולוגיה מקצועית, פורמטים של ציטוטים וכללי ניסוח השונים מנתוני האימון. כלי שעובד היטב על רשומות רפואיות עשוי לתפקד הרבה יותר גרוע על תמלולי עדויות.

מה נתוני השימוש בבינה מלאכותית מראים

הנה נקודת נתונים שנייה: 27.4% מתוכן צ'אטבוטים של בינה מלאכותית הוא רגיש, לפי ניתוח עצמאי של שימוש ארגוני בבינה מלאכותית.

זה מתאר מה עובדים שולחים במהלך משימות רגילות. לא נתונים שהתכוונו לשתף — תוכן שנכלל מהרגל או בשוגג. עורכי דין המשתמשים בבינה מלאכותית לניסוח מכתבים, סקירת חוזים או תמצות עדויות שולחים תוכן רגיש לשרתי ספק הבינה המלאכותית כתוצר לוואי של עבודה רגילה.

כמעט שלושה מכל עשרה אינטראקציות כוללות נתוני לקוחות, מידע חסוי או אסטרטגיית תיק. תוכן זה מגיע לשרתי ספק הבינה המלאכותית בצורה שמישה אלא אם בקרות עוצרות אותו תחילה.

למשרדי עורכי דין הבודקים את סיכוני הבינה המלאכותית שלהם, 27.4% אינו עניין שולי. זהו השיעור הבסיסי. כמעט שליש מהשימוש בבינה מלאכותית במשרד כולל תוכן הזקוק להגנה.

שרשרת האחריות

עריכת יתר ודליפות נתוני בינה מלאכותית יוצרות מסלולי סיכון נפרדים אך קשורים. שניהם מתחילים באותה החלטה: פריסת כלי בינה מלאכותית ללא הערכה נאותה.

מסלול הגילוי: הבינה המלאכותית מסמנת תוכן באופן רחב → עורך הדין מסתמך על הפלט ללא בדיקת מדגם → לייצור יש סימונים בלתי מוצדקים → עורך הדין שכנגד מגיש התנגדות → בית המשפט סוקר → סנקציות.

מסלול דליפת הנתונים: עורך הדין משתמש בבינה מלאכותית לעבודת תיקים → הבינה המלאכותית מקבלת תקשורת חסויה → ספק הבינה המלאכותית ספג פרצה → נתוני לקוח נחשפים → תביעות רשלנות מקצועית.

נקודת ההתחלה זהה בשני המקרים. משרדים פורסים כלי בינה מלאכותית מבלי לדעת מה הכלים הללו באמת עושים. לא הוגדרו בקרות לעבודה.

סקירה ממוקדת דיוק לייצורים

בתי משפט שואלים שאלה צרה כאשר הם סוקרים סימונים שנויים במחלוקת. האם כל אחד נתמך על ידי חסיון, כלל סודיות או צו בית משפט? בתי המשפט לא שואלים האם כלי הצד המגיש סימן כמה שיותר.

סימון ללא בסיס נאות הוא הפרת גילוי. לא משנה אם אדם או בינה מלאכותית עשו אותו. החקירה היא סימון-סימון.

לעורכי דין, משמעות הדבר היא שכלי סקירת בינה מלאכותית צריכים להיבדק על דיוק — שיעור הסימונים שהם באמת חסויים. לא רק היקף זכירה. כלי שמשיג 90% זכירה ב-22.7% דיוק תופס יותר תוכן רגיש. אך הוא יוצר עומס סקירה עבור 77.3% הסימונים הכוזבים. כאשר הסקירה הזו לא מתרחשת, עריכת יתר רחבה נובעת מכך.

כל סימון בייצור הוא טענה לבית המשפט. הוא אומר: תוכן זה מוסתר כדין. לאחר Schnitzer Steel, טענה זו חייבת לעמוד בבחינה.

למידע נוסף על ההבדל בין כלי אנונימיזציה לגילוי PII סטנדרטי, ראו את המדריך שלנו על דיוק בינה מלאכותית בסקירת מסמכים משפטיים. להקשר על יומני חסיון וכלי בינה מלאכותית, ראו את המאמר שלנו על חסיון עורך דין-לקוח ובינה מלאכותית.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.