מעודכן ל-2026

שני אופני כישלון של עריכה

צוותים משפטיים ניצבים בפני שני אופני כישלון. שניהם יוצרים אחריות ממשית.

עריכת חסר חושפת נתונים חסויים או מידע אישי שחייב להישאר מוסתר. הצד מגלה חומרים שהיה לו הזכות — ולעתים קרובות החובה — להגן עליהם.

עריכת יתר מסתירה עובדות שלצד שכנגד יש זכות לראות. בתי המשפט מתייחסים לכך כהסתרה. זוהי הפרת גילוי הכפופה לסנקציות.

כלי בינה מלאכותית המעדיפים היקף זכירה על פני דיוק גורמים לבעיה השנייה בעיצוב. מנוע בינה מלאכותית שמשחיר 80% ממסמך נמנע מלהחמיץ דבר. אך התוצאה חסרת תועלת. היא עשויה גם למשוך סנקציות בית משפט.

שני אופני הכישלון מובילים לאותו מקום: שופט, הסבר והוצאות.

תיק Schnitzer Steel (2024)

תיק Athletics Investment Group v. Schnitzer Steel משנת 2024 מדגים כיצד בתי משפט מתמודדים עם עריכת מסמכים לקויה.

צד אחד הגיש מסמכים עם סימוני עריכה רחבים. עורך הדין שכנגד הגיש התנגדות. בית המשפט עיין בחומרים. הוא מצא שהסימונים חרגו ממה שהחוק מתיר.

התוצאה: סנקציות לפי כלל 37 של כללי הפרוצדורה האזרחית הפדרלית. הצד המגיש שילם על תהליך פגום.

סנקציות כאלו אינן חדשות. בתי משפט השתמשו בהן שנים. מה שמייחד תיק זה הוא התזמון. סקירה בסיוע בינה מלאכותית נפוצה כיום בהליכים משפטיים. התיק מעלה שאלה מרכזית: האם צוותים משפטיים בדקו את דיוק כלי הבינה המלאכותית שלהם לפני השימוש בהם בייצור?

התשובה חשובה. כלי עם דיוק נמוך יסמן הרבה יותר מדי. עורך הדין שמסתמך עליו ללא בדיקה נושא בסיכון.

לניתוח מקיף של התיק, ראו ניתוח E-Discovery LLC של מניעה מבוססת רלוונטיות.

בעיית הדיוק של 22.7%

Presidio הוא מנוע גילוי PII קוד-פתוח שנבנה על ידי Microsoft. הוא נמצא בשימוש נרחב בכלי סקירת מסמכים. בדיקות על הגשות לבית משפט וחוזים מניבות לו שיעור דיוק של 22.7%.

הדיוק מודד כמה פעמים סימון חיובי נכון. ב-22.7%, כ-77 מכל 100 סימונים הם חיוביים כוזבים. אותם פריטים אינם רגישים לפי שום סטנדרט רלוונטי.

לגילוי אלקטרוני, המתמטיקה ישירה. קבוצה של 10,000 מסמכים שעובדו בשיעור זה תכלול אלפי סימונים חסרי בסיס. הצד המגיש ניצב בפני אותו סיכון כמו הנתבע ב-Schnitzer Steel: ייצור מוטל בספק, סקירה של בית המשפט וסנקציות אפשריות.

נתון זה מתייחס להגדרה מהקופסה של Presidio על תוכן משרדי משפטי. לא כל כלי הבינה המלאכותית מתפקדים ברמה זו. אך מנוע זה הוא אפשרות הקוד-פתוח הנמצאת בשימוש הרחב ביותר בתחום.

הסיבה מבנית. מערכות NLP מאומנות על טקסט כללי. שפת אולם בית המשפט שונה. היא משתמשת בטרמינולוגיה מקצועית, פורמטים של ציטוטים וכללי ניסוח השונים מנתוני האימון. כלי שעובד היטב על רשומות רפואיות עשוי לתפקד הרבה יותר גרוע על תמלולי עדויות.

מה נתוני השימוש בבינה מלאכותית מראים

הנה נקודת נתונים שנייה: 27.4% מתוכן צ'אטבוטים של בינה מלאכותית הוא רגיש, לפי ניתוח עצמאי של שימוש ארגוני בבינה מלאכותית.

זה מתאר מה עובדים שולחים במהלך משימות רגילות. לא נתונים שהתכוונו לשתף — תוכן שנכלל מהרגל או בשוגג. עורכי דין המשתמשים בבינה מלאכותית לניסוח מכתבים, סקירת חוזים או תמצות עדויות שולחים תוכן רגיש לשרתי ספק הבינה המלאכותית כתוצר לוואי של עבודה רגילה.

כמעט שלושה מכל עשרה אינטראקציות כוללות נתוני לקוחות, מידע חסוי או אסטרטגיית תיק. תוכן זה מגיע לשרתי ספק הבינה המלאכותית בצורה שמישה אלא אם בקרות עוצרות אותו תחילה.

למשרדי עורכי דין הבודקים את סיכוני הבינה המלאכותית שלהם, 27.4% אינו עניין שולי. זהו השיעור הבסיסי. כמעט שליש מהשימוש בבינה מלאכותית במשרד כולל תוכן הזקוק להגנה.

שרשרת האחריות

עריכת יתר ודליפות נתוני בינה מלאכותית יוצרות מסלולי סיכון נפרדים אך קשורים. שניהם מתחילים באותה החלטה: פריסת כלי בינה מלאכותית ללא הערכה נאותה.

מסלול הגילוי: הבינה המלאכותית מסמנת תוכן באופן רחב → עורך הדין מסתמך על הפלט ללא בדיקת מדגם → לייצור יש סימונים בלתי מוצדקים → עורך הדין שכנגד מגיש התנגדות → בית המשפט סוקר → סנקציות.

מסלול דליפת הנתונים: עורך הדין משתמש בבינה מלאכותית לעבודת תיקים → הבינה המלאכותית מקבלת תקשורת חסויה → ספק הבינה המלאכותית ספג פרצה → נתוני לקוח נחשפים → תביעות רשלנות מקצועית.

נקודת ההתחלה זהה בשני המקרים. משרדים פורסים כלי בינה מלאכותית מבלי לדעת מה הכלים הללו באמת עושים. לא הוגדרו בקרות לעבודה.

סקירה ממוקדת דיוק לייצורים

בתי משפט שואלים שאלה צרה כאשר הם סוקרים סימונים שנויים במחלוקת. האם כל אחד נתמך על ידי חסיון, כלל סודיות או צו בית משפט? בתי המשפט לא שואלים האם כלי הצד המגיש סימן כמה שיותר.

סימון ללא בסיס נאות הוא הפרת גילוי. לא משנה אם אדם או בינה מלאכותית עשו אותו. החקירה היא סימון-סימון.

לעורכי דין, משמעות הדבר היא שכלי סקירת בינה מלאכותית צריכים להיבדק על דיוק — שיעור הסימונים שהם באמת חסויים. לא רק היקף זכירה. כלי שמשיג 90% זכירה ב-22.7% דיוק תופס יותר תוכן רגיש. אך הוא יוצר עומס סקירה עבור 77.3% הסימונים הכוזבים. כאשר הסקירה הזו לא מתרחשת, עריכת יתר רחבה נובעת מכך.

כל סימון בייצור הוא טענה לבית המשפט. הוא אומר: תוכן זה מוסתר כדין. לאחר Schnitzer Steel, טענה זו חייבת לעמוד בבחינה.

למידע נוסף על ההבדל בין כלי אנונימיזציה לגילוי PII סטנדרטי, ראו את המדריך שלנו על דיוק בינה מלאכותית בסקירת מסמכים משפטיים. להקשר על יומני חסיון וכלי בינה מלאכותית, ראו את המאמר שלנו על חסיון עורך דין-לקוח ובינה מלאכותית.

מקורות

מאמרים קשורים

טכנולוגיה משפטית

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

התחל ניסיון חינם צפה בתכונות

סנקציות גילוי אלקטרוני: כישלון עריכה בבינה מלאכותית

שני אופני כישלון של עריכה

תיק Schnitzer Steel (2024)

בעיית הדיוק של 22.7%

מה נתוני השימוש בבינה מלאכותית מראים

שרשרת האחריות

סקירה ממוקדת דיוק לייצורים

מקורות

מאמרים קשורים

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

מוכן להגן על הנתונים שלך?

סנקציות גילוי אלקטרוני: כישלון עריכה בבינה מלאכותית

שני אופני כישלון של עריכה

תיק Schnitzer Steel (2024)

בעיית הדיוק של 22.7%

מה נתוני השימוש בבינה מלאכותית מראים

שרשרת האחריות

סקירה ממוקדת דיוק לייצורים

מקורות

מאמרים קשורים

Legal PII: Privilege Detection

PII Detection Cuts E-Discovery Costs

Anonymous HR Surveys with Reversible PII

מוכן להגן על הנתונים שלך?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow