By · Last updated 2026-06-03

חזרה לבלוגטכנולוגיה משפטית

זיהוי מידע משפטי רגיש: הגנת חיסיון עורך-דין-לקוח

מספרי הפנייה לבית-משפט, מספרי רישיון עריכת דין, מספרי תיקים ומזהי עניין לקוח הם מזהים רגישים משפטית שכלי PII סטנדרטיים מפספסים.

June 3, 20267 דקות קריאה
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

חיסיון עורך-דין-לקוח בעידן הבינה המלאכותית: מידע משפטי רגיש שכלי האנונימיזציה שלכם חייבים לזהות

כלי PII סטנדרטיים מזהים שמות, כתובות אימייל ומספרי תעודת זהות. הם מפספסים מספרי הפנייה לתיקים, מספרי רישיון עריכת דין ותגיות עניין לקוח. אלה טומנים בחובם סיכוני חיסיון רציניים. כלים גנריים משאירים פרצה זו פתוחה.

משרדי עורכי דין שולחים קבצים לכלי בינה מלאכותית מדי יום. קבצים אלה מכילים סמנים רגישים לחיסיון שכלים סטנדרטיים אינם מזהים.

כאשר משרד עורכי דין מנתב קבצים דרך עוזר בינה מלאכותית, הקבצים מכילים מזהים משפטיים לצד מידע PII סטנדרטי:

  • תגיות עניין לקוח: מקשרות לתיק העניין המלא ומזהות את הלקוח
  • מספרי הפנייה לתיק: קודים שהוקצו על ידי בית המשפט המקשרים לרשומות ציבוריות עם פרטים פרטיים
  • מספרי רישיון עריכת דין: מזהי עורכי דין הניתנים לחיפוש במאגרי מדינה ציבוריים
  • קודי תיק בית-משפט: מקשרים למערכות הגשה ציבוריות עם היסטוריית תיק מלאה
  • קודי שיבוץ שיפוטי: מזהים את השופט המנהל בסיטואציות רגישות

כל אחד מאלה, שנשלח לספק בינה מלאכותית חיצוני, יוצר בעיית חיסיון פוטנציאלית.

מדוע מזהים אלה דורשים זיהוי מותאם

פורמטים של תיקי בית-משפט פועלים לפי דפוסים ברמת המחוז. אין דפוס יחיד המכסה את כל בתי המשפט הפדרליים ובתי המשפט של המדינות.

תיקים אזרחיים פדרליים משתמשים בשנה דו-ספרתית, ואז "cv", ואז מספר התיק. תיקים פליליים משתמשים ב-"cr" באותה מיקום. בתי משפט מדינתיים משתנים לפי אזור ואין להם תקן משותף.

מספרי רישיון עריכת דין הם ספציפיים למדינה. קליפורניה משתמשת בפורמט מספרי. ניו יורק משתמשת בפורמט מרשם. טקסס משתמשת בפורמט מזהה לשכה משלה. לא קיים פורמט לאומי.

תגיות עניין לקוח הן ספציפיות למשרד. כל משרד בונה את הפורמט שלו. שנה-לקוח-עניין. קודי קבוצת תחום. מזהים רציפים.

כלי PII סטנדרטיים אינם יכולים לדעת אף אחד מאלה ללא הגדרה מותאמת.

הפרצה אמיתית. כלי מסמכים מקבל הקשר עניין מלא. קודי תיק מקשרים לרשומות ציבוריות. תגיות לקוח קיימות. הכלי מדווח שהוסר PII. שמות וכתובות אימייל הוסרו. מזהים הרגישים לחיסיון לא הוסרו.

מקרה סטארטאפ הבינה המלאכותית המשפטית

סטארטאפ בינה מלאכותית משפטית בונה כלי מסמכים למשרדי עורכי דין. המוצר סורק קבצי גילוי, מאתר סעיפים רלוונטיים ומסמן תוכן שעלול להיות מוגן בחיסיון. לקוחות ארגוניים דורשים מחיקת תגיות עניין לקוח לצד PII סטנדרטי לפני עיבוד.

חסם הציות: כלי הבינה המלאכותית מעבד נתוני קובץ המכילים תגיות עניין לקוח. בשילוב עם תיקי בית-משפט ציבוריים, תגיות אלה עשויות לאפשר זיהוי עניין. צוותי פעולות משפטיות ארגוניות מסמנים זאת כבלתי מקובל.

לפני זיהוי ישות מותאמת:

  • סקירת עסקה מוצאת את פרצת הציות
  • תור הנדסה של 3+ חודשים למודל NLP מותאם
  • חוזה ארגוני בהמתנה

עם API ישות מותאמת:

  • קצין הציות מגדיר את פורמט תגית העניין בהטמעה
  • דפוס נבדק על קבצי דוגמה: יומיים
  • ישות מותאמת נוספת לצינור: עוד יום אחד
  • חוזה ארגוני מתקדם

הפרש הוא 3 ימים לעומת 3+ חודשים. העבודה היא הגדרת דפוס ואינטגרציית API. אין צורך באימון מודל NLP.

פורמטים נפוצים לפי קטגוריה

תיקי בית-משפט פדרליים:

תיקים אזרחיים פדרליים משתמשים ב: שנה דו-ספרתית + "cv" + מספר תיק בן 4-6 ספרות. דוגמה: 24-cv-12345. תיקים פליליים משתמשים ב-"cr" באותה מיקום. תיקי פשיטת רגל משתמשים ב-"bk". ערעורים משתמשים בשנה דו-ספרתית ומספר בן 4-5 ספרות שמשתנה לפי מעגל.

פורמטים של בתי משפט מדינתיים (דוגמאות):

בית המשפט העליון של קליפורניה משתמש במערכת קידומת בת שש ספרות. ניו יורק משתמשת בפורמט אינדקס עם שנה ורצף. טקסס משתמשת בפורמט עילה עם שנה, רצף וקוד בית-משפט.

תגיות עניין לקוח (פורמטים אופייניים של משרד):

שלושה דפוסים נפוצים מופיעים ברוב המשרדים:

  • שנה דו-ספרתית, מזהה לקוח, רצף עניין (למשל, 24-ACME-001)
  • ראשי תיבות של קבוצת תחום, שנה, ואז רצף בן ארבע ספרות (למשל, LIT240042)
  • קידומת לקוח עם מזהה בן שש ספרות (למשל, SMITHCO-000123)

מזהי רישיון עריכת דין בארה"ב:

רוב המדינות משתמשות במספרים בני 4-8 ספרות, לעיתים עם קידומת ברמת המדינה. מזהי קבלה של USDC משתנים לפי מחוז ואינם פועלים לפי פורמט משותף.

צינור עיבוד מודע לחיסיון

לבינה מלאכותית לסקירת מסמכים, צינור שכבתי מטפל בהיקף המלא.

שכבה 1 — זיהוי PII סטנדרטי

שמות, כתובות אימייל, מספרי טלפון, כתובות, מספרי ביטוח לאומי. דיוק גבוה. כלים מבוססים מטפלים בשכבה זו היטב.

שכבה 2 — זיהוי קוד מותאם

קודי עניין, מזהי תיק, מזהי לשכה. דפוסים ספציפיים למשרד שהוגדרו בהטמעה. שכבה זו ממלאת את הפרצה שכלים סטנדרטיים מפספסים.

שכבה 3 — סקירת חיסיון (אנושית)

לאחר זיהוי אוטומטי, עורך דין סוקר את הסמנים המסומנים. כותרות ATTORNEY-CLIENT. תוויות WORK PRODUCT. סימונים CONFIDENTIAL. סקירה אנושית בשכבה זו אינה אופציונלית.

שכבה 4 — סקירת חריגי הקשר

תיקי רשומות ציבוריות שאינם מהווים סיכון חיסיון לעומת תגיות עניין לקוח שכן. זה דורש שיקול דעת של עורך דין. לא ניתן לאוטומציה.

שכבות 1 ו-2 מטפלות בעבודה בנפח גבוה. שכבות 3 ו-4 שומרות על שיקול דעתו של עורך הדין היכן שהחלטות חיסיון שייכות. לגבי מה קורה כאשר חיסיון כבר הוגנב על ידי שימוש בכלי בינה מלאכותית, ראו חיסיון עורך-דין-לקוח ובינה מלאכותית.

הגדרה למפתחים

תצורת הטמעה

אספו פורמטים של תגיות עניין לקוח במהלך הטמעה ארגונית. כל משרד משתמש בפורמט שונה. אחסנו אותם כישויות מותאמות ספציפיות למשרד. החילו על כל העיבוד לחשבון זה.

ערכות ברירת מחדל

ערכות מוכנות מראש מכסות הקשרים נפוצים ללא עבודה מותאמת:

  • "Federal Court Documents" — דפוסי תיק פדרלי לתיקים אזרחיים, פליליים ופשיטת רגל
  • "State Court Documents (CA/NY/TX)" — פורמטים ספציפיים למדינה עבור שלוש תחומי שיפוט עיקריים
  • "Internal Operations" — תגית עניין בתוספת PII סטנדרטי
  • "Outside Counsel Portal" — הפנייה לחשבון, תגית עניין ו-PII סטנדרטי

תיעוד ביקורת

רשומות עיבוד צריכות להראות שקודים מותאמים נכללו בכל מעבר זיהוי. זה תומך בהגנת מוצר עבודה לשיטת הניתוח.

למבט רחב יותר על אופן שבו עלויות המחיקה מתרחבות בתחום הליטיגציה, ראו אוטומציה של PII בגילוי אלקטרוני וצמצום עלות סקירה משפטית.

סיכום

מזהים הרגישים לחיסיון הם בסיכון כמו PII סטנדרטי — לעיתים קרובות יותר. כלים שמפספסים קודי תיק ותגיות עניין משאירים פרצה אמיתית בתהליכי עבודה עם מסמכים.

התיקון אינו מודל NLP. הוא הגדרת דפוסים. למפתחים שבונים כלים למשרדי עורכי דין, זהו ההבדל בין תיקון של 3 ימים לפרויקט של 3 חודשים. למשרדי עורכי דין, זהו ההבדל בין סקירה מסייעת בינה מלאכותית שניתן להגן עליה לבין סיכון של ויתור על חיסיון.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.