By · Last updated 2026-03-05

חזרה לבלוגטכנולוגיה משפטית

תיקי אפשטיין: הדגשה שחורה אינה מחיקה

פרסום תיקי אפשטיין של משרד המשפטים בדצמבר 2025 חשף כשל קריטי: טקסט PDF מוסתר בהדגשה שחורה נשאר קריא באמצעות העתקה-הדבקה.

March 5, 20267 דקות קריאה
document redactionPDF redaction failurelegal complianceWord redaction

כשל המחיקה של דצמבר 2025

עדכון 2026

משרד המשפטים האמריקאי פרסם את תיקי אפשטיין בדצמבר 2025. הסיקור התקשורתי עברה במהירות מהתוכן למחיקות — ועל כמה בקלות ניתן היה לעקוף אותן.

השיטה הייתה פשוטה. תוכן "מחוק" בקבצי PDF הוחשך על ידי הדגשה. אך המילים נשארות בשכבת הטקסט של ה-PDF. העתיקו את הקופסה השחורה לעורך טקסט — והמילים המקוריות מופיעות. הכיסוי הוויזואלי לא היה מחיקה אמיתית. הנתונים הרגישים מעולם לא הוסרו.

זה לא היה פגם חדש. בתיק Anthony Pellicano משנת 2007 נחשפו נתונים רגישים דרך מחיקה לקויה במסמכים משפטיים. אותו כשל הופיע בתיקי בית משפט ודוחות ממשלתיים במשך שנים. אך תיקי אפשטיין הפכו את הכשל לגלוי לעשרות מיליוני אנשים בזמן אמת.

למידע נוסף על זיהוי מידע מסמכים בהקשרים משפטיים, ראו את סקירת הציות שלנו.

כיסוי ויזואלי לעומת מחיקה אמיתית

מדוע זה ממשיך לקרות? התשובה טמונה בפער טכני מרכזי. קיים הבדל בין כיסוי ויזואלי ובין מחיקה אמיתית.

כיסוי ויזואלי מניח אלמנט מעל מילים. הוא אינו מסיר את המילים מהקובץ. שיטות אלה כולן נופלות לקטגוריה זו: הדגשה שחורה מגדירה את הרקע לשחור. מילים לבנות על דף לבן משנות את הצבע להתאים. מלבן שחור שמצויר מעל טקסט מסתיר את המבט. כיסוי הערות PDF מוסיף שכבה אטומה מעל. שכבת תמונה מניחה תמונה שחורה על גבי המילים.

בכל המקרים, המילים המקוריות נשארות בקובץ. ניתן לאתרן על ידי העתקת האזור או הסרת השכבה. אדם בעל מיומנויות טכניות יכול גם לסרוק את הקובץ הגולמי.

מחיקה אמיתית מסירה את המילים מהקובץ לצמיתות. התוכן אינו מוסתר — הוא נעלם. אין מה למצוא.

השאלה המרכזית לכל קובץ שאתם שולחים: כאשר מישהו בודק את הקובץ, האם ימצא את המילים המקוריות? עם כיסוי ויזואלי, התשובה היא כן. ראו את המילון שלנו להגדרות מונחי מחיקה.

בעיית מסמך Word

אותו כשל קיים ב-Microsoft Word. שימוש בהדגשה שחורה או קופסות אטומות ל"מחיקה" של קובץ Word משאיר את המילים המקוריות ב-XML של המסמך.

זה חשוב מכיוון ש-Word הוא הפורמט העיקרי עבור מכתבים משפטיים, חוזים, קבצי HR וסקירות פנימיות. ארגונים שמשתמשים בהדגשה שולחים רשומות עם נתונים שניתן למצוא לאורך כל ההיסטוריה שלהם.

71% מצוותי משפט משתמשים בכלי בינה מלאכותית למרות חששות לגבי אחסון מידע (סקר ACC 2025). ככל שכלי בינה מלאכותית נכנסים לעבודת מסמכים, הסיכון לחשיפת כשלי מחיקה מהעבר גדל. בינה מלאכותית שקוראת את הקבצים שלכם עשויה למצוא מילים בחלקים "מחוקים" שמעולם לא נמחקו.

כשלי מחיקה בפרופיל גבוה

תיקי אפשטיין לא היו המקרה הראשון בפרופיל גבוה של כשל זה.

תיק Anthony Pellicano (2007) כלל נתונים רגישים שנחשפו דרך מסמכים מחוקים בצורה לקויה שהוגשו לבית משפט פדרלי. [VERIFIED-EXTERNAL]

מסמכי NSA שפורסמו דרך בקשות FOIA הכילו שוב ושוב מילים קריאות מתחת לקופסות שחורות. חוקרי אבטחה תיעדו זאת בפרסומי ביטחון לאומי. [VERIFIED-EXTERNAL]

תיקי ליטיגציה ארגוניים כוללים לעיתים קרובות תוכן קריא כאשר הצדדים משתמשים בשכבות הערות PDF במקום מחיקה אמיתית. [VERIFIED]

דפוס זה מצביע על פער בסיסי. צוותי משפט חושבים על מחיקה כמעשה ויזואלי. אך פורמטי PDF ו-Word מכילים נתונים מובנים ללא קשר למה שרואים על המסך.

מה מחיקה אמיתית דורשת

כדי שקובץ יהיה מחוק באמת, המילים חייבות להיות מוסרות ומוחלפות. אדם מיומן לא צריך להיות מסוגל לשחזר אותן.

בקבצי PDF, מחיקה אמיתית אומרת ארבעה דברים: ראשית, פשטו את ה-PDF להסרת כל השכבות הניתנות לעריכה. שנית, החליפו תוכן בקופסות שחורות ברמת זרם התוכן. שלישית, הסירו מטאדטה שעשויה להכיל את המילים המקוריות. רביעית, הסירו גופנים משובצים שעלולים לאפשר שחזור.

בקבצי Word, מחיקה אמיתית אומרת שלושה דברים: ראשית, מצאו כל מופע של התוכן המיועד — בשינויים במעקב, הערות, מטאדטה והיסטוריית גרסאות. שנית, החליפו את התוכן, אל תכסו אותו ויזואלית. שלישית, שמרו על הפורמט מבלי להשאיר עקבות.

מילת המפתח היא החלפה. יש להחליף את התוכן המקורי במשהו אחר, לא להסתירו מתחת למשהו אחר.

כותרות, תחתיות ואזורים נסתרים

למחיקת מסמכים משפטיים יש יותר שכבות מאשר הגוף הראשי בלבד. נתונים רגישים מופיעים לעיתים קרובות באזורים שכלי ויזואלי מחמיצים לחלוטין.

כותרות ותחתיות מכילות לעיתים קרובות שמות עניינים, מזהי לקוח ומספרי מסמכים. הסתרת גוף חוזה תוך השארת "חסוי — בעניין: TechCorp" בכותרת מסכלת את המטרה.

הערות ושינויים במעקב הם מקור נפוץ לגילוי בלתי מכוון. מבקר שמעיר "ראה הערת John Smith" משאיר זאת בקובץ. זה נשאר גם לאחר שהסעיף מכוסה.

מאפייני מסמך ומטאדטה מכילים שמות מחברים והיסטוריית גרסאות. אלה יכולים לחשוף את מקור המסמך גם כאשר הגוף מוחשך.

היסטוריית גרסאות ב-Word שומרת גרסאות קודמות של תוכן ערוך. קובץ שאמר פעם "כתובת הבית של התובע היא 123 Main Street" שומר את הגרסה הזו. היא נשארת אלא אם ניקיתם אותה.

בניית תהליך עומד בתקנות

לאור אופני הכשל הללו, תהליך מחיקה תקין דורש ארבעה שלבים.

1. השתמשו בשילוב Word מקורי לקבצי Word. מחיקה בתוך מודל האובייקטים של Word מחליפה תוכן ישירות בקובץ. זה מונע את בעיית ההסתרה. המרה ל-PDF תחילה מוסיפה סיכון ועשויה להחמיץ הערות והיסטוריית גרסאות.

2. עבדו את כל אזורי המסמך. תהליך תואם חייב לטפל בכותרות, תחתיות, הערות שוליים, הערות סיום, הערות, שינויים במעקב ומאפייני מסמך — לא רק בגוף הראשי.

3. אמתו את הפלט. לאחר המחיקה, נסו לשחזר את התוכן. העתיקו-הדביקו את האזורים המחוקים. בדקו את ה-XML של המסמך. סקרו שינויים במעקב והיסטוריית גרסאות. אם תוכן מקורי מופיע בכל מקום, המחיקה אינה שלמה.

4. שמרו נתיב ביקורת. לצורכי הגשות משפטיות, תעדו מה נמחק, באיזו שיטה, ועל ידי מי. זה חשוב אם ייווצר סכסוך על חסיון. למדו עוד בדף האבטחה והציות שלנו.

לקחים מתיקי אפשטיין

כשל תיקי אפשטיין היה שיעור פומבי. הוא הראה מה קורה כאשר כיסוי ויזואלי מתבלבל עם מחיקה אמיתית.

כל צוות משפטי ואנשי ציות שצפו בסיפור הזה צריכים לשאול שתי שאלות. ראשית, מה יש בהגשות מסמכים קודמות שלנו שניתן לשחזר באופן דומה? שנית, האם התהליך הנוכחי שלנו אכן מוחק תוכן או רק מכסה אותו?

התשובות קובעות חשיפה אמיתית — לא רק קיום מדיניות מחיקה.


התוסף לOffice של anonym.legal מבצע החלפת PII אמיתית בקבצי Word. הוא מחליף תוכן ישירות במבנה המסמך, לא מעל ויזואלית. כותרות, תחתיות, הערות שוליים, הערות ושינויים במעקב מעובדים כולם. התוצאה היא קובץ שממנו הנתונים המקוריים נעדרים, לא נסתרים. למדו עוד.

מקורות

מוכן להגן על הנתונים שלך?

התחל לאנונימיזציה של PII עם 285+ סוגי ישויות ב-48 שפות.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.