By · Last updated 2026-06-05

بازگشت به وبلاگفناوری حقوقی

تله حذف اطلاعات PDF: داده‌های افشاشده

پرونده‌های اپستین در وزارت دادگستری، پرونده مانافورت، و نشت‌های NSA همگی یک نقص مشترک دارند: حذف ظاهری اطلاعات که متن زیرین را قابل استخراج می‌گذارد.

June 5, 20268 دقیقه مطالعه
PDF redactionlegal redactioncourt filingFOIAdocument security

خطرناک‌ترین واژه در امنیت اسناد حقوقی

این راهنما برای سال ۲۰۲۶ به‌روز شده است.

وقتی یک پرونده دادگاه عبارت «حذف شده» دارد، مردم تصور می‌کنند متن پنهان از بین رفته است. گاهی این‌گونه نیست. هر کسی می‌تواند یک متن سیاه‌پوشانده‌شده را کپی کند و در چند ثانیه بخواند. این شکاف نامی دارد: حذف ظاهری. این مشکل آسیب‌های واقعی وارد کرده است.

سه پرونده نشان می‌دهند این خطر فرضی نیست.

پرونده‌های اپستین در وزارت دادگستری (دسامبر ۲۰۲۵). اسناد دادگاه با نوارهای سیاه روی نام‌های حساس ارائه شدند. متن زیر قابل کپی‌پیست بود. خبرنگاران این را ظرف چند ساعت کشف کردند. نام‌هایی که دادستانان استدلال می‌کردند باید مهر و موم بمانند، فاش شدند.

پرونده پاول مانافورت (ژانویه ۲۰۱۹). وکلای مدافع اسناد مولر را با استفاده از قابلیت هایلایت Microsoft Word ارائه دادند. این ابزار یک نوار سیاه می‌کشد اما کلمات را دست نخورده می‌گذارد. یک عمل ساده پیست همه چیز را آشکار کرد. دادگاه ناراضی بود.

نشت‌های NSA (سال‌های متعدد). دهه‌ها انتشار فایل PDF حاوی متن قابل استخراج بوده است. خبرنگاران و محققان این موضوع را بارها کشف کرده‌اند. هیئت نظارت بر اطلاعات اجتماعی راهنمایی رسمی درباره این حالت شکست ارائه داد.

الگو هر بار یکسان است. کسی یک نوار بصری اعمال می‌کند. فایل را ارسال می‌کند. متن پنهان سر در می‌آورد. گاهی ظرف چند ساعت. گاهی سال‌ها بعد.

چرا نوارهای سیاه به تنهایی شکست می‌خورند

یک PDF سه لایه مجزا دارد.

لایه محتوا تمام کاراکترها، مختصات، و فونت‌ها را ذخیره می‌کند. ابزارهای کپی‌پیست و استخراج از اینجا می‌خوانند. لایه نمایش دستورالعمل‌های بصری را نگه می‌دارد. این شامل اشکال، رنگ‌ها، تصاویر، و مستطیل‌های سیاهی است که به عنوان نوارهای روکش استفاده می‌شوند. لایه فراداده ویژگی‌های فایل مانند نام نویسنده، مُهرهای زمانی، و تاریخچه ویرایش را ذخیره می‌کند.

یک نوار ظاهری فقط در لایه نمایش وجود دارد. لایه محتوای زیرین دست نخورده است. انتخاب همه → کپی → پیست هر کلمه‌ای را برمی‌گرداند. از جمله کلماتی که با نوار «پنهان» شده‌اند.

ابزارهایی که فقط نوارهای بصری تولید می‌کنند

برخی ابزارهای رایج فقط روی متن رنگ می‌زنند. آن را حذف نمی‌کنند.

ابزارهای رسم Adobe Acrobat. رسم یک مستطیل با استفاده از تابع Redact یکی نیست. مستطیل فقط بصری است.

ردیابی تغییرات Microsoft Word. عبارات حذف‌شده حتی پس از قبول شدن در تاریخچه نسخه باقی می‌مانند. تاریخچه همچنان قابل خواندن است.

ابزارهای حاشیه‌نویسی PDF مرورگر. اینها یک هایلایت سیاه اضافه می‌کنند. داده‌های زیرین را تغییر نمی‌دهند.

روکش‌های تصویری روی صفحات اسکن‌شده. فقط در صورتی ایمن است که لایه متن اصلی ابتدا پاک شده باشد. بدون آن مرحله، متن ذخیره‌شده دست نخورده می‌ماند.

حذف واقعی اطلاعات چه می‌خواهد

حذف واقعی اطلاعات را از لایه محتوا برمی‌دارد. لایه نمایش آنگاه چیزی برای نشان دادن ندارد. موفقیت را با استخراج متن از فایل ذخیره‌شده تأیید می‌کنید. بررسی می‌کنید که عبارت هدف غایب باشد.

واحدهای ارائه اسناد دادگاه و سازمان‌های اطلاعاتی این بررسی را انجام می‌دهند:

  1. از ابزاری استفاده کنید که لایه محتوا را تغییر می‌دهد. از ابزاری که روی آن رنگ می‌زند استفاده نکنید.
  2. به یک PDF جدید صادر کنید. فایل اصلی را بازنویسی نکنید.
  3. فایل جدید را در یک مشاهده‌گر تازه باز کنید. از مشاهده‌گری استفاده کنید که هیچ ارتباطی با فایل اصلی ندارد.
  4. انتخاب همه → کپی → پیست در یک ویرایشگر متن ساده.
  5. عبارتی از متن پنهان را جستجو کنید.
  6. پیدا شد؟ فایل واقعاً پردازش نشده است. با ابزار درست از ابتدا شروع کنید.
  7. پیدا نشد؟ به بررسی فراداده بروید.

مرحله پنج آزمون حیاتی است. روکش‌های بصری هر بار در آن شکست می‌خورند. یک فایل صحیح پردازش‌شده از آن عبور می‌کند.

مشکل فراداده

لایه محتوا تنها مسیر نشت نیست. فراداده فایل می‌تواند اطلاعات زیادی فاش کند.

نام نویسنده. اغلب وکیل یا مدیر پرونده‌ای که سند را ساخته است.

سازمان. نام دفتر حقوقی یا آژانس.

نسخه‌های قدیمی‌تر. اینها سند را قبل از هر تغییری نشان می‌دهند.

تاریخچه ویرایش. تغییرات ردیابی‌شده و نظرات اینجا ذخیره می‌شوند.

تصاویر بند انگشتی جاسازی‌شده. اینها می‌توانند سند را در حالت اصلی و پردازش‌نشده نشان دهند.

راهنمای NSA این را مستقیماً بیان می‌کند: «حذف با اطمینان مستلزم کنترل فراداده نیز هست.»

برای ارائه اسناد دادگاه، این یک مشکل واقعی است. سندی که از طرف یک طرف ناشناس ارائه می‌شود ممکن است فراداده‌ای حاوی نام نویسنده واقعی داشته باشد. یک نسخه سیاه‌پوشانده ممکن است تصویر بند انگشتی از نسخه اصلی داشته باشد. ابزارهای مناسب فراداده را به عنوان بخشی از فرآیند پاک‌سازی می‌کنند. ابزارهای روکش بصری آن را لمس نمی‌کنند.

پیامدهای حقوقی

پیامدها به زمینه بستگی دارند. سابقه برای کسانی که از روکش‌های فقط بصری استفاده می‌کنند خوب نیست.

دادگاه‌های فدرال. قانون ۵.۲(e) از آیین دادرسی مدنی فدرال ایالات متحده الزام می‌کند که اسناد ارائه‌شده شناسه‌های خاصی حذف شده باشند. دادگاه‌ها برای شکست‌ها در اینجا جریمه، ممنوعیت ارائه، و ارجاع به کانون وکلا اعمال کرده‌اند.

اختلافات FOIA. آژانس‌هایی که روکش‌های بصری روی اطلاعات معاف اعمال می‌کنند می‌توانند هنوز آن اطلاعات را قابل استخراج داشته باشند. دادگاه‌ها در چنین مواردی افشای واقعی را دستور داده‌اند.

امنیت ملی. پرسنل که از طریق فایل‌های نشت‌یافته شناسایی می‌شوند با خطرات امنیتی مستند مواجه هستند.

GDPR و HIPAA. داده‌های شخصی قابل استخراج یک نقض قابل گزارش است. ماده ۳۳ GDPR و قانون اطلاع‌رسانی نقض HIPAA هر دو اعمال می‌شوند.

بررسی پنج‌دقیقه‌ای قبل از ارائه

این چک‌لیست خطر روکش بصری را کاملاً از بین می‌برد. کمتر از پنج دقیقه برای هر سند طول می‌کشد.

  1. از ابزار لایه محتوا استفاده کنید. از ابزار رسم یا حاشیه‌نویسی استفاده نکنید.
  2. به یک PDF جدید صادر کنید. فایل اصلی را بازنویسی نکنید.
  3. فایل جدید را در یک مشاهده‌گر تازه باز کنید.
  4. انتخاب همه → کپی → پیست در یک ویرایشگر متن ساده.
  5. عبارت شناخته‌شده‌ای از متن پنهان را جستجو کنید.
  6. پیدا شد؟ با ابزار درست از ابتدا شروع کنید.
  7. ویژگی‌های PDF را بررسی کنید: Author، Creator، Subject، Keywords.
  8. تصاویر بند انگشتی جاسازی‌شده که سند را قبل از پردازش نشان می‌دهند بررسی کنید.
  9. سند تأییدشده را ارائه دهید.

پنج دقیقه اینجا بسیار کمتر هزینه دارد تا دفاع در برابر یک درخواست حذف ناموفق در برابر یک قاضی فدرال.

مرتبط: توضیح شکست حذف اطلاعات پرونده اپستین — تحلیل کامل حادثه دسامبر ۲۰۲۵.

همچنین ببینید: دستیاران کدنویسی هوش مصنوعی و نشت PII در تولید — مسیر نشت متفاوت، درس یکسان.

anonym.legal تأیید خودکار لایه متن را برای سازمان‌هایی که اسناد حساس دارند فراهم می‌کند.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.