By · Last updated 2026-06-05

بلاگ پر واپس جائیںقانونی ٹیک

ملا جلا فارمیٹ E-Discovery: تعمیل خلاء

E-discovery productions اور GDPR DSARs PDFs، Word docs، Excel، اور JSON exports میں پھیلے ہوتے ہیں۔ ہر فارمیٹ کے لیے مختلف ٹولز استعمال کرنا مستقل خلاء پیدا کرتا ہے جو DPA آڈٹ میں ظاہر ہوتے ہیں۔

June 5, 20267 منٹ پڑھیں
e-discoverymixed formatDSAR compliancelegal redactiondocument production

ملا جلا فارمیٹ E-Discovery: تعمیل خلاء بند کریں

ایک دستاویز production درخواست آتی ہے۔ سیٹ پانچ فارمیٹس میں پھیلا ہوا ہے: PDF معاہدے، Word دستاویزات، Excel اسپریڈ شیٹس، CSV ایکسپورٹ، اور JSON لاگ۔ ہر فارمیٹ کو ایک مختلف ٹول کی ضرورت ہے۔ یہی مسئلہ ہے۔

2025 Everlaw e-discovery رپورٹ میں پایا گیا کہ قانونی ٹیمیں ملے جلے فارمیٹ productions کے لیے اوسطاً 3.2 ٹولز استعمال کرتی ہیں۔ آپریشنل لاگت زیادہ ہے۔ تعمیل خطرہ اس سے بھی زیادہ۔

ہمارے legal compliance overview اور security practices دیکھیں کہ ہم دستاویز productions کیسے سنبھالتے ہیں۔

ٹول بکھراؤ خلاء کیوں پیدا کرتا ہے

مختلف ٹول مختلف معیارات مطلب ہیں۔ تین کمزوریاں پیدا ہوتی ہیں۔

Entity coverage ٹول سے ٹول مختلف ہوتی ہے۔ Adobe Acrobat ان text strings کو تلاش کرتا ہے جو آپ ہاتھ سے لکھتے ہیں۔ یہ entities کو خود نہیں detect کرتا۔ ایک Word macro نام اور ای میل پکڑ سکتا ہے۔ یہ 280+ دوسری entity اقسام چھوڑ دیتا ہے۔ Excel find-and-replace صرف وہ پکڑتا ہے جو آپ نے ٹائپ کیا۔ PDF اور Excel فائل میں یکساں SSN مختلف ٹولز سے مختلف treatment حاصل کر سکتا ہے۔

آڈٹ trails الگ ہو جاتی ہیں۔ ہر ٹول اپنی کارروائیاں log کرتا ہے — یا بالکل نہیں۔ ایک DPA پوچھ سکتا ہے کہ تمام ذاتی ڈیٹا کیسے تلاش اور سنبھالا گیا۔ تین ٹولز کی تین الگ logs کمزور جواب ہے۔

وقت کے ساتھ settings میں فرق آ جاتا ہے۔ چھ ماہ پہلے کا PDF redaction rule set پچھلے ہفتے اپڈیٹ کیے گئے Word macro سے میچ نہیں کر سکتا۔ خلاء پوشیدہ رہتا ہے جب تک کوئی production غلطی اسے ظاہر نہ کرے۔

عدالتوں نے اس مسئلے کو حل کیا ہے۔ E-discovery غلطیوں کے لیے sanctions نے ایک ہی production میں مختلف دستاویز اقسام میں متضاد معیارات کا حوالہ دیا ہے۔ عدالتیں ایک منظم عمل کی توقع رکھتی ہیں۔ فارمیٹ مخصوص ٹولز اس کے خلاف کام کرتے ہیں۔

DSAR مستقل مزاجی کی ضرورت

GDPR DSARs میں ایک مستقل مزاجی کا قاعدہ قانون میں شامل ہے۔

آرٹیکل 15 تقاضا کرتا ہے کہ data subject کو تمام ذاتی ڈیٹا کے بارے میں معلومات ملیں جو رکھا گیا ہے۔ صرف PDFs میں تمام ذاتی ڈیٹا اور Word دستاویزات میں زیادہ تر نہیں — سب۔

ICO DSAR رہنمائی اس نقطے پر واضح ہے۔ تنظیموں کو تمام سسٹمز اور فارمیٹس میں منظم نقطہ نظر اپنانا چاہیے۔ مستقل طریقہ کار درکار ہے۔ مختلف معیارات والے فارمیٹ مخصوص ٹولز یہ معیار پورا نہیں کرتے۔

جب کوئی DPA DSAR شکایت کی تحقیق کرتا ہے، چار سوال سامنے آتے ہیں:

  1. کس عمل نے تمام ذاتی ڈیٹا تلاش کیا؟
  2. کن ٹولز نے کون سی دستاویز اقسام پروسیس کیں؟
  3. ہر فارمیٹ میں کون سی entity اقسام تلاش کی گئیں؟
  4. مکمل ہونے کا ثبوت کس آڈٹ trail میں ہے؟

الگ logs والے الگ ٹولز سوالات 3 اور 4 کا صاف جواب نہیں دے سکتے۔

یونیفائیڈ انجن کا فائدہ

یونیفائیڈ انجن ہر فارمیٹ پر یکساں detection logic چلاتا ہے۔ چار فوائد سامنے آتے ہیں۔

مستقل entity coverage۔ 32 entity اقسام والا preset PDF، DOCX، XLSX، اور CSV کو یکساں طریقے سے پروسیس کرتا ہے۔ Excel میں SSN کو PDF میں SSN جیسا confidence threshold ملتا ہے۔

ایک آڈٹ trail۔ ایک log ایک batch میں تمام فائلوں کا احاطہ کرتا ہے۔ یہ فائل کا نام، قسم، detected entities، confidence قدریں، اور کی گئی کارروائیاں دکھاتا ہے۔ ایک دستاویز پوری production کی تعمیل ثابت کرتی ہے۔

Referential integrity۔ فرض کریں «Sarah Johnson» ایک PDF معاہدے، ایک Word خط، اور ایک Excel ریکارڈ میں ظاہر ہوتی ہے۔ یکساں token — PERSON_0001 — تینوں میں اس کا نام بدلتا ہے۔ data subject اپنا ریکارڈ پوری production میں trace کر سکتا ہے۔

آسان workflow۔ ملے جلے فارمیٹس کی 15 فائلیں ایک batch میں ڈالیں۔ ایک preset لگائیں۔ 15 گمنام آؤٹ پٹ اور ایک آڈٹ رپورٹ ملے۔ تین الگ ٹول workflows ایک میں سمٹ جاتے ہیں۔

presets batch jobs میں کیسے کام کرتے ہیں، اس کے لیے ہماری گائیڈ دیکھیں GDPR DSAR batch processing بڑے پیمانے پر۔

وفاقی FOIA: یکساں مسئلہ بڑے پیمانے پر

امریکی وفاقی ایجنسیاں زیادہ حجم پر ملے جلے فارمیٹ چیلنج کا سامنا کرتی ہیں۔

FOIA درخواستیں پرانے mainframe exports، جدید Word دستاویزات، اسکین شدہ PDF archives، اور CSV اور JSON database exports پر پھیلی ہوتی ہیں۔ کوئی بھی ایجنسی ایک فارمیٹ استعمال نہیں کرتی۔

DOJ اور HHS دونوں نے خودکار redaction سسٹم pilot کیے ہیں۔ دستی ملٹی فارمیٹ processing ان کی درخواست حجم کے ساتھ scale نہیں ہوتی۔ ہر pilot کی ایک ہی core ضرورت تھی: تمام فارمیٹس میں ایک exemption معیار۔ ایک دستاویز آڈٹ trail بھی درکار تھی۔

یہی اصول وفاقی حکومت سے باہر لاگو ہوتا ہے۔ ملٹی فارمیٹ تعمیل ضروریات والی کسی بھی تنظیم کو یکساں چیز درکار ہے۔ ایک معیار۔ ایک آڈٹ trail۔ یہ قابلِ دفاع تعمیل records کی بنیاد ہے۔

لاء فرم کیس اسٹڈی

ایک درمیانے سائز کی لاء فرم enterprise clients کے لیے GDPR DSAR جوابات چلاتی تھی۔

یکجائی سے پہلے، فرم چار مختلف ٹولز استعمال کرتی تھی۔ Adobe Acrobat PDFs سنبھالتا تھا۔ ایک Word macro DOCX سنبھالتا تھا، صرف نام اور ای میل کا احاطہ کرتا تھا۔ Excel find-and-replace XLSX سنبھالتا تھا۔ CSV exports دستی جائزے سے گزرتے تھے۔ ہر DSAR میں 8–12 گھنٹے لگتے تھے۔ صرف 2–3 entity اقسام تمام فارمیٹس میں یکساں طریقے سے جانچی جاتی تھیں۔

بعد میں، یونیفائیڈ انجن نے سبھی فارمیٹس کو ایک batch میں سنبھالا۔ preset: «DSAR EU Individual»۔ انجن نے ہر فارمیٹ میں یکساں طریقے سے 32 entity اقسام جانچیں۔ ہر DSAR ایک گھنٹے سے کم وقت میں مکمل ہوا۔ ایک آڈٹ رپورٹ DPO کے sign-off کے لیے گئی۔

فرم اب DSAR production میں ہر دستاویز کی قسم میں مستقل entity coverage ثابت کر سکتی ہے۔ ایک آڈٹ دستاویز ہر جواب کا احاطہ کرتی ہے۔ وقت 8–12 گھنٹوں سے ایک گھنٹے سے کم ہو گیا۔

متعلقہ: دستاویز فارمیٹ بکھراؤ اور PII anonymization۔

نتیجہ

فارمیٹ بکھراؤ ایک تعمیل ذمہ داری ہے۔ مختلف ٹول مختلف معیارات مطلب ہیں۔ مختلف معیارات آڈٹ خلاء پیدا کرتے ہیں۔ آڈٹ خلاء ریگولیٹر نمائش لاتے ہیں۔

یونیفائیڈ انجن یہ ماخذ پر ٹھیک کرتا ہے۔ ایک detection معیار۔ ایک آڈٹ trail۔ ایک workflow — ہر فارمیٹ کے لیے۔

ذرائع

کیا آپ اپنے ڈیٹا کی حفاظت کے لیے تیار ہیں؟

48 زبانوں میں 285+ ادارتی اقسام کے ساتھ PII کی گمنامی شروع کریں۔

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.