ملا جلا فارمیٹ E-Discovery: تعمیل خلاء بند کریں
ایک دستاویز production درخواست آتی ہے۔ سیٹ پانچ فارمیٹس میں پھیلا ہوا ہے: PDF معاہدے، Word دستاویزات، Excel اسپریڈ شیٹس، CSV ایکسپورٹ، اور JSON لاگ۔ ہر فارمیٹ کو ایک مختلف ٹول کی ضرورت ہے۔ یہی مسئلہ ہے۔
2025 Everlaw e-discovery رپورٹ میں پایا گیا کہ قانونی ٹیمیں ملے جلے فارمیٹ productions کے لیے اوسطاً 3.2 ٹولز استعمال کرتی ہیں۔ آپریشنل لاگت زیادہ ہے۔ تعمیل خطرہ اس سے بھی زیادہ۔
ہمارے legal compliance overview اور security practices دیکھیں کہ ہم دستاویز productions کیسے سنبھالتے ہیں۔
ٹول بکھراؤ خلاء کیوں پیدا کرتا ہے
مختلف ٹول مختلف معیارات مطلب ہیں۔ تین کمزوریاں پیدا ہوتی ہیں۔
Entity coverage ٹول سے ٹول مختلف ہوتی ہے۔ Adobe Acrobat ان text strings کو تلاش کرتا ہے جو آپ ہاتھ سے لکھتے ہیں۔ یہ entities کو خود نہیں detect کرتا۔ ایک Word macro نام اور ای میل پکڑ سکتا ہے۔ یہ 280+ دوسری entity اقسام چھوڑ دیتا ہے۔ Excel find-and-replace صرف وہ پکڑتا ہے جو آپ نے ٹائپ کیا۔ PDF اور Excel فائل میں یکساں SSN مختلف ٹولز سے مختلف treatment حاصل کر سکتا ہے۔
آڈٹ trails الگ ہو جاتی ہیں۔ ہر ٹول اپنی کارروائیاں log کرتا ہے — یا بالکل نہیں۔ ایک DPA پوچھ سکتا ہے کہ تمام ذاتی ڈیٹا کیسے تلاش اور سنبھالا گیا۔ تین ٹولز کی تین الگ logs کمزور جواب ہے۔
وقت کے ساتھ settings میں فرق آ جاتا ہے۔ چھ ماہ پہلے کا PDF redaction rule set پچھلے ہفتے اپڈیٹ کیے گئے Word macro سے میچ نہیں کر سکتا۔ خلاء پوشیدہ رہتا ہے جب تک کوئی production غلطی اسے ظاہر نہ کرے۔
عدالتوں نے اس مسئلے کو حل کیا ہے۔ E-discovery غلطیوں کے لیے sanctions نے ایک ہی production میں مختلف دستاویز اقسام میں متضاد معیارات کا حوالہ دیا ہے۔ عدالتیں ایک منظم عمل کی توقع رکھتی ہیں۔ فارمیٹ مخصوص ٹولز اس کے خلاف کام کرتے ہیں۔
DSAR مستقل مزاجی کی ضرورت
GDPR DSARs میں ایک مستقل مزاجی کا قاعدہ قانون میں شامل ہے۔
آرٹیکل 15 تقاضا کرتا ہے کہ data subject کو تمام ذاتی ڈیٹا کے بارے میں معلومات ملیں جو رکھا گیا ہے۔ صرف PDFs میں تمام ذاتی ڈیٹا اور Word دستاویزات میں زیادہ تر نہیں — سب۔
ICO DSAR رہنمائی اس نقطے پر واضح ہے۔ تنظیموں کو تمام سسٹمز اور فارمیٹس میں منظم نقطہ نظر اپنانا چاہیے۔ مستقل طریقہ کار درکار ہے۔ مختلف معیارات والے فارمیٹ مخصوص ٹولز یہ معیار پورا نہیں کرتے۔
جب کوئی DPA DSAR شکایت کی تحقیق کرتا ہے، چار سوال سامنے آتے ہیں:
- کس عمل نے تمام ذاتی ڈیٹا تلاش کیا؟
- کن ٹولز نے کون سی دستاویز اقسام پروسیس کیں؟
- ہر فارمیٹ میں کون سی entity اقسام تلاش کی گئیں؟
- مکمل ہونے کا ثبوت کس آڈٹ trail میں ہے؟
الگ logs والے الگ ٹولز سوالات 3 اور 4 کا صاف جواب نہیں دے سکتے۔
یونیفائیڈ انجن کا فائدہ
یونیفائیڈ انجن ہر فارمیٹ پر یکساں detection logic چلاتا ہے۔ چار فوائد سامنے آتے ہیں۔
مستقل entity coverage۔ 32 entity اقسام والا preset PDF، DOCX، XLSX، اور CSV کو یکساں طریقے سے پروسیس کرتا ہے۔ Excel میں SSN کو PDF میں SSN جیسا confidence threshold ملتا ہے۔
ایک آڈٹ trail۔ ایک log ایک batch میں تمام فائلوں کا احاطہ کرتا ہے۔ یہ فائل کا نام، قسم، detected entities، confidence قدریں، اور کی گئی کارروائیاں دکھاتا ہے۔ ایک دستاویز پوری production کی تعمیل ثابت کرتی ہے۔
Referential integrity۔ فرض کریں «Sarah Johnson» ایک PDF معاہدے، ایک Word خط، اور ایک Excel ریکارڈ میں ظاہر ہوتی ہے۔ یکساں token — PERSON_0001 — تینوں میں اس کا نام بدلتا ہے۔ data subject اپنا ریکارڈ پوری production میں trace کر سکتا ہے۔
آسان workflow۔ ملے جلے فارمیٹس کی 15 فائلیں ایک batch میں ڈالیں۔ ایک preset لگائیں۔ 15 گمنام آؤٹ پٹ اور ایک آڈٹ رپورٹ ملے۔ تین الگ ٹول workflows ایک میں سمٹ جاتے ہیں۔
presets batch jobs میں کیسے کام کرتے ہیں، اس کے لیے ہماری گائیڈ دیکھیں GDPR DSAR batch processing بڑے پیمانے پر۔
وفاقی FOIA: یکساں مسئلہ بڑے پیمانے پر
امریکی وفاقی ایجنسیاں زیادہ حجم پر ملے جلے فارمیٹ چیلنج کا سامنا کرتی ہیں۔
FOIA درخواستیں پرانے mainframe exports، جدید Word دستاویزات، اسکین شدہ PDF archives، اور CSV اور JSON database exports پر پھیلی ہوتی ہیں۔ کوئی بھی ایجنسی ایک فارمیٹ استعمال نہیں کرتی۔
DOJ اور HHS دونوں نے خودکار redaction سسٹم pilot کیے ہیں۔ دستی ملٹی فارمیٹ processing ان کی درخواست حجم کے ساتھ scale نہیں ہوتی۔ ہر pilot کی ایک ہی core ضرورت تھی: تمام فارمیٹس میں ایک exemption معیار۔ ایک دستاویز آڈٹ trail بھی درکار تھی۔
یہی اصول وفاقی حکومت سے باہر لاگو ہوتا ہے۔ ملٹی فارمیٹ تعمیل ضروریات والی کسی بھی تنظیم کو یکساں چیز درکار ہے۔ ایک معیار۔ ایک آڈٹ trail۔ یہ قابلِ دفاع تعمیل records کی بنیاد ہے۔
لاء فرم کیس اسٹڈی
ایک درمیانے سائز کی لاء فرم enterprise clients کے لیے GDPR DSAR جوابات چلاتی تھی۔
یکجائی سے پہلے، فرم چار مختلف ٹولز استعمال کرتی تھی۔ Adobe Acrobat PDFs سنبھالتا تھا۔ ایک Word macro DOCX سنبھالتا تھا، صرف نام اور ای میل کا احاطہ کرتا تھا۔ Excel find-and-replace XLSX سنبھالتا تھا۔ CSV exports دستی جائزے سے گزرتے تھے۔ ہر DSAR میں 8–12 گھنٹے لگتے تھے۔ صرف 2–3 entity اقسام تمام فارمیٹس میں یکساں طریقے سے جانچی جاتی تھیں۔
بعد میں، یونیفائیڈ انجن نے سبھی فارمیٹس کو ایک batch میں سنبھالا۔ preset: «DSAR EU Individual»۔ انجن نے ہر فارمیٹ میں یکساں طریقے سے 32 entity اقسام جانچیں۔ ہر DSAR ایک گھنٹے سے کم وقت میں مکمل ہوا۔ ایک آڈٹ رپورٹ DPO کے sign-off کے لیے گئی۔
فرم اب DSAR production میں ہر دستاویز کی قسم میں مستقل entity coverage ثابت کر سکتی ہے۔ ایک آڈٹ دستاویز ہر جواب کا احاطہ کرتی ہے۔ وقت 8–12 گھنٹوں سے ایک گھنٹے سے کم ہو گیا۔
متعلقہ: دستاویز فارمیٹ بکھراؤ اور PII anonymization۔
نتیجہ
فارمیٹ بکھراؤ ایک تعمیل ذمہ داری ہے۔ مختلف ٹول مختلف معیارات مطلب ہیں۔ مختلف معیارات آڈٹ خلاء پیدا کرتے ہیں۔ آڈٹ خلاء ریگولیٹر نمائش لاتے ہیں۔
یونیفائیڈ انجن یہ ماخذ پر ٹھیک کرتا ہے۔ ایک detection معیار۔ ایک آڈٹ trail۔ ایک workflow — ہر فارمیٹ کے لیے۔