מציאות פיצול הפורמטים
מגיעה בקשת הפקת מסמכים משפטית. ההפקה כוללת:
- חוזי PDF ממערכת ניהול המסמכים
- מסמכי Word מסקירה משפטית
- גיליונות Excel מהכספים
- ייצוא CSV ממערכת ה-CRM
- יומני JSON ממסלול הביקורת של ה-API
חמישה פורמטים. ערכת הכלים הנוכחית של המשרד: Adobe Acrobat לניפוי PDF, מאקרו Word עבור DOCX, "מצא והחלף" המובנה ב-Excel עבור XLSX, סקירה ידנית עבור CSV, ואין כלי ל-JSON.
זה אינו יוצא דופן. דוח גילוי אלקטרוני של Everlaw לשנת 2025 מזהה את פיצול הפורמטים כאתגר תפעולי מוביל, כאשר צוותים משפטיים משתמשים בממוצע ב-3.2 כלים שונים להפקות מסמכים הכוללות פורמטים מעורבים.
מדוע פיצול כלים יוצר פערי ציות
שימוש בכלים שונים לפורמטים שונים יוצר שלוש פגיעויות ציות:
אי-עקביות בכיסוי ישויות: הניפוי המובנה של Adobe Acrobat מחפש מחרוזות טקסט מפורשות — הוא אינו מריץ זיהוי ישויות. מאקרו Word מזהה רק את סוגי הישויות שתוכנת למצוא. "מצא והחלף" ב-Excel לא תופס דבר שלא הוזן במפורש. אותו SSN בחוזה PDF ובגיליון Excel עלול להיות מטופל בשני כלים עם שני סטנדרטים שונים.
פיצול מסלול ביקורת: כל כלי מייצר יומן משלו (או אין יומן כלל). עבור בקשת DSAR לפי GDPR שבה ה-DPA שואל "הוכח שכל המידע האישי על פרט זה זוהה וטופל כראוי," יומני ביקורת נפרדים משלושה כלים שונים אינם נרטיב ציות משכנע.
סחף תצורה: לכלים שונים יש תצורות שונות. תקן ניפוי ה-PDF שהוגדר לפני שישה חודשים עשוי שלא להתאים להגדרות המאקרו של Word שעודכנו לאחרונה.
דרישת העקביות אינה תיאורטית. סנקציות בתי משפט על שגיאות הפקה בגילוי אלקטרוני התייחסו ספציפית לבעיית חוסר העקביות.
דרישת העקביות ב-DSAR
לבקשות DSAR לפי GDPR יש דרישת עקביות מפורשת. סעיף 15 מחייב שהנושא יקבל מידע על "כל" המידע האישי המוחזק, לא "כל המידע בקבצי PDF ורוב המידע במסמכי Word."
הנחיית ICO לבקשות DSAR מפורשת: ארגונים חייבים ליישם גישה שיטתית לזיהוי כל המידע האישי המוחזק, בכל המערכות והפורמטים.
עבור חקירות DPA, הבודק ישאל:
- איזה תהליך שימש לזיהוי כל המידע האישי?
- אילו כלים עיבדו אילו סוגי מסמכים?
- אילו סוגי ישויות נחפשו בכל פורמט?
- איזה מסלול ביקורת מתעד את שלמות התגובה?
יתרון המנוע המאוחד
מנוע עיבוד מאוחד מטפל בכל הפורמטים עם אותה לוגיקת זיהוי, ומאפשר:
פריסות תצורה המוחלות באופן אחיד: פריסת "DSAR EU Individual" המוגדרת עם 32 סוגי ישויות מעבדת PDF, DOCX, XLSX ו-CSV מאותה בקשת DSAR עם כיסוי ישויות זהה.
מסלול ביקורת יחיד: יומן עיבוד אחד המכסה את כל הקבצים באצווה, ללא קשר לפורמט. דוח אחד מספק את ראיות הציות לכל ההפקה.
שלמות התייחסות בין פורמטים: אם "שרה כהן" מופיעה בחוזה PDF, ברשומת התכתבות Word ובגיליון Excel, פסאודו-אנונימיזציה עקבית בכל שלושת הפורמטים יכולה להחליף את שמה באותו אסימון (PERSON_0001) — מה שמאפשר לנושא הנתונים לאתר את הרשומה שלו.
עיבוד אצוות מרובות פורמטים: הפלת 15 קבצים בפורמטים שונים לאצווה אחת. עיבוד עם פריסה אחת. קבלת 15 פלטים מאנונימיים ודוח ביקורת מאוחד אחד.
יישום למשרד עורכי דין
משרד עורכי דין בינוני המטפל בבקשות DSAR לפי GDPR עבור לקוחות ארגוניים יישם עיבוד פורמטים מאוחד:
לפני:
- חוזי PDF: Adobe Acrobat (חיפוש טקסט ידני)
- התכתבות DOCX: מאקרו Word (שם + אימייל בלבד)
- רשומות חשבון XLSX: Excel "מצא והחלף" (קלט ידני)
- ייצוא CSV: סקירה ידנית
- זמן עיבוד לכל DSAR: 8-12 שעות
- סוגי ישויות שנבדקו באופן עקבי: 2-3
אחרי (מנוע מאוחד, עיבוד אצוות):
- כל הפורמטים: אצווה יחידה עם פריסת "DSAR EU Individual"
- 32 סוגי ישויות שנבדקו באופן עקבי בכל הפורמטים
- זמן עיבוד לכל DSAR: 45 דקות (כולל סקירת פלט)
- דוח ביקורת יחיד לכל DSAR לחתימת DPO
מקורות: