סיכון ה-GDPR השקט בערימת היומנים שלך
עודכן לשנת 2026
רוב הצוותים בודקים את מסד הנתונים שלהם לאיתור מידע אישי. פחות עושים את אותו הדבר עבור מערכת היומן שלהם.
סעיף 5(1)(e) ל-GDPR מגביל כמה זמן אתה יכול לאחסן מידע אישי. עבור מסדי נתונים, צוותים קובעים מדיניות ומריצים עבודות מחיקה. עבור קבצי יומן, הכלל פשוט יותר: שמור הכל 90 ימים לניפוי שגיאות.
הבעיה? אותן רשומות מכילות מידע אישי. רשומות בקשה מכילות אימיילי משתמשים. לכידת שגיאות מכילה ערכי קלט גולמיים. רשומות גישה מכילות כתובות IP. כל אחד מאלה נחשב מידע אישי תחת GDPR. הצוות שלך זקוק לבסיס חוקי ולתוכנית שמירה לכל אחד.
מה מסתיים בקבצי היומן שלך
רישום אפליקציות רגיל שולף מגוון רחב של PII.
רשומות גישה (nginx/Apache):
- כתובות IP — מידע אישי לפי הנחיית EDPB
- מחרוזות user-agent — עשויות לאפשר טביעת אצבע של מכשיר
- אסימוני סשן — אם נכתבים לפלט
רשומות אפליקציה (JSON מובנה):
- מזהי משתמשים וכתובות אימייל
- שגיאות קלט — לרוב כוללות את הערך הלא תקין הגולמי, שעשוי להיות מידע משתמש אמיתי
- אירועים עסקיים — מזהי הזמנות המקושרים לחשבונות לקוח
- שאילתות חיפוש — עשויות להכיל שמות או כתובות
רשומות שער API:
- כותרות אימות — לחלקן נלכדות בחלק מהתצורות
- פרמטרי שאילתה — עשויים לשאת מזהי משתמשים, שמות או אימיילים
- גוף בקשה ותגובה — קיים בתצורות ברמת debug
רשומות ביקורת מסד נתונים:
- שאילתות SQL עם פסקאות WHERE כמו
email = 'user@example.com' - ערכים אישיים ממשיים בפרמטרי שאילתה
זה לא נעשה במכוון. זהו תופעת לוואי של רישום שנבנה לניפוי שגיאות, לא ל-GDPR.
הנחיית EDPB בנושא כתובות IP
מועצת הגנת הנתונים האירופית אומרת שכתובות IP הן מידע אישי. ספקי אינטרנט יכולים לקשר אותן למנויים. בתוך ארגון, הן יכולות לזהות משתמשים ספציפיים.
השפעה ישירה. רשומות גישה עם כתובות IP הן רשומות אישיות. שמירת פלט nginx 12 חודשים פירושה שמירת מידע אישי 12 חודשים. זה דורש בסיס חוקי תחת סעיף 6. זה גם דורש שתקופת השמירה תתאים למטרה שהצהרת עליה.
רוב הצוותים מדלגים על שלב זה. "אנחנו שומרים רשומות 90 ימים כי אבטחה אמרה כך" הוא כלל אצבע. זה אינו סקירת סעיף 5(1)(e) ל-GDPR. ראה את סקירת הציות המשפטי שלנו כיצד זה מתאים לתוכנית רחבה יותר.
כיצד להגיע לציות
הנתיב המעשי לרוב הצוותים אינו לקצץ חלונות שמירה. קיימות סיבות תפעוליות ואבטחתיות אמיתיות לחלונות ארוכים יותר. הנתיב הטוב יותר הוא להסתיר רשומות לפני אחסון לטווח ארוך.
מודל שכבתי עובד היטב.
0–7 ימים: רשומות גולמיות מלאות לניפוי שגיאות פעיל. שבעה ימים קצרים מספיק לרוב הצוותים.
7–90 ימים: רשומות מוסתרות לניתוח מגמות וסקירת אבטחה. כתובות IP מוחלפות. אימיילי משתמשים הופכים לאסימונים יציבים. מספרי חשבון מוסתרים. שדות מפתח — חותמות זמן, קודי שגיאה, זמן תגובה, נקודות קצה — נשמרים כפי שהם.
90+ ימים (אם נדרש): פלט מצטבר בלבד. ספירות אירועים, שיעורי שגיאה, טווחי זמן תגובה. לא נותרות רשומות ברמת משתמש.
מידע אישי נעצר בשבעה ימים. פלט מצטבר יכול להמשיך ללא חשיפת אחד. ראה אבטחה וציות לפרטים נוספים.
שמור על המבנה שלם לניטור
הסתרה טובה שומרת את מבנה ה-JSON שלם. היא רק מחליפה תוכן. זה שומר על שימושיות הפלט לניפוי שגיאות והתראות.
נשמר כפי שהוא:
- מפתחות ומבנה JSON
- חותמות זמן וסדר זמן
- סוגי שגיאות וקודי סטטוס HTTP
- מתודות HTTP, נתיבים וערכי זמן תגובה
- סוגי אירועים עסקיים
מוחלף:
- כתובות אימייל → אסימון יציב לכל מקור (למשל
user1@example.com) - כתובות IP → טווחי RFC 5737 (
192.0.2.x) - מספרי חשבון →
ACCT_XXXXX - מספרי טלפון →
+XX XXX XXX XXXX - שמות בטקסט שגיאה →
[PERSON]
אסימונים יציבים שומרים על שימושיות העקבות. עקב ל-user1@example.com על פני 40 רשומות עובד זהה למקור. מדדים מצטברים — שיעורי שגיאה, זמן תגובה, throughput — אינם זקוקים למידע אישי כלל. ראה את המילון למונחים פסאודונימיזציה ואנונימיזציה.
שלוש דרכים לשלב זאת
שלושה דפוסים מכסים את רוב צוותי ההנדסה.
אפשרות 1 — הסתרת צינורית: Fluentd או Logstash מיירטים כל שורה לפני שליחתה הלאה. שלב הסתרה פועל ב-inline. Elastic או Datadog מקבלים רשומות נקיות בלבד. אין צורך בשינויי קוד אפליקציה.
אפשרות 2 — קבוצת לילה: רשומות גולמיות נוחתות באחסון מקומי. עבודת לילה מסתירה את הפלט של היום הקודם ומוחקת את הגרסה הגולמית. רשומות מוסתרות עוברות לאחסון לטווח ארוך. פלט גולמי נשמר שבעה ימים בלבד.
אפשרות 3 — הסתרה קדם-שיתוף: רשומות גולמיות נשמרות פנימיות עם בקרות גישה קפדניות. לפני שיתוף עם בודקי חדירה או קבלנים חיצוניים, הפעל מעבר הסתרה. גורמים חיצוניים מקבלים תמיד גרסאות נקיות.
לתיעוד GDPR, הסתרה היא "אמצעי טכני" תחת סעיף 32. תעד את הכלי, את הגדרותיו ואת מדיניות השמירה שלך ברשומות פעילויות העיבוד (RoPA) תחת סעיף 30. ראה את השאלות הנפוצות שלנו לשאלות נפוצות בנושא RoPA.
רוצה דוגמה מהעולם האמיתי? בדוק את מחקרי המקרה לפרטי יישום קונקרטיים. ניתן גם לסקור את התמחור שלנו לראות איזה תוכנית כוללת צינוריות הסתרה מובנות.
מקורות
- GDPR סעיף 5: עקרונות לעיבוד נתונים — VERIFIED-EXTERNAL
- דעת EDPB 5/2019 בנושא הנחיית ePrivacy ו-GDPR — VERIFIED-EXTERNAL
- Sonra.io: הסתרת PII בנתוני JSON ו-XML — VERIFIED-EXTERNAL