مخاطر GDPR الصامتة في منظومة السجلات لديك
محدَّث لعام 2026
معظم الفرق تفحص قاعدة بياناتها عن المعلومات الشخصية. أقل منهم يفعلون الشيء ذاته مع منظومة السجلات.
تُقيِّد المادة 5(1)(e) من GDPR المدة التي يمكنك فيها تخزين المعلومات الشخصية. بالنسبة لقواعد البيانات، تضع الفرق سياسات وتشغِّل وظائف الحذف. بالنسبة لملفات السجلات، القاعدة أبسط: احتفظ بكل شيء 90 يوماً لأغراض التصحيح.
المشكلة؟ تلك السجلات تحمل معلومات شخصية. سجلات الطلبات تحمل بريد إلكتروني للمستخدمين. سجلات الأخطاء تحمل قيم المدخلات الخام. سجلات الوصول تحمل عناوين IP. كل هذه تُحسَب معلومات شخصية بموجب GDPR. يحتاج فريقك إلى أساس قانوني وخطة احتفاظ لكل منها.
ما يصل إلى ملفات السجلات
تسحب تسجيل تطبيقات الويب القياسي نطاقاً واسعاً من البيانات الشخصية.
سجلات الوصول (nginx/Apache):
- عناوين IP — معلومات شخصية وفق إرشادات EDPB
- سلاسل User-agent — قد تمكِّن من تعريف هوية الجهاز
- رموز الجلسات — إذا كُتبت في المخرجات
سجلات التطبيق (JSON منظَّم):
- معرِّفات المستخدمين وعناوين البريد الإلكتروني
- أخطاء المدخلات — غالباً تتضمن القيمة الخام غير الصالحة، والتي قد تكون معلومات مستخدم حقيقية
- أحداث الأعمال — معرِّفات الطلبات المرتبطة بحسابات العملاء
- استعلامات البحث — قد تحتوي على أسماء أو عناوين
سجلات بوابة API:
- رؤوس التحقق من الهوية — مُلتقَطة جزئياً في بعض الإعدادات
- معاملات الاستعلام — قد تحمل معرِّفات المستخدمين أو أسماءهم أو بريدهم الإلكتروني
- هيئات الطلب والاستجابة — موجودة في إعدادات مستوى التصحيح
سجلات تدقيق قواعد البيانات:
- استعلامات SQL ببنود WHERE مثل
email = 'user@example.com' - قيم شخصية حرفية في معاملات الاستعلام
هذا لا يحدث عن قصد. إنه أثر جانبي للتسجيل المبني للتصحيح، لا لـ GDPR.
إرشادات EDPB بشأن عناوين IP
يقول المجلس الأوروبي لحماية البيانات إن عناوين IP معلومات شخصية. يمكن لمزودي خدمة الإنترنت ربطها بالمشتركين. داخل المنظمة، يمكنها تعريف مستخدمين بعينهم.
الأثر مباشر. سجلات الوصول التي تحمل عناوين IP هي سجلات شخصية. الاحتفاظ بمخرجات nginx 12 شهراً يعني الاحتفاظ بمعلومات شخصية 12 شهراً. هذا يحتاج إلى أساس قانوني بموجب المادة 6. ويحتاج أيضاً إلى أن تتوافق مدة الاحتفاظ مع غرضك المُعلَن.
معظم الفرق تتجاوز هذه الخطوة. "نحتفظ بالإدخالات 90 يوماً لأن قسم الأمن يقول ذلك" قاعدة عامة. إنها ليست مراجعة للمادة 5(1)(e) من GDPR. راجع نظرتنا العامة على الامتثال القانوني لمعرفة كيف يندرج هذا في برنامج أشمل.
كيف تصل إلى الامتثال
المسار العملي لمعظم الفرق ليس تقليص نوافذ الاحتفاظ. الأسباب التشغيلية والأمنية لنوافذ أطول حقيقية. المسار الأفضل هو إخفاء السجلات قبل التخزين طويل الأمد.
نموذج متعدد الطبقات يعمل جيداً.
0–7 أيام: سجلات خام كاملة للتصحيح النشط. سبعة أيام قصيرة بما يكفي لمعظم الفرق.
7–90 يوماً: سجلات مُخفاة لتحليل الاتجاهات ومراجعة الأمن. تُستبدل عناوين IP. يصبح بريد المستخدمين الإلكتروني رموزاً ثابتة. تُخفى أرقام الحسابات. تُحتفَظ الحقول الرئيسية — الطوابع الزمنية ورموز الأخطاء وزمن الاستجابة ونقاط النهاية — كما هي.
90+ يوماً (إذا لزم): مخرجات مجمَّعة فقط. أعداد الأحداث ومعدلات الأخطاء ونطاقات زمن الاستجابة. لا تبقى سجلات على مستوى المستخدم.
تتوقف المعلومات الشخصية عند سبعة أيام. يمكن للمخرجات المجمَّعة المضي قدماً دون كشف أي أحد. راجع الأمان والامتثال لمزيد من التفاصيل.
احتفظ بالبنية سليمة للرصد
الإخفاء الجيد يُبقي بنية JSON سليمة. يستبدل المحتوى فقط. هذا يُبقي المخرجات مفيدة للتصحيح والتنبيهات.
تبقى كما هي:
- مفاتيح JSON والتشعب
- الطوابع الزمنية والترتيب الزمني
- أنواع الأخطاء ورموز HTTP
- طرق HTTP والمسارات وقيم زمن الاستجابة
- أنواع أحداث الأعمال
تُستبدَل:
- عناوين البريد الإلكتروني ← رمز ثابت لكل أصل (مثال:
user1@example.com) - عناوين IP ← نطاقات RFC 5737 (
192.0.2.x) - أرقام الحسابات ←
ACCT_XXXXX - أرقام الهاتف ←
+XX XXX XXX XXXX - الأسماء في نص الخطأ ←
[PERSON]
الرموز الثابتة تُبقي التتبعات مفيدة. تتبع user1@example.com عبر 40 إدخالاً يعمل بالطريقة ذاتها كالأصل. المقاييس المجمَّعة — معدلات الأخطاء، زمن الاستجابة، الإنتاجية — لا تحتاج إلى أي معلومات شخصية على الإطلاق. راجع قاموس المصطلحات للاطلاع على مصطلحَي إزالة الهوية الزائفة وإزالة الهوية.
ثلاث طرق لدمج هذا
ثلاثة أنماط تغطي معظم فرق الهندسة.
الخيار 1 — إخفاء خط الأنابيب: يعترض Fluentd أو Logstash كل سطر قبل إرساله. تعمل خطوة الإخفاء بشكل مضمَّن. تحصل Elastic أو Datadog على سجلات نظيفة فقط. لا تغييرات في رمز التطبيق مطلوبة.
الخيار 2 — معالجة دفعية ليلية: تهبط السجلات الخام في التخزين المحلي. وظيفة ليلية تُخفي مخرجات اليوم السابق وتحذف النسخة الخام. تذهب السجلات المُخفاة إلى التخزين طويل الأمد. المخرجات الخام تُحتفَظ بها سبعة أيام فقط.
الخيار 3 — إخفاء ما قبل المشاركة: تبقى السجلات الخام داخلياً مع ضوابط وصول صارمة. قبل المشاركة مع اختبار الاختراق أو المقاولين الخارجيين، شغِّل مرحلة إخفاء. الأطراف الخارجية تحصل دائماً على نسخ نظيفة.
لوثائق GDPR، الإخفاء هو "تدبير تقني" بموجب المادة 32. سجِّل الأداة وإعداداتها وسياسة الاحتفاظ في سجلات أنشطة المعالجة (RoPA) بموجب المادة 30. راجع الأسئلة الشائعة للاطلاع على الأسئلة الشائعة حول RoPA.
هل تريد مثالاً من الواقع؟ راجع دراسات الحالة لتفاصيل تنفيذ ملموسة. يمكنك أيضاً مراجعة أسعارنا للاطلاع على الخطة التي تتضمن خطوط أنابيب إخفاء مدمجة.
المصادر
- المادة 5 من GDPR: مبادئ معالجة البيانات — مُتحقَّق من المصدر الخارجي
- رأي EDPB 5/2019 حول توجيه الخصوصية الإلكترونية وGDPR — مُتحقَّق من المصدر الخارجي
- Sonra.io: إخفاء البيانات الشخصية في بيانات JSON وXML — مُتحقَّق من المصدر الخارجي