العد التنازلي قد بدأ
محدَّث لعام 2026
الموعد النهائي لقانون الذكاء الاصطناعي الأوروبي حقيقي. تسري أحكام المادة 10 اعتباراً من 2 أغسطس 2026. إذا كان فريقك يبني أو يُشغّل نظام ذكاء اصطناعي عالي الخطورة، تصرّف الآن. الوقت شحيح.
الغرامات أعلى من GDPR. الحد الأقصى للغرامة هو 35 مليون يورو أو 7% من حجم الأعمال السنوي العالمي. يصل سقف GDPR إلى 20 مليون يورو أو 4%. لا يوجد قانون ذكاء اصطناعي آخر بغرامات أعلى.
ما هي أنظمة الذكاء الاصطناعي عالية الخطورة؟
يُصنّف قانون الذكاء الاصطناعي الأنظمة حسب الخطورة. تشمل الأنظمة عالية الخطورة (الملحق III) الذكاء الاصطناعي المستخدم في:
- التعليم — الوصول إلى المدارس أو تقييم الطلاب
- الوظائف — فرز السير الذاتية، وتقييم المقابلات، ورصد العمال
- الخدمات الأساسية — تقييم الائتمان، وتسعير التأمين، وإيفاد الطوارئ
- إنفاذ القانون — التنبؤ بالجريمة، والتعريف البيومتري
- الرعاية الصحية — برامج الأجهزة الطبية، وفرز المرضى
- البنية التحتية — إدارة الطاقة والمياه والنقل
- العدالة — أدوات البحث القانوني، وأدوات الأحكام
تعمل في أي من هذه المجالات؟ تسري عليك المادة 10.
المادة 10: أربع قواعد رئيسية
تضع المادة 10 قواعد لمجموعات البيانات المستخدمة من قِبَل أنظمة الذكاء الاصطناعي عالية الخطورة. إليك القواعد الأربع الرئيسية.
1. حوكمة مكتوبة
يجب أن تتبع مجموعات البيانات "ممارسات مناسبة لحوكمة وإدارة البيانات". تحتاج خطوات مكتوبة للجمع وفحوصات الجودة والمراجعة المستمرة.
2. اختبار التحيز
يجب فحص السجلات بحثاً عن "تحيزات محتملة" قد تتسبب في مخرجات غير عادلة. يُشترَط إجراء اختبارات نشطة. تجنّب التحيز المتعمد لا يكفي.
3. الدقة والتغطية
يجب أن تكون مجموعات البيانات "ذات صلة وتمثيلية بشكل كافٍ وخالية من الأخطاء". عمليات الزحف على الويب التي تفوّت مجموعات معينة قد تفشل في هذا الاختبار.
4. أنواع خاصة من السجلات
المادة 10(5) هي القاعدة الأكثر مباشرة. عندما يستخدم نظام عالي الخطورة سجلات ذات فئة خاصة — الصحة والعرق والدين والسياسة والبيومترية — لا يجوز معالجتها إلا عندما تكون "ضرورية صارمة" لفحوصات التحيز. يجب أيضاً تطبيق "ضمانات مناسبة". تنقية البيانات هي إحدى أقوى الضمانات التي يمكنك استخدامها.
خلاصة القول: معظم مجموعات بيانات نماذج الذكاء الاصطناعي تحتوي على سجلات شخصية. تقول المادة 10: استخدم الحد الأدنى اللازم، مع ضمانات تقنية قوية.
راجع صفحة الامتثال القانوني والنظرة العامة على الأمان للتفاصيل.
مستويات الغرامات
يمتلك قانون الذكاء الاصطناعي الأوروبي ثلاثة مستويات للغرامات. كلها تتجاوز GDPR لنفس نوع الانتهاك:
| اللائحة | الغرامة القصوى | سقف حجم الأعمال |
|---|---|---|
| GDPR | 20 مليون يورو | 4% من حجم الأعمال العالمي |
| قانون الذكاء الاصطناعي الأوروبي (عالي الخطورة) | 15 مليون يورو | 3% من حجم الأعمال العالمي |
| قانون الذكاء الاصطناعي الأوروبي (محظور) | 35 مليون يورو | 7% من حجم الأعمال العالمي |
تقع انتهاكات مجموعات البيانات في المستوى عالي الخطورة (15 مليون يورو / 3%). إذا وجدت جهة تنظيمية أن استخدام السجلات الشخصية بلا ضمانات يُعدّ فعلاً محظوراً، يُطبَّق المستوى الأعلى.
أمثلة حقيقية: حجم أعمال 500 مليون يورو بنسبة 3% = غرامة 15 مليون يورو. حجم أعمال 5 مليار يورو بنسبة 3% = غرامة 150 مليون يورو. هذه أرقام حقيقية، لا نظرية.
لماذا يحل تنقية البيانات هذه المشكلة؟
السجلات المُنقَّاة بشكل صحيح تقع خارج نطاق GDPR. هذا يزيل معظم العبء الملقى بموجب المادة 10.
القواعد الصارمة — معالجة الفئات الخاصة وفحوصات التحيز وحقوق أصحاب البيانات — لا تسري إلا عندما تحتوي مجموعة البيانات على سجلات شخصية. أزِل تلك السجلات أولاً. يختفي العبء إلى حد بعيد.
أوضحت الهيئة الوطنية لحماية البيانات الفرنسية (CNIL) ذلك بوضوح في مطلع عام 2026. تقول إرشاداتها للذكاء الاصطناعي: تنقية البيانات الشخصية غير الضرورية لأداء النموذج هي الإجراء التقني الأساسي للمادة 10.
هذه ليست وجهة نظر هامشية. إنها الموقف السائد لأعلى جهة تنظيمية للذكاء الاصطناعي في الاتحاد الأوروبي.
ما تعنيه تنقية البيانات عملياً
تنقية مجموعات بيانات نماذج الذكاء الاصطناعي تختلف عن تنقية سجلات الإنتاج الحية. يمكن أن تحتوي مجموعات بيانات النماذج على:
- وثائق تحتوي على بيانات شخصية — عقود ورسائل إلكترونية وتقارير وتذاكر دعم
- سجلات منظمة — جداول عملاء تُستخدم لبناء نماذج تنبؤية
- محتوى موسوم — صور أو نصوص مع ملاحظات تتضمن بيانات شخصية
- سجلات اصطناعية — حيث قد يحافظ التوليد على أنماط شخصية
يجب عليك كشف البيانات الشخصية في كل هذه الصيغ. تفويت نوع واحد يُعرّض مجموعة البيانات بأكملها للخطر. عقد أُزيلت منه الأسماء لكن بقيت فيه العناوين الكاملة سيُعلّم النموذج ربط الموقع بالأنماط الديموغرافية.
تتعامل anonym.legal API مع المعالجة الدفعية لمجموعات بيانات الذكاء الاصطناعي الكبيرة. تكتشف أكثر من 285 نوعاً من الكيانات في 48 لغة. بالنسبة لشركات الذكاء الاصطناعي الأوروبية ذات مجموعات البيانات متعددة اللغات، التغطية متعددة اللغات أمر بالغ الأهمية. ثغرة في لغة واحدة تخلق خطراً في إطار قانون الذكاء الاصطناعي الأوروبي عبر النظام بأكمله.
لمزيد من المعلومات حول كشف الكيانات، راجع دليل نظام الرموز المميزة ومرجع أنواع الكيانات.
خطوات عملية: تنقية مجموعة بياناتك
الخطوة 1: التدقيق أولاً
أجرِ تمريرة كشف قبل أي تنقية. يُخبرك هذا بالبيانات الشخصية الموجودة:
curl -X POST https://anonym.legal/api/presidio/analyze \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"text": "'"$(cat document.txt)"'",
"language": "en"
}'
تسرد الاستجابة كل كيان مكتشف مع نوعه وموضعه ودرجته. شغّل هذا على جميع ملفاتك لمعرفة الحجم الكامل قبل البدء.
الخطوة 2: التنقية الدفعية
بالنسبة لمجموعات البيانات الكبيرة، استخدم نقطة النهاية الدفعية لمعالجة ملفات متعددة في وقت واحد:
import requests
import os
from pathlib import Path
def scrub_batch(documents: list[dict]) -> list[dict]:
response = requests.post(
"https://anonym.legal/api/presidio/anonymize-batch",
json={"items": documents, "language": "en"},
headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
)
return response.json()["results"]
source_dir = Path("./dataset")
docs = [
{"id": f.name, "text": f.read_text()}
for f in source_dir.glob("*.txt")
]
batch_size = 50
for i in range(0, len(docs), batch_size):
results = scrub_batch(docs[i:i+batch_size])
for result in results:
out = source_dir / "clean" / result["id"]
out.write_text(result["text"])
print(f"تم: {result['id']} — تمت إزالة {len(result['items'])} كيانات")
الخطوة 3: الاحتفاظ بالسجلات
تتطلب المادة 10 سجلات مكتوبة بما فعلته. لكل مجموعة بيانات، احتفظ بـ:
- نموذج الكشف والإصدار المستخدم
- أنواع الكيانات المكتشفة وكيفية استبدال كل منها
- أعداد الكيانات المُزالة لكل مجموعة بيانات
- تاريخ التنقية وإصدار مجموعة البيانات المستخدم
هذا يلبّي متطلب "ممارسات حوكمة وإدارة البيانات" في المادة 10(2)(أ).
أسئلة شائعة
هل تُفسد التنقية جودة النموذج؟
في معظم الحالات، لا. يتعلم النموذج الأنماط من هيكل النص، لا من التفاصيل الشخصية. يمكن استبدال الأسماء وأرقام الهاتف والعناوين بعناصر نائبة مثل [NAME] أو [PHONE] ولا يزال النموذج يتعلم الأنماط ذاتها. وجد كثير من فرق البحث أن مجموعات البيانات المُنقَّاة تُنتج نماذج بجودة مساوية. المفتاح هو استخدام عناصر نائبة متسقة حتى يرى النموذج نمطاً واضحاً.
ماذا لو كانت مجموعة بياناتي كبيرة جداً؟
استخدم واجهة API الدفعية. تتعامل مع أحجام كبيرة بالتوازي. تُظهر صفحة التسعير الخطط لحالات الاستخدام ذات الحجم الكبير. تعالج كثير من الفرق ملايين السجلات شهرياً.
ماذا عن مجموعات البيانات غير الإنجليزية؟
تدعم واجهة API 48 لغة. تستخدم كل لغة نموذج كشف مُدرَّب على تلك اللغة. هذا يعني تغطية الألمانية والفرنسية والإسبانية واليابانية وغيرها. راجع الأسئلة الشائعة للاطلاع على قائمة اللغات الكاملة. مجموعات البيانات متعددة اللغات مدعومة أيضاً — يمكنك تحديد اللغة لكل وثيقة في الطلب الدفعي.
قانون Colorado للذكاء الاصطناعي: موعدان نهائيان
يدخل قانون Colorado للذكاء الاصطناعي حيز التنفيذ في 30 يونيو 2026 — خمسة أسابيع قبل الموعد الأوروبي. يضع قواعد مشابهة لـ "أنظمة الذكاء الاصطناعي عالية الخطورة" وفق قانون الولاية. التركيز الرئيسي هو التحيز والتمييز.
الفرق العاملة في كل من الاتحاد الأوروبي وCOlorado تواجه موعدين في آنٍ واحد. تنقية مجموعات بياناتك يساعد على تلبية القانونَين: المادة 10 (الاتحاد الأوروبي) وقواعد Colorado لمكافحة التحيز. الخطوات التقنية واحدة.
تصرّف الآن
خمسة أشهر تكفي — إذا بدأت اليوم. لن تكفي إذا انتظرت حتى يونيو.
جدول زمني عملي:
- الأسبوعان 1-2: دقّق مجموعات بياناتك — اكتشف ما هي السجلات الشخصية الموجودة
- الأسابيع 3-6: ابنِ واختبر مسار التنقية الخاص بك
- الأسابيع 7-10: اكتب سجلات الحوكمة؛ احصل على مراجعة قانونية
- الأسابيع 11-16: تحقق — تأكد من أن مجموعات البيانات المُنقَّاة تلبي قواعد جودة المادة 10
- 2 أغسطس: تاريخ التطبيق — ممارسات متوافقة جاهزة
تتصل anonym.legal API بمسارك الحالي دون تغييرات جوهرية. تحقق من التسعير للخطط الدفعية. تغطي الأسئلة الشائعة الأسئلة الشائعة حول المادة 10.
استخدم قائمة التحقق من امتثال GDPR للسجلات التي تتداخل بين GDPR والمادة 10.
قانون الذكاء الاصطناعي الأوروبي جاهز للتطبيق. هل ستكون مؤسستك جاهزة بحلول 2 أغسطس؟
ابدأ بقائمة التحقق من امتثال GDPR ←
حدود وأسئلة مفتوحة
تنقية البيانات لأحكام قانون الذكاء الاصطناعي لا تزال تتطور. إليك الفجوات الرئيسية.
العتبات غير محددة. لا يحدد قانون الذكاء الاصطناعي الأوروبي مستوى التنقية "الكافي". حتى يُصدر المكتب الأوروبي للذكاء الاصطناعي توجيهاته، تواجه خطراً قانونياً. قد لا تعرف إذا كانت طريقتك ستُرضي الجهات التنظيمية.
خطر إعادة التعريف قائم. تُظهر الأبحاث أن نماذج اللغة الكبيرة يمكنها حفظ واسترجاع المحتوى من مجموعات بياناتها. السجلات التي اجتازت معايير التنقية قبل تطوير النموذج قد لا تزال قابلة للاستخراج. التنقية قبل التطوير لا تحل هذه المشكلة كلياً.
للسجلات الاصطناعية حدود. يحافظ التوليد الاصطناعي على الأنماط الإحصائية لكنه قد يُضيف تحيزات خفية أو يفوّت حالات حافة نادرة. النماذج المبنية فقط على محتوى اصطناعي قد تؤدي أداءً ضعيفاً على المدخلات الحقيقية.
المادة 10 لا تزال تُفسَّر. تحتاج عبارة "التدابير التقنية المناسبة" إلى تفسير. العمل المبكر لهيئات حماية البيانات في دول الاتحاد الأوروبي لم يستقر بعد على معايير واضحة. راقب توجيهات EDPB وقرارات الدول الأعضاء طوال عام 2026.
المصادر
- قانون الذكاء الاصطناعي الأوروبي، اللائحة (EU) 2024/1689، المواد 9-17 (التزامات الذكاء الاصطناعي عالي الخطورة)، OJ L 2024/1689
- قانون الذكاء الاصطناعي الأوروبي، المادة 10 — البيانات وحوكمة البيانات
- إرشادات مجموعات بيانات الذكاء الاصطناعي من CNIL، يناير 2026
- قانون Colorado للذكاء الاصطناعي، SB 205، نافذ اعتباراً من 30 يونيو 2026
- جدول قانون الذكاء الاصطناعي الأوروبي: الممارسات المحظورة من 2 فبراير 2025؛ الأنظمة عالية الخطورة من 2 أغسطس 2026