العودة إلى المدونةالامتثال لـ GDPR

قانون الذكاء الاصطناعي الأوروبي أغسطس 2026: إخفاء هوية بيانات التدريب لتحقيق متطلبات المادة 10

يبدأ التطبيق الكامل لقانون الذكاء الاصطناعي الأوروبي في 2 أغسطس 2026. الغرامات تصل إلى 35 مليون يورو أو 7% من حجم الأعمال العالمي. تستلزم المادة 10 إخفاء هوية بيانات التدريب.

March 16, 20269 دقيقة قراءة
EU AI Acttraining dataArticle 10GDPR complianceAI regulation2026 deadlinedata governance

العد التنازلي قد بدأ

محدَّث لعام 2026

الموعد النهائي لقانون الذكاء الاصطناعي الأوروبي حقيقي. تسري أحكام المادة 10 اعتباراً من 2 أغسطس 2026. إذا كان فريقك يبني أو يُشغّل نظام ذكاء اصطناعي عالي الخطورة، تصرّف الآن. الوقت شحيح.

الغرامات أعلى من GDPR. الحد الأقصى للغرامة هو 35 مليون يورو أو 7% من حجم الأعمال السنوي العالمي. يصل سقف GDPR إلى 20 مليون يورو أو 4%. لا يوجد قانون ذكاء اصطناعي آخر بغرامات أعلى.

ما هي أنظمة الذكاء الاصطناعي عالية الخطورة؟

يُصنّف قانون الذكاء الاصطناعي الأنظمة حسب الخطورة. تشمل الأنظمة عالية الخطورة (الملحق III) الذكاء الاصطناعي المستخدم في:

  • التعليم — الوصول إلى المدارس أو تقييم الطلاب
  • الوظائف — فرز السير الذاتية، وتقييم المقابلات، ورصد العمال
  • الخدمات الأساسية — تقييم الائتمان، وتسعير التأمين، وإيفاد الطوارئ
  • إنفاذ القانون — التنبؤ بالجريمة، والتعريف البيومتري
  • الرعاية الصحية — برامج الأجهزة الطبية، وفرز المرضى
  • البنية التحتية — إدارة الطاقة والمياه والنقل
  • العدالة — أدوات البحث القانوني، وأدوات الأحكام

تعمل في أي من هذه المجالات؟ تسري عليك المادة 10.

المادة 10: أربع قواعد رئيسية

تضع المادة 10 قواعد لمجموعات البيانات المستخدمة من قِبَل أنظمة الذكاء الاصطناعي عالية الخطورة. إليك القواعد الأربع الرئيسية.

1. حوكمة مكتوبة

يجب أن تتبع مجموعات البيانات "ممارسات مناسبة لحوكمة وإدارة البيانات". تحتاج خطوات مكتوبة للجمع وفحوصات الجودة والمراجعة المستمرة.

2. اختبار التحيز

يجب فحص السجلات بحثاً عن "تحيزات محتملة" قد تتسبب في مخرجات غير عادلة. يُشترَط إجراء اختبارات نشطة. تجنّب التحيز المتعمد لا يكفي.

3. الدقة والتغطية

يجب أن تكون مجموعات البيانات "ذات صلة وتمثيلية بشكل كافٍ وخالية من الأخطاء". عمليات الزحف على الويب التي تفوّت مجموعات معينة قد تفشل في هذا الاختبار.

4. أنواع خاصة من السجلات

المادة 10(5) هي القاعدة الأكثر مباشرة. عندما يستخدم نظام عالي الخطورة سجلات ذات فئة خاصة — الصحة والعرق والدين والسياسة والبيومترية — لا يجوز معالجتها إلا عندما تكون "ضرورية صارمة" لفحوصات التحيز. يجب أيضاً تطبيق "ضمانات مناسبة". تنقية البيانات هي إحدى أقوى الضمانات التي يمكنك استخدامها.

خلاصة القول: معظم مجموعات بيانات نماذج الذكاء الاصطناعي تحتوي على سجلات شخصية. تقول المادة 10: استخدم الحد الأدنى اللازم، مع ضمانات تقنية قوية.

راجع صفحة الامتثال القانوني والنظرة العامة على الأمان للتفاصيل.

مستويات الغرامات

يمتلك قانون الذكاء الاصطناعي الأوروبي ثلاثة مستويات للغرامات. كلها تتجاوز GDPR لنفس نوع الانتهاك:

اللائحةالغرامة القصوىسقف حجم الأعمال
GDPR20 مليون يورو4% من حجم الأعمال العالمي
قانون الذكاء الاصطناعي الأوروبي (عالي الخطورة)15 مليون يورو3% من حجم الأعمال العالمي
قانون الذكاء الاصطناعي الأوروبي (محظور)35 مليون يورو7% من حجم الأعمال العالمي

تقع انتهاكات مجموعات البيانات في المستوى عالي الخطورة (15 مليون يورو / 3%). إذا وجدت جهة تنظيمية أن استخدام السجلات الشخصية بلا ضمانات يُعدّ فعلاً محظوراً، يُطبَّق المستوى الأعلى.

أمثلة حقيقية: حجم أعمال 500 مليون يورو بنسبة 3% = غرامة 15 مليون يورو. حجم أعمال 5 مليار يورو بنسبة 3% = غرامة 150 مليون يورو. هذه أرقام حقيقية، لا نظرية.

لماذا يحل تنقية البيانات هذه المشكلة؟

السجلات المُنقَّاة بشكل صحيح تقع خارج نطاق GDPR. هذا يزيل معظم العبء الملقى بموجب المادة 10.

القواعد الصارمة — معالجة الفئات الخاصة وفحوصات التحيز وحقوق أصحاب البيانات — لا تسري إلا عندما تحتوي مجموعة البيانات على سجلات شخصية. أزِل تلك السجلات أولاً. يختفي العبء إلى حد بعيد.

أوضحت الهيئة الوطنية لحماية البيانات الفرنسية (CNIL) ذلك بوضوح في مطلع عام 2026. تقول إرشاداتها للذكاء الاصطناعي: تنقية البيانات الشخصية غير الضرورية لأداء النموذج هي الإجراء التقني الأساسي للمادة 10.

هذه ليست وجهة نظر هامشية. إنها الموقف السائد لأعلى جهة تنظيمية للذكاء الاصطناعي في الاتحاد الأوروبي.

ما تعنيه تنقية البيانات عملياً

تنقية مجموعات بيانات نماذج الذكاء الاصطناعي تختلف عن تنقية سجلات الإنتاج الحية. يمكن أن تحتوي مجموعات بيانات النماذج على:

  • وثائق تحتوي على بيانات شخصية — عقود ورسائل إلكترونية وتقارير وتذاكر دعم
  • سجلات منظمة — جداول عملاء تُستخدم لبناء نماذج تنبؤية
  • محتوى موسوم — صور أو نصوص مع ملاحظات تتضمن بيانات شخصية
  • سجلات اصطناعية — حيث قد يحافظ التوليد على أنماط شخصية

يجب عليك كشف البيانات الشخصية في كل هذه الصيغ. تفويت نوع واحد يُعرّض مجموعة البيانات بأكملها للخطر. عقد أُزيلت منه الأسماء لكن بقيت فيه العناوين الكاملة سيُعلّم النموذج ربط الموقع بالأنماط الديموغرافية.

تتعامل anonym.legal API مع المعالجة الدفعية لمجموعات بيانات الذكاء الاصطناعي الكبيرة. تكتشف أكثر من 285 نوعاً من الكيانات في 48 لغة. بالنسبة لشركات الذكاء الاصطناعي الأوروبية ذات مجموعات البيانات متعددة اللغات، التغطية متعددة اللغات أمر بالغ الأهمية. ثغرة في لغة واحدة تخلق خطراً في إطار قانون الذكاء الاصطناعي الأوروبي عبر النظام بأكمله.

لمزيد من المعلومات حول كشف الكيانات، راجع دليل نظام الرموز المميزة ومرجع أنواع الكيانات.

خطوات عملية: تنقية مجموعة بياناتك

الخطوة 1: التدقيق أولاً

أجرِ تمريرة كشف قبل أي تنقية. يُخبرك هذا بالبيانات الشخصية الموجودة:

curl -X POST https://anonym.legal/api/presidio/analyze \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "'"$(cat document.txt)"'",
    "language": "en"
  }'

تسرد الاستجابة كل كيان مكتشف مع نوعه وموضعه ودرجته. شغّل هذا على جميع ملفاتك لمعرفة الحجم الكامل قبل البدء.

الخطوة 2: التنقية الدفعية

بالنسبة لمجموعات البيانات الكبيرة، استخدم نقطة النهاية الدفعية لمعالجة ملفات متعددة في وقت واحد:

import requests
import os
from pathlib import Path

def scrub_batch(documents: list[dict]) -> list[dict]:
    response = requests.post(
        "https://anonym.legal/api/presidio/anonymize-batch",
        json={"items": documents, "language": "en"},
        headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
    )
    return response.json()["results"]

source_dir = Path("./dataset")
docs = [
    {"id": f.name, "text": f.read_text()}
    for f in source_dir.glob("*.txt")
]

batch_size = 50
for i in range(0, len(docs), batch_size):
    results = scrub_batch(docs[i:i+batch_size])
    for result in results:
        out = source_dir / "clean" / result["id"]
        out.write_text(result["text"])
        print(f"تم: {result['id']} — تمت إزالة {len(result['items'])} كيانات")

الخطوة 3: الاحتفاظ بالسجلات

تتطلب المادة 10 سجلات مكتوبة بما فعلته. لكل مجموعة بيانات، احتفظ بـ:

  • نموذج الكشف والإصدار المستخدم
  • أنواع الكيانات المكتشفة وكيفية استبدال كل منها
  • أعداد الكيانات المُزالة لكل مجموعة بيانات
  • تاريخ التنقية وإصدار مجموعة البيانات المستخدم

هذا يلبّي متطلب "ممارسات حوكمة وإدارة البيانات" في المادة 10(2)(أ).

أسئلة شائعة

هل تُفسد التنقية جودة النموذج؟

في معظم الحالات، لا. يتعلم النموذج الأنماط من هيكل النص، لا من التفاصيل الشخصية. يمكن استبدال الأسماء وأرقام الهاتف والعناوين بعناصر نائبة مثل [NAME] أو [PHONE] ولا يزال النموذج يتعلم الأنماط ذاتها. وجد كثير من فرق البحث أن مجموعات البيانات المُنقَّاة تُنتج نماذج بجودة مساوية. المفتاح هو استخدام عناصر نائبة متسقة حتى يرى النموذج نمطاً واضحاً.

ماذا لو كانت مجموعة بياناتي كبيرة جداً؟

استخدم واجهة API الدفعية. تتعامل مع أحجام كبيرة بالتوازي. تُظهر صفحة التسعير الخطط لحالات الاستخدام ذات الحجم الكبير. تعالج كثير من الفرق ملايين السجلات شهرياً.

ماذا عن مجموعات البيانات غير الإنجليزية؟

تدعم واجهة API 48 لغة. تستخدم كل لغة نموذج كشف مُدرَّب على تلك اللغة. هذا يعني تغطية الألمانية والفرنسية والإسبانية واليابانية وغيرها. راجع الأسئلة الشائعة للاطلاع على قائمة اللغات الكاملة. مجموعات البيانات متعددة اللغات مدعومة أيضاً — يمكنك تحديد اللغة لكل وثيقة في الطلب الدفعي.

قانون Colorado للذكاء الاصطناعي: موعدان نهائيان

يدخل قانون Colorado للذكاء الاصطناعي حيز التنفيذ في 30 يونيو 2026 — خمسة أسابيع قبل الموعد الأوروبي. يضع قواعد مشابهة لـ "أنظمة الذكاء الاصطناعي عالية الخطورة" وفق قانون الولاية. التركيز الرئيسي هو التحيز والتمييز.

الفرق العاملة في كل من الاتحاد الأوروبي وCOlorado تواجه موعدين في آنٍ واحد. تنقية مجموعات بياناتك يساعد على تلبية القانونَين: المادة 10 (الاتحاد الأوروبي) وقواعد Colorado لمكافحة التحيز. الخطوات التقنية واحدة.

تصرّف الآن

خمسة أشهر تكفي — إذا بدأت اليوم. لن تكفي إذا انتظرت حتى يونيو.

جدول زمني عملي:

  1. الأسبوعان 1-2: دقّق مجموعات بياناتك — اكتشف ما هي السجلات الشخصية الموجودة
  2. الأسابيع 3-6: ابنِ واختبر مسار التنقية الخاص بك
  3. الأسابيع 7-10: اكتب سجلات الحوكمة؛ احصل على مراجعة قانونية
  4. الأسابيع 11-16: تحقق — تأكد من أن مجموعات البيانات المُنقَّاة تلبي قواعد جودة المادة 10
  5. 2 أغسطس: تاريخ التطبيق — ممارسات متوافقة جاهزة

تتصل anonym.legal API بمسارك الحالي دون تغييرات جوهرية. تحقق من التسعير للخطط الدفعية. تغطي الأسئلة الشائعة الأسئلة الشائعة حول المادة 10.

استخدم قائمة التحقق من امتثال GDPR للسجلات التي تتداخل بين GDPR والمادة 10.

قانون الذكاء الاصطناعي الأوروبي جاهز للتطبيق. هل ستكون مؤسستك جاهزة بحلول 2 أغسطس؟

ابدأ بقائمة التحقق من امتثال GDPR ←

حدود وأسئلة مفتوحة

تنقية البيانات لأحكام قانون الذكاء الاصطناعي لا تزال تتطور. إليك الفجوات الرئيسية.

العتبات غير محددة. لا يحدد قانون الذكاء الاصطناعي الأوروبي مستوى التنقية "الكافي". حتى يُصدر المكتب الأوروبي للذكاء الاصطناعي توجيهاته، تواجه خطراً قانونياً. قد لا تعرف إذا كانت طريقتك ستُرضي الجهات التنظيمية.

خطر إعادة التعريف قائم. تُظهر الأبحاث أن نماذج اللغة الكبيرة يمكنها حفظ واسترجاع المحتوى من مجموعات بياناتها. السجلات التي اجتازت معايير التنقية قبل تطوير النموذج قد لا تزال قابلة للاستخراج. التنقية قبل التطوير لا تحل هذه المشكلة كلياً.

للسجلات الاصطناعية حدود. يحافظ التوليد الاصطناعي على الأنماط الإحصائية لكنه قد يُضيف تحيزات خفية أو يفوّت حالات حافة نادرة. النماذج المبنية فقط على محتوى اصطناعي قد تؤدي أداءً ضعيفاً على المدخلات الحقيقية.

المادة 10 لا تزال تُفسَّر. تحتاج عبارة "التدابير التقنية المناسبة" إلى تفسير. العمل المبكر لهيئات حماية البيانات في دول الاتحاد الأوروبي لم يستقر بعد على معايير واضحة. راقب توجيهات EDPB وقرارات الدول الأعضاء طوال عام 2026.

المصادر

  • قانون الذكاء الاصطناعي الأوروبي، اللائحة (EU) 2024/1689، المواد 9-17 (التزامات الذكاء الاصطناعي عالي الخطورة)، OJ L 2024/1689
  • قانون الذكاء الاصطناعي الأوروبي، المادة 10 — البيانات وحوكمة البيانات
  • إرشادات مجموعات بيانات الذكاء الاصطناعي من CNIL، يناير 2026
  • قانون Colorado للذكاء الاصطناعي، SB 205، نافذ اعتباراً من 30 يونيو 2026
  • جدول قانون الذكاء الاصطناعي الأوروبي: الممارسات المحظورة من 2 فبراير 2025؛ الأنظمة عالية الخطورة من 2 أغسطس 2026

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.