By · Last updated 2026-05-18

العودة إلى المدونةالامتثال لـ GDPR

LGPD والبيانات الشخصية البرازيلية: ما تتطلبه ANPD للـ...

يغطي LGPD 215 مليون برازيلي وبدأت ANPD التطبيق الرئيسي في 2024. تكتشف الأدوات المدربة على الإنجليزية CPF بدقة 45% فقط.

May 18, 20268 دقيقة قراءة
Brazil LGPDCPF detectionBrazilian Portuguese PIIANPD complianceSouth America data protection

يُعدّ القانون البرازيلي العام لحماية البيانات (LGPD) ثالث أكبر إطار لحماية البيانات في العالم من حيث عدد السكان المشمولين — 215 مليون برازيلي، أكثر من ألمانيا وفرنسا والمملكة المتحدة مجتمعين. أصدرت الهيئة الوطنية لحماية البيانات (ANPD) أول إجراءاتها التطبيقية الرئيسية في 2024، مؤذنةً بانتهاء فترة السماح التي أعقبت صدور LGPD في 2020.

يتسم التحدي التقني للامتثال بطابعه المميز: البرتغالية البرازيلية هي لغة الوثائق المشمولة بـ LGPD، لكن المعرّفات الوطنية البرازيلية مختلفة تماماً عن معرّفات البرتغالية الأوروبية — وعن أي نظام تعريف وطني آخر في العالم.

لماذا تتميز البيانات الشخصية البرازيلية تقنياً

تطوّرت أنظمة التعريف البرازيلية الاتحادية والولائية بشكل مستقل عن أطر الهوية الرقمية الأوروبية. والنتيجة مجموعة معقدة من المعرّفات التي تخفق في اكتشافها الأدوات العامة — معظمها مدرَّب على البيانات الإنجليزية أو الأوروبية:

CPF (Cadastro de Pessoas Físicas): رقم تسجيل دافع الضريبة الفردي المكوّن من 11 رقماً هو المعرّف الشامل للمواطنين في البرازيل. التنسيق: XXX.XXX.XXX-XX مع رقمين للتحقق. تستخدم خوارزمية رقم التحقق للـ CPF حسابين منفصلين للحساب المعياري — إذا تطابق رقما التحقق، فالـ CPF صالح.

المشكلة التقنية: تكتشف أدوات NLP المدربة على الإنجليزية CPF بدقة 45% فقط (التقييم التقني لـ ANPD لعام 2024). الإخفاقات: الأدوات التي تطابق الأنماط للأرقام المكونة من 11 رقماً دون التحقق من رقمَي التحقق بخطوتين لا تميّز أرقام CPF الصالحة من التسلسلات العشوائية؛ وتظهر CPF في الوثائق البرازيلية أحياناً دون التنسيق القياسي XXX.XXX.XXX-XX (مخرجات OCR، نماذج النص العادي).

CNPJ (Cadastro Nacional da Pessoa Jurídica): رقم تسجيل الشركة المكوّن من 14 رقماً. التنسيق: XX.XXX.XXX/XXXX-XX مع رقمين للتحقق باستخدام خوارزميات مشابهة للـ CPF (لكن غير مطابقة).

RG (Registro Geral): وثيقة الهوية المدنية الولائية البرازيلية. على خلاف CPF (اتحادي، موحد)، يتفاوت تنسيق RG حسب الولاية:

  • ساو باولو: حرفان + 5-9 أرقام (مثال: MG-12.345.678)
  • ريو دي جانيرو: 7-8 أرقام مع شرطة
  • ميناس جيرايس: 7-9 أرقام
  • ولايات أخرى: تنسيقات متنوعة

الأداة التي تتعرف على تنسيق RG لولاية واحدة فقط تُفوّت غالبية أرقام RG في الوثائق البرازيلية.

CNH (Carteira Nacional de Habilitação): رقم رخصة القيادة المكوّن من 11 رقماً مع رقم تحقق. يُصدَر CNH اتحادياً لكن التنسيق يشمل ترميز المنطقة.

Título de Eleitor (تسجيل الناخب): رقم مكوّن من 12 رقماً بثلاثة مكونات — رمز التعريف (8 أرقام)، رمز الولاية (رقمان)، أرقام التحقق (رقمان).

رقم SUS (Cartão SUS): رقم نظام الصحة الموحد المكوّن من 15 رقماً المخصص لكل برازيلي للوصول إلى الرعاية الصحية العامة. يظهر في سجلات المستشفيات العامة ورعاية أولية.

PIS/PASEP: رقم برنامج تكامل العمل المكوّن من 11 رقماً المستخدم في جميع سجلات التوظيف.

معيار التجهيل وفق LGPD

تُعرّف المادة 12 من LGPD البيانات المجهولة بأنها "البيانات المتعلقة بالشخص المعني التي لا يمكن تعريفها، مع مراعاة الوسائل التقنية المعقولة المتاحة وقت المعالجة." هذا معيار نسبي تقنياً — ما هو مجهول اليوم قد لا يكون كذلك حين تتطور تقنيات إعادة التعريف مستقبلاً.

توضح توجيهات ANPD أن التجهيل يستلزم أكثر من مجرد إزالة المعرّفات الصريحة (CPF، الاسم). قد تُمكّن تجمّعات شبه المعرّفات (الفئة العمرية، البلدية، الجنس، المهنة) من إعادة التعريف ويجب معالجتها عبر التعميم أو إضافة الضوضاء.

لبيانات تدريب الذكاء الاصطناعي، تشترط ANPD أن تكون البيانات المستخدمة في تدريب نماذج LLM أو ML إما:

  • مجهولة حقاً (مستوفيةً المعيار التقني للمادة 12)، أو
  • حاصلة على موافقة صريحة من كل شخص معني للاستخدام التدريبي المحدد، أو
  • مؤهلة بموجب غرض مشروع مع تبرير موثق

متطلبات اللغة البرتغالية البرازيلية

تختلف البرتغالية البرازيلية عن البرتغالية الأوروبية (البرتغال) في المفردات والإملاء وتقاليد الوثائق. تؤدي نماذج NLP المدربة على البرتغالية الأوروبية بدقة تبلغ نحو 71% من دقة النماذج المدربة تحديداً على النصوص البرتغالية البرازيلية (التقييم التقني لـ ANPD).

فروقات محددة ذات صلة باكتشاف البيانات الشخصية:

  • تقاليد الأسماء: الأسماء البرازيلية تتبع أنماطاً مختلفة عن الأسماء البرتغالية.
  • تنسيقات العناوين: تستخدم العناوين البرازيلية "Rua" و"Avenida" و"Alameda" و"Travessa" بطريقة مشابهة للبرتغال، لكن رموز CEP البريدية (8 أرقام: XXXXX-XXX) خاصة بالبرازيل.
  • مصطلحات الوثائق: تستخدم الوثائق البرازيلية مصطلحات مختلفة عن البرتغالية الأوروبية — "Carteira de Identidade" مقابل "Bilhete de Identidade" للهوية الوطنية.

للامتثال لـ LGPD: CPF وCNPJ مع التحقق من رقمَي التحقق بخطوتين، والتعرف على تنسيقات RG متعددة الولايات، واكتشاف رقم SUS وTítulo de Eleitor، ودعم نماذج NLP للبرتغالية البرازيلية تمثّل الخط الأساسي التقني للامتثال لـ ANPD.

المصادر:

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.