By · Last updated 2026-06-05

العودة إلى المدونةالامتثال لـ GDPR

الدنمارك: التحقق من الرقم الشخصي CPR بالمودولو 11 لضمان الامتثال للائحة

تُخطئ 67% من أدوات معالجة اللغة الطبيعية في التحقق من الرقم الشخصي الدنماركي CPR بالمودولو 11. أصدرت Datatilsynet 14 قراراً في قطاع الرعاية الصحية في 2024. الاستخدام الثانوي لبيانات الصحة.

June 5, 20267 دقيقة قراءة
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

أرقام CPR الدنماركية: دليل الامتثال للائحة العامة لحماية البيانات

محدَّث لعام 2026

أصدرت هيئة حماية البيانات الدنماركية Datatilsynet 31 قراراً بموجب اللائحة العامة لحماية البيانات في عام 2024، تناول أربعة عشر منها بيانات الرعاية الصحية. يعكس هذا التركيز العالي حقيقتين: الدنمارك تُدير منظومة صحية وطنية ضخمة، والثغرات التقنية فيها تُسبب استمرار تسرب سجلات المرضى.

قاعدة رقم التحقق لأرقام CPR

رقم CPR هو الهوية الشخصية في الدنمارك. يتكون من 10 أرقام بصيغة DDMMYY-XXXX. الأرقام الستة الأولى هي تاريخ الميلاد، والأربعة الأخيرة رمز مع رقم تحقق.

يعتمد رقم التحقق على قاعدة المودولو 11:

  1. تُؤخذ الأرقام من 1 إلى 9.
  2. يُخصص لكل منها وزن: 4، 3، 2، 7، 6، 5، 4، 3، 2.
  3. يُضرب كل رقم في وزنه وتُجمع جميع النتائج.
  4. تُقسم على 11 وتُؤخذ البقية.
  5. بقية 0 → رقم التحقق هو 0.
  6. بقية 1 → الرقم غير صالح.
  7. بقية من 2 إلى 10 → رقم التحقق هو 11 ناقص البقية.

هذه القاعدة ضرورية لكل أداة تبحث عن أرقام CPR. فبعض السلاسل بصيغة DDMMYY-XXXX لا يمكن أن تكون صالحة قط. الأدوات التي تتجاهل هذه الخطوة تُعلّم التواريخ ورموز الفواتير والأرقام المرجعية كهويات حقيقية.

كشف مراجعة الهيئة لعام 2024 أن 67% من أدوات معالجة اللغة الطبيعية العامة تتجاهل هذا الاختبار. وهذه الثغرة هي الإخفاق التقني الأبرز في قضاياها المتعلقة بالرعاية الصحية.

السجلات الصحية الوطنية الخمسة في الدنمارك

تربط الدنمارك بيانات الصحة عبر خمسة سجلات وطنية، ويربطها معاً الرقم الشخصي:

  • سجلات الخروج من المستشفيات (منذ 1977)
  • بيانات الوصفات الطبية (منذ 1995)
  • سجل السرطان (منذ 1943)
  • سجل أسباب الوفاة (منذ 1970)
  • تشخيصات الرعاية الأولية (منذ 1990)

يجعل هذا الترابط البحث الصحي الدنماركي متميزاً للغاية، لكنه يُشكّل في الوقت ذاته خطراً. إزالة الرقم الخام وحدها لا تكفي. مجموعة بيانات لا تزال تحمل العمر والجنس والتشخيص والسنة يمكنها إعادة تعريف الأشخاص — لا سيما المصابين بأمراض نادرة.

تُحدد توجيهات Datatilsynet لعام 2024 بشأن الاستخدام الثانوي لبيانات الصحة ثلاثة متطلبات.

توثيق خطوات معالجة البيانات: يستلزم الأمر سرد الحقول المُحذوفة والمُجمَّعة وحجم المجموعات في الناتج. لا تُفي ملاحظة سياساتية بهذا المعيار.

مراجعة خارجية للمجموعات الكبيرة: للمجموعات التي تتجاوز 5,000 شخص، توصي الهيئة بمراجعة تقنية مستقلة لخطوات إخفاء الهوية.

مطابقة البيانات للغرض المعلن: يجب أن تتناسب مجموعة البيانات مع الهدف البحثي المُصرّح به. وجدت الهيئة حالات استخدمت فيها فرق بحثية سجلات وطنية كاملة في حين كانت عينة أصغر كافية.

راجع دليل اكتشاف الهويات الوطنية الأوروبية للاطلاع على كيفية تطبيق قواعد التحقق على صيغ الهوية الأوروبية الأخرى.

ما كشفته قضايا 2024

تتشارك قضايا الرعاية الصحية الأربع عشرة ثلاثة أنماط شائعة للإخفاق.

تبادل بيانات البحث: يُرسل مستشفى مجموعة بيانات مرضى مُزالة هويتها إلى شريك أكاديمي لتدريب الذكاء الاصطناعي. تحتوي المجموعة على أجزاء من تاريخ الميلاد ورموز التشخيص وتواريخ العلاج. تخلص الهيئة إلى أن هذا المزيج يُعيد تعريف المرضى بأمراض نادرة. التشخيصات غير الشائعة تُضيّق نطاق المجموعة بسرعة.

خدمات الذكاء الاصطناعي من أطراف ثالثة: ترسل شركة تقنية صحية ملاحظات المرضى إلى خدمة ذكاء اصطناعي أمريكية لأعمال السجلات السريرية. الهويات الشخصية في تلك الملاحظات لم تُزَل أولاً. لا توجد آلية نقل صالحة.

ثغرات خط أنابيب التعرف الضوئي على الحروف (OCR): تعالج شركة تأمين نماذج PDF ممسوحة ضوئياً لمطالبات الإعاقة. يُحوّل أداة OCR الصور إلى نص، لكنها لا تُجري اختبارات التحقق على الناتج فتُفوّت هويات كثيرة.

كثيراً ما يُدرج OCR مسافات في منتصف الأرقام أو يُزيح الشرطة، فتفشل مطابقة النمط البسيطة على هذا الناتج. يجب أن يعمل الاكتشاف على نص OCR لا على مدخلات نظيفة فحسب. راجع دليل اكتشاف البيانات الشخصية في الصحة عبر OCR للاطلاع على خطوات معالجة الوثائق الممسوحة.

ثلاثة متطلبات تقنية لا غنى عنها

تُشكّل هذه العناصر الثلاثة الأساس للامتثال الدنماركي في قطاع الرعاية الصحية:

اختبارات التحقق على جميع النصوص: تطبيق اختبار المودولو 11 الكامل على كل سلسلة مرشحة، سواء في النص النظيف أو في ناتج OCR.

اكتشاف الأسماء باللغة الدنماركية: استخدام نموذج مدرب على النصوص الدنماركية. نموذج spaCy da_core_news أحد الخيارات المتاحة. يُخطئ النموذج الإنجليزي العام في الأسماء الدنماركية وأسماء المنظمات.

سجلات إخفاء الهوية: توثيق ما أُزيل وما جُمّع وحجم المجموعات في الناتج. تطلب الهيئة هذا التوثيق بصيغة تقنية لا كملاحظة سياساتية.

للاطلاع على بيانات تكلفة حوادث البيانات الصحية، راجع تحليل تكاليف انتهاكات الرعاية الصحية.

المصادر

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.