By · Last updated 2026-06-05

بازگشت به وبلاگGDPR و انطباق

CPR دانمارک: اعتبارسنجی Modulus-11 برای GDPR

۶۷٪ از ابزارهای NLP اعتبارسنجی modulus-11 شماره CPR دانمارکی را از دست می‌دهند. ۱۴ اقدام اجرایی بهداشتی Datatilsynet در سال ۲۰۲۴. استفاده ثانویه از داده‌های بهداشتی.

June 5, 20267 دقیقه مطالعه
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

شماره‌های CPR دانمارک: راهنمای انطباق GDPR

بروزرسانی برای ۲۰۲۶

سازمان نظارتی داده دانمارک، Datatilsynet، در سال ۲۰۲۴ ۳۱ تصمیم GDPR صادر کرد. چهارده تا مربوط به داده‌های بهداشتی بود. این سهم بالا دو واقعیت را منعکس می‌کند: دانمارک یک سیستم بهداشت ملی بزرگ اداره می‌کند، و شکاف‌های فنی در آن سیستم به پخش شدن پرونده‌های بیمار ادامه می‌دهد.

قانون رقم کنترلی برای شماره‌های CPR

شماره CPR شناسه شخصی دانمارک است. این عدد ۱۰ رقمی با قالب DDMMYY-XXXX است. شش رقم اول تاریخ تولد هستند. چهار رقم آخر یک کد به علاوه یک رقم کنترلی هستند.

رقم کنترلی از قانون modulus-11 استفاده می‌کند:

  1. ارقام ۱ تا ۹ را بگیرید.
  2. به هر کدام یک وزن بدهید: ۴، ۳، ۲، ۷، ۶، ۵، ۴، ۳، ۲.
  3. هر رقم را در وزن آن ضرب کنید. همه نتایج را جمع بزنید.
  4. بر ۱۱ تقسیم کنید. باقیمانده را یادداشت کنید.
  5. باقیمانده ۰ → رقم کنترلی ۰ است.
  6. باقیمانده ۱ → عدد معتبر نیست.
  7. باقیمانده ۲–۱۰ → رقم کنترلی ۱۱ منهای باقیمانده است.

این قانون برای هر ابزاری که شماره‌های CPR را اسکن می‌کند اهمیت دارد. برخی رشته‌های DDMMYY-XXXX هرگز نمی‌توانند معتبر باشند. ابزارهایی که این مرحله را نادیده می‌گیرند تاریخ‌ها، کدهای فاکتور، و شماره‌های مرجع را به عنوان شناسه‌های واقعی علامت‌گذاری می‌کنند.

بررسی ۲۰۲۴ این سازمان نشان داد که ۶۷٪ از ابزارهای عمومی NLP این بررسی را نادیده می‌گیرند. این شکاف اصلی‌ترین شکست فنی در پرونده‌های بهداشتی آن است.

پنج ثبت بهداشتی دانمارک

دانمارک داده‌های بهداشتی را در پنج ثبت ملی پیوند می‌زند. شناسه شخصی همه پنج را به هم متصل می‌کند.

  • سوابق ترخیص بیمارستان (از ۱۹۷۷)
  • داده‌های نسخه (از ۱۹۹۵)
  • ثبت سرطان (از ۱۹۴۳)
  • ثبت علت مرگ (از ۱۹۷۰)
  • تشخیص‌های مراقبت اولیه (از ۱۹۹۰)

این تحقیقات بهداشتی دانمارکی را بسیار قوی می‌کند. همچنین یک خطر ایجاد می‌کند. حذف شناسه خام کافی نیست. یک مجموعه داده که هنوز سن، جنس، تشخیص، و سال را نگه می‌دارد می‌تواند افراد را مجدداً افشا کند — به ویژه آنهایی که بیماری‌های نادر دارند.

راهنمای ۲۰۲۴ Datatilsynet درباره استفاده ثانویه از داده‌های بهداشتی سه الزام تعیین می‌کند.

بنویسید با داده چه کردید: فهرست کنید کدام فیلدها را حذف کردید، کدام‌ها را گرد کردید یا گروه‌بندی کردید، و خروجی چه اندازه گروهی دارد. یک یادداشت سیاستی این استاندارد را برآورده نمی‌کند.

برای مجموعه‌های بزرگ بررسی خارجی دریافت کنید: برای مجموعه داده‌هایی با بیش از ۵,۰۰۰ نفر، سازمان یک بررسی فنی مستقل از مراحل شناسایی را توصیه می‌کند.

داده را با سؤال مطابقت دهید: مجموعه داده باید با هدف تحقیقاتی اعلام‌شده مطابقت داشته باشد. سازمان مواردی پیدا کرد که تیم‌ها از ثبت‌های ملی کامل استفاده می‌کردند در حالی که یک نمونه کوچکتر کافی بود.

برای نحوه اعمال قوانین رقم کنترلی به قالب‌های شناسه اروپایی دیگر، راهنمای شناسایی شناسه ملی اتحادیه اروپا ما را ببینید.

آنچه پرونده‌های ۲۰۲۴ یافتند

چهارده پرونده بهداشتی سه نوع شکست مشترک را به اشتراک می‌گذارند.

اشتراک‌گذاری داده‌های تحقیقاتی: یک بیمارستان یک مجموعه داده بیمار ناشناس‌شده را برای آموزش هوش مصنوعی به یک شریک دانشگاهی ارسال می‌کند. این مجموعه بخش‌های تاریخ تولد، کدهای تشخیص، و تاریخ‌های درمان را دارد. سازمان می‌یابد که این ترکیب بیماران با بیماری‌های نادر را مجدداً افشا می‌کند. تشخیص‌های غیرمعمول استخر را سریع محدود می‌کنند.

خدمات هوش مصنوعی شخص ثالث: یک شرکت فناوری بهداشت یادداشت‌های بیمار را برای کار با سوابق بالینی به یک سرویس هوش مصنوعی مستقر در آمریکا ارسال می‌کند. شناسه‌های شخصی در آن یادداشت‌ها اول حذف نشده‌اند. هیچ مکانیزم انتقال معتبری وجود ندارد.

شکاف‌های خط لوله OCR: یک بیمه‌گر فرم‌های PDF اسکن‌شده برای ادعاهای ناتوانی را پردازش می‌کند. ابزار OCR آن تصاویر را به متن تبدیل می‌کند. اما آزمون‌های رقم کنترلی را روی خروجی اجرا نمی‌کند. بسیاری از شناسه‌ها از دست می‌روند.

OCR اغلب در وسط عدد فاصله درج می‌کند یا خط فاصله را جابه‌جا می‌کند. تطابق الگوی ساده روی آن خروجی شکست می‌خورد. شناسایی باید روی متن OCR کار کند، نه فقط ورودی تمیز. برای مراحل رسیدگی به اسناد اسکن‌شده، راهنمای شناسایی PII بهداشتی OCR ما را ببینید.

سه ضرورت فنی

این سه عنصر پایه انطباق GDPR بهداشت دانمارکی را تشکیل می‌دهند.

آزمون‌های رقم کنترلی روی همه متون: بررسی کامل modulus-11 را روی هر رشته کاندید اجرا کنید. آن را هم روی متن تمیز و هم خروجی OCR اعمال کنید.

شناسایی نام دانمارکی: از یک مدل آموزش‌دیده روی متن دانمارکی استفاده کنید. مدل spaCy da_core_news یک گزینه است. یک مدل عمومی انگلیسی نام‌های دانمارکی و نام‌های سازمانی را از دست می‌دهد.

سوابق شناسایی‌زدایی: بنویسید چه چیزی حذف شد، چه چیزی گروه‌بندی شد، و اندازه گروه خروجی. سازمان این را در فرم فنی می‌خواهد، نه به عنوان یادداشت سیاستی.

برای داده‌های مربوط به هزینه حوادث داده بهداشتی، تحلیل هزینه نقض بهداشتی ما را ببینید.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.