By · Last updated 2026-06-05

بازگشت به وبلاگGDPR و انطباق

ANSPDCP رومانی: شناسایی CNP و بررسی‌های GDPR

ANSPDCP دریافت که ۷۸٪ از ابزارها CNP رومانیایی را با اعتبارسنجی مناسب از دست می‌دهند. CNP جنسیت، تاریخ تولد، و شهرستان تولد را کدگذاری می‌کند — پیامدهای دسته خاص ماده ۹ GDPR.

June 5, 20267 دقیقه مطالعه
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

ANSPDCP رومانی: شناسایی CNP و بررسی‌های GDPR

بروزرسانی برای ۲۰۲۶

سازمان حفاظت داده رومانی ANSPDCP است. ارزیابی ۲۰۲۴ این سازمان نشان داد که ۷۸٪ از ابزارهای PII در شناسایی Cod Numeric Personal یا CNP شکست می‌خورند. اکثر مرحله چک‌سام را نادیده می‌گیرند. این شکاف خطر واقعی انطباق ایجاد می‌کند. رومانی داده‌های اتحادیه اروپا را برای بسیاری از مشتریان غربی پردازش می‌کند. خطر گسترده است.

غنی‌ترین شناسه ملی رومانی از نظر داده

CNP یک شناسه ملی ۱۳ رقمی است. هر گروه رقم داده شخصی را در خود نگه می‌دارد:

  • رقم ۱: کد جنسیت و قرن. مرد متولد ۱۹۰۰–۱۹۹۹ = ۱. زن متولد ۱۹۰۰–۱۹۹۹ = ۲. مرد متولد ۲۰۰۰+ = ۵. زن متولد ۲۰۰۰+ = ۶. مرد مقیم خارجی = ۷. زن مقیم خارجی = ۸. سایر مقیمان = ۹.
  • ارقام ۲–۳: دو رقم آخر سال تولد.
  • ارقام ۴–۵: ماه تولد (۰۱–۱۲).
  • ارقام ۶–۷: روز تولد (۰۱–۳۱).
  • ارقام ۸–۹: کد شهرستان. ۴۱ شهرستان و شش بخش بخارست را پوشش می‌دهد (کدهای ۰۱–۵۲).
  • ارقام ۱۰–۱۲: ترتیب تولد در آن روز و شهرستان.
  • رقم ۱۳: رقم کنترلی.

رقم ۱ به تنهایی جنس بیولوژیکی را آشکار می‌کند. طبق ماده ۹ GDPR، این عدد را به یک داده دسته خاص تبدیل می‌کند. به حفاظت قوی‌تری نسبت به داده شخصی معمولی نیاز دارد.

نحوه کارکرد رقم کنترلی: ۱۲ رقم اول را بگیرید. هر کدام را در وزن خود ضرب کنید (۲، ۷، ۹، ۱، ۴، ۶، ۳، ۵، ۸، ۲، ۷، ۹). نتایج را جمع بزنید. بر ۱۱ تقسیم کنید و باقیمانده را بگیرید. باقیمانده ۱۰ رقم کنترلی ۱ را می‌دهد. باقیمانده ۱۱ به معنای نامعتبر بودن کد است. هر باقیمانده دیگری رقم کنترلی است.

ابزارهایی که این آزمون را نادیده می‌گیرند دو حالت شکست دارند. اول، هر رشته ۱۳ رقمی به عنوان تطابق علامت‌گذاری می‌شود (مثبت کاذب). دوم، یک عدد خراب آزمون الگو را رد می‌کند اما داده بدی دارد. آن داده نیاز به بررسی دارد و از دست می‌رود (منفی کاذب).

مشکلات NER در اسناد به زبان رومانیایی

یافتن شناسه‌ها تنها بخشی از کار است. متن رومانیایی موانع شناسایی بیشتری اضافه می‌کند.

دیاکریتیک‌ها: رومانیایی از ș، ț، ă، â، و î استفاده می‌کند. ابزارهایی که روی زبان‌های دیگر آموزش دیده‌اند اغلب نام‌هایی با این حروف را از دست می‌دهند. اسناد قدیمی با رمزگذاری Latin-2 شکست‌های بیشتری اضافه می‌کند.

قالب‌های آدرس: انواع خیابان از فرم‌های کوتاه استفاده می‌کنند — Str.، Bd.، Al.، Cal. نام‌های شهر و بخش از قوانین محلی پیروی می‌کنند. تجزیه‌گرهای ساخته‌شده برای آدرس‌های فرانسوی یا آلمانی عملکرد ضعیفی دارند.

تصریف اسم: نام‌ها در زبان رومانیایی بر اساس حالت دستوری تغییر می‌کنند. نام یک شخص در قسمت‌های مختلف یک جمله متفاوت به نظر می‌رسد. مدل‌های NER باید این را برای پیوند نام‌ها در یک سند مدیریت کنند.

برای نحوه تأثیر شکاف‌های زبانی بر شناسایی در اسکریپت‌های غیرغربی، راهنمای شناسایی PII آسیا-اقیانوسیه ما را ببینید.

نحوه توسعه پرونده‌های ANSPDCP

پرونده‌های ANSPDCP سه الگو را نشان می‌دهند.

پرونده‌های نقض BPO: فایل‌های مشترک شماره‌های شناسایی کارمند و داده‌های مشتریان اتحادیه اروپا را بدون رمزگذاری در خود دارند. گزارش‌های ضعیف به این معنی است که شرکت نمی‌تواند بگوید به کدام سوابق دسترسی داشته شده. این تحقیق را طولانی می‌کند و جریمه را افزایش می‌دهد.

افشای بهداشتی: پرونده‌های بیمار — شناسه ملی، شناسه کارت بهداشت، و تشخیص — به شخص اشتباه می‌رسند. ابزار PII پشتیبانی از این قالب را نداشت. داده بدون پوشش‌دهی خارج شد.

شکست‌های انتقال بین‌المللی: یک شرکت برون‌سپاری سوابق مرتبط با شناسه را به طرف غیر EEA ارسال می‌کند. هیچ ارزیابی تأثیر انتقال نیست. هیچ بند قرارداد استاندارد نیست. وضعیت ماده ۹ داده، یک شکاف معمولی را به یک نقض جدی‌تر تبدیل می‌کند.

سه کنترل برای انطباق با ANSPDCP

این سه، حداقل خط پایه فنی را تشکیل می‌دهند:

  1. شناسایی CNP با اعتبارسنجی modulo-11 — تطابق الگو به تنهایی کافی نیست.
  2. NER آگاه از دیاکریتیک — ș، ț، ă، â، و î را هم در منابع UTF-8 و هم Latin-2 پوشش دهید.
  3. شناسایی کارت شناسایی — کارت ملی در بسیاری از انواع اسناد در کنار CNP ظاهر می‌شود.

برای دیدی گسترده‌تر از نحوه ایجاد خطر GDPR توسط شناسه‌های ملی، راهنمای شناسایی شماره مالیاتی ملی اتحادیه اروپا ما را ببینید.

منابع

آماده‌اید داده‌های خود را محافظت کنید؟

شروع به ناشناس‌سازی PII با بیش از ۲۸۵ نوع نهاد در ۴۸ زبان.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.