anonym.legal

By · Last updated 2026-05-18

Назад к блогуGDPR и соблюдение

ANSPDCP и румынский GDPR: почему обнаружение CNP с...

ANSPDCP установила, что 78% инструментов пропускают румынский CNP при правильной валидации.

May 18, 20267 мин чтения
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

Национальный орган по надзору за обработкой персональных данных Румынии (ANSPDCP) опубликовал техническую оценку 2024 года с показательным выводом: 78% инструментов PII, развёрнутых в румынских аутсорсинговых операциях, не обнаруживают Cod Numeric Personal (CNP) с надлежащей проверкой контрольной суммы. Для страны, обрабатывающей данные граждан ЕС в больших масштабах для западноевропейских клиентов, это создаёт системные риски несоответствия.

CNP: наиболее информационно насыщенный персональный идентификатор Румынии

CNP — 13-значный национальный идентификационный номер:

  • Цифра 1: код пола и века (1=мужской 1900–1999, 2=женский 1900–1999, 5=мужской 2000+, 6=женский 2000+, 7=мужской иностранный резидент, 8=женский иностранный резидент, 9=прочий резидент)
  • Цифры 2–3: последние две цифры года рождения
  • Цифры 4–5: месяц рождения (01–12)
  • Цифры 6–7: день рождения (01–31)
  • Цифры 8–9: код жудеца (01–52, соответствующий 41 жудецу Румынии + секторам Бухареста)
  • Цифры 10–12: порядковый номер рождения в день и жудеце
  • Цифра 13: контрольная цифра (взвешенная сумма по модулю 11)

CNP кодирует пол, полную дату рождения, жудец рождения и гражданский статус — делая его одним из наиболее информационно насыщенных национальных идентификаторов в Европе. Кодирование пола в цифре 1 делает CNP фактическим индикатором специальной категории по статье 9 GDPR (раскрывающим биологический пол), требующим повышенной защиты.

Проверка контрольной суммы: Алгоритм контрольной цифры умножает первые 12 цифр на веса (2,7,9,1,4,6,3,5,8,2,7,9), суммирует произведения, берёт результат по модулю 11. Если результат равен 10, контрольная цифра = 1. Если результат равен 11, CNP недействителен. В противном случае контрольная цифра равна результату.

78% инструментов пропускают эту валидацию — порождая как ложные срабатывания (любое 13-значное число помечается), так и ложные отрицания (повреждённые номера CNP проходят поиск по шаблону, но не проходят проверку контрольной суммы и поэтому пропускаются как потенциально недействительные данные, требующие проверки).

Румынский NER: недостающий уровень

Помимо CNP, обработка румынского языка создаёт специфические проблемы для NER:

Диакритические знаки румынского языка: Румынский использует символы ș (s-седиль), ț (t-седиль), ă, â и î. Инструменты, обученные на нерумынском тексте, могут не распознавать румынские имена, содержащие эти символы. Проблемы кодировки (UTF-8 против Latin-2) в устаревших румынских документах создают дополнительные трудности при обнаружении.

Форматы румынских адресов: «Strada» (сокращённо «Str.»), «Bulevardul» (сокращённо «Bd.»), «Aleea» (сокращённо «Al.»), «Calea» (сокращённо «Cal.») для обозначения типов улиц. Румынские населённые пункты включают как города (municipii), так и коммуны (comune) с именными конвенциями, отличными от форматов западноевропейских адресов.

Шаблоны румынских имён: Румынские имена следуют специфическим патронимическим и грамматическим конвенциям. Одно и то же имя встречается в разных грамматических падежах в зависимости от грамматической роли в предложении (именительный, родительный-дательный). Модели NER должны учитывать падежные вариации для корректного распознавания румынских имён в различных контекстах документов.

Структура правоприменения ANSPDCP

Дела правоприменения ANSPDCP следуют последовательной схеме, выявляющей конкретные технические сбои, ведущие к нарушениям:

Дела об утечках данных в BPO: Колл-центр или организация IT-поддержки страдает от утечки данных. Расследование обнаруживает, что общие файлы, содержащие румынские номера CNP сотрудников и персональные данные клиентов ЕС, хранились без надлежащего шифрования. Оценку масштаба утечки затрудняет неадекватное ведение журналов — организация не может определить, к каким именно записям был получен доступ.

Раскрытие медицинских данных: Записи о пациентах, содержащие номера CNP, номера медицинских карт и сведения о диагнозах, непреднамеренно передаются неавторизованным сторонам (отправляются по электронной почте не тому получателю, публикуются в неверной облачной папке). Номера CNP не были обнаружены или псевдонимизированы перед отправкой, поскольку инструмент PII организации не включал поддержку румынских идентификаторов.

Трансграничная передача без гарантий: Румынская BPO-организация передаёт данные клиентов ЕС (включая записи, привязанные к CNP) индийскому субобработчику для ввода или обработки данных без надлежащей оценки воздействия передачи и стандартных договорных положений. Номера CNP в передаваемых файлах создают риск передачи специальной категории данных GDPR.

Для соответствия GDPR в Румынии: обнаружение CNP с проверкой контрольной суммы по modulo-11, обработка румынского языка с учётом диакритических знаков и обнаружение румынских национальных удостоверений личности — технический минимум, подтверждённый практикой правоприменения ANSPDCP.

Источники:

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.