By · Last updated 2026-06-05

블로그로 돌아가기GDPR 및 준수

루마니아 ANSPDCP: CNP 감지 및 GDPR 검증

ANSPDCP 조사 결과 78%의 도구가 루마니아 CNP를 적절한 검증과 함께 감지하지 못합니다. CNP는 성별, 생년월일, 출생 현을 인코딩합니다. GDPR 특수 범주 개인정보 관련 사항 안내.

June 5, 20267 분 읽기
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

루마니아 ANSPDCP: CNP 감지 및 GDPR 검증

2026년 기준 최신화

루마니아의 데이터 보호 기관은 ANSPDCP입니다. 2024년 평가 결과, 개인정보 도구의 78%가 Cod Numeric Personal(CNP) 감지에 실패하는 것으로 나타났습니다. 대부분이 체크섬 단계를 건너뜁니다. 이 격차는 실질적인 규정 준수 위험을 만들어냅니다. 루마니아는 많은 서구 고객들을 위해 EU 데이터를 처리합니다. 노출 범위가 넓습니다.

루마니아의 가장 많은 정보를 담은 국가 식별 정보

CNP는 13자리 국가 식별 정보입니다. 각 자릿수 그룹에 개인 데이터가 담겨 있습니다.

  • 1자리: 성별 및 세기 코드. 19001999년생 남성 = 1. 19001999년생 여성 = 2. 2000년 이후생 남성 = 5. 2000년 이후생 여성 = 6. 남성 외국인 거주자 = 7. 여성 외국인 거주자 = 8. 기타 거주자 = 9.
  • 2~3자리: 출생연도의 마지막 두 자리.
  • 4~5자리: 출생월 (01~12).
  • 6~7자리: 출생일 (01~31).
  • 8~9자리: 현(県) 코드. 41개 현과 부쿠레슈티의 6개 구역을 포함합니다 (코드 01~52).
  • 10~12자리: 해당 날짜와 현의 출생 순서.
  • 13자리: 검사 숫자.

1자리만으로도 생물학적 성별이 드러납니다. GDPR 제9조 하에서 이 번호는 특수 범주 데이터 항목에 해당합니다. 일반 개인 데이터보다 강화된 보호가 필요합니다.

검사 숫자 작동 방식: 처음 12자리를 가져옵니다. 각 자리에 가중치(2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9)를 곱합니다. 결과를 더합니다. 11로 나눠 나머지를 구합니다. 나머지가 10이면 검사 숫자는 1입니다. 나머지가 11이면 코드가 유효하지 않습니다. 다른 나머지는 그대로 검사 숫자가 됩니다.

이 검사를 건너뛰는 도구는 두 가지 실패 모드를 가집니다. 첫째, 13자리 문자열이 모두 일치로 표시됩니다(오탐). 둘째, 손상된 번호가 패턴 검사를 통과하지만 잘못된 데이터를 포함합니다. 해당 데이터는 검토가 필요하지만 놓치게 됩니다(미탐).

루마니아어 문서의 NER 문제

식별자를 찾는 것은 작업의 일부에 불과합니다. 루마니아어 텍스트는 추가적인 감지 장애물을 더합니다.

발음 부호: 루마니아어는 ș, ț, ă, â, î를 사용합니다. 다른 언어로 학습된 도구는 이러한 문자가 포함된 이름을 종종 놓칩니다. Latin-2 인코딩의 오래된 문서는 더 많은 실패를 만들어냅니다.

주소 형식: 거리 유형은 Str., Bd., Al., Cal. 같은 약어를 사용합니다. 도시와 마을 이름은 현지 규칙을 따릅니다. 프랑스어나 독일어 주소용으로 만들어진 파서는 여기서 제대로 작동하지 않습니다.

이름 굴절: 루마니아어에서는 문법적 격에 따라 이름 형태가 변합니다. 같은 사람의 이름이 문장의 다른 위치에서 다르게 보입니다. NER 모델은 문서 전체에서 이름을 연결하려면 이를 처리할 수 있어야 합니다.

비서구 문자에서 언어 격차가 감지에 미치는 영향에 대해서는 APAC 개인정보 감지 가이드를 참고하세요.

ANSPDCP 사례의 패턴

ANSPDCP 사례는 세 가지 패턴을 보입니다.

BPO 데이터 침해 사례: 공유 파일에 암호화 없이 직원 ID 번호와 EU 고객 데이터가 포함되어 있습니다. 열악한 기록 관리로 인해 어떤 기록에 접근했는지 파악할 수 없습니다. 이는 조사 기간을 연장하고 벌금을 높입니다.

의료 정보 노출: 환자 파일(국가 ID, 건강보험증 ID, 진단)이 잘못된 사람에게 전달됩니다. 개인정보 도구가 이 형식을 지원하지 않았습니다. 데이터가 마스킹 없이 유출되었습니다.

국경 간 이전 실패: 아웃소싱 기업이 식별자가 연결된 기록을 EEA 외 당사자에게 전송합니다. 이전 영향 평가 없음. 표준 계약 조항 없음. 데이터의 제9조 지위가 일상적인 위반을 더 심각한 위반으로 만듭니다.

ANSPDCP 규정 준수를 위한 세 가지 통제 수단

이 세 가지가 최소한의 기술적 기준을 형성합니다.

  1. 모듈로-11 검증을 포함한 CNP 감지 — 패턴 일치만으로는 충분하지 않습니다.
  2. 발음 부호 인식 NER — UTF-8 및 Latin-2 소스에서 ș, ț, ă, â, î를 처리합니다.
  3. 신분증 감지 — 많은 문서 유형에서 CNP와 함께 국가 신분증이 등장합니다.

국가 ID가 GDPR 위험을 만들어내는 방식에 대한 더 넓은 시각은 EU 국가 세금 ID 감지 가이드를 참고하세요.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.