루마니아 ANSPDCP: CNP 감지 및 GDPR 검증
2026년 기준 최신화
루마니아의 데이터 보호 기관은 ANSPDCP입니다. 2024년 평가 결과, 개인정보 도구의 78%가 Cod Numeric Personal(CNP) 감지에 실패하는 것으로 나타났습니다. 대부분이 체크섬 단계를 건너뜁니다. 이 격차는 실질적인 규정 준수 위험을 만들어냅니다. 루마니아는 많은 서구 고객들을 위해 EU 데이터를 처리합니다. 노출 범위가 넓습니다.
루마니아의 가장 많은 정보를 담은 국가 식별 정보
CNP는 13자리 국가 식별 정보입니다. 각 자릿수 그룹에 개인 데이터가 담겨 있습니다.
- 1자리: 성별 및 세기 코드. 1900
1999년생 남성 = 1. 19001999년생 여성 = 2. 2000년 이후생 남성 = 5. 2000년 이후생 여성 = 6. 남성 외국인 거주자 = 7. 여성 외국인 거주자 = 8. 기타 거주자 = 9. - 2~3자리: 출생연도의 마지막 두 자리.
- 4~5자리: 출생월 (01~12).
- 6~7자리: 출생일 (01~31).
- 8~9자리: 현(県) 코드. 41개 현과 부쿠레슈티의 6개 구역을 포함합니다 (코드 01~52).
- 10~12자리: 해당 날짜와 현의 출생 순서.
- 13자리: 검사 숫자.
1자리만으로도 생물학적 성별이 드러납니다. GDPR 제9조 하에서 이 번호는 특수 범주 데이터 항목에 해당합니다. 일반 개인 데이터보다 강화된 보호가 필요합니다.
검사 숫자 작동 방식: 처음 12자리를 가져옵니다. 각 자리에 가중치(2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9)를 곱합니다. 결과를 더합니다. 11로 나눠 나머지를 구합니다. 나머지가 10이면 검사 숫자는 1입니다. 나머지가 11이면 코드가 유효하지 않습니다. 다른 나머지는 그대로 검사 숫자가 됩니다.
이 검사를 건너뛰는 도구는 두 가지 실패 모드를 가집니다. 첫째, 13자리 문자열이 모두 일치로 표시됩니다(오탐). 둘째, 손상된 번호가 패턴 검사를 통과하지만 잘못된 데이터를 포함합니다. 해당 데이터는 검토가 필요하지만 놓치게 됩니다(미탐).
루마니아어 문서의 NER 문제
식별자를 찾는 것은 작업의 일부에 불과합니다. 루마니아어 텍스트는 추가적인 감지 장애물을 더합니다.
발음 부호: 루마니아어는 ș, ț, ă, â, î를 사용합니다. 다른 언어로 학습된 도구는 이러한 문자가 포함된 이름을 종종 놓칩니다. Latin-2 인코딩의 오래된 문서는 더 많은 실패를 만들어냅니다.
주소 형식: 거리 유형은 Str., Bd., Al., Cal. 같은 약어를 사용합니다. 도시와 마을 이름은 현지 규칙을 따릅니다. 프랑스어나 독일어 주소용으로 만들어진 파서는 여기서 제대로 작동하지 않습니다.
이름 굴절: 루마니아어에서는 문법적 격에 따라 이름 형태가 변합니다. 같은 사람의 이름이 문장의 다른 위치에서 다르게 보입니다. NER 모델은 문서 전체에서 이름을 연결하려면 이를 처리할 수 있어야 합니다.
비서구 문자에서 언어 격차가 감지에 미치는 영향에 대해서는 APAC 개인정보 감지 가이드를 참고하세요.
ANSPDCP 사례의 패턴
ANSPDCP 사례는 세 가지 패턴을 보입니다.
BPO 데이터 침해 사례: 공유 파일에 암호화 없이 직원 ID 번호와 EU 고객 데이터가 포함되어 있습니다. 열악한 기록 관리로 인해 어떤 기록에 접근했는지 파악할 수 없습니다. 이는 조사 기간을 연장하고 벌금을 높입니다.
의료 정보 노출: 환자 파일(국가 ID, 건강보험증 ID, 진단)이 잘못된 사람에게 전달됩니다. 개인정보 도구가 이 형식을 지원하지 않았습니다. 데이터가 마스킹 없이 유출되었습니다.
국경 간 이전 실패: 아웃소싱 기업이 식별자가 연결된 기록을 EEA 외 당사자에게 전송합니다. 이전 영향 평가 없음. 표준 계약 조항 없음. 데이터의 제9조 지위가 일상적인 위반을 더 심각한 위반으로 만듭니다.
ANSPDCP 규정 준수를 위한 세 가지 통제 수단
이 세 가지가 최소한의 기술적 기준을 형성합니다.
- 모듈로-11 검증을 포함한 CNP 감지 — 패턴 일치만으로는 충분하지 않습니다.
- 발음 부호 인식 NER — UTF-8 및 Latin-2 소스에서 ș, ț, ă, â, î를 처리합니다.
- 신분증 감지 — 많은 문서 유형에서 CNP와 함께 국가 신분증이 등장합니다.
국가 ID가 GDPR 위험을 만들어내는 방식에 대한 더 넓은 시각은 EU 국가 세금 ID 감지 가이드를 참고하세요.