PII 도구가 놓치는 EU 국가 납세자 번호
납세자 번호는 극히 민감한 정보입니다. 급여명세서, 세금 신고서, 은행 신청서에 등장합니다. 유출되면 사기와 신원 도용으로 이어집니다.
GDPR은 이를 개인정보로 분류합니다. 실제 위험도 높습니다. EU 각국은 저마다의 국가 식별자 형식을 사용합니다. 대부분의 PII 도구는 미국이나 영국 시장을 겨냥해 만들어졌습니다. SSN과 NINO는 쉽게 찾아내지만, Steueridentifikationsnummer, Codice Fiscale, BSN은 빠뜨리는 경우가 많습니다. 유럽 팀이 매일 처리하는 형식들입니다.
EU 납세자 번호 지형
EU 각국은 고유한 형식을 씁니다. 주요 형식을 살펴봅니다.
독일 — Steueridentifikationsnummer
Steuer-ID는 11자리 숫자입니다. 출생 시 부여됩니다. 첫 번째 자리는 19입니다(0으로 시작하지 않음). 동일한 숫자가 세 자리 연속으로 나타나지 않습니다. 예: 12345678901. Steuernummer도 사용되며, 1011자리로 주(州)마다 형식이 다릅니다.
프랑스 — Numéro fiscal de référence
SPI는 13자리 숫자입니다. 프랑스 세무청 DGFiP가 발급합니다. 세금 서류에는 "Identifiant fiscal"로 표기됩니다.
이탈리아 — Codice Fiscale
Codice Fiscale는 16자리 영숫자 조합입니다. 성, 이름, 출생연도, 출생월, 출생일, 출생지 정보를 인코딩합니다. 예: RSSMRA85M01H501Z. 체크섬으로 유효성 검증이 가능합니다.
스페인 — NIF와 NIE
스페인 국적자는 DNI 번호와 체크 문자를 사용합니다: 8자리 + 문자, 예: 12345678A. 외국 거주자는 NIE를 씁니다: 접두사 X/Y/Z + 7자리 + 체크 문자, 예: X1234567A. 법인은 CIF를 사용합니다: 문자 + 8자리, 예: B12345678.
네덜란드 — BSN
BSN(Burgerservicenummer)은 9자리 숫자입니다. 11-proef 체크 디지트 알고리즘을 사용합니다. 급여 및 복리후생 서류에 매우 자주 등장합니다.
폴란드 — PESEL
PESEL은 11자리입니다. 앞 6자리는 생년월일을 인코딩합니다. 뒤 자리들은 성별과 일련번호를 나타냅니다.
벨기에 — Numéro de registre national
RN은 11자리입니다. 생년월일, 일련번호, 체크 디지트를 인코딩합니다.
포르투갈 — NIF
포르투갈 NIF(Número de Identificação Fiscal)는 체크 디지트 포함 9자리입니다. 약자는 스페인의 NIF와 같지만 형식은 다릅니다.
스웨덴 — Personnummer
Personnummer는 10자리 또는 12자리입니다. 생년월일과 일련번호를 인코딩합니다. 형식: YYYYMMDD-XXXX 또는 YYMMDD-XXXX.
핀란드 — Henkilötunnus
HETU는 11자리 문자열입니다. 날짜, 구분자, 일련번호, 체크 문자를 인코딩합니다. 형식: DDMMYY-XXXC.
표준 도구가 놓치는 것
미국·영국 도구는 기본적으로 다음 형식을 포함합니다:
- 미국 SSN (XXX-XX-XXXX)
- 영국 NINO (XX 99 99 99 X)
- 미국 여권 번호
- 미국 운전면허 형식
- 주요 신용카드 번호
EU 국가 식별자는 빠진 경우가 많습니다. Presidio의 기본 인식기 세트에는 포함되지 않습니다. EU 전용 확장 없이는 EU 커버리지가 없습니다.
실제 컴플라이언스 공백
독일의 한 급여 회사가 500개 고객사를 서비스합니다. 이름, 이메일, IBAN, 전화번호를 제거하는 워크플로를 운영하지만 독일 Steueridentifikationsnummer는 빠뜨립니다. 표준 설정에 없는 형식이었기 때문입니다.
DPA 감사에서 급여명세서 PDF에 마스킹되지 않은 Steuer-ID가 발견됩니다. 회사는 과거 문서 처리 비용을 부담해야 하고, GDPR 제83조에 따른 DPA 제재를 받을 수 있으며, 고객사에 대한 계약상 책임도 지게 됩니다.
이 공백을 찾은 것은 회사가 아니었습니다. 규제 기관이 먼저 발견했습니다.
자체 커버리지 점검 방법은 GDPR 적합성 가이드를 참조하세요.
EU 커버리지 우선순위
여러 EU 국가에서 운영하는 경우 다음 순서로 식별자 형식을 추가하세요.
1단계 — 최고 처리량:
- 독일: Steueridentifikationsnummer
- 프랑스: Numéro fiscal
- 이탈리아: Codice Fiscale
- 스페인: NIF/NIE
- 네덜란드: BSN
2단계 — 중요하지만 규모가 작은 시장:
- 폴란드: PESEL
- 벨기에: RN
- 스웨덴: Personnummer
- 포르투갈: NIF
- 오스트리아: Sozialversicherungsnummer
3단계 — 특수 사용 사례:
나머지 17개 EU 회원국. 데이터를 처리하는 지역에 따라 추가하세요.
Steueridentifikationsnummer 추가하기
독일 Steuer-ID가 가장 먼저 추가할 형식으로 적합합니다. 형식이 명확하고 잘 문서화되어 있습니다.
Steuer-ID는 11자리입니다. 첫 자리는 1~9입니다. 나머지 10자리에는 0이 포함될 수 있습니다. 사용자 정의 알고리즘이 체크 디지트를 검증합니다.
형식 생성을 위한 자연어 설명: "독일 납세자 번호: 11자리. 첫 자리는 1~9. 나머지 10자리에는 0 포함 가능."
형식을 생성한 후 독일 급여명세서와 납세 증명서로 테스트하세요. 탐지율과 오탐율을 확인하세요. 검증을 통과한 후에만 배포하세요.
독일어 프리셋에 형식을 추가하세요. 다국어 문서의 경우 언어 감지와 함께 사용하면 올바른 형식을 올바른 문서에 적용할 수 있습니다.
단일 프리셋 vs. 복수 프리셋
옵션 1 — 국가별 프리셋:
국가마다 하나씩 프리셋을 만듭니다. 원산지에 따라 문서를 라우팅합니다. 오탐율이 낮습니다. 라우팅 로직이 더 복잡합니다.
옵션 2 — 통합 EU 프리셋:
모든 EU 식별자 형식을 하나의 프리셋에 담습니다. 운영이 단순합니다. 일반 텍스트에서 오탐 위험이 높아집니다. 문서 전체에 식별자가 예상되는 경우 잘 작동합니다.
급여 문서: 원산지 기반 라우팅으로 옵션 1 사용. 혼합 문서 세트: 임계값 조정과 함께 옵션 2 사용.
프리셋 설정이 전체 컴플라이언스 워크플로에서 어떤 역할을 하는지는 보안 및 컴플라이언스 개요를 참조하세요.
감사 전에 공백을 닫으세요
GDPR은 모든 EU 회원국에서 동일하게 적용됩니다. 미국산 도구는 그렇지 않은 경우가 많습니다. Codice Fiscale, BSN, Steuer-ID는 SSN과 동일한 위험을 가집니다. 공유 문서에 나타나는 빈도도 마찬가지입니다.
커스텀 엔티티 형식은 몇 시간 만에 탐지 공백을 메웁니다. Steuer-ID 형식을 추가하고, 독일 급여명세서 샘플로 테스트하고, 모든 워크플로에 배포하세요. 도구 벤더를 기다릴 필요가 없습니다. DPA 감사로 공백을 발견할 필요도 없습니다.
anonym.legal은 프리셋 설정 인터페이스를 통해 커스텀 엔티티 유형을 추가할 수 있습니다. 형식은 배포 전에 샘플 문서로 검증됩니다.
출처
- Bundeszentralamt für Steuern: Steueridentifikationsnummer. VERIFIED-EXTERNAL.
- GDPR 제4조, 제9조, 제32조 — gdpr-info.eu. VERIFIED-EXTERNAL.
- EDPB: 감독 기관 관할권 가이드라인. VERIFIED-EXTERNAL.