By · Last updated 2026-06-05

블로그로 돌아가기GDPR 및 준수

체코 로드네 치슬로: 성별 인코딩과 GDPR

체코 로드네 치슬로는 월 코드에 50을 더하는 방식으로 성별을 인코딩합니다 — GDPR 제9조 특수 범주 데이터에 해당합니다. 체코 기업의 67%가 독일 도구를 사용하고 있습니다.

June 5, 20267 분 읽기
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

ÚOOÚ와 로드네 치슬로: GDPR상 성별 인코딩

2026년 업데이트

체코 개인정보보호기관은 ÚOOÚ입니다. 정식 명칭은 Úřad pro ochranu osobních údajů(개인정보보호청)입니다. 2024년에 58건의 결정을 내렸습니다. 그중 하나의 지적 사항이 여러 사건에서 반복적으로 등장했습니다. 로드네 치슬로(출생번호)가 감지되지 않은 채 처리된 것입니다. 해당 PII 도구는 독일어나 영어용으로 제작된 것이었으며, 이 식별자를 처리하는 로직이 전혀 없었습니다. ÚOOÚ는 명확히 밝혔습니다: 도구는 체크섬 유효성 검사와 올바른 성별 오프셋 처리를 통해 로드네 치슬로를 탐지해야 합니다.

로드네 치슬로: 구조상 특수 범주 데이터

로드네 치슬로(RČ)는 RRMMDD/XXXX 형식을 사용합니다.

  • RR — 출생 연도의 마지막 두 자리
  • MM — 출생 월. 여성의 경우 50을 더합니다. 1월은 51이 되고, 12월은 62가 됩니다.
  • DD — 출생 일
  • XXXX — 3~4자리 숫자와 검증값(모듈러스 11)으로 구성된 시퀀스

여성의 월 오프셋은 이 번호를 생물학적 성별의 지표로 만듭니다. 이 오프셋은 우연적인 것이 아닙니다. 민적 등록 시스템이 행정 조회에 이를 활용합니다. GDPR 제9조는 개인적 특성을 드러내는 데이터를 다룹니다. 성별은 그 중 하나입니다. ÚOOÚ의 입장: 로드네 치슬로가 포함된 모든 문서는 특수 범주에 준하는 데이터를 담고 있으며, 더 강력한 보호 조치가 적용됩니다.

검증값 작동 방식: 1954년 이후 발급된 10자리 번호의 경우, 9자리 기본값이 11로 나누어 떨어져야 합니다. 1954년 이전에 발급된 9자리 번호에는 검증값이 없습니다. 도구는 두 가지 형식을 모두 처리해야 합니다.

ÚOOÚ가 요구하는 적절한 탐지 기준

ÚOOÚ의 2024년 PII 도구 기술 지침은 세 가지 요건을 규정합니다.

성별 오프셋 처리: 월 값이 51~62인 번호는 여성에게 유효한 식별자입니다. 이를 잘못된 날짜로 처리하는 도구는 성인 여성 인구 대부분의 주요 ID를 놓치게 됩니다.

형식 변형: 1954년 이전 출생자는 검증값 없는 9자리 번호를 갖습니다. 1954년 이후 출생자는 검증값이 포함된 10자리 번호를 갖습니다. 두 형식 모두 지원해야 합니다.

문맥 신호: 현지어 문서에서 이 식별자는 "Rodné číslo:", "RČ:", 또는 "r.č.:"와 같은 레이블 근처에 나타납니다. 언어 인식 NER은 자유 형식 텍스트에서도 이러한 신호를 찾는 데 도움이 됩니다.

독일 모회사 문제

체코 기업의 67%가 독일어 또는 영어로 설정된 PII 도구를 사용하고 있습니다. ÚOOÚ가 설문조사에서 확인한 사실입니다. 제조업에서의 실패 패턴은 예측 가능합니다.

독일 모회사가 스캔 도구를 도입합니다. 독일 식별자용으로 설정되어 있습니다. 인사 데이터 — 계약서, 건강 기록, 급여 데이터 — 에는 출생번호가 포함되어 있습니다. 그러나 도구에는 이 식별자 유형을 처리하는 로직이 없습니다. 모든 출생번호가 누락됩니다. 직원의 건강 및 급여 데이터가 ÚOOÚ가 요구하는 통제 없이 이동합니다. 감사나 침해 사고 발생 시, 현지 기업은 GDPR 제32조에서 요구하는 "적절한 기술적 조치"를 입증할 수 없습니다.

ÚOOÚ는 현지 컨트롤러를 책임자로 봅니다. "모회사가 도구를 선택했습니다"는 유효한 방어가 되지 않습니다. GDPR의 책임 원칙이 이를 허용하지 않습니다.

제조업 기업을 위한 컴플라이언스 체크리스트

이 통제 조치는 독일 모회사 도구를 사용하는 산업 기업에 적용됩니다.

  • 출생번호 탐지: 9자리 및 10자리 형식 모두. 성별 오프셋 월 처리(50+). 10자리 변형에 대한 모듈러스 11 검증값.
  • 현지어 NER: spaCy cs_core_news 또는 동등한 모델. 범용 도구는 이 언어에서 NER 정확도가 23% 낮게 나타납니다. 현지 모델이 격차를 좁힙니다.
  • Číslo OP 탐지: 시민증(국가 신분증)은 9자리 번호입니다. 많은 문서 유형에서 출생번호와 함께 나타납니다.
  • IČO 및 DIČ: 사업자 번호와 세금 번호가 계약서에 나타납니다. 두 가지 모두 커버해야 합니다.
  • 다국어 파이프라인: 혼합 환경에서는 현지어, 독일어, 영어 문서가 혼재합니다. 단일 언어 파이프라인은 언어 간 공동 발생을 놓칩니다.

ÚOOÚ의 집행은 일관됩니다. 감사에서 기술적 증거를 제시하는 기업은 벌금이 훨씬 낮습니다. 제시하지 못하는 기업은 더 높은 위험에 노출됩니다.

국가 식별자가 GDPR 노출을 어떻게 만드는지 더 넓게 살펴보려면 EU 국가 세금 ID 탐지 가이드를 참조하세요.

유사한 북유럽 식별자에 대해서는 Datatilsynet CPR 기술 가이드를 참조하세요.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.