By · Last updated 2026-06-05

ブログに戻るGDPRおよびコンプライアンス

ÚOOÚ チェコ: rodné číslo GDPR技術

チェコのÚOOUによるrodné číslo(チェコ個人識別番号)の検出・保護技術ガイド。数学的検証アルゴリズム解説。

June 5, 20267 分で読めます
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

ÚOOÚとロドネ・チスロ:GDPRにおける性別コーディング

2026年版に更新済み

チェコのデータ保護機関はÚOOÚです。正式名称はÚřad pro ochranu osobních údajůです。2024年に58件の執行決定を下しました。多くの案件で共通の問題が見られます。ロドネ・チスロ(rodné číslo、出生番号)が検出されずに処理されていたことです。使用されたPIIツールはドイツ語または英語向けに設計されていました。このIDに対応するロジックが含まれていませんでした。ÚOOÚの指針は明確です:ツールはチェックサム検証と正しいジェンダーオフセット処理を備えてロドネ・チスロを検出しなければなりません。

ロドネ・チスロ:構造的な特別カテゴリーデータ

ロドネ・チスロ(略称RČ)はRRMMDD/XXXXの形式を使用します。

  • RR — 生年の下2桁。
  • MM — 生月。女性の場合は50が加算されます。月01は51になります。月12は62になります。
  • DD — 生日。
  • XXXX — 3〜4桁の連番と検証値(モジュラス11)。

女性の月オフセットにより、この番号は生物学的性別の構造的指標となります。このオフセットは偶然のものではありません。戸籍システムが行政的な検索のために使用しています。GDPRの第9条は個人の特性を「明らかにする」データを対象としています。性別もその一つです。ÚOOÚの見解:ロドネ・チスロを含む文書はすべて、特別カテゴリーに準じるデータを含んでいます。より強固な保護が必要です。

検証値の仕組み: 10文字の番号(1954年以降に発行)では、9文字のベースが11で割り切れなければなりません。9文字の番号(1954年以前)には検証値がありません。ツールは両方に対応しなければなりません。

ÚOOÚが定める「適切な検出」

ÚOOÚの2024年PIIツール向け技術ガイダンスは3つの要件を定めています。

ジェンダーオフセット処理: 月の値が51〜62の番号は女性の有効なIDです。これらを無効な日付として扱うツールは、成人女性のほぼ半数のIDを見逃すことになります。

フォーマットバリアント: 1954年以前の出生は検証値のない9文字の番号を生成します。1954年以降は検証値付きの10文字の番号を生成します。両方をサポートしなければなりません。

コンテキスト信号: 母国語の文書では、IDは「Rodné číslo:」「RČ:」「r.č.:」などのラベルの近くに現れます。言語対応のNERは、非構造化テキストでもこれらの信号を見つけるのに役立ちます。

ドイツ親会社の問題

国内企業の67%がドイツ語または英語向けに設定されたPIIツールを使用しています。ÚOOÚはこれを調査で文書化しています。製造業における障害の連鎖は予測可能です。

ドイツの親会社がスキャンツールを導入します。ドイツのIDに対応するよう設定されています。HR データ(雇用契約、健康記録、給与データ)には出生番号が含まれています。このツールにはそのID種別に対応するロジックがありません。すべての出生番号が見逃されます。従業員の健康・給与データはÚOOÚが求める管理なしに移動します。監査や侵害が発生した場合、現地の子会社はGDPR第32条に基づく「適切な技術的措置」を示すことができません。

ÚOOÚは現地のデータ管理者を責任者とします。「親会社がツールを選定した」という主張は有効な抗弁ではありません。GDPRのアカウンタビリティ規則はそれを認めていません。

製造業向けコンプライアンスチェックリスト

ドイツ親会社のツールを使用する産業企業には以下の管理が適用されます。

  • 出生番号の検出: 9文字と10文字の両フォーマット。ジェンダーオフセット月処理(50+)。10文字バリアントにはモジュラス11の検証値。
  • 母国語NER: spaCy cs_core_newsまたは同等のモデル。汎用ツールはこの言語でNERの精度が23%低くなります。言語固有のモデルがこのギャップを埋めます。
  • Číslo OP検出: občanský průkaz(国民IDカード)は9文字の番号です。多くの文書種別で出生番号と並んで現れます。
  • IČOとDIČ: 企業ID番号と税務登録番号は契約書に含まれます。両方をカバーする必要があります。
  • 多言語パイプライン: 混在環境では現地語、ドイツ語、英語の文書があります。単一言語パイプラインは言語をまたがる共起を見逃します。

ÚOOÚの執行は一貫しています。監査で技術的証拠を示せる企業は罰金が大幅に低くなります。示せない企業はリスクが高まります。

国民IDがGDPRリスクをどのように生み出すかについてのより広い視点は、EU国家税務IDの検出ガイドをご覧ください。

類似の北欧IDについては、DatastilsynetのCPR技術ガイドをご覧ください。

情報源

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.