By · Last updated 2026-06-05

Bumalik sa BlogGDPR & Pagsunod

Czech Rodne Cislo: Gender Encoding at GDPR

Ang Czech rodne cislo ay nag-e-encode ng kasarian sa pamamagitan ng 50-offset month encoding — ginagawa itong GDPR Article 9 special category na datos. 67% ng mga Czech firm ang gumagamit ng mga German tool.

June 5, 20267 min basahin
Czech ÚOOÚrodné číslo detectionCzech GDPR compliancemanufacturing data protectionCentral Europe

UOOÚ at Rodné Cislo: Gender Encoding sa ilalim ng GDPR

Na-update para sa 2026

Ang katawan ng datos ng Czech ay UOOÚ. Sa kabuuan: Úrad pro ochranu osobních údaju. Naglabas ito ng 58 hatol noong 2024. Isang natuklasan ang lumilitaw sa maraming kaso. Ang rodné cislo (numero ng kapanganakan) ay naproseso nang walang pag-detect. Ang PII tool na ginamit ay itinayo para sa German o Ingles. Wala itong lohika para sa uri ng pagkakakilanlan na ito. Malinaw ang UOOÚ: ang mga tool ay dapat mag-detect ng rodné cislo na may checksum validation at wastong paghawak ng gender-offset.

Rodné Cislo: Special Category na Datos Ayon sa Istraktura

Ang rodné cislo, o RC, ay gumagamit ng format na RRMMDD/XXXX.

  • RR — huling dalawang digit ng taon ng kapanganakan.
  • MM — buwan ng kapanganakan. Para sa mga babae, 50 ang idinaragdag. Ang buwan 01 ay nagiging 51. Ang buwan 12 ay nagiging 62.
  • DD — araw ng kapanganakan.
  • XXXX — isang maikling pagkakasunud-sunod ng 3–4 na digit kasama ang isang check value (modulus 11).

Ginagawa ng women's month offset ang numerong ito bilang isang marker ng biyolohikal na kasarian. Hindi aksidental ang offset na iyon. Ginagamit ito ng sistema ng civil registration para sa admin lookup. Sinasaklaw ng GDPR Article 9 ang datos na nagpapahayag ng mga personal na katangian. Ang kasarian ay isa sa mga ito. Ang pananaw ng UOOÚ: anumang dokumentong may rodné cislo ay nagtataglay ng datos na katulad ng special-category. Nalalapat ang mas matibay na proteksyon.

Paano gumagana ang check value: Para sa mga 10-karakter na numero (inilabas pagkatapos ng 1954), ang buong 9-karakter na base ay dapat na mahatian nang pantay sa 11. Para sa mga 9-karakter na numero (inilabas bago ang 1954), walang check value. Ang mga tool ay dapat hawakan ang parehong.

Ano ang Tinatawag ng UOOÚ na Sapat na Pag-detect

Nagtakda ang 2024 na teknikal na gabay ng UOOÚ para sa mga PII tool ng tatlong kinakailangan.

Paghawak ng gender-offset: Ang mga numero na may mga halaga ng buwan na 51–62 ay mga wastong pagkakakilanlan para sa mga babae. Ang isang tool na tinatrato ang mga ito bilang mga hindi wastong petsa ay nakalilikha ng pagkabigo sa humigit-kumulang kalahati ng pangunahing ID ng babaing populasyon ng matatanda.

Mga variant ng format: Ang mga kapanganakan bago ang 1954 ay nagbibigay ng mga 9-karakter na numero na walang check value. Ang mga kapanganakan pagkatapos ng 1954 ay nagbibigay ng mga 10-karakter na numero na may isa. Parehong dapat na sinusuportahan.

Mga signal ng konteksto: Sa mga dokumento sa katutubong wika, ang pagkakakilanlan ay lumalabas malapit sa mga label tulad ng "Rodné cislo:", "RC:", o "r.c.:". Tumutulong ang language-aware NER na mahanap ang mga signal na ito kahit sa free-form na teksto.

Ang Problema ng German Parent Company

67% ng mga firm sa bansa ang nag-de-deploy ng mga PII tool na naka-configure para sa German o Ingles. Natuklasan ito ng UOOÚ sa isang survey. Ang chain ng kabiguan sa manufacturing ay mahuhulaan.

Nag-de-deploy ang isang German parent ng isang tool sa pag-scan. Ito ay naka-set up para sa mga German identifier. Ang datos ng HR — mga kontrata, mga rekord ng kalusugan, payroll — ay naglalaman ng mga numero ng kapanganakan. Ang tool ay walang lohika para sa uri ng pagkakakilanlan na ito. Ang bawat numero ng kapanganakan ay nakalilikha ng pagkabigo. Ang datos ng kalusugan at sahod ng empleyado ay gumagalaw nang wala ang mga kontrol na kinakailangan ng UOOÚ. Sa isang pag-audit o breach, hindi maipapakita ng lokal na firm ang "mga naaangkop na teknikal na hakbain" sa ilalim ng GDPR Article 32.

Hinahawakan ng UOOÚ ang lokal na controller na responsable. Ang "Ang aming parent company ang pumili ng tool" ay hindi isang wastong depensa. Ang panuntunan ng accountability ng GDPR ay hindi nagpapahintulot nito.

Checklist ng Pagsunod para sa Mga Firm sa Manufacturing

Nalalapat ang mga kontrol na ito sa mga industrial firm na may tooling ng German parent company.

  • Pag-detect ng numero ng kapanganakan: Parehong 9-karakter at 10-karakter na format. Paghawak ng buwan ng gender-offset (50+). Modulus-11 check value para sa mga 10-karakter na variant.
  • Native-language NER: spaCy cs_core_news o katumbas na modelo. Ang mga generic na tool ay nagpapakita ng 23% na mas mababang katumpakan ng NER para sa wikang ito. Isinasara ng mga lokal na modelo ang agwat.
  • Pag-detect ng Cislo OP: Ang obcanský prukaz (pambansang ID card) ay isang 9-karakter na numero. Lumalabas ito kasabay ng numero ng kapanganakan sa maraming uri ng dokumento.
  • ICO at DIC: Ang business ID at mga numero ng buwis ay lumilitaw sa mga kontrata. Parehong nangangailangan ng saklaw.
  • Multi-language na pipeline: Ang mga mixed na kapaligiran ay may mga dokumento sa lokal na wika, German, at Ingles. Ang isang single-language na pipeline ay nakalilikha ng pagkabigo sa cross-language co-occurrence.

Ang pagpapatupad ng UOOÚ ay pare-pareho. Ang mga firm na nagpapakita ng teknikal na ebidensya sa isang pag-audit ay nahaharap sa mas mababang mga multa. Ang mga hindi makapagpakita nito ay nahaharap sa mas mataas na pagkakalantad.

Para sa mas malawak na pananaw kung paano lumilikha ng pagkakalantad ng GDPR ang mga national ID, tingnan ang aming gabay sa pag-detect ng EU national tax ID.

Para sa katulad na Nordic na identifier, tingnan ang aming teknikal na gabay sa Datatilsynet CPR.

Mga Pinagkukunan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.