By · Last updated 2026-06-05

Zpět na blogGDPR a shoda

ANSPDCP Rumunsko: Detekce CNP a kontroly

ANSPDCP zjistil, že 78 % nástrojů nedetekuje rumunský CNP se správnou validací. CNP kóduje pohlaví, datum narození a kraj — důsledky pro zvláštní kategorii GDPR.

June 5, 20267 min čtení
Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

ANSPDCP Rumunsko: Detekce CNP a kontroly GDPR

Aktualizováno pro rok 2026

Rumunský úřad pro ochranu dat je ANSPDCP. Jeho hodnocení z roku 2024 zjistilo, že 78 % nástrojů PII správně nedetekuje Cod Numeric Personal (CNP). Většina přeskakuje krok kontrolního součtu. Tato mezera představuje reálné riziko souladu. Rumunsko zpracovává data EU pro mnoho západních klientů. Expozice je rozsáhlá.

Nejdatově bohatší národní ID Rumunska

CNP je 13místný národní identifikátor. Každá skupina číslic nese osobní údaje:

  • Číslice 1: Kód pohlaví a století. Muž narozený 1900–1999 = 1. Žena narozená 1900–1999 = 2. Muž narozený od roku 2000 = 5. Žena narozená od roku 2000 = 6. Zahraniční rezident-muž = 7. Zahraniční rezidentka = 8. Ostatní rezidenti = 9.
  • Číslice 2–3: Poslední dvě číslice roku narození.
  • Číslice 4–5: Měsíc narození (01–12).
  • Číslice 6–7: Den narození (01–31).
  • Číslice 8–9: Kód kraje. Zahrnuje 41 krajů a šest sektorů Bukurešti (kódy 01–52).
  • Číslice 10–12: Pořadí v rámci daného dne a kraje.
  • Číslice 13: Kontrolní číslice.

Samotná číslice 1 odhaluje biologické pohlaví. Podle článku 9 GDPR z toho plyne, že toto číslo je položkou zvláštní kategorie údajů. Vyžaduje silnější ochranu než běžné osobní údaje.

Jak funguje kontrolní číslice: Vezměte prvních 12 číslic. Každou vynásobte příslušnou vahou (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Výsledky sečtěte. Vydělte 11 a vezměte zbytek. Zbytek 10 dává kontrolní číslici 1. Zbytek 11 znamená, že kód není platný. Jakýkoli jiný zbytek je kontrolní číslice.

Nástroje, které tento test přeskočí, selhávají dvěma způsoby. Za prvé, jako shoda se označí jakýkoli 13místný řetězec (falešně pozitivní výsledky). Za druhé, poškozené číslo projde kontrolou vzoru, ale obsahuje špatná data. Tato data potřebují přezkum a jsou přehlédnuta (falešně negativní výsledky).

Problémy NER v dokumentech v rumunském jazyce

Nalezení identifikátorů je jen část práce. Rumunský text přidává další překážky detekce.

Diakritika: Rumunština používá ș, ț, ă, â a î. Nástroje trénované na jiných jazycích často přehlíží jména s těmito písmeny. Staré dokumenty v kódování Latin-2 přidávají další selhání.

Formáty adres: Typy ulic používají zkrácené formy — Str., Bd., Al., Cal. Názvy měst a obcí se řídí místními pravidly. Analyzátory vytvořené pro francouzské nebo německé adresy si zde vedou slabě.

Skloňování jmen: Jména se v rumunštině mění podle gramatického pádu. Stejná osoba má v různých částech věty jinak vypadající jméno. Modely NER musejí toto zvládat, aby propojovaly jména napříč dokumentem.

Viz náš průvodce detekcí PII v regionu APAC, jak jazykové mezery ovlivňují detekci v nezápadních písmech.

Jak se vyvíjejí případy ANSPDCP

Případy ANSPDCP vykazují tři vzory.

Případy porušení u BPO firem: Sdílené soubory obsahují identifikační čísla zaměstnanců a data zákazníků EU bez šifrování. Slabé protokoly znamenají, že firma nedokáže říct, ke kterým záznamům byl přistupováno. To prodlužuje vyšetřování a zvyšuje pokutu.

Expozice ve zdravotnictví: Soubory pacientů — národní ID, číslo zdravotní karty a diagnóza — se dostanou k nesprávné osobě. Nástroj PII tento formát nepodporoval. Data odešla bez maskování.

Selhání přeshraničních přenosů: Firma zajišťující outsourcing posílá záznamy spojené s identifikátory třetí straně mimo EHP. Žádné posouzení dopadu přenosu. Žádné standardní smluvní doložky. Charakter článku 9 u dotčených dat mění rutinní mezeru v závažnější porušení.

Tři kontroly pro soulad s ANSPDCP

Tato trojice tvoří minimální technický základ:

  1. Detekce CNP s validací modulo-11 — samotná shoda vzoru nestačí.
  2. NER s podporou diakritiky — pokrytí ș, ț, ă, â a î ve zdrojích UTF-8 i Latin-2.
  3. Detekce průkazu totožnosti — občanský průkaz se vyskytuje vedle CNP v mnoha typech dokumentů.

Pro širší pohled na to, jak národní ID zakládají riziko GDPR, viz náš průvodce detekcí daňových ID v EU.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.