Takaisin Blogiin GDPR & Vaatimustenmukaisuus

ANSPDCP Romania: CNP-tunnistus ja tarkistukset

ANSPDCP havaitsi, että 78 % työkaluista jää rumanialaisen CNP-numeron oikeasta validoinnista kiinni. CNP koodaa sukupuolen, syntymäajan ja syntymämaakunnan — GDPR:n erityisluokan tietojen vaikutukset.

George CurtaMarch 6, 20267 min lukuaika

Romania ANSPDCPCNP checksum validationRomanian GDPRBPO complianceRomanian identifiers

Päivitetty vuodelle 2026

Romanian tietosuojaviranomainen on ANSPDCP. Sen vuoden 2024 arviointi osoitti, että 78 % henkilötietotyökaluista ei tunnista Cod Numeric Personal -numeroa (CNP). Useimmat ohittavat tarkistussumman. Tämä aukko luo todellisen vaatimustenmukaisuusriskin. Romania käsittelee EU-tietoja monille länsimaisille asiakkaille. Altistus on laaja.

Romanian Tietorikkain Kansallinen Tunniste

CNP on 13-numeroinen kansallinen tunniste. Jokainen numeroryhmä sisältää henkilötietoja:

Numero 1: Sukupuoli- ja vuosisatakoodi. Mies, syntynyt 1900–1999 = 1. Nainen, syntynyt 1900–1999 = 2. Mies, syntynyt 2000+ = 5. Nainen, syntynyt 2000+ = 6. Miespuolinen ulkomaalainen asukas = 7. Naispuolinen ulkomaalainen asukas = 8. Muu asukas = 9.
Numerot 2–3: Syntymävuoden kaksi viimeistä numeroa.
Numerot 4–5: Syntymäkuukausi (01–12).
Numerot 6–7: Syntymäpäivä (01–31).
Numerot 8–9: Maakunnan koodi. Kattaa 41 maakuntaa ja Bukarestin kuusi sektoria (koodit 01–52).
Numerot 10–12: Syntymäjärjestys kyseiselle päivälle ja maakunnalle.
Numero 13: Tarkistusnumero.

Pelkästään numero 1 paljastaa biologisen sukupuolen. GDPR:n 9 artiklan mukaan tämä tekee numerosta erityisluokan tiedon. Se tarvitsee vahvempaa suojaa kuin tavalliset henkilötiedot.

Miten tarkistusnumero toimii: Otetaan 12 ensimmäistä numeroa. Kerrotaan jokainen painollaan (2, 7, 9, 1, 4, 6, 3, 5, 8, 2, 7, 9). Lasketaan tulot yhteen. Jaetaan 11:llä ja otetaan jakojäännös. Jakojäännös 10 antaa tarkistusnumeron 1. Jakojäännös 11 tarkoittaa, että koodi ei ole kelvollinen. Mikä tahansa muu jakojäännös on tarkistusnumero.

Työkaluilla, jotka ohittavat tämän testin, on kaksi virhemoodia. Ensinnäkin mikä tahansa 13-numeroinen merkkijono merkitään osumaaksi (vääriä positiivisia). Toiseksi vioittunut numero läpäisee kuviotarkistuksen mutta sisältää viallisia tietoja. Nämä tiedot tarvitsevat tarkistamista mutta jäävät huomaamatta (vääriä negatiivisia).

Kohdetunnistuksen Ongelmat Romaniankielisissä Asiakirjoissa

Tunnisteiden löytäminen on vain osa työtä. Romaniankielinen teksti lisää tunnistuksen esteitä.

Diakriittiset merkit: Romania käyttää merkkejä ș, ț, ă, â ja î. Muille kielille koulutetut työkalut jäävät usein näitä kirjaimia sisältävistä nimistä kiinni. Vanhemmat Latin-2-koodauksessa olevat asiakirjat lisäävät enemmän epäonnistumisia.

Osoitemuodot: Katutyypit käyttävät lyhenteitä — Str., Bd., Al., Cal. Kaupunki- ja kuntanimet noudattavat paikallisia sääntöjä. Ranskalaisille tai saksalaisille osoitteille rakennetut jäsentimet pärjäävät huonosti täällä.

Nimitaivutus: Nimet muuttavat muotoaan kieliopin sijan mukaan romaniassa. Sama henkilön nimi näyttää erilaiselta lauseen eri osissa. Kohdetunnistusmallit on käsiteltävä tämä yhdistääkseen nimet asiakirjan eri osissa.

Katso APAC:n henkilötietojen tunnistusopas siitä, miten kieliaukot vaikuttavat tunnistukseen ei-läntisten kirjoitusjärjestelmien osalta.

Miten ANSPDCP-Tapaukset Kehittyvät

ANSPDCP-tapauksissa on kolme mallia.

BPO-rikkomustapaukset: Jaetuissa tiedostoissa on työntekijöiden tunnusnumeroita ja EU:n asiakastietoja ilman salausta. Heikko lokitus tarkoittaa, että yritys ei pysty kertomaan, mihin tietueisiin päästiin käsiksi. Tämä pidentää tutkintaa ja kasvattaa sakkoa.

Terveydenhuollon altistus: Potilastiedostot — kansallinen tunniste, terveyskortintunnus ja diagnoosi — päätyvät väärälle henkilölle. Henkilötietotyökalulla ei ollut tukea tälle muodolle. Tieto lähti ilman peittämistä.

Rajat ylittävien siirtojen epäonnistumiset: Ulkoistusyritys lähettää tunnisteiden kanssa sidottuja tietueita ETA-alueen ulkopuoliselle osapuolelle. Ei siirtovaikutustenarviointia. Ei vakiosopimuslausekkeita. Tietojen 9 artiklan asema muuttaa tavanomaisen aukon vakavammaksi rikkomukseksi.

Kolme Hallintakeinoa ANSPDCP-Vaatimustenmukaisuuteen

Nämä kolme muodostavat teknisen vähimmäislähtötason:

CNP-tunnistus modulo-11-validoinnilla — kuviohaku yksinään ei riitä.
Diakriittitietoinen kohdetunnistus — katettava ș, ț, ă, â ja î sekä UTF-8- että Latin-2-lähteissä.
Henkilökortin tunnistus — kansallinen kortti esiintyy CNP:n vieressä monissa asiakirjatyypeissä.

Laajemman näkemyksen siitä, miten kansalliset tunnisteet luovat GDPR-riskin, saat EU:n kansallisten verotunnusten tunnistusoppaastamme.

Lähteet

Liittyvät Artikkelit

GDPR & Vaatimustenmukaisuus

Itse isännöidyt PII-työkalut epäonnistuvat compliance-auditoinneissa

spaCy 3.4.4 tuottaa erilaisia NER-tuloksia kuin spaCy 3.5.1. Eräs finanssipalveluyritys havaitsee, että 3 % asiakirjoista oli anonymisoitu eri tavalla staging- kuin tuotantoympäristössä — GDPR-auditoinnin tulos.

GDPR & Vaatimustenmukaisuus

Presidio ei tunnista 220+ GDPR-entiteettiä

Presidio toimitetaan noin 40 valmiilla entiteettitunnistimella, jotka keskittyvät yhdysvaltalaisiin tunnistimiin. Eurooppalaiset organisaatiot tarvitsevat IBAN:ia, kansallisia verotunnistenumeroita ja kansallisia asiakirjoja, joita Presidio ei sisällä.

GDPR & Vaatimustenmukaisuus

Konfiguraation ajautuminen: piilevä GDPR-riski

Analyytikko A korvaa nimet pseudonyymeillä. Analyytikko B mustaa ne. GDPR-tarkastuksesi löytää molemmat samasta aineistosta. Konfiguraation ajautuminen — jossa tiimi...

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.

Aloita Ilmainen Kokeilu Katso Ominaisuudet

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

We follow these rules

GDPR (EU 2016/679).
ISO/IEC 27001:2022.
NIS2 (EU 2022/2555).
HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our company HQ is in Saarbrücken, Germany. Our servers run in Hetzner's Falkenstein datacenter.

Hetzner holds ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

We never sell your information to third parties.
We never train models on what you upload.
We never keep your work after you delete it.
We never share keys with any outside firm.
We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.

ANSPDCP Romania: CNP-tunnistus ja tarkistukset

ANSPDCP Romania: CNP-tunnistus ja GDPR-tarkistukset

Romanian Tietorikkain Kansallinen Tunniste

Kohdetunnistuksen Ongelmat Romaniankielisissä Asiakirjoissa

Miten ANSPDCP-Tapaukset Kehittyvät

Kolme Hallintakeinoa ANSPDCP-Vaatimustenmukaisuuteen

Lähteet

Liittyvät Artikkelit

Itse isännöidyt PII-työkalut epäonnistuvat compliance-auditoinneissa

Presidio ei tunnista 220+ GDPR-entiteettiä

Konfiguraation ajautuminen: piilevä GDPR-riski

Valmiina suojaamaan tietojasi?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow