anonym.legal

By · Last updated 2026-06-05

Înapoi la BlogGDPR & Conformitate

Danemarca CPR: Validarea Modulus-11 pentru GDPR

67% dintre instrumentele NLP ratează validarea modulus-11 a numărului CPR danez. 14 acțiuni de aplicare în domeniul sănătății ale Datatilsynet în 2024. Utilizarea secundară a datelor medicale.

June 5, 20267 min citire
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

Numerele CPR din Danemarca: Ghid de Conformitate GDPR

Actualizat pentru 2026

Autoritatea daneză de supraveghere a datelor, Datatilsynet, a emis 31 de decizii GDPR în 2024. Paisprezece au vizat date medicale. Această pondere ridicată reflectă două realități: Danemarca administrează un sistem național de sănătate extins, iar lacunele tehnice din acest sistem continuă să expună înregistrările pacienților.

Regula Cifrei de Control pentru Numerele CPR

Numărul CPR este ID-ul personal al Danemarcei. Are 10 cifre în formatul ZZLLAA-XXXX. Primele șase cifre reprezintă data nașterii. Ultimele patru sunt un cod plus o cifră de control.

Cifra de control folosește regula modulus-11:

  1. Se preiau cifrele de la 1 la 9.
  2. Fiecăreia i se atribuie un coeficient: 4, 3, 2, 7, 6, 5, 4, 3, 2.
  3. Se înmulțește fiecare cifră cu coeficientul său. Se adună toate rezultatele.
  4. Se împarte la 11. Se notează restul.
  5. Rest 0 → cifra de control este 0.
  6. Rest 1 → numărul nu este valid.
  7. Rest 2–10 → cifra de control este 11 minus restul.

Această regulă contează pentru orice instrument care scanează numere CPR. Unele șiruri ZZLLAA-XXXX nu pot fi niciodată valide. Instrumentele care sar acest pas marchează date, coduri de facturi și numere de referință ca ID-uri reale.

Revizuirea din 2024 a autorității a constatat că 67% dintre instrumentele NLP generice sar această verificare. Această lacună este principalul eșec tehnic în cazurile sale de sănătate.

Cele Cinci Registre de Sănătate ale Danemarcei

Danemarca corelează datele de sănătate din cinci registre naționale. ID-ul personal leagă toate cinci.

  • Înregistrări de externare spitalicească (din 1977)
  • Date privind rețetele (din 1995)
  • Registrul de cancer (din 1943)
  • Registrul cauzelor de deces (din 1970)
  • Diagnostice din asistența medicală primară (din 1990)

Acest lucru face cercetarea medicală daneză foarte solidă. Creează și un risc. Eliminarea ID-ului brut nu este suficientă. Un set de date care mai conține vârstă, sex, diagnostic și an poate reexpune persoanele — mai ales cele cu afecțiuni rare.

Orientările din 2024 ale Datatilsynet privind utilizarea secundară a datelor medicale stabilesc trei cerințe.

Documentați ce ați făcut cu datele: Enumerați câmpurile eliminate, pe cele rotunjite sau grupate și dimensiunea grupului realizată în ieșire. O notă de politică nu îndeplinește acest standard.

Solicitați o revizuire externă pentru seturi mari: Pentru seturile de date cu mai mult de 5.000 de persoane, autoritatea recomandă o revizuire tehnică independentă a etapelor de eliminare a identificatorilor.

Potriviți datele cu întrebarea: Setul de date trebuie să corespundă scopului de cercetare declarat. Autoritatea a găsit cazuri în care echipele au utilizat registrele naționale complete când un eșantion mai mic ar fi fost suficient.

Consultați ghidul nostru de detectare a ID-urilor naționale UE pentru cum se aplică regulile cifrelor de control la alte formate de ID europene.

Ce Au Găsit Cazurile din 2024

Cele 14 cazuri din sănătate au trei tipuri comune de eșec.

Partajarea datelor de cercetare: Un spital trimite un set de date de pacienți pseudo-anonimizat unui partener academic pentru antrenarea AI. Setul conține fragmente din data nașterii, coduri de diagnostic și date de tratament. Autoritatea constată că această combinație reexpune pacienții cu boli rare. Diagnosticele neobișnuite reduc rapid grupul.

Servicii AI de la terțe părți: O firmă de tehnologie medicală trimite note de pacienți unui serviciu AI bazat în SUA pentru procesarea dosarelor clinice. ID-urile personale din acele note nu sunt eliminate în prealabil. Nu există un mecanism de transfer valabil.

Lacune în conductele OCR: Un asigurător procesează formulare PDF scanate pentru cererile de invaliditate. Instrumentul OCR convertește imaginile în text, dar nu efectuează teste cu cifre de control pe ieșire. Multe ID-uri sunt omise.

OCR inserează adesea spații în mijlocul unui număr sau deplasează cratima. Potrivirea simplă de șabloane eșuează pe acel rezultat. Detectarea trebuie să funcționeze pe textul OCR, nu doar pe inputul curat. Consultați ghidul nostru de detectare OCR în sănătate pentru pașii de gestionare a documentelor scanate.

Trei Cerințe Tehnice Esențiale

Aceste trei elemente formează baza conformității GDPR în sănătatea daneză.

Teste cu cifre de control pe toate textele: Rulați verificarea completă modulus-11 pe fiecare șir candidat. Aplicați-o atât pe text curat, cât și pe ieșirea OCR.

Detectarea numelor în daneză: Utilizați un model antrenat pe text danez. Modelul spaCy da_core_news este o opțiune. Un model general în engleză ratează numele daneze și denumirile organizațiilor.

Înregistrări de eliminare a identificatorilor: Documentați ce a fost eliminat, ce a fost grupat și dimensiunea grupului din ieșire. Autoritatea solicită aceasta în formă tehnică, nu ca notă de politică.

Pentru date privind costul incidentelor cu date medicale, consultați analiza noastră a costurilor breșelor în sănătate.

Surse

Pregătit să vă protejați datele?

Începeți să anonimizati PII cu 285+ tipuri de entități în 48 de limbi.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.