anonym.legal

By · Last updated 2026-06-05

Назад на блоготGDPR & Усогласеност

Данска CPR: Валидација по модул 11 за GDPR

67% од NLP алатките ја пропуштаат валидацијата по модул 11 на данскиот CPR-број. 14 активности за спроведување во здравствената заштита на Datatilsynet во 2024 година. Секундарна употреба на здравствени податоци.

June 5, 20267 мин читање
Denmark DatatilsynetCPR modulus-11Danish healthcare GDPRhealth data anonymizationNordic compliance

Дански CPR броеви: Водич за усогласеност со GDPR

Ажурирано за 2026 година

Данскиот надзорен орган за заштита на податоци, Datatilsynet, издал 31 одлука по GDPR во 2024 година. Четиринаесет се однесувале на здравствени податоци. Тој висок удел ги одразува два факта: Данска управува со голем национален здравствен систем и техничките јазови во тој систем продолжуваат да ги изложуваат записите на пациентите.

Правилото за проверна цифра на CPR броеви

CPR бројот е личниот идентификатор на Данска. Тој е 10 цифри во формат DDMMYY-XXXX. Првите шест цифри се датумот на раѓање. Последните четири се шифра плус проверна цифра.

Проверната цифра користи правило по модул 11:

  1. Се земаат цифрите 1 до 9.
  2. На секоја се доделува тежина: 4, 3, 2, 7, 6, 5, 4, 3, 2.
  3. Секоја цифра се множи со нејзината тежина. Сите резултати се собираат.
  4. Се дели со 11. Се забележува остатокот.
  5. Остаток 0 → проверната цифра е 0.
  6. Остаток 1 → бројот не е важечки.
  7. Остаток 2–10 → проверната цифра е 11 минус остатокот.

Ова правило е важно за секоја алатка која скенира за CPR броеви. Некои низи DDMMYY-XXXX никогаш не можат да бидат важечки. Алатките кои ја прескокнуваат оваа чекор означуваат датуми, шифри на фактури и референтни броеви како вистински идентификатори.

Прегледот на органот за 2024 година утврди дека 67% од генеричките NLP алатки ја прескокнуваат оваа проверка. Тој јаз е главниот технички неуспех во неговите случаи во здравствената заштита.

Петте здравствени регистри на Данска

Данска ги поврзува здравствените податоци низ пет национални регистри. Личниот идентификатор ги поврзува сите пет.

  • Записи за отпуштање од болница (од 1977 година)
  • Податоци за рецепти (од 1995 година)
  • Регистар на рак (од 1943 година)
  • Регистар на причини за смртта (од 1970 година)
  • Дијагнози во примарната здравствена заштита (од 1990 година)

Ова го прави данското здравствено истражување многу силно. Исто така создава ризик. Отстранувањето на суровиот идентификатор не е доволно. База на податоци која сè уште содржи возраст, пол, дијагноза и година може повторно да ги изложи луѓето — особено оние со ретки состојби.

Упатството на Datatilsynet за 2024 година за секундарна употреба на здравствени податоци поставува три барања.

Запишете го она што сте го направиле со податоците: Наведете кои полиња сте ги отстраниле, кои сте ги заокружиле или групирале и какви резултати за групна големина дава резултатот. Политичка белешка не го исполнува овој стандард.

Добијте надворешен преглед за големи множества: За бази на податоци со повеќе од 5.000 луѓе, органот препорачува независен технички преглед на чекорите за деидентификација.

Усогласете ги податоците со прашањето: Базата на податоци мора да одговара на наведената цел на истражувањето. Органот пронашол случаи каде тимовите користеле полни национални регистри кога помал примерок би бил доволен.

Што открија случаите за 2024 година

Четиринаесетте случаи во здравствената заштита споделуваат три вообичаени типови неуспеси.

Споделување на истражувачки податоци: Болница испраќа деидентификувана база на податоци за пациенти до академски партнер за обука на ВИ. Множеството содржи делови од датумот на раѓање, дијагностички шифри и датуми на третман. Органот утврдува дека оваа комбинација ги повторно изложува пациентите со ретки болести. Невообичаените дијагнози брзо го стеснуваат кругот.

Услуги на ВИ на трети страни: Здравствена технолошка фирма испраќа белешки за пациенти до американска услуга за ВИ за работа со клинички записи. Личните идентификатори во тие белешки не се отстрануваат прво. Нема важечки механизам за пренос.

Јазови во OCR процесирачкиот ланец: Осигурувач обработува скенирани PDF формулари за барања за инвалидност. Неговата OCR алатка ги претвора сликите во текст. Но не извршува проверки на проверната цифра на излезот. Многу идентификатори се пропуштаат.

OCR честопати вметнува празни места во средината на бројот или го поместува цртичката. Простото совпаѓање на шаблони не работи со тој излез. Откривањето мора да работи на OCR текст, не само на чист влез.

Три технички задолжителни барања

Овие три елементи ја формираат основата за усогласеност на данската здравствена заштита со GDPR.

Проверки на проверната цифра на сиот текст: Извршете ја целосната проверка по модул 11 на секоја кандидатска низа. Применете ја на чист текст и на OCR излез подеднакво.

Откривање на имиња на дански јазик: Користете модел обучен на дански текст. Моделот spaCy da_core_news е една опција. Генерички англиски модел пропушта дански имиња и имиња на организации.

Записи за деидентификација: Запишете го она што е отстрането, она што е групирано и групната големина на излезот. Органот бара ова во техничка форма, не како политичка белешка.

Извори

Подготвени да ги заштитите вашите податоци?

Започнете со анонимизација на PII со 285+ типови на ентитети на 48 јазици.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.