By · Last updated 2026-05-30

Zpět na blogZdravotnictví

HIPAA: Detekce čísel MRN specifických pro nemocnici

HIPAA Safe Harbor vyžaduje odstranění čísel zdravotních záznamů — ale formáty MRN nejsou standardizované. Epic, Cerner a Meditech používají různé formáty.

May 30, 20267 min čtení
HIPAA Safe Harbormedical record numbersMRN detectionhealthcare compliancecustom PII patterns

Aktualizováno pro rok 2026

HIPAA Safe Harbor de-identifikace: Detekce formátů MRN specifických pro nemocnici bez programování

HIPAA Safe Harbor vyžaduje odstranění čísel zdravotních záznamů. Jedná se o jeden z 18 požadovaných typů ID. Zní to jednoduše. Problém je v tom, že formáty MRN nejsou standardizované.

Epic používá jeden formát. Cerner používá jiný. Meditech používá další. Každá nemocnice přidává vlastní kódy. Regionální zdravotnické skupiny vytvářejí ještě více formátů. Standardní nástroj PII nemůže znát váš formát. Vaše čísla MRN přehlédne.

To není zanedbatelné riziko. Zdravotnické IT týmy často nacházejí MRN stále v datasetech, které měly být de-identifikovány. Nástroj byl nastaven pouze pro běžné typy PII.

Problém s formátem MRN

USA nemá žádný národní standard pro čísla zdravotních záznamů. Každá nemocnice nebo dodavatel EHR definuje vlastní formát.

Běžně pozorované vzory:

  • Styl Epic: 8–12 číslic (např. 123456789)
  • Styl Cerner: Předpona kódu nemocnice + číselná část (např. MGH-987654)
  • Regionální sítě: Kód zařízení + rok + sekvence (např. HOSP-2023-456789)
  • Veterans Affairs: 9 číslic s kontrolní číslicí
  • Pediatrické systémy: Předpona typu pacienta + číselná část (např. PED-12345678)

Žádné jediné pravidlo nepokryje všechny tyto formáty. Neexistuje žádný universální vzor MRN.

Co standardní nástroje PII zachytí: Většina nástrojů HIPAA se zaměřuje na ID s pevným formátem. SSN sleduje formát XXX-XX-XXXX. Telefonní čísla sledují formát XXX-XXX-XXXX. E-mailové adresy mají jasný tvar. Ty jsou snadno nalezitelné.

MRN, čísla účtů a čísla licencí jsou typy HIPAA 8, 10 a 11. Ty se liší nemocnici od nemocnice. Potřebují vlastní nastavení. Obecný nástroj je nezachytí.

Mezera v compliance

Regionální nemocnice chce sdílet pacientská data s univerzitním výzkumným partnerem. Jejich EHR používá tento formát MRN: HOSP-RRRR-XXXXXX.

Data spustí přes svůj nástroj HIPAA. Nástroj odstraní jména, data, telefonní čísla a SSN. MRN neodstraní. HOSP-2023-456789 neodpovídá žádnému vestavěnému pravidlu.

Výzkumník dataset obdrží. Spojí ho se svými záznamy. Tyto záznamy zahrnují MRN z dřívějších doporučení ve stejné nemocnici. Mnoho pacientů může být nyní znovu identifikováno. Nemocnice má porušení HIPAA.

To je skutečný způsob selhání. Viz také de-identifikace HIPAA Safe Harbor pro zdravotnický výzkum pro více informací o tom, kde Safe Harbor selhává.

Řešení: Vytvoření vlastní entity

Řešením je definovat formát vašeho MRN jako vlastní entitu. Compliance officer to může provést. Inženýr není potřeba.

Kroky:

  1. Zapište formát: „Začíná HOSP, pak pomlčka, čtyřciferný rok, pomlčka a šesticiferné číslo”

  2. Použijte AI nástroj pro vytvoření regulárního výrazu: HOSP-\\d{4}-\\d{6}

  3. Otestujte na 20 propouštěcích zprávách. Potvrďte, že zachytí všechna MRN.

  4. Uložte jako vlastní entitu nazvanou „Nemocniční MRN”

  5. Přidejte ji do vašeho HIPAA presetu vedle standardních 17 typů ID

Tento proces zabere compliance officerovi přibližně 3 dny. Budování vlastního kódu může trvat 3 měsíce.

Příklad: Síť 15 zdravotnických zařízení

Organizace: Regionální nemocniční síť 15 zařízení

Formát MRN: HOSP-RRRR-XXXXXX (v tisících propouštěcích zpráv PDF)

Cíl: Sdílet výzkumný dataset s univerzitním partnerem podle dohody o využití dat HIPAA

Starý přístup: Externím dodavatelem de-identifikace za 120 000 USD ročně

Nalezená mezera: Nástroj dodavatele nedetekoval formát MRN specifický pro instituci

Nový pracovní postup:

  1. Compliance officer definuje vzor MRN — 20 minut
  2. AI ověří regulární výraz — 5 minut
  3. Testování na 50 vzorových zprávách — 30 minut
  4. Potvrzení, že nezůstala žádná MRN, žádné falešné pozitivy — 10 minut
  5. Přidání vlastní entity do HIPAA presetu
  6. Spuštění celého datasetu 50 000 záznamů v dávkovém режиму

Celkový čas k uzavření mezery: jedno odpoledne.

Sítě více zařízení: Více formátů MRN

Nemocniční sítě budované prostřednictvím fúzí často provozují několik EHR systémů. Každý starší systém může používat jiný formát MRN.

Jak to řešit:

Vytvořte samostatnou vlastní entitu pro každý formát:

  • „Formát MRN A (Epic)” — 8-ciferný číselný
  • „Formát MRN B (starší Cerner)” — předpona + 7-ciferný číselný
  • „Formát MRN C (přidružená afilace)” — kód státu + rok + sekvence

Jeden preset obsahuje všechny tři vlastní entity plus standardní typy ID HIPAA. Každý dokument z každého zařízení bude mít svá MRN odstraněna.

Viz vlastní detekce MRN v pipeline HIPAA bez kódu pro podrobného průvodce tímto nastavením s více formáty.

Mimo MRN: Další nestandardní identifikátory

Stejný přístup funguje i pro další typy ID HIPAA Safe Harbor.

Čísla členů zdravotního plánu (kategorie 9): Každá pojišťovna používá vlastní formát. Aetna, Blue Cross a United Healthcare vypadají všechny jinak. Fakturační tým potřebuje vlastní vzor pro každého plátce.

Čísla účtů (kategorie 10): Čísla fakturačních účtů nemocnic se liší nemocnici od nemocnice.

Čísla licencí (kategorie 11): DEA čísla mají standardní federální formát. Čísla státních lékařských licencí nikoli. Každá státní rada používá vlastní formát.

Identifikátory zařízení (kategorie 14): Sériová čísla zdravotnických pomůcek jsou stanovena každým výrobcem.

Pro každý z těchto typů vlastní entita uzavírá mezeru. Inženýři nejsou potřeba.

Viz vlastní identifikátory PII pro organizační anonymizaci pro více informací o nestandardních typech ID.

Validace: Prokázání souladu se Safe Harbor

HIPAA Safe Harbor říká, že krytý subjekt nesmí mít „skutečnou znalost”, že by data mohla identifikovat osobu. (45 CFR §164.514(b)(1))

Validace vlastní entity dokazuje pokrytí všech 18 typů ID.

Kroky validace:

  1. Zpracujte 50–100 vzorových dokumentů z výzkumného datasetu
  2. Přezkumejte výstup — vypadá něco jako ID?
  3. Spusťte druhý detekční průchod pro zachycení případných přehlédnutých položek
  4. Zdokumentujte, co jste provedli

Vaše nastavení vlastní entity, přezkoumání vzorků a protokoly zpracování tvoří váš záznam Safe Harbor.

Závěr

Standardní nástroje PII s výchozím nastavením nedokončí de-identifikaci HIPAA Safe Harbor. Čísla zdravotních záznamů jsou specifická pro každou nemocnici. Potřebují vlastní detekci.

Vytvoření vlastní entity tuto mezeru uzavírá během hodin. Compliance officers mohou definovat vzor, otestovat ho a zpracovat data. Žádná inženýrská práce není potřeba.

Mezera mezi „spustili jsme nástroj HIPAA” a „odstranili jsme všech 18 identifikátorů Safe Harbor” je často jen jedna chybějící vlastní entita.

Zdroje

Připraveni chránit svá data?

Začněte anonymizovat PII s více než 285 typy entit ve 48 jazycích.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.