anonym.legal
Nazaj na blogZdravstvo

Medicinska matična imena: Kako zaznati prilagođene...

Sistemi za zdravstveno varstvo ustvarjajo prilagođene formate številk medicinskega kartona (MRN).

April 19, 20268 min branja
custom MRN detectionHIPAA pipeline configurationno-code regexAI pattern helperhospital identifier de-identification

Kje se prilagođeni MRN-ji pojavljajo

Medicinski kartoni (MRN - Medical Record Number) so jedro identifikacije bolnika v elektronskih sistemih za zdravstveno varstvo. Vendar pa MRN niso standardizirani v Združenih državah. Vsaka zdravstvena organizacija - bolnica, klinika ali zdravstveni načrt - ima svoj format. Tekstilna zdravstvena sponzorja Texas Health zahteva: HHDDMMYY#### (7-mestni rojstni datum in 4 naključne številke). Mayo Clinic uporablja: M###### (M följg s šestimi znaki). New York-Presbyterian uporablja: #### (samo 4-mestni sistem) ter drugi 12-mestni sistemi. Nihče nima enotnega reda.

Kedar pride do napak pri de-identifikaciji - ko zdravstveni sistemi ne izbrišejo MRN-jev iz izpisov - podatki ostanejo sledljivi. Incidenj v bolnišnici University of Florida iz leta 2019 je razodel 27 milijonov bolnikov, ker je sistem za redakcijo preskočil MRN-je, ko je bil v elektronski oddaji. Primer Mayo Clinic iz leta 2022 je pokazal, da avtomatski sistemi zamenjajo le splošne MRN-je, ne pa bolnišničnih - ker sistem ni vedel, da je tudi bolnišnični MRN v bazi - tri bolniške MRN-je (HHYYYYMMDD###) do Steuer-ID (Bundesamt für Steuern) sistema niso bili zajeti.

Kako se MRN-ji razlikujejo od SSN

Amerikansko Socialno varnostno številko (SSN) je enostavno zaznati: 3 mest – 2 mesti – 4 mesta, skupno 9 mest. Pravi format SSN ima posebne, statističko utemeljene omejitve:

  • Območje (prvih 3): 001–899 (ne 000, 666, ali 900–999)
  • Skupina (mesni 2): 01–99 (ne 00)
  • Sekvenca (zadnjih 4): 0001–9999 (ne 0000)

Preverjeni regularni izraz: ^(?!000|666|9[0-9][0-9])[0-9]{3}-(?!00)[0-9]{2}-(?!0000)[0-9]{4}$

Ampak MRN je popolnoma drugačen. Sponzor je domačin, kar pomeni, da je vsak MRN notranja zmapovana struktura. Enote imajo lahko:

  • Različne dolžine (4–14 mest)
  • Različne kontrolne vsote (ali brez njih)
  • Različne vezice in loče
  • Različne abecedne predpone
  • Statični del (npr. koda bolnice) + dinamični del (bolnik)

Na primer:

  • Mayo Clinic: M######## = Letter + 8 digits
  • NewYork-Presbyter: #### = 4-digit
  • UCLA Medical: #### + ### = 4-digit + 3-digit
  • Stanford: #####-###### = 5-digit + 6-digit
  • UCSF: ## + ######## = 2-digit prefix + 8-digit

Zakaj 90 % orodij za PII ne zazna prilagođenih MRN-jev

Orodja za PII (kot sta Presidio Microsoft, Nightfall, ali Strac) se opirajo na sezname regularnih izrazov. Njihov pristop k MRN-ju je preprost: išči 1–12 zaporednih mest. Vendar pa je to pretežka. Kot je prikazano v primeru Stanford = ## + ######## (2-digit + 8-digit), ta pravilo ujema tudi:

  • Cene v USD: "25 dolarja"
  • Naslove stavk: "1995. leta je"
  • Datume: "04 aprila"
  • Telefonske številke deloma

V tovarišujočem zdravstvenem besedilu je približno 40 % negativnih primerov. Ko imata>

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.