HIPAA saugios prieplaukos identifikatorių pašalinimas dideliame mastelyje: sveikatos tyrėjų vadovas
Akademinis medicinos centras turi išvalyti 200 000 išrašymo įrašų. Tikslas: sukurti pakartotinio hospitalizavimo prognozės modelį. Esamų įrankių kaina: 120 000 USD per metus. Dotacijos biudžetas duomenų darbui: 5 000 USD.
Ši spraga dažna. Sveikatos tyrimams reikia didelių duomenų rinkinių. Tie duomenų rinkiniai turi apsaugotą sveikatos informaciją (ASI). ASI apima vardus, datas, adresus ir kitas asmenines detales. ASI pašalinimas leidžia tyrėjams teisėtai naudoti duomenis. Tačiau įrankiai kainuoja ligoninių sistemoms, o ne tyrimų dotacijoms.
HIPAA saugios prieplaukos: 18 identifikatorių
HIPAA saugios prieplaukos metodas (45 CFR §164.514(b)) sąrašuje 18 ASI tipų. Visi turi būti pašalinti prieš sveikatos duomenys prarandant "apsaugotą" statusą. Po pašalinimo tyrimai gali vykti be pacientų sutikimo.
Stai visi 18 tipų:
- Vardai
- Geografiniai duomenys, mažesni nei valstija (pašto kodai turi būti sutrumpinti iki 3 skaitmenų mažoms populiacijoms)
- Visos datos, išskyrus metus — priėmimo, išrašymo, gimimo, mirties ir kitos datos
- Telefonų numeriai
- Faksų numeriai
- El. pašto adresai
- Socialinio draudimo numeriai
- Medicininių įrašų numeriai
- Sveikatos plano naudos gavėjų numeriai
- Sąskaitų numeriai
- Sertifikatų ir licencijų numeriai
- Transporto priemonių identifikatoriai ir serijos numeriai
- Įrenginių identifikatoriai ir serijos numeriai
- Interneto URL
- IP adresai
- Biometriniai identifikatoriai (pirštų atspaudai, balso atspaudai)
- Pilno veido nuotraukos ir panašios vaizdai
- Bet kuris kitas unikalus identifikavimo numeris arba kodas
Pirmieji penki atsiranda beveik kiekviename išrašymo įraše. Visi turi būti pašalinti arba pakeisti.
Datos reikalauja ypatingos priežiūros. Kiekviena paciento data turi išlaikyti metus, bet prarasti konkrečią dieną ir mėnesį. "2023 m. kovo 15 d." tampa "2023 m." Galite laikyti trukmę kaip lauką — bet tik pašalinus šaltinio datas.
Masto problema
Naudingos sveikatos duomenų rinkiniai yra dideli:
- Pakartotinio hospitalizavimo prognozė: 50 000–500 000 susitikimų
- Gydymo rezultatų darbas: 10 000–100 000 pacientų per ligą
- Vaistų efektyvumas: 5 000–50 000 įrašų
- Populiacijos sveikata: 100 000+ susitikimų
Rankinis peržiūrėjimas tokiu mastu neveikia. 5 minučių peržiūra per įrašą reikalauja 250–2 500 darbo dienų 100 000 įrašų. Žmogaus klaidų rodikliai siekia 1–5%. Net mažas praleidimo rodiklis sukuria HIPAA riziką. Du peržiūrėtojai, skirtingai vertinantys datas, gali pažeisti saugios prieplaukos statusą. Tai lengva klaida dideliame duomenų rinkinyje.
Automatizuotas valymas yra vienintelis realus variantas. Jis turi aptikti visus 18 tipų įvairiuose formatuose, esančiuose klinikinėse pastabose.
Įrankių kainų spraga
Įmonių įrankiai skirti ligoninių sistemoms:
- Datavant: 100 000+ USD per metus
- Veradigm (Allscripts): panašios kainos
- Clinithink CLiX: tik kontaktas su pardavimu
- Syntegra (sintetiniai duomenys): įmonių kainodara
Šie pardavėjai parduoda didelėms organizacijoms su teisinėmis ir atitikties komandomis. Tyrimų dotacijos — ne jų rinka.
Nemokami ir atvirojo kodo įrankiai egzistuoja, bet reikalauja kompetencijos:
- MITRE MIST: nemokamas, bet reikia sudėtingo diegimo ir ribota kalbų palaikymo
- Stanford NLP DEID: tyrimo lygio, reikia Java ir kodavimo įgūdžių
- i2b2 NLP įrankiai: klinikinė NLP, reikia diegimo
Daugumui tyrėjų reikia patikimo ASI pašalinimo su paprastu diegimu. Atvirojo kodo įrankiams reikia kodavimo ir lingvistikos įgūdžių. Jiems taip pat reikia validavimo darbo. Įmonių įrankiai kainuoja daugiau nei leidžia daugelis dotacijų. Spraga reali ir ji blokuoja tyrimus.
Penkių žingsnių paketinis procesas
200 000 išrašymo įrašams tinka nuoseklus paketinis metodas.
1 žingsnis: Eksportavimas iš EHR. Ištraukite struktūrizuotus ir nestruktūrizuotus laukus kaip tekstinius arba PDF failus per susitikimą. Epic, Cerner ir Meditech tai palaiko. Jie eksportuoja CSV arba HL7 failus su klinikinių pastabų laukais.
2 žingsnis: Paleiskite paketus po 5 000. Tokie paketai yra greiti ir pakankamai maži peržiūrai kiekviename etape.
Nustatykite saugios prieplaukos objektų tipus:
- PERSON (pacientų vardai, šeimos nariai pastabose)
- US_SSN
- US_MEDICAL_RECORD_NUMBER
- PHONE_NUMBER
- EMAIL_ADDRESS
- URL
- IP_ADDRESS
- LOCATION (adresai, pašto kodai, miestai — viskas žemiau valstijos lygio)
- DATE (visos klinikinės datos; pacientai vyresni nei 89 tampa "> 89")
- HEALTHCARE_ID (draudimo numeriai, naudos gavėjų numeriai)
- ACCOUNT_NUMBER
Daugiau apie ASI valymą klinikinėse pastabose žr. paketinis klinikinių pastabų apdorojimas su vietiniais HIPAA įrankiais.
3 žingsnis: Datas tvarkykite atskiru žingsniu. Išlaikykite metus. Pašalinkite mėnesį ir dieną. Pakeiskite bet kokį amžių virš 89 su "> 89". Retos amžiaus-ligos poros gali pakartotinai identifikuoti pacientus. Pirmiausia apskaičiuokite trukmės laukus — buvimo trukmę, dienas iki pakartotinio hospitalizavimo. Tada ištrinkite šaltinio datas.
4 žingsnis: Imkite pavyzdžius ir peržiūrėkite kiekvieną paketą. Po kiekvieno 5 000 įrašų paketo ištraukite 50 įrašų žmogaus peržiūrai. Patikrinkite visus 18 tipų. Ieškokite konteksto elementų, pvz., tyrėjų vardų pastabose arba kreipimosi gydytojo duomenų. Patvirtinkite, kad datų tvarkymas atitinka saugios prieplaukos taisykles. Prieš tęsiant ištaisykite spragas.
5 žingsnis: Dokumentuokite ir sertifikuokite. HIPAA reikalauja, kad asmuo, turintis statistinių žinių, patvirtintų, kad pakartotinio identifikavimo rizika yra labai maža. Saugios prieplaukos atveju tai daro pašalinimą atliekanti komanda. Parašykite objektų konfigūraciją ir imties ėmimo rezultatus. Laikykite juos IRB įrašams.
Reikia audito pėdsakų kiekvienam pašalinimui? Paaiškinamas redagavimas su HIPAA audito pėdsaku išsamiai aprašo registravimą.
Kainų palyginimas
Įmonių įrankis: 120 000 USD per metus. Apima diegimą, mokymą, neribotą apdorojimą ir atitikties palaikymą.
Paketinis apdorojimas:
- 200 000 įrašų × 300 žodžių vidurkis = 60 000 000 žetonų
- Esant 0,0001 EUR/žetonui: 6 000 EUR apdorojimui
- Pro planas (180 EUR/metus) arba Business planas (348 EUR/metus) projektui
- Tyrėjų peržiūros laikas: 20–40 valandų
- Iš viso: maždaug 7 000–8 000 EUR
Sutaupymai, palyginti su įmonių įrankiu: 111 000–113 000 USD. Tyrimai, strigę ties 120 000 USD, tampa įmanomi už 7 000 USD.
Pagrindiniai apribojimai
Tik tekstas. Šis metodas tvarko tekstiniu formatu grindžiamą ASI. Vaizdams, garso įrašams ir biometrinių duomenų (saugios prieplaukos 13, 16 ir 17 kategorijos) reikia kitų įrankių.
Reikalingas validavimas. Automatizuoti įrankiai kai ką praleidžia. 0,1% praleidimo rodiklis 200 000 įrašų palieka 200 įrašų su gyvu ASI. Tai reali HIPAA rizika. Nepraleiskite validavimo.
Konsultuokitės su privatumo biuru. IRB studijos patvirtinimas neapima valymo metodo. Dauguma centrų atskirai peržiūri ASI pašalinimo metodus. Šis vadovas papildo tą peržiūrą — jis jo nepakeičia.
Eksperto nustatymas yra galimybė. HIPAA taip pat leidžia valymą per "Eksperto nustatymą" (45 CFR §164.514(b)(1)). Statistikos ekspertas patvirtina, kad pakartotinio identifikavimo rizika yra labai maža. Šis kelias tinka neįprastiems duomenų rinkiniams. Jis gerai veikia, kai visų datų pašalinimas suardytų laiko eilučių analizę.
Žr. ASI aptikimo tikslumo palyginimą.
Išvada
Sveikatos tyrimai, kurie galėtų padėti pacientams, stringa dėl ASI pašalinimo išlaidų. Rankinis peržiūrėjimas nemasteliuojamas. Įmonių įrankiai kainuoja daugiau nei leidžia daugelis dotacijų. Duomenų rinkiniai lieka užrakinti arba netinkamai išvalyti.
Žetonais grindžiamas paketinis apdorojimas daro didelio masto tyrimus įmanomus. Akademiniai centrai ir nepriklausomi tyrėjai gauna tą patį tikslumą kaip didelės ligoninių sistemos. Standartinio dotacijos biudžeto ribose.