Kutojulikana kwa HIPAA Safe Harbor kwa Kiwango: Mwongozo kwa Watafiti wa Afya
Kituo cha tiba cha kitaaluma kinahitaji kusafisha rekodi 200,000 za kutolewa hospitalini. Lengo: kujenga mfano wa utabiri wa kurudishwa hospitalini. Zana iliyopo inagharimu $120,000 kwa mwaka. Bajeti ya ruzuku kwa kazi ya data: $5,000.
Pengo hili ni la kawaida. Utafiti wa afya unahitaji seti kubwa za data. Seti hizo zinashikilia taarifa za afya zinazolindwa (PHI). PHI inajumuisha majina, tarehe, anwani, na maelezo mengine ya kibinafsi. Kuondoa PHI kunawaacha watafiti kutumia data kisheria. Lakini zana zimepangwa bei kwa mifumo ya hospitali, si ruzuku za utafiti.
HIPAA Safe Harbor: Vitambulisho 18
Njia ya Safe Harbor ya HIPAA (45 CFR §164.514(b)) inaorodhesha aina 18 za PHI. Zote lazima ziende kabla ya data ya afya kupoteza hali yake ya "iliyolindwa". Baada ya kuondolewa, utafiti unaweza kuendelea bila idhini ya mgonjwa.
Hapa ziko aina zote 18:
- Majina
- Data ya kijiografia ndogo ya majimbo (nambari za zip zinahitaji kupunguzwa hadi tarakimu 3 kwa watu wachache)
- Tarehe zote isipokuwa mwaka — kulazwa, kutolewa, kuzaliwa, kifo, na tarehe zingine
- Nambari za simu
- Nambari za faksi
- Anwani za barua pepe
- Nambari za usalama wa jamii
- Nambari za rekodi za matibabu
- Nambari za wahusika wa mpango wa afya
- Nambari za akaunti
- Nambari za cheti na leseni
- Vitambulisho vya gari na nambari za serial
- Vitambulisho vya kifaa na nambari za serial
- URLs za tovuti
- Anwani za IP
- Vitambulisho vya biometria (alama za vidole, nyayo za sauti)
- Picha za uso kamili na picha kama hizo
- Nambari yoyote nyingine ya kipekee ya kutambua au msimbo
Tano za kwanza zinaonekana katika karibu kila rekodi ya kutolewa hospitalini. Zote lazima ziondolewe au zibadilishwe.
Tarehe zinahitaji umakini maalum. Kila tarehe ya mgonjwa lazima ibaki na mwaka lakini ipoteze siku na mwezi mahususi. "Machi 15, 2023" inakuwa "2023." Unaweza kubaki na muda kama sehemu — lakini tu baada ya tarehe za chanzo kwisha.
Tatizo la Kiwango
Seti za data za afya zinazofaa ni kubwa:
- Utabiri wa kurudishwa hospitalini: makutano 50,000–500,000
- Kazi ya matokeo ya matibabu: wagonjwa 10,000–100,000 kwa hali
- Ufanisi wa dawa: rekodi 5,000–50,000
- Afya ya idadi ya watu: makutano 100,000+
Mapitio ya mkono kwa kiwango hiki hayafanyi kazi. Mapitio ya dakika 5 kwa rekodi huchukua siku 250–2,500 za kazi kwa rekodi 100,000. Viwango vya makosa ya binadamu vinaendesha 1–5%. Hata kiwango kidogo cha kukosa huunda hatari ya HIPAA. Wapitia wawili wanaoshughulikia tarehe tofauti wanaweza kuvunja hali ya Safe Harbor. Hiyo ni kosa rahisi kufanya kwenye seti kubwa ya data.
Usafishaji wa kiotomatiki ndio chaguo pekee la kweli. Lazima uchukulie aina zote 18 katika maumbo mbalimbali yanayopatikana katika maelezo ya kliniki.
Pengo la Bei ya Zana
Zana za biashara zinalenga mifumo ya hospitali:
- Datavant: $100,000+/mwaka
- Veradigm (Allscripts): bei sawa
- Clinithink CLiX: wasiliana na mauzo tu
- Syntegra (data ya syntetiki): bei ya biashara
Wauzaji hawa wauzia mashirika makubwa yenye timu za kisheria na kufuata sheria. Ruzuku za utafiti si soko lao.
Zana za bure na chanzo wazi zipo lakini zinahitaji ujuzi:
- MITRE MIST: bure, lakini inahitaji usanidi mzito na ina msaada mdogo wa lugha
- Stanford NLP DEID: kiwango cha utafiti, inahitaji Java na ujuzi wa uandishi wa programu
- Zana za i2b2 NLP: NLP ya kliniki, usanidi unahitajika
Watafiti wengi wanahitaji uondoaji wa PHI unaotegemewa na usanidi rahisi. Zana za chanzo wazi zinahitaji ujuzi wa uandishi wa programu na lugha kukimbia. Zinahitaji pia kazi ya uthibitishaji. Zana za biashara zinagharimu zaidi ya ruzuku nyingi zinavyoruhusu. Pengo ni la kweli na linazuia utafiti.
Mchakato wa Kundi wa Hatua Tano
Kwa rekodi 200,000 za kutolewa hospitalini, mbinu ya mlolongo wa kundi inafanya kazi vizuri.
Hatua 1: Hamisha kutoka EHR. Vuta sehemu zilizoundwa na zisizoundwa kama faili za maandishi au PDF kwa kila makutano. Epic, Cerner, na Meditech zote zinasaidia hili. Zinauza CSV au faili za HL7 zenye sehemu za maelezo ya kliniki zilizojumuishwa.
Hatua 2: Endesha makundi ya 5,000. Makundi ya ukubwa huu ni ya haraka na madogo ya kutosha kwa mapitio katika kila hatua.
Weka aina za huluki kwa Safe Harbor:
- PERSON (majina ya mgonjwa, wanafamilia katika maelezo)
- US_SSN
- US_MEDICAL_RECORD_NUMBER
- PHONE_NUMBER
- EMAIL_ADDRESS
- URL
- IP_ADDRESS
- LOCATION (anwani, nambari za zip, miji — chochote chini ya kiwango cha jimbo)
- DATE (tarehe zote za kliniki; wagonjwa zaidi ya umri wa miaka 89 wanakuwa "> 89")
- HEALTHCARE_ID (nambari za bima, nambari za wahusika)
- ACCOUNT_NUMBER
Kwa maelezo zaidi ya usafishaji wa PHI wa kundi kwa maelezo ya kliniki, angalia usindikaji wa kundi wa maelezo ya kliniki na zana za HIPAA za ndani. Mwongozo huo unashughulikia maumbo ya faili na urekebishaji wa huluki kwa kina.
Hatua 3: Shughulikia tarehe kama hatua tofauti. Baki na mwaka. Ondoa mwezi na siku. Badilisha umri wowote zaidi ya miaka 89 na "> 89." Jozi za umri-ugonjwa nadra zinaweza kutambua tena wagonjwa. Hesabu sehemu za muda kwanza — urefu wa kulazwa, siku hadi kurudishwa hospitalini. Kisha futa tarehe za chanzo.
Hatua 4: Sampuli na upitie kila kundi. Baada ya kila kundi la rekodi 5,000, vuta rekodi 50 kwa mapitio ya binadamu. Angalia aina zote 18. Tafuta vipengele vya muktadha kama majina ya watafiti katika maelezo au maelezo ya daktari wa rufaa. Thibitisha ushughulikiaji wa tarehe unafanana na sheria za Safe Harbor. Sababisha mapungufu yoyote kabla ya kuendelea.
Hatua 5: Andika na thibitisha. HIPAA inahitaji mtu mwenye maarifa ya takwimu kuthibitisha hatari ya kutambuliwa tena ni ndogo sana. Kwa Safe Harbor, timu inayofanya uondoaji hufanya uamuzi huo. Andika usanidi wako wa huluki na matokeo ya sampuli. Yaache kwa rekodi za IRB.
Unahitaji njia ya ukaguzi kwa kila uondoaji? Ufichaji unaoweza kuelezewa na njia ya ukaguzi ya HIPAA inashughulikia kurekodi kwa kina.
Ulinganisho wa Gharama
Zana ya biashara: $120,000/mwaka. Inashughulikia usanidi, mafunzo, usindikaji usio na kikomo, na msaada wa kufuata sheria.
Usindikaji wa kundi:
- Rekodi 200,000 × maneno 300 wastani = tokens 60,000,000
- Kwa €0.0001/token: €6,000 katika usindikaji
- Mpango wa Pro (€180/mwaka) au mpango wa Business (€348/mwaka) kwa mradi
- Muda wa mapitio ya mtafiti: masaa 20–40
- Jumla: takriban €7,000–8,000
Akiba dhidi ya zana ya biashara: $111,000–113,000. Utafiti uliokwama kwa $120,000 unakuwa wa kutekelezwa kwa $7,000.
Vikwazo Muhimu
Maandishi tu. Mbinu hii inashughulikia PHI inayotegemea maandishi. Picha, sauti, na data ya biometria (kategoria za Safe Harbor 13, 16, na 17) zinahitaji zana zingine.
Uthibitishaji unahitajika. Zana za kiotomatiki hukosa baadhi ya vipengele. Kiwango cha kukosa cha 0.1% kwenye rekodi 200,000 kunacha rekodi 200 zenye PHI hai. Hiyo ni hatari ya kweli ya HIPAA. Usikimbie uthibitishaji.
Angalia ofisi yako ya faragha. Idhini ya IRB kwa utafiti haishughulikii njia ya usafishaji. Vituo vingi vinapitia mbinu za uondoaji wa PHI tofauti. Mwongozo huu unaongeza mapitio hayo — haubadilishi.
Uamuzi wa Mtaalamu ni chaguo. HIPAA pia inaruhusu usafishaji kupitia "Uamuzi wa Mtaalamu" (45 CFR §164.514(b)(1)). Mtaalamu wa takwimu anathibitisha hatari ya kutambuliwa tena ni ndogo sana. Njia hii inafaa seti za data zisizo za kawaida. Inafanya kazi vizuri wakati kuondoa tarehe zote kunavunja uchambuzi wa mfululizo wa muda.
Kwa mtazamo wa upande kwa upande wa zana za kiotomatiki za PHI, angalia ulinganisho wa usahihi wa ugunduzi wa PHI.
Hitimisho
Utafiti wa afya ambao ungeweza kusaidia wagonjwa umekwama nyuma ya gharama za uondoaji wa PHI. Mapitio ya mkono hayazingatii kiwango. Zana za biashara zinagharimu zaidi ya ruzuku nyingi zinavyoruhusu. Seti za data zinabaki zilizofungwa au kusafishwa vibaya.
Usindikaji wa kundi unaotegemea token unafanya utafiti wa kiwango kikubwa kuwa wa kutekelezwa. Vituo vya kitaaluma na watafiti wa kujitegemea wanapata usahihi sawa na mifumo ya hospitali ya kina. Kwa bajeti ya kawaida ya ruzuku.