إزالة التعريف الآمن بموجب HIPAA على نطاق واسع: دليل عملي للباحثين في الرعاية الصحية
يتطلب مشروع بحث معتمد من لجنة المراجعة المؤسسية (IRB) في مركز طبي أكاديمي إزالة التعريف من 200,000 سجل خروج لنموذج توقع إعادة القبول باستخدام التعلم الآلي. تكلف أداة إزالة التعريف الحالية بموجب HIPAA 120,000 دولار سنويًا. الميزانية المخصصة لمعالجة البيانات في منحة البحث: 5,000 دولار.
هذا السيناريو شائع. ينتج البحث في الرعاية الصحية رؤى قيمة - نماذج توقع إعادة القبول، دراسات نتائج العلاج، تحليلات فعالية الأدوية - التي تتطلب مجموعات بيانات كبيرة وتمثيلية لتكون ذات دلالة إحصائية. تحتوي تلك المجموعات على معلومات صحية محمية (PHI). تتيح إزالة التعريف إجراء البحث مع حماية خصوصية المرضى. لكن الأدوات المتاحة لإزالة التعريف على نطاق واسع مصممة لأنظمة المستشفيات الكبيرة، وليس لميزانيات البحث.
إزالة التعريف الآمن بموجب HIPAA: ما يجب إزالته
تحدد طريقة إزالة التعريف الآمنة بموجب HIPAA (45 CFR §164.514(b)) 18 فئة من PHI يجب إزالتها قبل أن تفقد المعلومات الصحية وضعها "المحمي" ويمكن استخدامها للبحث دون تفويض فردي:
- الأسماء
- البيانات الجغرافية (كل ما هو أصغر من الولاية؛ تتطلب الرموز البريدية تقصيرًا إلى 3 أرقام للسكان الصغار)
- التواريخ (باستثناء السنة) - تاريخ القبول، تاريخ الخروج، تاريخ الميلاد، تاريخ الوفاة، جميع التواريخ الأخرى
- أرقام الهواتف
- أرقام الفاكس
- عناوين البريد الإلكتروني
- أرقام الضمان الاجتماعي
- أرقام السجلات الطبية
- أرقام المستفيدين في خطط الصحة
- أرقام الحسابات
- أرقام الشهادات/الرخص
- معرّفات المركبات وأرقامها التسلسلية
- معرّفات الأجهزة وأرقامها التسلسلية
- عناوين الويب
- عناوين IP
- معرّفات بيومترية (بصمات الأصابع، بصمات الصوت)
- صور الوجه الكامل وصور مماثلة
- أي رقم، خاصية، أو رمز فريد آخر
تظهر أول 5 معرفات (الأسماء، البيانات الجغرافية، التواريخ، أرقام الهواتف، أرقام الفاكس) في كل سجل خروج تقريبًا. يجب إزالتها أو تعديلها جميعًا.
ملاحظة حول التواريخ: هذه واحدة من أكثر متطلبات إزالة التعريف الآمنة تعقيدًا من الناحية التشغيلية. ليس فقط تاريخ الميلاد - يجب الحفاظ على السنة لجميع التواريخ المرتبطة برعاية المريض وإزالة التاريخ المحدد أو تعميمه. يصبح سجل الخروج المؤرخ بـ "15 مارس 2023" "2023." يمكن الحفاظ على مدة القبول كحقل محسوب إذا تمت إزالة التواريخ الأساسية.
مشكلة النطاق في البحث الأكاديمي
تتطلب مجموعات بيانات البحث التي تنتج نتائج ذات دلالة إحصائية في الرعاية الصحية عادة:
- توقع إعادة القبول: 50,000-500,000 لقاء مريض
- تحليل نتائج العلاج: 10,000-100,000 مريض لكل حالة
- دراسات فعالية الأدوية: 5,000-50,000 سجل مريض
- تحليل صحة السكان: 100,000+ لقاء
إزالة التعريف يدويًا على هذا النطاق ليست ممكنة:
- حتى مراجعة لمدة 5 دقائق لكل سجل تتطلب 250-2,500 يوم عمل لـ 100,000 سجل
- تقدم المراجعة اليدوية معدلات خطأ بشرية تتراوح بين 1-5% - وهو غير مقبول لمجموعات بيانات البحث حيث حتى نسبة صغيرة من السجلات القابلة للتعريف تخلق مسؤولية بموجب HIPAA
- التطبيق غير المتسق عبر مجموعة بيانات (مراجع واحد يتعامل مع التواريخ بشكل مختلف عن آخر) يقوض تأهيل إزالة التعريف الآمنة
البديل - إزالة التعريف الآلي - يتطلب أدوات متطورة بما يكفي لاكتشاف جميع 18 فئة معرف عبر التنسيقات المتنوعة الموجودة في الوثائق السريرية.
المشهد الحالي للأدوات وفجوة التسعير
أدوات إزالة التعريف بموجب HIPAA للمؤسسات:
- Datavant: 100,000 دولار+/سنة للمنظمات الصحية الكبيرة
- Veradigm (Allscripts) إزالة التعريف: تسعير مؤسسي مشابه
- Clinithink CLiX: اتصل بأسعار المبيعات
- Syntegra (توليد البيانات الاصطناعية): تسعير مؤسسي
تم تصميم هذه الأدوات لأنظمة المستشفيات التي تعالج ملايين السجلات سنويًا مع فرق الامتثال، والأقسام القانونية، وقدرات الشراء المؤسسي. إنها ليست متاحة للباحثين الأكاديميين على ميزانيات المنح.
خيارات مجانية/مفتوحة المصدر:
- مجموعة أدوات MITRE Identification Scrubber (MIST): مجانية، ولكن تتطلب إعدادًا تقنيًا كبيرًا ومحدودة في دعم اللغة
- Stanford NLP DEID: درجة بحث، تتطلب خبرة في Java/البرمجة
- أدوات i2b2 NLP: أدوات NLP السريرية، تتطلب إعدادًا تقنيًا
الفجوة: تحتاج المراكز الطبية الأكاديمية إلى إزالة تعريف موثوقة ودقيقة مع الحد الأدنى من الإعداد الفني. تتطلب الأدوات مفتوحة المصدر خبرة في اللغويات الحاسوبية للتكوين والتحقق. تتطلب الأدوات المؤسسية ميزانية لا تمتلكها مشاريع البحث.
نهج عملي: معالجة دفعات في عمليات متسلسلة
لمجموعة بيانات من 200,000 سجل خروج:
الخطوة 1: تصدير البيانات من السجل الصحي الإلكتروني تصدير الحقول الهيكلية وغير الهيكلية إلى ملفات نصية أو سجلات PDF لكل لقاء مريض. تدعم معظم أنظمة السجل الصحي الإلكتروني (Epic، Cerner، Meditech) تصدير البيانات الهيكلية بتنسيق CSV/HL7 مع حقول نصية منفصلة للملاحظات السريرية.
الخطوة 2: إزالة التعريف في دفعات في عمليات متسلسلة معالجة في دفعات من 5,000 سجل - كبيرة بما يكفي لتكون فعالة، وصغيرة بما يكفي للسماح بمراجعة الجودة في كل مرحلة.
تكوين أنواع الكيانات لإزالة التعريف الآمنة بموجب HIPAA:
- PERSON (أسماء المرضى، أسماء أفراد الأسرة المذكورة في الملاحظات)
- US_SSN
- US_MEDICAL_RECORD_NUMBER
- PHONE_NUMBER
- EMAIL_ADDRESS
- URL
- IP_ADDRESS
- LOCATION (كيانات جغرافية أصغر من الولاية - عناوين الشوارع، الرموز البريدية، المدن)
- DATE (جميع التواريخ السريرية - تطبيق تعميم العمر: المرضى فوق 89 يصبحون "أكثر من 89")
- HEALTHCARE_ID (أرقام أعضاء التأمين، أرقام المستفيدين)
- ACCOUNT_NUMBER
الخطوة 3: التعامل مع التواريخ (متخصص) تتطلب التواريخ معالجة محددة تتجاوز الإزالة:
- الحفاظ على السنة
- إزالة الشهر واليوم
- لحساب العمر: إذا كان العمر > 89، استبدال العمر الدقيق بـ "> 89" لمنع إعادة التعريف من خلال تركيبات العمر-المرض النادرة
- حساب حقول المدة (مدة الإقامة، الأيام حتى إعادة القبول) من اختلافات التواريخ، ثم إزالة التواريخ الأصلية
قد تتطلب هذه الخطوة نص معالجة ما بعد متخصص لحساب الحقول المشتقة قبل إزالة التواريخ.
الخطوة 4: عينة التحقق بعد كل دفعة من 5,000 سجل، عيّن 50 سجلًا للمراجعة البشرية:
- تحقق من إزالة جميع 18 فئة معرف
- تحقق من وجود معرفات سياقية محددة (أسماء الباحثين في الملاحظات السريرية، تفاصيل الطبيب المحيل)
- تحقق من أن التعامل مع التواريخ متسق مع متطلبات إزالة التعريف الآمنة
الخطوة 5: الشهادة يتطلب HIPAA أن يحدد شخص ذو معرفة إحصائية أو علمية مناسبة أن احتمال إعادة التعريف صغير جدًا. بالنسبة لإزالة التعريف الآمنة، تشهد الكيان الذي يطبق إزالة الفئات الـ 18 على الامتثال. وثق عمليتك، تكوين نوع الكيان، وعينة التحقق لسجلات IRB.
تحليل التكلفة: ميزانية البحث مقابل أداة المؤسسة
أداة إزالة التعريف بموجب HIPAA للمؤسسات: 120,000 دولار/سنة تشمل الإعداد، التدريب، معالجة غير محدودة، دعم وثائق الامتثال.
نهج معالجة الدفعات:
- 200,000 سجل × متوسط 300 كلمة/سجل = 60,000,000 توكن
- بسعر €0.0001/توكن: €6,000 في تكلفة المعالجة
- خطة احترافية (€180/سنة) أو خطة أعمال (€348/سنة) لمدة المشروع
- وقت الباحث للتحقق: 20-40 ساعة بأسعار ما بعد الدكتوراه
- الإجمالي: حوالي €7,000-8,000
التوفير السنوي مقابل أداة المؤسسة: 111,000-113,000 دولار.
يصبح البحث الذي كان مكلفًا عند 120,000 دولار ممكنًا عند 7,000 دولار - مع تغطية ميزانية المنحة لكل من معالجة البيانات ووقت الباحث.
تحذيرات مهمة
هذا النهج مناسب لإزالة التعريف النصي لـ PHI. تتطلب الصور، التسجيلات الصوتية، والبيانات البيومترية (فئات Safe Harbor 13، 16، 17) أدوات متخصصة تتجاوز معالجة النصوص.
التحقق مطلوب. الأدوات الآلية ليست دقيقة بنسبة 100%. تعني نسبة خطأ 0.1% على 200,000 سجل 200 سجل مع PHI متبقية - لا تزال تمثل خطرًا كبيرًا بموجب HIPAA. خطوة عينة التحقق ليست اختيارية.
يجب على مكتب الخصوصية في مؤسستك المراجعة. لا يخول الموافقة من IRB للبحث تلقائيًا نهج إزالة التعريف. تمتلك معظم المراكز الطبية الأكاديمية مكتب خصوصية أو IRB يراجع منهجيات إزالة التعريف. تكمل هذه الإرشادات، ولا تحل محل، المراجعة المؤسسية.
اعتبر تحديد الخبراء كبديل. يسمح HIPAA أيضًا بإزالة التعريف من خلال "تحديد الخبراء" (45 CFR §164.514(b)(1)) - خبير إحصائي يشهد بأن خطر إعادة التعريف صغير جدًا. قد يكون هذا النهج أكثر ملاءمة لمجموعات البيانات غير العادية حيث يخلق الإزالة الفئوية لـ Safe Harbor مشاكل منهجية (إزالة جميع التواريخ تجعل التحليل الزمني مستحيلًا).
الخاتمة
البحث في الرعاية الصحية الذي يمكن أن يحسن نتائج المرضى محاصر حاليًا بتكاليف إزالة التعريف بموجب HIPAA. عندما تكون الخيار الوحيد المتاح للباحثين الأكاديميين هو إما إزالة التعريف اليدوي (غير ممكن على نطاق واسع) أو أدوات المؤسسات المكلفة (تتجاوز ميزانيات المنح)، تبقى مجموعات بيانات البحث مغلقة أو غير مُزالة التعريف بشكل كافٍ.
تجعل إزالة التعريف بالدفعات باستخدام تسعير يعتمد على التوكن مجموعة بيانات البحث المكونة من 200,000 سجل ممكنة من الناحية الاقتصادية. تصبح نفس الدقة الإحصائية المتاحة لأنظمة المستشفيات الكبيرة متاحة للمراكز الطبية الأكاديمية، والباحثين المستقلين، والمنظمات الصحية الصغيرة المشاركة في أبحاث تحسين الجودة.
المصادر: