Το Πρόβλημα Όγκου στην Κλινική Έρευνα
Ένας οργανισμός κλινικής έρευνας που δημιουργεί ένα απο-ταυτοποιημένο σύνολο δεδομένων από 500.000 σημειώσεις συνεδριών ασθενών αντιμετωπίζει ένα χάσμα που τα cloud-based εργαλεία απο-ταυτοποίησης δεν μπορούν να καλύψουν: ο όγκος είναι πολύ μεγάλος για ανάρτηση στο cloud, το ρυθμιστικό περιβάλλον απαιτεί on-premises επεξεργασία και η χειροκίνητη εναλλακτική δεν είναι εφικτή.
Η μέθοδος Expert Determination του κανόνα απορρήτου HIPAA απαιτεί ότι τα απο-ταυτοποιημένα σύνολα δεδομένων φέρουν «πολύ μικρό κίνδυνο» επανα-ταυτοποίησης. Η τεκμηρίωση σημαίνει ότι η απο-ταυτοποίηση δεν μπορεί να είναι μια διαδικασία black-box: ο ερευνητικός οργανισμός πρέπει να μπορεί να εξηγήσει ακριβώς τι ανιχνεύτηκε, τι αφαιρέθηκε και πώς επικυρώθηκε η διαδικασία.
Η cloud επεξεργασία 500.000 κλινικών σημειώσεων εγείρει δύο ξεχωριστές ανησυχίες. Πρώτον, πρακτική: η ανάρτηση 500.000 αρχείων μέσω οποιουδήποτε API έχει περιορισμούς ρυθμού, εύρους ζώνης και κόστους. Δεύτερον, ρυθμιστική: υπό HIPAA, η μετάδοση PHI σε Business Associate απαιτεί Συμφωνία Business Associate.
Τοπική Εγκατάσταση για Κλινικές Σημειώσεις
Η τοπική αρχιτεκτονική χρησιμοποιεί τις μηχανές ανίχνευσης Presidio που εκτελούνται στο υλικό του ερευνητικού οργανισμού, με μοντέλα γλώσσας spaCy φορτωμένα τοπικά, χωρίς να μεταδίδεται το περιεχόμενο σημειώσεων σε εξωτερικούς servers.
Βήμα 2: Διαμόρφωση Αναγνωριστών HIPAA
Διαμόρφωση τύπων οντοτήτων για HIPAA Safe Harbor:
- PERSON (ονόματα ασθενών, ονόματα μελών οικογένειας που αναφέρονται στις σημειώσεις)
- US_SSN
- US_MEDICAL_RECORD_NUMBER
- PHONE_NUMBER
- EMAIL_ADDRESS
- URL
- IP_ADDRESS
- LOCATION
- DATE (όλες οι κλινικές ημερομηνίες)
Πηγές: