Wykrywanie MRN zgodne z HIPAA bez doktoratu z wyrażeń regularnych

Format MRN Twojego szpitala nie jest uwzględniony w żadnym standardowym narzędziu PII. Oto jak go dodać w pięć minut — bez kodowania.

Zespoły IT w ochronie zdrowia stoją przed problemem związanym z HIPAA, którego inne branże nie mają. Identyfikator, który najbardziej potrzebują wykrywać — numer dokumentacji medycznej (MRN) — jest ustalany przez sam szpital. Nie istnieje żaden krajowy standard.

Każdy projekt de-identyfikacji zgodny z HIPAA wymaga niestandardowej konfiguracji. Bez niej numery MRN prześlizgują się przez pozornie zidentyfikowane pliki niezauważone.

Problem z formatami MRN w sieci wieloplacówkowej

Sieci szpitalne budowane przez przejęcia dysponują starszymi systemami EHR. Każdy system ma własny format MRN:

Memorial Hospital (Epic): MRN:XXXXXXX — 7-cyfrowy numer z prefiksem
St. Mary's (Cerner): PT-YYYYY — 5-cyfrowy z prefiksem pacjenta
University Hospital (Meditech): UHN-XXXXXXXXXX — 10-znakowa mieszana forma
Przychodnia (autonomiczny EMR): C\d{5} — litera C plus 5 cyfr

HIPAA Safe Harbor wymaga usunięcia wszystkich 18 typów identyfikatorów. Kategoria 8 to numery dokumentacji medycznej. Narzędzie nieznające Twojego formatu je pominie. Plik będzie wyglądał na czysty. Nie będzie.

Społeczność ServiceNow ds. ochrony zdrowia odnotowała dokładnie ten problem. Standardowe narzędzia wychwytują numery PESEL/SSN i numery telefonów. Numery MRN specyficzne dla placówki pomijają za każdym razem.

Bariera wyrażeń regularnych

Dodanie niestandardowych reguł do Microsoft Presidio — open-source'owej podstawy wielu narzędzi HIPAA — wymaga prawdziwych umiejętności:

Musisz znać klasę PatternRecognizer
Musisz pisać wyrażenia regularne w składni Pythona
Musisz konfigurować pliki YAML
Musisz dostrajać progi ufności
Musisz testować i debugować skrypty Pythona

Specjalista ds. compliance, który zna format MRN, nie może zrobić tego samodzielnie. Rozwiązanie trafia do kolejki inżynierskiej. Czeka tam 6-8 tygodni. Luka pozostaje otwarta.

Generowanie wzorców wspomagane AI

Istnieje szybsza droga. Opisz wzorzec prostymi słowami. Otrzymaj działające wyrażenie regularne.

Kroki:

Otwórz konstruktor niestandardowych encji
Podaj przykłady: nasze numery MRN wyglądają tak: MRN:1234567, MRN:9876543, MRN:0001234
AI buduje regułę: MRN:\d{7}
Przetestuj na 10 przykładowych rekordach
Wszystkie MRN znalezione? Zapisz i wdróż.

Dla sieci z czterema formatami MRN:

Memorial Hospital: MRN:\d{7}
St. Mary's: PT-\d{5}
University Hospital: UHN-[A-Z0-9]{10}
Przychodnia: C\d{5}

Utwórz cztery niestandardowe encje. Zgrupuj je w preset. Uruchom na wszystkich plikach. Czas: jedno popołudnie.

Pełny przewodnik znajdziesz w artykule niestandardowe wykrywanie MRN w pipeline'ach HIPAA bez kodowania.

Walidacja na potrzeby Safe Harbor

HIPAA Safe Harbor stanowi, że podmiot objęty przepisami nie może mieć rzeczywistej wiedzy o tym, że dane mogą identyfikować osobę (45 CFR § 164.514(b)).

Walidacja dowodzi, że Twoje niestandardowe reguły obejmują wszystkie 18 typów identyfikatorów.

Krok 1: Pobierz próbki. Pobierz 100 rekordów z każdej placówki. Uwzględnij różne okresy i oddziały.

Krok 2: Uruchom wykrywanie. Przetwórz wszystkie 400 dokumentów z Twoimi niestandardowymi regułami.

Krok 3: Ręczna kontrola. Przejrzyj 20 dokumentów ręcznie (próba 5%). Szukaj pominiętych MRN i fałszywych trafień.

Krok 4: Udoskonalaj reguły. Pominięte MRN? Rozszerz wzorzec. Za dużo fałszywych trafień? Dodaj ograniczniki słów.

Krok 5: Udokumentuj. Zapisz regułę, wielkość próby, wyniki i datę. Ten zapis to Twoja dokumentacja Safe Harbor.

O tym, co dokumentować — patrz wytłumaczalna redakcja i ścieżki audytu HIPAA.

Pełne pokrycie Safe Harbor

Po naprawieniu wykrywania MRN sprawdź wszystkie 18 kategorii.

Kategoria	Standardowe narzędzia	Niestandardowe potrzebne?
1. Imiona i nazwiska	Model NER	Nie
2. Dane geograficzne	Wykrywanie lokalizacji	Nie dla stanu; Tak dla kodów placówek
3. Daty	Wykrywanie dat	Nie
4. Numery telefonów	Wykrywanie telefonów	Nie
5. Numery faksów	Wykrywanie telefonów	Nie
6. Adresy e-mail	Wykrywanie e-mail	Nie
7. Numery PESEL/SSN	Wykrywanie SSN	Nie
8. Numery dokumentacji medycznej	Nie wbudowane	Tak — specyficzne dla placówki
9. Numery ubezpieczenia zdrowotnego	Częściowe	Często tak — specyficzne dla płatnika
10. Numery kont	Częściowe	Często tak — format rozliczeniowy
11. Numery licencji	Częściowe	Często tak — specyficzne dla stanu
12. Identyfikatory pojazdów	Częściowe	Rzadko w dokumentach klinicznych
13. Identyfikatory urządzeń	Częściowe	Tak, jeśli urządzenia są w rekordach
14. Adresy URL	Wykrywanie URL	Nie
15. Adresy IP	Wykrywanie IP	Nie
16. Identyfikatory biometryczne	Kontekst tekstowy	Rzadko w epikryzach
17. Zdjęcia twarzy	Tylko obraz	Poza zakresem tekstu
18. Inne unikalne identyfikatory	Nie wbudowane	Tak — specyficzne dla placówki

Dla tekstu klinicznego kategorie 8, 9, 10 i 18 najczęściej wymagają niestandardowej konfiguracji.

Kontekst dokumentów klinicznych

Epikryzy, notatki kliniczne i protokoły operacyjne to główne pliki udostępniane do celów badawczych. Zawierają:

Numery MRN w nagłówkach i stopkach
Numery kont w sekcjach rozliczeniowych
Daty wszystkich zdarzeń — przyjęcia, zabiegu, badań, leków
Imiona i nazwiska lekarzy oraz numery DEA
Dane lekarzy kierujących
Numery ubezpieczenia zdrowotnego

Niestandardowe reguły dla formatów specyficznych dla placówki uzupełniają wbudowane reguły dla formatów standardowych. Razem zapewniają pełne pokrycie Safe Harbor.

Podsumowanie

De-identyfikacja HIPAA bez niestandardowych reguł nie jest de-identyfikacją Safe Harbor. Każdy szpital ma unikalny format MRN. Standardowe narzędzia je pomijają. Luka w zgodności jest realna i pozostaje otwarta, dopóki jej nie zamkniesz.

Generowanie wzorców wspomagane AI skraca czas naprawy z 6-8 tygodni pracy inżynierskiej do jednego popołudnia pracy compliance'owej. Opisz format. Przetestuj na prawdziwych rekordach. Wdróż. Gotowe.

Źródła

Pokrewne artykuły

Służba zdrowia

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

Rozpocznij bezpłatny okres próbny Zobacz funkcje

Wykrywanie MRN zgodne z HIPAA bez doktoratu z wyrażeń regularnych