18 identyfikatorów HIPAA, które twoje narzędzie pomija
Zaktualizowano na rok 2026.
HIPAA wyróżnia 18 kategorii identyfikatorów PHI. Większość narzędzi do anonimizacji wykrywa może sześć z nich. Pozostałe dwanaście prześlizguje się niezauważone — a każde z nich to luka w zgodności z przepisami.
Reguła Safe Harbor
Prawa prywatności HIPAA (45 CFR § 164.514) definiują metodę deidentyfikacji Safe Harbor. Wszystkie 18 kategorii identyfikatorów musi zostać usunięte. Usunięcie każdej z nich sprawia, że dane są prawnie uznawane za zdeidentyfikowane. Właśnie dlatego metoda Safe Harbor jest popularna: jest to decyzja zerojedynkowa — spełniasz wymagania albo nie.
18 kategorii to:
- Imiona i nazwiska
- Dane geograficzne mniejsze niż stan — adres, miasto, powiat, kod pocztowy
- Daty inne niż rok — urodzenie, przyjęcie, wypisanie, śmierć
- Numery telefonów
- Numery faksów
- Adresy e-mail
- Numery ubezpieczenia społecznego (SSN)
- Numery dokumentacji medycznej (MRN)
- Numery beneficjentów planów zdrowotnych
- Numery kont
- Numery certyfikatów i licencji
- Identyfikatory pojazdów i numery seryjne
- Identyfikatory urządzeń i numery seryjne
- Adresy URL
- Adresy IP
- Identyfikatory biometryczne — odciski palców, wzorce głosu
- Pełne zdjęcia twarzy i podobne wizerunki
- Wszelkie inne unikalne kody lub wartości identyfikujące
Większość narzędzi dobrze radzi sobie z kategoriami 1, 4, 6 i 7. Rutynowo pomijają jednak kategorie 8, 9, 10, 11, 13 i 18.
Luka w zakresie MRN
Numer dokumentacji medycznej należy do kategorii 8. Format MRN ustalany jest przez każdy szpital osobno. Nie istnieje żaden ogólnokrajowy standard w USA.
Szpital A stosuje 7-cyfrową liczbę całkowitą. Szpital B używa formatu „PT-RRRRNNNN”. Szpital C stosuje 8-znakowy ciąg alfanumeryczny. Szpital D poprzedza 9-cyfrowy kod sekwencją „MRN: ”.
Generyczne narzędzie nie oznaczy wartości „PT-2024-8847” jako PHI. Dokument przejdzie kontrolę deidentyfikacji. Ale w rzeczywistości nie zostanie zdeidentyfikowany. Żaden alarm nie zostanie wyzwolony. Zespół uzna zadanie za wykonane. A tak nie jest.
To najgorszy możliwy rodzaj luki: cicha.
Trzy sposoby na jej naprawienie
Implementacja w Presidio. Wymaga znajomości Pythona i bieżącej obsługi. Działa, ale kosztuje czas.
Ręczna weryfikacja. Człowiek sprawdza każdy dokument pod kątem MRN. Rozwiązanie nie jest skalowalne.
Tworzenie niestandardowych encji wspomagane przez AI. Nie wymaga kodu. Zespół podaje przykładowe wartości, a AI buduje wzorzec.
Oto jak to działa. Zespół dostarcza pięć przykładowych wartości MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI zwraca SVHS-\d{7} i weryfikuje wzorzec na próbkach. Zespół zapisuje go do presetu HIPAA. Wszystkie kolejne sesje będą wykrywać ten format. To samo podejście działa dla kodów beneficjentów i numerów seryjnych urządzeń.
Dowiedz się więcej o presetach w przewodniku po wykrywaniu MRN HIPAA. Przeczytaj o procesie tworzenia wzorców AI.
Ukryte założenie
Wiele zespołów testuje narzędzie na przykładowym dokumencie zawierającym imię i numer telefonu. Narzędzie zdaje test. Zakładają pełne pokrycie. Ale próbki rzadko obejmują identyfikatory specyficzne dla danej instytucji. MRN i kody beneficjentów wyglądają dla generycznego narzędzia jak losowe ciągi znaków. Przechodzą bez ostrzeżenia.
Rzeczywisty audyt Safe Harbor przypisuje każdą z 18 kategorii do konkretnej metody wykrywania. Dla kategorii 8 należy przeprowadzić weryfikację na rzeczywistych próbkach MRN z własnego szpitala. Nie wolno zakładać, że narzędzie zna twój format.
Zapoznaj się z pełnym zestawem zasad w naszym przeglądzie zgodności z HIPAA.
Podsumowanie
Metoda Safe Harbor wymaga usunięcia wszystkich 18 kategorii identyfikatorów. Generyczne narzędzia obejmują znacznie mniej. Luki — MRN, kody beneficjentów, numery seryjne urządzeń — nie mają standardowego formatu, więc narzędzia je pomijają. Niestandardowe encje tworzone wspomagane przez AI zamykają tę lukę bez pisania kodu i bez ręcznej weryfikacji.
Źródła
- HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. ZWERYFIKOWANO.
- Shaip: Typy identyfikatorów PHI w deidentyfikacji danych medycznych — shaip.com. ZWERYFIKOWANO ZEWNĘTRZNIE.
- HHS OCR: Wytyczne dotyczące deidentyfikacji zaktualizowane w 2024 r. — hhs.gov. ZWERYFIKOWANO.