18 identyfikatorów HIPAA, które twoje narzędzie pomija

Zaktualizowano na rok 2026.

HIPAA wyróżnia 18 kategorii identyfikatorów PHI. Większość narzędzi do anonimizacji wykrywa może sześć z nich. Pozostałe dwanaście prześlizguje się niezauważone — a każde z nich to luka w zgodności z przepisami.

Reguła Safe Harbor

Prawa prywatności HIPAA (45 CFR § 164.514) definiują metodę deidentyfikacji Safe Harbor. Wszystkie 18 kategorii identyfikatorów musi zostać usunięte. Usunięcie każdej z nich sprawia, że dane są prawnie uznawane za zdeidentyfikowane. Właśnie dlatego metoda Safe Harbor jest popularna: jest to decyzja zerojedynkowa — spełniasz wymagania albo nie.

18 kategorii to:

Imiona i nazwiska
Dane geograficzne mniejsze niż stan — adres, miasto, powiat, kod pocztowy
Daty inne niż rok — urodzenie, przyjęcie, wypisanie, śmierć
Numery telefonów
Numery faksów
Adresy e-mail
Numery ubezpieczenia społecznego (SSN)
Numery dokumentacji medycznej (MRN)
Numery beneficjentów planów zdrowotnych
Numery kont
Numery certyfikatów i licencji
Identyfikatory pojazdów i numery seryjne
Identyfikatory urządzeń i numery seryjne
Adresy URL
Adresy IP
Identyfikatory biometryczne — odciski palców, wzorce głosu
Pełne zdjęcia twarzy i podobne wizerunki
Wszelkie inne unikalne kody lub wartości identyfikujące

Większość narzędzi dobrze radzi sobie z kategoriami 1, 4, 6 i 7. Rutynowo pomijają jednak kategorie 8, 9, 10, 11, 13 i 18.

Luka w zakresie MRN

Numer dokumentacji medycznej należy do kategorii 8. Format MRN ustalany jest przez każdy szpital osobno. Nie istnieje żaden ogólnokrajowy standard w USA.

Szpital A stosuje 7-cyfrową liczbę całkowitą. Szpital B używa formatu „PT-RRRRNNNN”. Szpital C stosuje 8-znakowy ciąg alfanumeryczny. Szpital D poprzedza 9-cyfrowy kod sekwencją „MRN: ”.

Generyczne narzędzie nie oznaczy wartości „PT-2024-8847” jako PHI. Dokument przejdzie kontrolę deidentyfikacji. Ale w rzeczywistości nie zostanie zdeidentyfikowany. Żaden alarm nie zostanie wyzwolony. Zespół uzna zadanie za wykonane. A tak nie jest.

To najgorszy możliwy rodzaj luki: cicha.

Trzy sposoby na jej naprawienie

Implementacja w Presidio. Wymaga znajomości Pythona i bieżącej obsługi. Działa, ale kosztuje czas.

Ręczna weryfikacja. Człowiek sprawdza każdy dokument pod kątem MRN. Rozwiązanie nie jest skalowalne.

Tworzenie niestandardowych encji wspomagane przez AI. Nie wymaga kodu. Zespół podaje przykładowe wartości, a AI buduje wzorzec.

Oto jak to działa. Zespół dostarcza pięć przykładowych wartości MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI zwraca SVHS-\d{7} i weryfikuje wzorzec na próbkach. Zespół zapisuje go do presetu HIPAA. Wszystkie kolejne sesje będą wykrywać ten format. To samo podejście działa dla kodów beneficjentów i numerów seryjnych urządzeń.

Dowiedz się więcej o presetach w przewodniku po wykrywaniu MRN HIPAA. Przeczytaj o procesie tworzenia wzorców AI.

Ukryte założenie

Wiele zespołów testuje narzędzie na przykładowym dokumencie zawierającym imię i numer telefonu. Narzędzie zdaje test. Zakładają pełne pokrycie. Ale próbki rzadko obejmują identyfikatory specyficzne dla danej instytucji. MRN i kody beneficjentów wyglądają dla generycznego narzędzia jak losowe ciągi znaków. Przechodzą bez ostrzeżenia.

Rzeczywisty audyt Safe Harbor przypisuje każdą z 18 kategorii do konkretnej metody wykrywania. Dla kategorii 8 należy przeprowadzić weryfikację na rzeczywistych próbkach MRN z własnego szpitala. Nie wolno zakładać, że narzędzie zna twój format.

Zapoznaj się z pełnym zestawem zasad w naszym przeglądzie zgodności z HIPAA.

Podsumowanie

Metoda Safe Harbor wymaga usunięcia wszystkich 18 kategorii identyfikatorów. Generyczne narzędzia obejmują znacznie mniej. Luki — MRN, kody beneficjentów, numery seryjne urządzeń — nie mają standardowego formatu, więc narzędzia je pomijają. Niestandardowe encje tworzone wspomagane przez AI zamykają tę lukę bez pisania kodu i bez ręcznej weryfikacji.

Źródła

HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. ZWERYFIKOWANO.
Shaip: Typy identyfikatorów PHI w deidentyfikacji danych medycznych — shaip.com. ZWERYFIKOWANO ZEWNĘTRZNIE.
HHS OCR: Wytyczne dotyczące deidentyfikacji zaktualizowane w 2024 r. — hhs.gov. ZWERYFIKOWANO.

Pokrewne artykuły

Służba zdrowia

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.

Rozpocznij bezpłatny okres próbny Zobacz funkcje

18 identyfikatorów HIPAA, które twoje narzędzie pomija