By · Last updated 2026-04-28

Torna al BlogSanità

18 Identificatori HIPAA che il Tuo Strumento Non Rileva

L'HIPAA elenca 18 identificatori PHI. La maggior parte degli strumenti di anonimizzazione ne rileva forse 6. I Medical Record Number variano per istituzione senza un formato standard negli USA.

April 28, 20269 min di lettura
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

18 Identificatori HIPAA che il Tuo Strumento Non Rileva

Aggiornato per il 2026.

L'HIPAA elenca 18 categorie di identificatori PHI. La maggior parte degli strumenti di anonimizzazione ne rileva forse sei. Le altre dodici passano inosservate — e ognuna rappresenta una lacuna di conformità.

La Regola Safe Harbor

L'HIPAA Privacy Rule (45 CFR § 164.514) definisce la de-identificazione Safe Harbor. Tutte e 18 le categorie di identificatori devono essere rimosse. Eliminarle tutte rende i dati de-identificati per legge. È questo il motivo per cui il Safe Harbor è così diffuso: è un criterio binario, non una valutazione discrezionale.

Le 18 categorie sono:

  1. Nomi
  2. Dati geografici inferiori allo stato — indirizzo, città, contea, CAP
  3. Date diverse dall'anno — nascita, ammissione, dimissione, decesso
  4. Numeri di telefono
  5. Numeri di fax
  6. Indirizzi email
  7. Numeri di previdenza sociale
  8. Identificatori del cartellino clinico (MRN)
  9. Codici del beneficiario del piano sanitario
  10. Identificatori di conto
  11. Numeri di certificato e licenza
  12. Identificatori e numeri di serie dei veicoli
  13. Identificatori e numeri di serie dei dispositivi
  14. URL web
  15. Indirizzi IP
  16. Identificatori biometrici — impronte digitali, voceprint
  17. Fotografie del viso e immagini simili
  18. Qualsiasi altro codice o valore identificativo univoco

La maggior parte degli strumenti gestisce bene le categorie 1, 4, 6 e 7. Le categorie 8, 9, 10, 11, 13 e 18 vengono sistematicamente tralasciate.

La Lacuna degli MRN

Gli identificatori del cartellino clinico rientrano nella categoria 8. I formati degli MRN sono stabiliti da ciascun ospedale. Non esiste uno standard nazionale negli USA.

L'Ospedale A usa un intero a 7 cifre. L'Ospedale B usa "PT-YYYYNNNN". L'Ospedale C usa una stringa alfanumerica a 8 caratteri. L'Ospedale D scrive "MRN: " prima di un codice a 9 cifre.

Uno strumento generico non contrassegnerà "PT-2024-8847" come PHI. Il documento supera i controlli di de-identificazione. Ma non è de-identificato. Nessun avviso scatta. Il team ritiene il lavoro completato. Non lo è.

Questa è la peggiore tipologia di lacuna: quella silenziosa.

Tre Modi per Risolverla

Codificare in Presidio. Richiede competenze Python e manutenzione continua. Funziona, ma richiede tempo.

Aggiungere revisione manuale. Una persona controlla ogni documento alla ricerca di MRN. Non è scalabile.

Usare la creazione di entità personalizzate assistita dall'IA. Nessun codice necessario. Il team fornisce valori di esempio. L'IA costruisce il pattern.

Ecco come funziona. Un team fornisce cinque MRN di esempio: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. L'IA restituisce `SVHS-\d{7}` e lo verifica rispetto agli esempi. Il team lo salva nel proprio preset HIPAA. Tutte le sessioni successive rilevano il formato. Lo stesso approccio funziona per i codici dei beneficiari e i numeri di serie dei dispositivi.

Scopri come funzionano i preset nella guida al rilevamento degli MRN HIPAA. Leggi il flusso di lavoro per i pattern IA.

Il Presupposto Nascosto

Molti team effettuano test su un documento campione contenente un nome e un numero di telefono. Lo strumento supera il test. Si assume una copertura completa. Ma i campioni raramente includono identificatori specifici dell'istituzione. Gli MRN e i codici dei beneficiari sembrano stringhe casuali a uno strumento generico. Passano senza essere segnalati.

Un audit Safe Harbor autentico mappa tutte le 18 categorie su un metodo di rilevamento. Per la categoria 8, verifica con MRN reali provenienti dal tuo ospedale. Non presumere che lo strumento conosca il tuo formato.

Esamina il framework completo nella nostra panoramica sulla conformità HIPAA.

Conclusione

Il Safe Harbor richiede la rimozione di tutte e 18 le categorie di identificatori. Gli strumenti generici ne coprono molte meno. Le lacune — MRN, codici dei beneficiari, numeri di serie dei dispositivi — non hanno un formato standard, quindi gli strumenti generici le ignorano. Le entità personalizzate assistite dall'IA colmano questa lacuna senza codice né revisione manuale.

Fonti

  • HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFIED.
  • Shaip: tipi di identificatori PHI nella de-identificazione sanitaria — shaip.com. VERIFIED-EXTERNAL.
  • HHS OCR: guida alla de-identificazione aggiornata 2024 — hhs.gov. VERIFIED.

Pronto a proteggere i tuoi dati?

Inizia ad anonimizzare i PII con oltre 285 tipi di entità in 48 lingue.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.