O problema dos formatos MRN
Os Estados Unidos têm cerca de 6.100 hospitais. Cada um opera seu próprio sistema EHR. Cada um usa seu próprio formato de número de prontuário médico (Medical Record Number). Não existe padrão nacional. A Joint Commission exige apenas que os sistemas identifiquem pacientes de forma única — não como.
Os formatos variam muito. Alguns são inteiros de 7 dígitos. Outros de 8 dígitos. Alguns usam prefixos como HOSP-, MRN- ou PT-. Outros adicionam códigos de instituição como SVHS- ou CHOP-. Alguns incorporam o ano de admissão no número.
O HIPAA Safe Harbor classifica os números de prontuário como identificador tipo 8 de 18. (45 CFR §164.514(b)(2)) Todos os 18 devem ser removidos. A norma não limita nenhum formato. Se seu hospital usa um formato personalizado, ele deve ser detectado. Uma ferramenta que o perde falha no Safe Harbor — mesmo que remova os outros 17 tipos.
Por que a abordagem com código falha
A forma padrão de adicionar um formato de número personalizado a um pipeline de desidentificação é estender o Microsoft Presidio. Isso significa escrever Python.
Um desenvolvedor cria uma classe que estende EntityRecognizer. Ele escreve o regex, integra ao registro do Presidio, testa e mantém. Para equipes de conformidade — que raramente programam — isso é um bloqueio duro. Cada mudança de formato precisa de um engenheiro.
As equipes de engenharia na área de saúde estão ocupadas. Gerenciam integração EHR e sistemas clínicos. Ferramentas de conformidade raramente são prioridade.
O fluxo de trabalho sem código
A abordagem guiada remove a etapa de programação.
Um responsável de conformidade abre o Custom Entity Creator no aplicativo web. Cola cinco números de exemplo do seu sistema — por exemplo:
SVHS-0012345
SVHS-0987654
SVHS-1122334
SVHS-4455667
SVHS-8899001
Clica em Gerar padrão. A IA lê a estrutura e retorna:
- Padrão:
SVHS-\d{7} - Confiança: alta
- Nome sugerido:
HOSPITAL-MRN - Substituição sugerida:
[MRN]
O responsável cola mais cinco exemplos. O padrão passa. Ele salva no preset HIPAA.
A partir daí, cada sessão — aplicativo web, suplemento do Office, aplicativo desktop e API — detecta esse formato no passo PHI padrão. Sem código.
Nota sobre GDPR e pesquisa
O artigo 89 do GDPR exige pseudonimização para conjuntos de dados de pesquisa. Entidades personalizadas garantem que identificadores específicos da instituição estejam no escopo — fechando a lacuna que ferramentas genéricas deixam aberta para formatos proprietários.
O que você obtém
Este fluxo de trabalho leva uma tarde. Código personalizado leva semanas.
O responsável de conformidade define o padrão, testa e implanta. Sem ticket. Sem espera. O preset contém a entidade personalizada ao lado dos 17 identificadores padrão do Safe Harbor.
No próximo lote de notas clínicas, todos os 18 tipos de identificadores estão cobertos. Safe Harbor está completo.
Ver desidentificação HIPAA Safe Harbor para pesquisa em saúde. Para padrões de detecção específicos por hospital: detectar formatos MRN hospitalares sem programar.