By · Last updated 2026-04-28

Kembali ke BlogKesehatan

18 Pengidentifikasi HIPAA yang Dilewatkan Alat Anda

HIPAA mencantumkan 18 pengidentifikasi PHI. Sebagian besar alat anonimisasi mungkin hanya mendeteksi 6 di antaranya. Medical Record Number bervariasi per institusi tanpa format standar AS.

April 28, 20269 menit baca
HIPAA 18 identifiersPHI complete detectionMRN detectionNPI DEA numbersHIPAA Safe Harbor compliance

18 Pengidentifikasi HIPAA yang Dilewatkan Alat Anda

Diperbarui untuk 2026.

HIPAA mencantumkan 18 kategori pengidentifikasi PHI. Sebagian besar alat anonimisasi mungkin hanya mendeteksi enam. Dua belas lainnya lolos — dan masing-masing adalah celah kepatuhan.

Aturan Safe Harbor

HIPAA's Privacy Rule (45 CFR § 164.514) mendefinisikan de-identifikasi Safe Harbor. Semua 18 kategori pengidentifikasi harus dihapus. Hapus semuanya dan data tersebut secara hukum telah de-identifikasi. Inilah mengapa Safe Harbor populer: ini lulus atau gagal, bukan penilaian subjektif.

18 kategorinya adalah:

  1. Nama
  2. Data geografis lebih kecil dari negara bagian — alamat jalan, kota, kabupaten, kode pos
  3. Tanggal kecuali tahun — lahir, masuk, keluar, meninggal
  4. Nomor telepon
  5. Nomor faks
  6. Alamat email
  7. Nomor Jaminan Sosial
  8. Pengidentifikasi rekam medis (MRN)
  9. Nomor penerima manfaat rencana kesehatan
  10. Pengidentifikasi akun
  11. Nomor sertifikat dan lisensi
  12. Pengidentifikasi kendaraan dan nomor seri
  13. Pengidentifikasi perangkat dan nomor seri
  14. URL web
  15. Alamat IP
  16. Pengidentifikasi biometrik — sidik jari, voiceprint
  17. Foto wajah penuh dan gambar serupa
  18. Kode atau nilai pengenal unik lainnya

Sebagian besar alat menangani kategori 1, 4, 6, dan 7 dengan baik. Mereka secara rutin melewatkan 8, 9, 10, 11, 13, dan 18.

Kesenjangan MRN

Pengidentifikasi rekam medis berada di kategori 8. Format MRN ditetapkan oleh setiap rumah sakit. Tidak ada standar nasional AS.

Rumah Sakit A menggunakan bilangan bulat 7 digit. Rumah Sakit B menggunakan "PT-YYYYNNNN." Rumah Sakit C menggunakan string alfanumerik 8 karakter. Rumah Sakit D menulis "MRN: " sebelum kode 9 digit.

Alat generik tidak akan menandai "PT-2024-8847" sebagai PHI. Dokumen lolos pemeriksaan de-identifikasi. Tetapi itu belum de-identifikasi. Tidak ada peringatan yang muncul. Tim mengira pekerjaan sudah selesai. Padahal belum.

Inilah jenis kesenjangan yang paling berbahaya: yang tidak terlihat.

Tiga Cara untuk Memperbaikinya

Kode dalam Presidio. Ini membutuhkan keahlian Python dan pemeliharaan berkelanjutan. Berhasil tetapi membutuhkan waktu.

Tambahkan tinjauan manual. Seseorang memeriksa setiap dokumen untuk MRN. Ini tidak dapat diskalakan.

Gunakan pembuatan entitas kustom berbantuan AI. Tidak perlu kode. Tim memberikan contoh nilai. AI membangun polanya.

Berikut cara kerjanya. Tim memberikan lima contoh nilai MRN: SVHS-0012345, SVHS-0987654, SVHS-1122334, SVHS-4455667, SVHS-8899001. AI mengembalikan SVHS-\d{7} dan memverifikasinya terhadap sampel. Tim menyimpannya ke preset HIPAA mereka. Semua sesi mendatang mendeteksi format ini. Pendekatan yang sama berlaku untuk kode penerima manfaat dan nomor seri perangkat.

Lihat cara kerja preset dalam panduan deteksi MRN HIPAA. Pelajari tentang alur kerja pola AI.

Asumsi Tersembunyi

Banyak tim menguji pada dokumen sampel dengan nama dan nomor telepon. Alat lulus. Mereka mengasumsikan cakupan penuh. Tetapi sampel jarang menyertakan pengidentifikasi spesifik institusi. MRN dan kode penerima manfaat tampak seperti string acak bagi alat generik. Mereka lolos tanpa tanda.

Audit Safe Harbor yang sesungguhnya memetakan semua 18 kategori ke metode deteksi. Untuk kategori 8, verifikasi dengan sampel MRN nyata dari rumah sakit Anda sendiri. Jangan asumsikan alat mengetahui format Anda.

Tinjau kerangka lengkap dalam ikhtisar kepatuhan HIPAA kami.

Kesimpulan

Safe Harbor mensyaratkan semua 18 kategori pengidentifikasi dihapus. Alat generik mencakup jauh lebih sedikit. Kesenjangan — MRN, kode penerima manfaat, nomor seri perangkat — tidak memiliki format standar, sehingga alat generik melewatkannya. Entitas kustom berbantuan AI menutup kesenjangan tanpa kode atau tinjauan manual.

Sumber

  • HHS: HIPAA Safe Harbor, 45 CFR § 164.514 — hhs.gov. VERIFIED.
  • Shaip: Jenis pengidentifikasi PHI dalam de-identifikasi layanan kesehatan — shaip.com. VERIFIED-EXTERNAL.
  • HHS OCR: Panduan de-identifikasi diperbarui 2024 — hhs.gov. VERIFIED.

Siap untuk melindungi data Anda?

Mulai anonimisasi PII dengan 285+ jenis entitas dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.