By · Last updated 2026-02-24

Kembali ke BlogPenjagaan Kesihatan

Pengesanan PHI: Snow Labs 96% lwn GPT-4o

Bukan semua alat penyah-pengenalan adalah sama. Penanda aras ECIR 2025 menunjukkan skor F1 antara 79% hingga 96%. Ketahui mengapa ketepatan penting dan cara menilai alat tersebut.

February 24, 20267 min baca
PHI detectionde-identificationNER accuracyHIPAAbenchmarks

Dikemas kini untuk 2026

Bukan Semua Alat Penyah-Pengenalan Adalah Sama

Ketepatan adalah satu-satunya metrik yang penting untuk penyah-pengenalan PHI. Jurang 4% kelihatan kecil. Pada satu juta rekod, itu bermakna 40,000 pesakit terdedah.

Penanda aras ECIR 2025 menunjukkan jurang ketepatan yang besar antara alat-alat terkemuka. Keputusan ini sepatutnya membentuk setiap keputusan pembelian dalam sektor penjagaan kesihatan.

Keputusan Penanda Aras ECIR 2025

<!-- VERIFIED-EXTERNAL: John Snow Labs ECIR 2025 Text2Story Workshop paper -->
AlatSkor F1PresisiPanggil Balik
John Snow Labs96%95%97%
Azure AI91%90%92%
AWS Comprehend Medical83%81%85%
GPT-4o79%82%76%

Skor F1 menggabungkan dua perkara. Presisi: berapa banyak item yang ditanda adalah PHI sebenar. Panggil balik: berapa banyak item PHI sebenar yang ditemui.

  • Presisi rendah bermakna penyuntingan berlebihan dan kehilangan konteks.
  • Panggil balik rendah bermakna PHI yang terlepas — satu pelanggaran.

Mengapa Jurang Ini Wujud

Data Latihan Adalah Penting

John Snow Labs melatih pada nota klinikal. Nota-nota ini tidak kemas dan penuh dengan singkatan. GPT-4o melatih pada campuran teks yang luas. Ia tidak dibina untuk data klinikal.

AlatFokus Latihan
John Snow LabsKhusus penjagaan kesihatan, nota klinikal
Azure AIPerubatan umum + klinikal
AWS Comprehend MedicalEntiti perubatan umum
GPT-4oLatihan luas, bukan khusus penjagaan kesihatan

Liputan Entiti Berbeza

Tidak setiap alat menemui jenis PHI yang sama.

EntitiJohn SnowAzureAWSGPT-4o
Nama pesakitYaYaYaYa
Nombor rekod perubatanYaYaTerhadTerhad
Dos ubatanYaYaYaSepara
Kod prosedurYaYaTerhadTidak
Singkatan klinikalYaSeparaTidakSepara
Nama ahli keluargaYaYaSeparaSepara

Konteks Sukar Untuk Ditangani

Ambil nota klinikal ini:

"Pesakit melaporkan mengambil ubat Smith. Dr. Johnson mengesyorkan peningkatan dos."

Alat PHI yang baik mesti melakukan tiga perkara di sini:

  1. Membaca "Smith" sebagai nama jenama, bukan pesakit.
  2. Menanda "Dr. Johnson" sebagai nama pembekal untuk disunting.
  3. Mengetahui "Pesakit" adalah label peranan, bukan nama.

GPT-4o terlepas kes-kes ini. Itu menolak panggil balik kepada 76%.

Kos Ketepatan Rendah

Beralih dari 79% kepada 96% mengurangkan pendedahan sebanyak 170,000 rekod setiap juta yang diproses.

<!-- VERIFIED: arithmetic derived from ECIR 2025 benchmark figures -->
KetepatanRekodPendedahan PHI
96%1,000,00040,000
91%1,000,00090,000
83%1,000,000170,000
79%1,000,000210,000

Penalti HIPAA Berskala Dengan Pendedahan

<!-- VERIFIED-EXTERNAL: HIPAA Journal penalty tiers / 45 CFR 160.404 -->
TahapPuncaPenalti Setiap Pelanggaran
1Tidak sedar$100–$50,000
2Sebab munasabah$1,000–$50,000
3Cuai yang disengajakan, diperbetulkan$10,000–$50,000
4Cuai yang disengajakan, tidak diperbetulkan$50,000+

Memilih alat 79% apabila alat 96% wujud mungkin dianggap cuai yang disengajakan di bawah peraturan HHS. Jurang ini diketahui. Alat yang lebih baik ada di pasaran.

Cara Saluran Paip Hibrid Meningkatkan Ketepatan

Tiada satu kaedah pun menemui semua jenis PHI. Saluran paip hibrid menggabungkan kaedah-kaedah. Setiap satu mengisi jurang yang ditinggalkan oleh yang lain.

Teks Input
    ↓
[Corak Regex] — Data berstruktur: SSN, MRN, tarikh
    ↓
[spaCy NER] — Nama, lokasi, organisasi
    ↓
[Model Transformer] — Entiti bergantung konteks
    ↓
[Kamus Perubatan] — Terma khusus penjagaan kesihatan
    ↓
Keputusan Digabung (keyakinan tertinggi menang)
KaedahKekuatanKelemahan
RegexSempurna untuk data berstrukturTiada pengendalian konteks
spaCyPantas, entiti umumPerbendaharaan perubatan terhad
TransformerSedar konteks, panggil balik tinggiLebih perlahan
KamusTerma perubatan lengkapStatik, perlu kemas kini

Setiap kaedah menangkap apa yang lain terlepas. Lihat cara ini berfungsi dalam halaman pematuhan keselamatan dan dokumen pematuhan undang-undang.

Soalan yang Perlu Ditanya kepada Mana-mana Vendor

Sebelum anda menandatangani, tanya lima perkara:

  1. Apakah skor F1 pada nota klinikal? Dapatkan data pihak ketiga. Tolak dakwaan kabur.
  2. Jenis entiti mana? Semua 18 pengecam HIPAA Safe Harbor mesti diliputi.
  3. Bagaimana anda mengendalikan singkatan? "Pt," "Dx," dan "Hx" perlu penyelesaian yang betul.
  4. Adakah anda menangkap PHI ahli keluarga? "Ibu menghidap diabetes" adalah PHI. Banyak alat terlepas ini.
  5. Adakah anda menyokong semua format nota? Nota kemajuan, ringkasan discaj, dan laporan radiologi sangat berbeza.

Tanda amaran yang perlu diperhatikan:

  • Tiada nombor ketepatan khusus
  • Pengujian hanya pada data bersih dan berstruktur
  • Tiada data latihan penjagaan kesihatan
  • Sedikit jenis entiti
  • Tiada pengesahan HIPAA Safe Harbor

Menguji Alat Sendiri

Jalankan ujian sendiri dalam empat langkah.

Langkah 1 — Bina set data. Gunakan nota yang telah dinyah-pengenalan dari pelbagai kepakaran. Liputi semua 18 jenis HIPAA ditambah kes tepi seperti singkatan dan nama ahli keluarga.

Langkah 2 — Tetapkan piawaian emas. Pakar menanda setiap item PHI dengan jenis dan rentang tepat.

Langkah 3 — Jalankan setiap alat. Bandingkan output dengan piawaian emas. Nilai presisi, panggil balik, dan F1.

Langkah 4 — Pecah kegagalan. Kumpulkan kegagalan mengikut jenis, konteks, dan format. Ini menunjukkan di mana setiap alat gagal.

Kesimpulan

Data ECIR 2025 adalah jelas. Jurang 17 mata — 96% berbanding 79% — bermakna 170,000 rekod tambahan terdedah setiap juta. Pilihan alat adalah pemboleh ubah risiko terbesar pada skala besar.

Apabila anda memilih alat pengesanan PHI:

  • Perlukan data ketepatan khusus pada teks klinikal
  • Sahkan liputan penuh HIPAA Safe Harbor
  • Uji pada format dokumen anda sendiri
  • Pilih saluran paip hibrid berbanding alat kaedah tunggal

Baca cara tokenisasi berfungsi dalam dokumen sistem token. Soalan biasa terdapat dalam FAQ.


anonym.legal menggantikan PHI dengan token sebelum dokumen sampai ke mana-mana alat AI. Nama, tarikh, dan nombor rekod ditukar di pihak anda. Keputusan dikembalikan dengan butiran sebenar dipulihkan — hanya untuk anda. Terokai harga.

Sumber

Sedia untuk melindungi data anda?

Mulakan pengenalan PII dengan 285+ jenis entiti dalam 48 bahasa.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.