ব্লগে ফিরে যানস্বাস্থ্যসেবা

PHI সনাক্তকরণ নির্ভুলতা: John Snow Labs ०६% বনাম...

সমস্ত ডি-শনাক্তকরণ সরঞ্জাম সমান নয়। ECIR २०२५ বেঞ্চমার্ক F१ স্কোর ००% থেকে ०६% পর্যন্ত দেখায়। নির্ভুলতা কেন গুরুত্বপূর্ণ এবং কিভাবে সরঞ্জাম...

February 24, 20267 মিনিট পড়া
PHI detectionde-identificationNER accuracyHIPAAbenchmarks

সমস্ত ডি-শনাক্তকরণ সরঞ্জাম সমান নয়

PHI ডি-শনাক্তকরণ সরঞ্জাম মূল্যায়ন করলে, নির্ভুলতা সবকিছু। সনাক্তকরণ হারে ৪% পার্থক্য ছোট মনে হতে পারে—যতক্ষণ না আপনি বুঝতে পারেন যে একটি মিলিয়ন-রেকর্ড ডেটাসেটের ৪% ४०,००० এক্সপোজড রেকর্ড

ECIR २०२५ থেকে সাম্প্রতিক বেঞ্চমার্ক শীর্ষস্থানীয় সরঞ্জাম জুড়ে PHI সনাক্তকরণ নির্ভুলতায় নাটকীয় পার্থক্য প্রকাশ করে।

ECIR २००२५ বেঞ্চমার্ক ফলাফল

সরঞ্জামF१-স্কোরনির্ভুলতাস্মরণ
John Snow Labs०६%०५%०७%
Azure AI०१%०० %०२%
AWS Comprehend চিকিৎসা८३%८१%८५%
GPT-४o०१%०२%०६%

F१-স্কোর নির্ভুলতা (কতটি সনাক্ত সত্তা সঠিক ছিল) এবং স্মরণ (কতটি প্রকৃত সত্তা সনাক্ত করা হয়েছিল) একত্রিত করে। উভয় গুরুত্বপূর্ণ:

  • নিম্ন নির্ভুলতা = মিথ্যা ইতিবাচক (অধিক-রিডেকশন)
  • নিম্ন স্মরণ = মিথ্যা নেতিবাচক (মিস্ড PII = লঙ্ঘন)

কেন ব্যবধান বিদ্যমান

প্রশিক্ষণ ডেটা পার্থক্য

সরঞ্জামপ্রশিক্ষণ ফোকাস
John Snow Labsস্বাস্থ্যসেবা-নির্দিষ্ট, ক্লিনিক্যাল নোট
Azure AIসাধারণ চিকিৎসা + ক্লিনিক্যাল
AWS Comprehendসাধারণ চিকিৎসা সত্তা
GPT-४oবিস্তৃত প্রশিক্ষণ, স্বাস্থ্যসেবা-নির্দিষ্ট নয়

John Snow Labs এর মডেলগুলি ক্লিনিক্যাল ডকুমেন্টেশন-এর জন্য বিশেষভাবে প্রশিক্ষিত, যা স্বাস্থ্যসেবা আসলে উৎপাদন করে—সংক্ষিপ্ত, প্রসঙ্গ-নির্ভর পাঠ্য।

সত্তা প্রকার কভারেজ

সমস্ত সরঞ্জাম একই সত্তা সনাক্ত করে না:

| সত্তা | John Snow | Azure | AWS | GPT-४o | |--------|-----------|-------|-----|------...

আপনার তথ্য সুরক্ষিত করতে প্রস্তুত?

48 ভাষায় 285+ সত্তা প্রকারের সাথে PII অ্যানোনিমাইজ করা শুরু করুন।