Die Handgeskrebene OCR-Probleem
Gesondheids- en versekeringsinstellinge verwerk jare handgeskrebene-vorms:
- Pasiënt-intakevorms (lêrs, adresse, versekerersdata)
- Skadeskaaneisingsvorms (pasiënt-name, diagnose, medikasionyspesifisering)
- Autoris-vorms (Hartslag, skaderiing verantwoording, handtekening)
- Verantwoording-vorms (doktorsaaatekings, diagnose)
Die vorms word:
- Geskande (digitaal gefoto wat papier word)
- Geindeks vir soektog (OCR word gespeel)
- Opgebou in digital archive
- Moontlik verwagte vir naleving
OCR-Uitdagings
Handgeskrebene-teks is moeilik vir OCR-engines:
- Verskille skrifstyle: Medisyne het niemand identieke handskrif.
- Veraltering: Regtstellinge en oorbrysingsel.
- Taalmenging: Medicyne skryf tyd in verskillende tale (bvv, Nederlandse medisynotasie met Engels-begrippe).
- Lukkedheid: Slecht leesbare geboortedatum of handtekening.
OCR-engines soos Tesseract of Google Cloud Vision gee nie slapgevoelde accuracy nie:
- Geboortedatum 1975-03-15 word "1975-03-15" of "1975-08-45"
- Sosiale sekerheid 123-45-6789 word "123-45-6788" of "123-4-6789"
- Mediyne-name "Lisinopril" word "Lislnopril" of "Lisinopri1"