Prípad Poistnej Spoločnosti: "Máme 500 000 Ručne Vypísaných Formulárov Nárokov"
Veľké zdravotné poistenie spracúva nároky:
Proces:
- Pacient vyplní papierový formulár (tinta, rukou)
- Pošle ho poštou
- Scanuje sa (300 DPI, čiernobiele alebo farebné)
- OCR extrakcuje text
- Dáta sa vloží do systému nárokov
Formulár Vzor:
Full Name: __________________
Date of Birth: ____ / ____ / ________
Policy #: ___________
Service Date: ____ / ____ / ________
Provider: ___________________________________
Diagnosis: ___________________________________
Treatment Notes: ___________________________
____________________________________________________
Patient Signature: _______________ Date: ___________
Problémy s OCR + PII:
1. Ručné Písmo je Nepredvídateľné
- OCR tréningový dataset: tlačený text
- Reálne údaje: "J.Smith", "J. Smith", "j smith" – tri rôzne zapisy
- Čísla: "123-45-6789" vs "123 45 6789" vs "1234-5678-9" (nekonzistetnosť)