Popieriaus-skaitmeninio formato asmens duomenų spraga
Atnaujinta 2026 m.
Dauguma skaitmeninių įrankių negali perskaityti nuskenuotų ranka rašytų popierinių įrašų. Tačiau sveikatos ir draudimo grupės tvarko milijonus jų.
Pacientų priėmimo lapai. Žalos pareiškimų formos. Sutikimo puslapiai. Išleidimo prašymai. Darbuotojai juos užpildo ranka. Pacientai atneša arba siunčia faksu. Skeneriai juos paverčia vaizdiniais PDF failais — failais, kuriuose yra pikselių vaizdai, o ne skaitomas tekstas.
Metinis kiekis didelis:
- Vidutinio dydžio ligoninė per metus gali apdoroti 50 000 ranka rašytų priėmimo lapų
- Draudikas per metus gali gauti 500 000 nuskenuotų žalos bylų
- Socialinių paslaugų biuras per metus gali apdoroti 200 000 ranka rašytų prašymų
Kiekvienas nuskeneutas puslapis turi daug asmeninių duomenų. Vardai. Gimimo datos. Asmens kodai. Medicinos įrašų ID. Draudimo numeriai. Namų adresai. Kontaktiniai duomenys. Klinikinės pastabos. Kiekvienas laukas yra HIPAA įtraukta pozicija arba BDAR asmens duomenų elementas. Žr. mūsų žodyną pagrindinėms sąvokoms.
Dauguma grupių visiškai neturi jokio įrankio, leidžiančio aptikti šiuos duomenis nuskenuotuose failuose.
Kodėl rankinis redagavimas žlunga dideliu mastu
Dažniausias sprendimas yra rankinis peržiūrėjimas. Darbuotojas perskaito kiekvieną puslapį, randa asmens duomenis ir juos redaguoja prieš bet kokį dalijimąsi.
Tai greitai žlunga dideliu kiekiu.
Laikas vienam failų rinkiniui (apmokytas peržiūrėtojas):
- Paprastas priėmimo lapas, du puslapiai: 8–12 minučių
- Sudėtinga byla, penki–aštuoni puslapiai: 20–30 minučių
- Failai su priedais: 30–60 minučių
Kiekio skaičiavimas 3 000 failų per mėnesį:
- 12 minučių vienam failui: 600 valandų per mėnesį = 3,75 etato
- 25 € per valandą: 15 000 € per mėnesį = 180 000 € per metus
Kokybė taip pat kenčia:
- Darbuotojai pavargsta su pasikartojančiais puslapių tipais
- Kiekvienas peržiūrėtojas dirba pagal skirtingus standartus
- Nėra bendro audito žurnalo
- Asmens duomenys praleidžiami arba žymimi skirtingomis taisyklėmis kiekvieną kartą
Tokiu mastu rankinis peržiūrėjimas yra brangus ir nepatikimas. Argumentai automatizavimui akivaizdūs.
OCR tikslumas: ko tikėtis
OCR gerai skaito spausdintą tekstą. Ranka rašytas tekstas yra sunkesnis. Pirmiausia susipažinkite su tikslumo intervalais.
Spausdintas tekstas: 98–99 % simbolių atitikties rodiklis. Beveik visi asmens duomenys spausdintuose laukuose randami. Automatinis apdorojimas tinka beveik 100 % kiekio.
Aiškus ranka rašytas tekstas (raidynas, tamsus rašalas, baltas popierius): 90–97 % simbolių atitikties rodiklis. Vardų atitikties rodiklis aukštesnis — viena neteisinga raidė vis tiek skaitoma kaip vardas. Automatinis apdorojimas tinka 80–90 % kiekio. Likusieji patenka į žmogaus peržiūros eilę.
Sunkus ranka rašytas tekstas (kursyvas, pieštukas, pasenęs popierius): 70–88 % atitikties rodiklis. Automatinis apdorojimas tinka 50–70 % kiekio. Likusieji reikalauja žmogaus peržiūros. Tai vis tiek daug geriau nei kiekvieno puslapio skaitymas rankiniu būdu.
Praktinė sąranka: OCR vykdomas visuose failuose ir kiekvienam suteikiamas balas. Aukšto balo failai automatiškai praeina. Žemo balo failai patenka į nedidelę peržiūros eilę. Peržiūrėtojai tada susitelkia tik į sudėtingus atvejus.
Sveikatos priežiūros investicijų grąžos skaičiavimas
Atvejis: regioninis sveikatos draudikas, 3 000 failų per mėnesį
Šiandien:
- Rankinis asmens duomenų redagavimas: 0,5 etato = 24 000 € per metus
- Peržiūros kokybė: trys peržiūrėtojai, be bendro kontrolinio sąrašo, rezultatai skiriasi
- Audito žurnalas: popierinis, nepatogu ieškoti
- Atvirų registracijų įsiskolinimas: dvi–trys savaitės
Su OCR ir automatiniu asmens duomenų aptikimu:
- 85 % failų (aukštas balas): automatiškai apdorojama, ~2 550 per mėnesį
- 15 % failų (žemas balas): žmogaus peržiūros eilė, ~450 per mėnesį = ~3 valandos per savaitę
- Peržiūros kokybė: tie patys objektų tipai tikrinami kiekviename faile
- Audito žurnalas: skaitmeninis, lengva ieškoti, viena ataskaita kiekvienam failui
- Įsiskolinimas: išnykęs — automatinis apdorojimas vyksta tolygiai
Metinės santaupos:
- Sutaupytas darbas: 24 000 € (0,5 etato → 3 valandos per savaitę)
- Likusi peržiūros kaina: 3 valandos × 50 savaičių × 25 € = 3 750 €
- Grynos santaupos: ~20 250 € per metus
Metinė kaina:
- anonym.legal Pro: 180 €
Investicijų grąža: ~112 kartai vien darbui. Žr. dabartinę plano informaciją mūsų kainų puslapyje.
HIPAA atitikties nauda
HIPAA aprėptoms grupėms automatinis asmens duomenų aptikimas nuskenuotuose puslapiuose suteikia teisinę vertę, viršijančią sąnaudų sumažinimą. Mūsų teisinės atitikties vadovas apima visą vaizdą.
Minimaliai būtinas taisyklė: HIPAA 45 CFR 164.502(b) reikalauja, kad būtų perduodamas tik minimaliai būtinas PHI kiekis. Automatinis redagavimas kiekvienam failui taiko tą pačią taisyklę vienodai.
Saugios prieglaudos deidentifikavimas: Saugi prieglauda reikalauja visų 18 išvardytų PHI identifikatorių pašalinimo. Automatinis aptikimas kiekvieną kartą apima visus 18 vienodai. Rankinis peržiūrėjimas priklauso nuo to, ar kiekvienas darbuotojas žino kiekvieną tipą.
Atskleidimo žurnalai: HIPAA 45 CFR 164.528 reikalauja tam tikrų PHI atskleidimų registravimo. Automatinis apdorojimas sukuria audito įrašą kiekvienam failui. Tas įrašas parodo, kurie elementai buvo rasti ir ką buvo padaryta. Jis tiesiogiai atitinka tą registravimo poreikį.
Pažeidimo rizika: Mažiau rankinio tvarkymo neredaguoto PHI reiškia mažesnę vidinę riziką ir mažesnę fizinę riziką. Abu svarbūs audito metu.
Žalos pareiškimų apdorojimas: konvejerio modelis
Draudikui, tvarkančiam 500 000 failų per metus, nakties paketinis konvejeris veikia gerai.
Kaip konvejeris vykdomas:
- Nuskenuoti failai patenka į įvesties aplanką iš nuskenavimo stotelių ar pašto
- Kiekvieną naktį: OCR ir asmens duomenų aptikimas vykdomas visuose naujuose failuose
- Aukšto balo failai (virš 90 % OCR kokybės): automatinis išvesties failas, sukuriama redaguota versija
- Žemo balo failai: patenka į peržiūros eilę su jau užpildytu OCR tekstu ir rastais objektais
- Peržiūrėtojas patikrina ir patvirtina redagavimą
- Kiekvienas failas gauna audito įrašą
Kur tai jungiasi:
- Dokumentų sistema: gauna automatinę paketinę išvestį
- Žalos sistema: redaguotos versijos siunčiamos išoriniams reguliuotojams
- Atitikties ataskaitos: mėnesinis suvestinė pagal failo tipą ir objekto klasę
Svarbiausiasis pokytis yra tas, kur peržiūrėtojo laikas skiriamas. Darbuotojai pereina nuo kiekvieno puslapio skaitymo prie tik žemo balo atvejų skaitymo — paprastai 10–20 % kiekio. Bendra peržiūros valandų suma mažėja. Kokybė gerėja per standartinį procesą.
Šaltiniai
- HIPAA: Sveikatos informacijos deidentifikavimas — PATIKRINTA-IŠORĖ
- HIPAA Saugumo taisyklė: Techninės apsaugos priemonės — PATIKRINTA-IŠORĖ
- BDAR 32 straipsnis: Tvarkymo saugumas — PATIKRINTA-IŠORĖ