Popieriaus-skaitmeninio formato asmens duomenų spraga

Atnaujinta 2026 m.

Dauguma skaitmeninių įrankių negali perskaityti nuskenuotų ranka rašytų popierinių įrašų. Tačiau sveikatos ir draudimo grupės tvarko milijonus jų.

Pacientų priėmimo lapai. Žalos pareiškimų formos. Sutikimo puslapiai. Išleidimo prašymai. Darbuotojai juos užpildo ranka. Pacientai atneša arba siunčia faksu. Skeneriai juos paverčia vaizdiniais PDF failais — failais, kuriuose yra pikselių vaizdai, o ne skaitomas tekstas.

Metinis kiekis didelis:

Vidutinio dydžio ligoninė per metus gali apdoroti 50 000 ranka rašytų priėmimo lapų
Draudikas per metus gali gauti 500 000 nuskenuotų žalos bylų
Socialinių paslaugų biuras per metus gali apdoroti 200 000 ranka rašytų prašymų

Kiekvienas nuskeneutas puslapis turi daug asmeninių duomenų. Vardai. Gimimo datos. Asmens kodai. Medicinos įrašų ID. Draudimo numeriai. Namų adresai. Kontaktiniai duomenys. Klinikinės pastabos. Kiekvienas laukas yra HIPAA įtraukta pozicija arba BDAR asmens duomenų elementas. Žr. mūsų žodyną pagrindinėms sąvokoms.

Dauguma grupių visiškai neturi jokio įrankio, leidžiančio aptikti šiuos duomenis nuskenuotuose failuose.

Kodėl rankinis redagavimas žlunga dideliu mastu

Dažniausias sprendimas yra rankinis peržiūrėjimas. Darbuotojas perskaito kiekvieną puslapį, randa asmens duomenis ir juos redaguoja prieš bet kokį dalijimąsi.

Tai greitai žlunga dideliu kiekiu.

Laikas vienam failų rinkiniui (apmokytas peržiūrėtojas):

Paprastas priėmimo lapas, du puslapiai: 8–12 minučių
Sudėtinga byla, penki–aštuoni puslapiai: 20–30 minučių
Failai su priedais: 30–60 minučių

Kiekio skaičiavimas 3 000 failų per mėnesį:

12 minučių vienam failui: 600 valandų per mėnesį = 3,75 etato
25 € per valandą: 15 000 € per mėnesį = 180 000 € per metus

Kokybė taip pat kenčia:

Darbuotojai pavargsta su pasikartojančiais puslapių tipais
Kiekvienas peržiūrėtojas dirba pagal skirtingus standartus
Nėra bendro audito žurnalo
Asmens duomenys praleidžiami arba žymimi skirtingomis taisyklėmis kiekvieną kartą

Tokiu mastu rankinis peržiūrėjimas yra brangus ir nepatikimas. Argumentai automatizavimui akivaizdūs.

OCR tikslumas: ko tikėtis

OCR gerai skaito spausdintą tekstą. Ranka rašytas tekstas yra sunkesnis. Pirmiausia susipažinkite su tikslumo intervalais.

Spausdintas tekstas: 98–99 % simbolių atitikties rodiklis. Beveik visi asmens duomenys spausdintuose laukuose randami. Automatinis apdorojimas tinka beveik 100 % kiekio.

Aiškus ranka rašytas tekstas (raidynas, tamsus rašalas, baltas popierius): 90–97 % simbolių atitikties rodiklis. Vardų atitikties rodiklis aukštesnis — viena neteisinga raidė vis tiek skaitoma kaip vardas. Automatinis apdorojimas tinka 80–90 % kiekio. Likusieji patenka į žmogaus peržiūros eilę.

Sunkus ranka rašytas tekstas (kursyvas, pieštukas, pasenęs popierius): 70–88 % atitikties rodiklis. Automatinis apdorojimas tinka 50–70 % kiekio. Likusieji reikalauja žmogaus peržiūros. Tai vis tiek daug geriau nei kiekvieno puslapio skaitymas rankiniu būdu.

Praktinė sąranka: OCR vykdomas visuose failuose ir kiekvienam suteikiamas balas. Aukšto balo failai automatiškai praeina. Žemo balo failai patenka į nedidelę peržiūros eilę. Peržiūrėtojai tada susitelkia tik į sudėtingus atvejus.

Sveikatos priežiūros investicijų grąžos skaičiavimas

Atvejis: regioninis sveikatos draudikas, 3 000 failų per mėnesį

Šiandien:

Rankinis asmens duomenų redagavimas: 0,5 etato = 24 000 € per metus
Peržiūros kokybė: trys peržiūrėtojai, be bendro kontrolinio sąrašo, rezultatai skiriasi
Audito žurnalas: popierinis, nepatogu ieškoti
Atvirų registracijų įsiskolinimas: dvi–trys savaitės

Su OCR ir automatiniu asmens duomenų aptikimu:

85 % failų (aukštas balas): automatiškai apdorojama, ~2 550 per mėnesį
15 % failų (žemas balas): žmogaus peržiūros eilė, ~450 per mėnesį = ~3 valandos per savaitę
Peržiūros kokybė: tie patys objektų tipai tikrinami kiekviename faile
Audito žurnalas: skaitmeninis, lengva ieškoti, viena ataskaita kiekvienam failui
Įsiskolinimas: išnykęs — automatinis apdorojimas vyksta tolygiai

Metinės santaupos:

Sutaupytas darbas: 24 000 € (0,5 etato → 3 valandos per savaitę)
Likusi peržiūros kaina: 3 valandos × 50 savaičių × 25 € = 3 750 €
Grynos santaupos: ~20 250 € per metus

Metinė kaina:

anonym.legal Pro: 180 €

Investicijų grąža: ~112 kartai vien darbui. Žr. dabartinę plano informaciją mūsų kainų puslapyje.

HIPAA atitikties nauda

HIPAA aprėptoms grupėms automatinis asmens duomenų aptikimas nuskenuotuose puslapiuose suteikia teisinę vertę, viršijančią sąnaudų sumažinimą. Mūsų teisinės atitikties vadovas apima visą vaizdą.

Minimaliai būtinas taisyklė: HIPAA 45 CFR 164.502(b) reikalauja, kad būtų perduodamas tik minimaliai būtinas PHI kiekis. Automatinis redagavimas kiekvienam failui taiko tą pačią taisyklę vienodai.

Saugios prieglaudos deidentifikavimas: Saugi prieglauda reikalauja visų 18 išvardytų PHI identifikatorių pašalinimo. Automatinis aptikimas kiekvieną kartą apima visus 18 vienodai. Rankinis peržiūrėjimas priklauso nuo to, ar kiekvienas darbuotojas žino kiekvieną tipą.

Atskleidimo žurnalai: HIPAA 45 CFR 164.528 reikalauja tam tikrų PHI atskleidimų registravimo. Automatinis apdorojimas sukuria audito įrašą kiekvienam failui. Tas įrašas parodo, kurie elementai buvo rasti ir ką buvo padaryta. Jis tiesiogiai atitinka tą registravimo poreikį.

Pažeidimo rizika: Mažiau rankinio tvarkymo neredaguoto PHI reiškia mažesnę vidinę riziką ir mažesnę fizinę riziką. Abu svarbūs audito metu.

Žalos pareiškimų apdorojimas: konvejerio modelis

Draudikui, tvarkančiam 500 000 failų per metus, nakties paketinis konvejeris veikia gerai.

Kaip konvejeris vykdomas:

Nuskenuoti failai patenka į įvesties aplanką iš nuskenavimo stotelių ar pašto
Kiekvieną naktį: OCR ir asmens duomenų aptikimas vykdomas visuose naujuose failuose
Aukšto balo failai (virš 90 % OCR kokybės): automatinis išvesties failas, sukuriama redaguota versija
Žemo balo failai: patenka į peržiūros eilę su jau užpildytu OCR tekstu ir rastais objektais
Peržiūrėtojas patikrina ir patvirtina redagavimą
Kiekvienas failas gauna audito įrašą

Kur tai jungiasi:

Dokumentų sistema: gauna automatinę paketinę išvestį
Žalos sistema: redaguotos versijos siunčiamos išoriniams reguliuotojams
Atitikties ataskaitos: mėnesinis suvestinė pagal failo tipą ir objekto klasę

Svarbiausiasis pokytis yra tas, kur peržiūrėtojo laikas skiriamas. Darbuotojai pereina nuo kiekvieno puslapio skaitymo prie tik žemo balo atvejų skaitymo — paprastai 10–20 % kiekio. Bendra peržiūros valandų suma mažėja. Kokybė gerėja per standartinį procesą.

Šaltiniai

HIPAA: Sveikatos informacijos deidentifikavimas — PATIKRINTA-IŠORĖ
HIPAA Saugumo taisyklė: Techninės apsaugos priemonės — PATIKRINTA-IŠORĖ
BDAR 32 straipsnis: Tvarkymo saugumas — PATIKRINTA-IŠORĖ

Susiję Straipsniai

Sveikatos Priežiūra

HIPAA MRN aptikimas be regex doktorantūros

Kiekvienos ligoninės MRN formatas yra skirtingas. Memorial naudoja MRN:XXXXXXX, St. Mary's - PT-YYYYY, University Hospital - UHN-XXXXXXXXXX.

Sveikatos Priežiūra

HIPAA: Ligoninei bdingi MRN formatai

HIPAA Safe Harbor reikalauja pasalinti medicinos irasu numerius, taciau MRN formatai nera standartizuoti. Epic, Cerner ir Meditech naudoja skirtingus formatus.

Sveikatos Priežiūra

HIPAA saugios prieplaukos identifikatorių pašalinimas dideliame mastelyje

HIPAA saugios prieplaukos metodas reikalauja pašalinti 18 konkrečių apsaugotų sveikatos informacijos identifikatorių kategorijų. Akademiniai medicinos centrai turi atlikti identifikatorių pašalinimą dideliame mastelyje, tačiau esami įrankiai kainuoja daugiau nei dotacijos biudžetas.

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

Pradėti Nemokamą Bandomąją Versiją Peržiūrėti Funkcijas

Ranka rašytų formų OCR ir asmens duomenų aptikimas

Popieriaus-skaitmeninio formato asmens duomenų spraga

Kodėl rankinis redagavimas žlunga dideliu mastu

OCR tikslumas: ko tikėtis

Sveikatos priežiūros investicijų grąžos skaičiavimas

HIPAA atitikties nauda

Žalos pareiškimų apdorojimas: konvejerio modelis

Šaltiniai

Susiję Straipsniai

HIPAA MRN aptikimas be regex doktorantūros

HIPAA: Ligoninei bdingi MRN formatai

HIPAA saugios prieplaukos identifikatorių pašalinimas dideliame mastelyje

Pasiruošę apsaugoti savo duomenis?

About this page

Related reading

We follow these rules

Our promise

Where we run

Need help?

How we test

What we never do

Plans in plain words

Who built this

Where to start

How the parts fit

Words from our team

Common questions we hear

A short tour of the workflow