By · Last updated 2026-06-05

Rudi kwa BlogHuduma za Afya

OCR ya Fomu Zilizoandikwa kwa Mkono na Ugunduzi wa PII

Hospitali ya ukubwa wa kati inachakata fomu 50,000 za ulizaji wa habari zilizoandikwa kwa mkono kwa mwaka. Kukatia PII kwa mkono kwa wingi huu kunahitaji FTE 0.5.

June 5, 20267 dakika kusoma
handwritten formsOCR healthcareHIPAA complianceinsurance documentsdocument automation

Pengo la PII kutoka Karatasi hadi Dijitali

Imesasishwa kwa 2026

Zana nyingi za kidijitali haziwezi kusoma kumbukumbu za karatasi zilizoandikwa kwa mkono zilizoskanishwa. Hata hivyo, makundi ya afya na bima hushughulikia mamilioni yao.

Karatasi za ulizaji wa habari za wagonjwa. Fomu za madai. Kurasa za idhini. Maombi ya kutolewa. Wafanyakazi hujaza hizi kwa mkono. Wagonjwa wanaziwasilisha au kuzifaksi. Viskanisha vinavibadilisha kuwa PDF za picha — faili zinazobeba picha za pikseli, si maandishi yanayoweza kusomwa.

Kiasi cha kila mwaka ni kikubwa:

  • Hospitali ya ukubwa wa kati inaweza kushughulikia karatasi 50,000 za ulizaji wa habari zilizoandikwa kwa mkono kwa mwaka
  • Mkaguzi wa bima anaweza kupokea faili 500,000 za madai zilizoskanishwa kwa mwaka
  • Ofisi ya huduma za kijamii inaweza kuchakata maombi 200,000 yaliyoandikwa kwa mkono kwa mwaka

Kila ukurasa ulioskanishwa una data mingi ya kibinafsi. Majina. Tarehe za kuzaliwa. Nambari za Usalama wa Jamii. Vitambulisho vya kumbukumbu za matibabu. Nambari za bima. Anwani za nyumbani. Maelezo ya mawasiliano. Maelezo ya kliniki. Kila sehemu ni kipengele kilichoorodheshwa cha HIPAA au kipengele cha data ya kibinafsi ya GDPR. Angalia faharasa yetu kwa maneno muhimu.

Makundi mengi hayana zana yoyote ya kugundua data hii katika faili zilizoskanishwa kabisa.

Kwa Nini Kukatia kwa Mkono Kunashindwa kwa Wingi

Suluhisho la kawaida ni ukaguzi wa mkono. Mwanachama wa wafanyakazi anasoma kila ukurasa, anapata PII, na anakatia kabla ya kushiriki yoyote.

Hilo huzorota haraka kwa wingi.

Muda kwa kila seti ya faili (mkaguzi aliyefunzwa):

  • Karatasi rahisi ya ulizaji wa habari, kurasa mbili: dakika 8-12
  • Dai ngumu, kurasa tano hadi nane: dakika 20-30
  • Faili zenye viambatisho: dakika 30-60

Hesabu ya kiasi kwa faili 3,000 kwa mwezi:

  • Kwa dakika 12 kwa faili: masaa 600 kwa mwezi = FTE 3.75
  • Kwa €25 kwa saa: €15,000 kwa mwezi = €180,000 kwa mwaka

Ubora pia unateseka:

  • Wafanyakazi wanachoka kwenye aina za kurasa zinazorudiwa
  • Kila mkaguzi anafanya kazi kwa kiwango tofauti
  • Hakuna mkondo wa pamoja wa ukaguzi
  • PII imekoswa au imewekwa alama kwa sheria tofauti kila wakati

Kwa wingi huu, ukaguzi wa mkono ni wa gharama kubwa na hauaminiwi. Hoja kwa uendeshaji wa kiotomatiki ni wazi.

Usahihi wa OCR: Nini cha Kutarajia

OCR inasoma maandishi yaliyochapishwa vizuri. Maandishi ya mkono ni magumu zaidi. Jua masafa ya usahihi kwanza.

Maandishi yaliyochapishwa: Kiwango cha ulinganifu wa herufi wa 98-99%. Karibu PII zote katika sehemu zilizochapishwa zinapatikana. Uchakataji wa kiotomatiki unafaa karibu asilimia 100 ya kiasi.

Maandishi mazuri ya mkono (herufi kubwa, wino mzito, karatasi nyeupe): Kiwango cha ulinganifu wa herufi wa 90-97%. Kiwango cha ulinganifu wa jina ni juu zaidi — herufi moja mbaya bado inasomeka kama jina. Uchakataji wa kiotomatiki unafaa asilimia 80-90 ya kiasi. Zilizobaki zinaenda kwenye foleni ya ukaguzi wa binadamu.

Maandishi magumu ya mkono (mstari unaoendelea, penseli, karatasi ya zamani): Kiwango cha ulinganifu wa 70-88%. Uchakataji wa kiotomatiki unafaa asilimia 50-70 ya kiasi. Zilizobaki zinahitaji ukaguzi wa binadamu. Bado ni bora zaidi kuliko kusoma kila ukurasa kwa mkono.

Usanidi wa vitendo: OCR inafanya kazi kwenye faili zote na kupiga alama kila moja. Faili zenye alama za juu zinaendelea peke yake. Faili zenye alama za chini zinaenda kwenye foleni ndogo ya ukaguzi. Wakaguzi kisha wanazingatia hali ngumu peke yake.

Hesabu ya ROI ya Afya

Hali: mkaguzi wa bima wa kikanda, faili 3,000 kwa mwezi

Leo:

  • Kukatia PII kwa mkono: FTE 0.5 = €24,000 kwa mwaka
  • Ubora wa ukaguzi: wakaguzi watatu, hakuna orodha ya pamoja, matokeo yanatofautiana
  • Mkondo wa ukaguzi: unaotegemea karatasi, si rahisi kutafuta
  • Foleni ya usajili wazi: wiki mbili hadi tatu

Kwa OCR pamoja na ugunduzi wa PII wa kiotomatiki:

  • Asilimia 85 ya faili (alama za juu): zimechakatwa kiotomatiki, takriban 2,550 kwa mwezi
  • Asilimia 15 ya faili (alama za chini): foleni ya ukaguzi wa binadamu, takriban 450 kwa mwezi = takriban masaa 3 kwa wiki
  • Ubora wa ukaguzi: aina sawa za viumbe zinakaguliwa kwenye kila faili
  • Mkondo wa ukaguzi: wa kidijitali, rahisi kutafuta, ripoti moja kwa kila faili
  • Foleni: imepotea — uchakataji wa kiotomatiki unafanyika kwa kasi ya kawaida

Akiba ya kila mwaka:

  • Kazi iliyookolewa: €24,000 (FTE 0.5 hadi masaa 3 kwa wiki)
  • Gharama ya ukaguzi iliyobaki: masaa 3 × wiki 50 × €25 = €3,750
  • Akiba halisi: takriban €20,250 kwa mwaka

Gharama ya kila mwaka:

  • anonym.legal Pro: €180

ROI: takriban mara 112 kwa kazi peke yake. Angalia maelezo ya sasa ya mpango kwenye ukurasa wetu wa bei.

Faida za Ufuatano wa HIPAA

Kwa makundi yanayofunikwa na HIPAA, ugunduzi wa kiotomatiki wa PII kwenye kurasa zilizoskanishwa unaongeza thamani ya kisheria zaidi ya kupungua kwa gharama. Mwongozo wetu wa ufuatano wa kisheria unashughulikia picha nzima.

Kanuni ya kiwango cha chini cha lazima: HIPAA 45 CFR 164.502(b) inahitaji kwamba PHI ya chini tu inayohitajika ishirikiwe. Kukatia kiotomatiki kunatumia kanuni hiyo kwa njia sawa kwenye kila faili.

Kutokujulikana salama: Njia salama inahitaji kuondolewa kwa vitambulisho vyote 18 vilivyoorodheshwa vya PHI. Ugunduzi wa kiotomatiki unashughulikia vyote 18 kwa njia sawa kila wakati. Ukaguzi wa mkono unategemea kila mwanachama wa wafanyakazi kujua kila aina.

Kumbukumbu za ufichuzi: HIPAA 45 CFR 164.528 inahitaji kurekodi ufichuzi fulani wa PHI. Uchakataji wa kiotomatiki huunda kumbukumbu ya ukaguzi kwa kila faili. Kumbukumbu hiyo inaonyesha vitu vilivyopatikana na kilichofanywa. Inakidhi moja kwa moja haja hiyo ya uandishi wa kumbukumbu.

Hatari ya ukiukaji: Kushughulikia kidogo kwa mkono kwa PHI isiyokatwa kunamaanisha hatari ndogo ya ndani na hatari ndogo ya kimwili. Zote mbili zinahusika wakati wa ukaguzi.

Uchakataji wa Madai: Mfumo wa Mfululizo

Kwa mkaguzi anayeshughulikia faili 500,000 kwa mwaka, mfululizo wa kuchakata usiku hufanya kazi vizuri.

Jinsi mfululizo unavyofanya kazi:

  • Faili zilizoskanishwa zinawasili kwenye foleni ya ingizo kutoka kwa vituo vya kuskanisha au posta
  • Kila usiku: OCR pamoja na ugunduzi wa PII unafanyika kwenye faili zote mpya
  • Faili zenye alama za juu (zaidi ya asilimia 90 ya ubora wa OCR): matokeo ya kiotomatiki, toleo lililokatwa limeundwa
  • Faili zenye alama za chini: zinaenda kwenye foleni ya ukaguzi pamoja na maandishi ya OCR na viumbe vilivyopatikana tayari vimejazwa
  • Mkaguzi anakagua na kuidhinisha ukatizaji
  • Kila faili inapata kumbukumbu ya ukaguzi

Mahali inapounganika:

  • Mfumo wa hati: unapokea matokeo ya kundi la kiotomatiki
  • Mfumo wa madai: matoleo yaliyokatwa yanaenda kwa wasuluhishi wa nje
  • Ripoti za uzingativu: muhtasari wa kila mwezi kwa aina ya faili na darasa la viumbe

Mabadiliko muhimu ni mahali ambapo muda wa mkaguzi unaenda. Wafanyakazi wanabadilika kutoka kusoma kila ukurasa hadi kusoma hali za alama za chini tu — kawaida asilimia 10-20 ya kiasi. Jumla ya masaa ya ukaguzi hupungua. Ubora unaboresha kupitia mchakato wa kawaida.

Vyanzo

Tayari kulinda data yako?

Anza kuanonymisha PII na aina 285+ za vitu katika lugha 48.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.