By · Last updated 2026-06-05

Vissza a BlograEgészségügy

Kézzel írt nyomtatványok OCR-je és személyesadat-felismerése

Egy közepes méretű kórház évente 50 000 kézzel írt felvételi lapot dolgoz fel. Ekkora volumen esetén a személyes adatok kézi redakálása 0,5 munkavállalói egyenértéket igényel.

June 5, 20267 perc olvasás
handwritten formsOCR healthcareHIPAA complianceinsurance documentsdocument automation

A papír-digitális átalakítás személyesadat-hiányossága

Frissítve 2026-ra

A digitális eszközök többsége nem tudja beolvasni a szkennelt, kézzel írt papíralapú iratokat. Az egészségügyi és biztosítási szervezetek mégis több milliónyit kezelnek belőlük.

Betegfelvételi lapok. Igényformanyomtatványok. Beleegyező nyilatkozatok. Adatkibocsátási kérelmek. Ezeket kézzel tölti ki a személyzet. A betegek postán küldik be vagy faxon juttatják el. A szkennelők képes PDF-fájlokká alakítják őket — olyan fájlokká, amelyek pixelképeket tartalmaznak, nem olvasható szöveget.

Az éves volumen jelentős:

  • Egy közepes méretű kórház évente 50 000 kézzel írt felvételi lapot dolgozhat fel
  • Egy biztosítótársaság évente 500 000 szkennelt igénydossziét kaphat
  • Egy szociális szolgáltatási iroda évente 200 000 kézzel írt kérelmet kezelhet

Minden beolvasott oldal sűrű személyes adatot tartalmaz. Nevek. Születési dátumok. Társadalombiztosítási számok. Betegnyilvántartási azonosítók. Biztosítási számok. Lakóhelyek. Elérhetőségi adatok. Klinikai megjegyzések. Minden mező HIPAA-listán szereplő elem vagy GDPR szerinti személyes adat. A kulcsfogalmakért lásd szójegyzékünket.

A szervezetek többségének egyáltalán nincs eszköze arra, hogy ezeket az adatokat szkennelt fájlokban észlelje.

Miért csődöl fel a kézi redakálás nagy volumen esetén

A bevett megoldás a kézi ellenőrzés. Egy munkatárs végigolvassa az egyes oldalakat, megtalálja a személyes adatokat, és redakálja azokat megosztás előtt.

Ez nagy volumen esetén gyorsan összeomlik.

Idő fájlonként (képzett ellenőr esetén):

  • Egyszerű felvételi lap, két oldal: 8–12 perc
  • Összetett igény, öt–nyolc oldal: 20–30 perc
  • Mellékleteket tartalmazó fájlok: 30–60 perc

Mennyiségi számítás havi 3000 fájlra:

  • Fájlonként 12 perccel: 600 óra/hó = 3,75 munkavállalói egyenérték
  • Óránként 25 euróval: 15 000 euró/hó = 180 000 euró/év

A minőség is romlik:

  • A munkatársak elfáradnak az ismétlődő oldaltípusoknál
  • Minden ellenőr más-más színvonalat képvisel
  • Nincs egységes auditnapló
  • A személyes adatokat kihagyják, vagy minden alkalommal eltérő szabályok szerint jelölik

Ekkora volumen esetén a kézi ellenőrzés költséges és megbízhatatlan. Az automatizálás mellett szóló érvek egyértelműek.

OCR-pontosság: mire számítson

Az OCR jól olvassa a nyomtatott szöveget. A kézírás nehezebb feladat. Először ismerje meg a pontossági tartományokat.

Nyomtatott szöveg: 98–99%-os karakteregyezési arány. A nyomtatott mezőkben lévő személyes adatok szinte kivétel nélkül megtalálhatók. Az automatikus feldolgozás a volumen közel 100%-ára alkalmazható.

Tiszta kézírás (nyomtatott betűk, sötét tinta, fehér papír): 90–97%-os karakteregyezési arány. A névegyezési arány magasabb — egy hibás betű még mindig névként olvasható. Az automatikus feldolgozás a volumen 80–90%-ára alkalmazható. A többi kézi ellenőrzési sorba kerül.

Nehezen olvasható kézírás (folyóírás, ceruza, elöregedett papír): 70–88%-os egyezési arány. Az automatikus feldolgozás a volumen 50–70%-ára alkalmazható. A többi kézi ellenőrzésre szorul. Ez még mindig lényegesen jobb, mint minden oldalt kézzel átolvasni.

A gyakorlati beállítás: az OCR minden fájlon fut, és pontozza azokat. A magas pontszámú fájlok önállóan haladnak tovább. Az alacsony pontszámú fájlok egy kis ellenőrzési sorba kerülnek. Az ellenőrök így csak a nehéz esetekre koncentrálnak.

Az egészségügyi megtérülési számítás

Eset: regionális egészségbiztosító, havi 3000 fájl

Jelenleg:

  • Kézi személyesadat-redakálás: 0,5 munkavállalói egyenérték = 24 000 euró/év
  • Ellenőrzési minőség: három ellenőr, közös ellenőrzőlista nélkül, változó eredmények
  • Auditnapló: papíralapú, nehezen kereshető
  • Nyílt beiratkozási hátralék: két–három hét

OCR és automatikus személyesadat-felismeréssel:

  • A fájlok 85%-a (magas pontszámú): automatikusan feldolgozva, ~2550 havonta
  • A fájlok 15%-a (alacsony pontszámú): kézi ellenőrzési sor, ~450 havonta = ~3 óra hetente
  • Ellenőrzési minőség: minden fájlon ugyanazokat az entitástípusokat ellenőrzik
  • Auditnapló: digitális, könnyen kereshető, minden fájlhoz egy jelentés
  • Hátralék: megszűnt — az automatikus feldolgozás egyenletes ütemben fut

Éves megtakarítás:

  • Megtakarított munkaerő: 24 000 euró (0,5 munkavállalói egyenérték → heti 3 óra)
  • Fennmaradó ellenőrzési költség: 3 óra × 50 hét × 25 euró = 3750 euró
  • Nettó megtakarítás: ~20 250 euró/év

Éves költség:

  • anonym.legal Pro: 180 euró

Megtérülés: ~112-szeres csak a munkaerőköltségen. Lásd az aktuális csomagrészleteket az árazási oldalon.

HIPAA-megfelelőségi előnyök

A HIPAA hatálya alá tartozó szervezetek számára a szkennelt oldalak automatikus személyesadat-felismerése a költségcsökkentésen túl jogi értéket is teremt. Jogi megfelelőségi útmutatónk teljes képet ad.

A szükséges minimumra vonatkozó szabály: A HIPAA 45 CFR 164.502(b) előírja, hogy csak a szükséges minimumra kiterjedő védett egészségügyi adatokat (PHI) szabad megosztani. Az automatikus redakálás minden fájlnál ugyanúgy alkalmazza ezt a szabályt.

Safe Harbor szerinti anonimizálás: A Safe Harbor megköveteli mind a 18 felsorolt PHI-azonosító eltávolítását. Az automatikus felismerés minden alkalommal ugyanúgy fedezi mind a 18-at. A kézi ellenőrzés attól függ, hogy minden munkatárs ismeri-e az összes típust.

Közzétételi naplók: A HIPAA 45 CFR 164.528 előírja bizonyos PHI-közzétételek naplózását. Az automatikus feldolgozás minden fájlhoz auditnaplót hoz létre. Ez a napló megmutatja, milyen elemeket találtak és mi történt velük. Közvetlenül teljesíti ezt a naplózási kötelezettséget.

Adatvédelmi incidensek kockázata: A nem redakált PHI kisebb mértékű kézi kezelése csökkenti a bennfentes és a fizikai kockázatot. Mindkettő fontos az audit szempontjából.

Igényfeldolgozás: egy folyamatminta

Az évente 500 000 fájlt kezelő biztosítók számára az éjszakai kötegelt folyamat jól működik.

A folyamat menete:

  • A szkennelt fájlok bejövő mappába kerülnek a szkennelőállomásokról vagy a postázásból
  • Minden este: OCR és személyesadat-felismerés fut az összes új fájlon
  • Magas pontszámú fájlok (90% feletti OCR-minőség): automatikus kimenet, redakált verzió létrehozva
  • Alacsony pontszámú fájlok: ellenőrzési sorba kerülnek, OCR-szöveggel és már kitöltött entitásokkal
  • Az ellenőr átnézi és jóváhagyja a redakálást
  • Minden fájl auditnaplót kap

Kapcsolódási pontok:

  • Dokumentumrendszer: az automatikus kötegelt kimenetet fogadja
  • Igényfeldolgozó rendszer: a redakált verziók külső kárszakértőkhöz kerülnek
  • Megfelelőségi jelentések: havi összefoglaló fájltípus és entitásosztály szerint

A kulcsváltozás az ellenőri idő felhasználásában rejlik. A munkatársak nem minden oldalt olvasnak át, csupán az alacsony pontszámú eseteket — általában a volumen 10–20%-át. Az összes ellenőrzési óra csökken. A minőség javul egy egységes folyamat révén.

Források

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.