A KYC automatizálási kihívás
A Know Your Customer (KYC) dokumentumfeldolgozáshoz precíziós PII-észlelés szükséges nagy volumenen. Egy paneurópai digitális bank felállása:
- 5 000 napi KYC-kérelem 15 EU-s országból
- 12 különböző dokumentumtípus (útlevelek, személyigazolványok, tartózkodási engedélyek)
- 23 különböző PII-formátum 15 EU-s ország esetén
- 2 napos elmaradás a nem megfelelő PII-észlelési pontossági arányok miatt
A 2 napos elmaradás közvetlen üzleti hatással jár: elveszített ügyfél-onboarding, szabályozói megfelelőségi kockázat, és üzemeltetési terhelés.
A hamis pozitív elmaradás mechanizmusa
Hogyan épülnek fel az elmaradások
5 000 kérelem naponta
× 15% hamis pozitívum arány
= 750 kézi felülvizsgálandó tétel naponta
750 felülvizsgálat × 5 perc felülvizsgálat = 62.5 óra
KYC csapat mérete: 10 ügynök × 8 óra = 80 óra kapacitás
Nettó elmaradás-növekmény: ~60 óra/nap
2 napos elmaradás létrehozásához szükséges: ~3 hét
Ami a bank érintett volt
- Minden hamis pozitívumot kézzel kellett felülvizsgálni
- A felülvizsgálók nem tudják megkülönböztetni a hamis pozitívumokat valódi PII-ktől
- Az eszközük nem adott konfidencia-pontszámokat a prioritizáláshoz
Az ACL 2024 megállapítás
Az ACL (Computational Linguistics Association) 2024-es felmérése:
„A többnyelvű NLP-modellek csupán 5%-a ér el >85% F1-et az összes 24 EU-s nyelven."
Ez azt jelenti, hogy ha az Ön PII-eszköze nem az 5%-os legjobb teljesítő eszközök egyike, valószínűleg szisztematikusan alulteljesít a nem elsődleges EU-s nyelveken.
A megoldás: Konfidencia-alapú triázs
Egy pontossági probléma megoldásának módja konfidencia-pontszámokkal:
| Konfidencia | Intézkedés |
|---|---|
| >95% | Automatikusan szerkesztve, nincs felülvizsgálat |
| 80-95% | Szerkesztve, jelölve gyors felülvizsgálatra |
| <80% | Kiemelve kézi döntésre |
Ezzel az alacsony volumenű kézi felülvizsgálat marad, ahol tényleg szükséges.
Következtetés
A KYC PII-feldolgozás gazdasági esete az automatizálás mellett nem valósulhat meg, ha a hamis pozitívumok visszaemészti a megtakarítást. A konfidencia-rétegzés és a magas precizitású többnyelvű felismerés megoldja ezt.