Adatvédelmi eszközök betanítása: hetekből órák presetekkel
Egy LPO-cég évente 50 új dokumentum-felülvizsgálati munkatársat vesz fel. Presetek nélkül a képzés három hétig tart. Az új munkatársaknak meg kell tanulniuk, hogy 285+ entitástípus közül melyik illik az egyes dokumentumtípusokhoz. Meg kell választaniuk a megfelelő módszert. Be kell állítaniuk a megbízhatósági küszöbértékeket. Mindezt helyesen elvégezni időbe telik.
Három hetes képzés 50 munkatárs számára évente mintegy 60 000 euróba kerül. Ez nem számítja a tanulási időszak alatt kiesett teljesítményt.
Presetek bevezetése után: egynapos képzés. Az éves költség 15 000 euróra csökken. Ez 45 000 eurós megtakarítás.
Miért tart olyan sokáig az adatvédelmi eszközök betanítása?
Az új munkatársaknak három nehéz döntést kell meghozniuk, mielőtt egyetlen fájlt is feldolgoznának.
Entitásválasztás. A platform 285+ entitástípust támogat 48 nyelven. Hat észlelési kategória létezik: kormányzati azonosítók, pénzügyi adatok, orvosi adatok, személyes elérhetőségek, szervezeti azonosítók és egyedi kategóriák. A megfelelő részhalmazt kiválasztani egy adott dokumentumtípushoz nem egyszerű feladat. Ismerni kell az entitástárat és az alkalmazandó szabályokat.
Módszerválasztás. Öt anonymizálási módszer áll rendelkezésre:
- Redact — véglegesen eltávolítja az adatokat; maximalizálja az adatcsökkentést
- Replace — valós adatokat szintetikus értékekkel helyettesít; hasznos ML-tanítókészletekhez
- Pseudonymize — stabil leképezést hoz létre; megőrzi a rekordok közötti kapcsolatokat; kulccsal visszafordítható
- Mask — karakterszinten rejti el az adatokat; megőrzi a mező alakját
- Encrypt — AES-256 titkosítás kulcskezeléssel; ellenőrzött hozzáféréssel visszafordítható
A helyes választáshoz ismerni kell a feldolgozás célját és az alkalmazandó szabályokat. Az új munkatársak sokszor egyiket sem ismerik.
Megbízhatósági küszöbértékek. Magasabb küszöb kevesebb téves pozitívot, de több kihagyott személyes adatot jelent. Alacsonyabb küszöb több személyes adatot fog meg, de több felülvizsgálati munkát is okoz. Az új munkatársak, ha egyedül hozzák meg ezt a döntést, gyakran tévednek.
Presetek nélkül az első heti beállítási hibák aránya mintegy 22%. Egyes hibák személyes adatokat hagynak a kimenetben. Mások szükségtelenül sokat távolítanak el.
A preset-fordulat
A presetek megfordítják a képzési problémát.
Presetek nélkül: Az új munkatársaknak meg kell tanulniuk az entitástípusokat, a módszer-logikát és a küszöbérték-hangolást. Ez hosszú tanfolyam. A tényleges munka addig vár.
Presetekkel: Az új munkatársaknak meg kell tanulniuk, melyik preset illik az egyes dokumentumtípusokhoz. Ez egyszerű. Nem kell minden beállítást ismerniük. Kiválasztják a megfelelő presetet és dolgoznak.
Egy megfelelőségi vezető, adatvédelmi tisztviselő vagy adatvédelmi felelős egyszer beleviszi a helyes választásokat egy presetbe. A munkatársak ezeket a választásokat alkalmazzák. Nem kell minden alkalommal újra végiggondolniuk.
Így néz ki a képzés presetek előtt és után.
Presetek előtt — összesen 3 hét:
- 3 nap: entitástár áttekintése
- 3 nap: módszerválasztás
- 3 nap: küszöbérték-hangolás és minőség-ellenőrzés
- 3 nap: jogszabályi követelmények (GDPR, HIPAA)
- 3 nap: felügyelt gyakorlat
Presetekkel — összesen 1 nap:
- 2 óra: dokumentumtípus azonosítása
- 2 óra: preset kiválasztása dokumentumkategória szerint
- 2 óra: mikor kell a kimenetet felülvizsgálatra jelölni
- 2 óra: felügyelt gyakorlat 3–4 dokumentumpéldán
Az LPO-cég esete
Ez a cég ügyvédi irodák számára végez dokumentum-felülvizsgálatot. Négy dokumentumtípussal foglalkozik: US és EU e-discovery, GDPR 15. cikk szerinti érintetti hozzáférési kérelmek (DSAR), szerződéses felülvizsgálat és M&A átvilágítás.
A cég egy négy nevesített presetből álló preset-könyvtárat épített fel:
- US E-Discovery Standard — nevek, e-mailek, SSN-ek, pénzügyi azonosítók; Redact
- EU E-Discovery — GDPR — EU személyes adatkategóriák; Redact
- DSAR Response — harmadik felek azonosítói, nem az érintett saját adatai; Replace
- M&A Due Diligence — kereskedelmi azonosítók, pénzügyi adatok; Redact
Új munkatársak képzése: négy dokumentumpélda, presetenként egy, plusz egy felügyelt munkamenet.
Presetek előtt:
- Képzési idő: 3 hét
- Első heti hibaarány: 22%
- Éves képzési költség: 60 000 euró
Presetekkel:
- Képzési idő: 1 nap
- Első heti hibaarány: 3%
- Éves képzési költség: 15 000 euró
A 3%-os maradék hibaarány könnyen kiszűrhető a minőség-ellenőrzés során. A 22%-os arány nem volt az. Megfelelőségi incidenseket okozott, amelyek eszkalációt tettek szükségessé.
Egy további előny: a termelékenység az 1–3. héten. Presetekkel az új munkatársak már a második naptól felhasználható kimenetet produkálnak. Nélkülük három hét telik el, mielőtt önállóan dolgoznak.
Intézményi tudás a presetben
A dokumentum-felülvizsgálatban magas a fluktuáció. Presetek nélkül a tudás elmegy, amikor a munkatárs távozik. Az elemző, aki megtalálta az EU e-discovery névfelismerés megfelelő megbízhatósági beállítását, már elment. Ez az ismeret vele ment.
Presetekkel a konfiguráció marad. Az „EU E-Discovery — GDPR” preset tartalmazza a tesztelt, jóváhagyott beállításokat. Az új munkatársak az első naptól használják. Nem kell újraépíteni, amit az előző csapat megtanult.
Ez a legfontosabb a gyorsan bővülő vagy szezonális csúcsokkal szembesülő csapatoknál. A preset az intézményi emlékezet. Nem megy nyugdíjba.
A hibaarány csökkentése megfelelőségi mutató
22%-ról 3%-ra csökkentés nem csupán képzési szám. Megfelelőségi szám is.
Minden konfigurációs hiba két típus egyike:
- Alul-anonymizálás: A személyes adat megmarad a kimenetben. Ez megfelelőségi kockázatot teremt.
- Túl-anonymizálás: Hasznos adatokat szükségtelenül eltávolítanak. Ez rontja a munkaterméket.
Dokumentum-felülvizsgálatnál az alul-anonymizálás ügyfél-adatokat tehet közzé vagy megsértheti a védelmi végzéseket. A túl-anonymizálás ügyvédi időt emészt fel, miközben visszakeresik a tévesen eltávolított kontextust.
A presetek mindkét hibatípust csökkentik. A megfelelő személy állítja be a konfigurációt. A munkatársak alkalmazzák azt. Nem értelmezik.
A preset-irányítás konfigurációs eltérést csökkentő hatásáról bővebben lásd a konfigurációs eltérés GDPR-megfelelőségi útmutatót. Az ML-csapatok ugyanezzel a problémával szembesülnek és ugyanezt a megoldást alkalmazhatják — lásd reprodukálható adatvédelmi presetek ML-tanítóadatokhoz.
Összefoglalás
A 2–4 hetes képzési időszak nem a szoftverbe van beépítve. Abból ered, hogy minden személytől megkövetelik, hogy saját konfigurációs döntéseket hozzon.
A presetek eltüntetik ezt a követelményt. Csökkentik a bevezetési időt és alacsonyabb szintre szorítják a hibaarányt. Megőrzik az intézményi tudást. Az auditorok egyértelmű nyilvántartást kapnak a feldolgozási döntések meghozataláról.
A gyorsan növekvő csapatok, a szezonális műveletek és a magas fluktuációjú környezetek mind profitálnak ebből. Az új munkatársak órákon belüli betanítása hetek helyett valódi működési előny.