Usposabljanje za orodja za zasebnost: od tednov do ur s prednastavitvami
Podjetje za pravno obdelavo dokumentov (LPO) vsako leto zaposli 50 novih delavcev za pregled dokumentov. Brez prednastavitev usposabljanje traja tri tedne. Novi delavci se morajo nauciti, katera od 285+ vrst entitet ustreza posameznemu tipu dokumenta. Izbrati morajo pravo metodo. Nastaviti morajo pragove zaupanja. Vse to skupaj vzame cas.
Tri tedne usposabljanja za 50 delavcev stane priblizno 60.000 EUR na leto. To ne vkljucuje izgubljenega ucinka med obdobjem ucenja.
Po uvedbi prednastavitev: en dan usposabljanja. Letni stroski padejo na 15.000 EUR. Prihranek znaša 45.000 EUR.
Zakaj usposabljanje za orodja za zasebnost traja tako dolgo
Preden obdelajo prvo datoteko, novi delavci soocajo s tremi zahtevnimi odlocitvami.
Izbira entitet. Platforma podpira 285+ vrst entitet v 48 jezikih. Obstaja šest kategorij zaznavanja: vladni ID, financni, medicinski, osebni kontakt, organizacijski identifikatorji in po meri. Izbira pravega podmnozice za posamezen tip dokumenta ni hitra. Zahteva poznavanje knjiznice entitet in veljavnih pravil.
Izbira metode. Na voljo je pet metod anonimizacije:
- Redact -- trajno odstrani podatke; maksimizira zmanjsanje podatkov
- Replace -- zamenja prave podatke s sinteticnimi vrednostmi; uporabno za nabore podatkov za ucenje ML
- Pseudonymize -- ustvari stabilno preslikavo; ohranja povezave med zapisi; reverzibilno s kljucem
- Mask -- skrije podatke na ravni znakov; ohranja obliko polja
- Encrypt -- šifriranje AES-256 z upravljanjem kljucev; reverzibilno z nadzorovanim dostopom
Dobra izbira zahteva poznavanje nadaljnje uporabe in veljavnih pravil. Novi delavci tega pogosto ne vedo.
Pragovi zaupanja. Višji prag pomeni manj laznih pozitivnih rezultatov, a vec spregledan PII. Nizji prag zajame vec PII, a zahteva vec pregledovalnega dela. Novi delavci, ki to odlocitev sprejemajo sami, se pogosto motijo.
Brez prednastavitev stopnja napak pri nastavitvi v prvem tednu znasa priblizno 22 % v takem scenariju. Nekatere napake pustijo PII v izhodu. Druge odstranijo prevec.
Preobrat s prednastavitvami
Prednastavitve obrnejo problem usposabljanja.
Brez prednastavitev: Novi delavci se morajo nauciti vrst entitet, logike metod in nastavljanja pragov. To je dolg tecaj. Pravo delo caka.
S prednastavitvami: Novi delavci se naucijo, katera prednastavitev ustreza posameznemu tipu dokumenta. To je enostavno. Ne potrebujejo poznati vsake nastavitve. Izberejo pravo prednastavitev in delajo.
Menedzer za skladnost, DPO ali vodja zasebnosti enkrat vnese prave odlocitve v prednastavitev. Delavci te odlocitve uporabijo. Vsakic jih ne premisljajo znova.
Tako je videti usposabljanje pred in po.
Pred prednastavitvami -- skupaj 3 tedne:
- 3 dni: pregled knjiznice entitet
- 3 dni: izbira metode
- 3 dni: nastavitev pragov in pregled kakovosti
- 3 dni: regulativne zahteve (GDPR, HIPAA)
- 3 dni: nadzorovana praksa
Po prednastavitvah -- skupaj 1 dan:
- 2 uri: prepoznavanje tipa dokumenta
- 2 uri: izbira prednastavitve po kategoriji dokumenta
- 2 uri: kdaj oznaciti izhod za pregled
- 2 uri: nadzorovana praksa na 3-4 primerih dokumentov
Primer podjetja LPO
To podjetje opravlja pregled dokumentov za odvetniške stranke. Ukvarja se s stirimi tipi dokumentov: elektronskim odkritjem (e-discovery) v ZDA in EU, odgovori na zahtevke DSAR po clenku 15 GDPR, pregledom pogodb in skrbnim pregledom pri prevzemih in zdruzitevah.
Podjetje je zgradilo knjiznico prednastavitev s stirimi imenovanimi prednastavitvami:
- US E-Discovery Standard -- imena, e-pošta, SSN, financni identifikatorji; Redact
- EU E-Discovery -- GDPR -- kategorije osebnih podatkov EU; Redact
- DSAR Response -- identifikatorji tretjih oseb, ne podatki samega posameznika; Replace
- M&A Due Diligence -- poslovni identifikatorji, financni podatki; Redact
Usposabljanje novih delavcev: stiri primeri dokumentov, po en za vsako prednastavitev, in nadzorovana seja.
Pred prednastavitvami:
- Cas usposabljanja: 3 tedne
- Stopnja napak v prvem tednu: 22 %
- Letni stroski usposabljanja: 60.000 EUR
Po prednastavitvah:
- Cas usposabljanja: 1 dan
- Stopnja napak v prvem tednu: 3 %
- Letni stroski usposabljanja: 15.000 EUR
3-odstotno preostalo stopnjo napak je enostavno zaznati v QA. 22-odstotne stopnje ni bilo. Povzrocila je incidente glede skladnosti, ki so zahtevali eskalacijo.
Dodatna prednost: produktivnost v tednih 1-3. S prednastavitvami novi delavci ze od drugega dne naprej ustvarjajo uporabne izide. Brez njih minejo tri tedne, preden zacnejo delati samostojno.
Institucionalno znanje v prednastavitvi
Visoka fluktuacija zaposlenih je v pregledu dokumentov pogosta. Brez prednastavitev znanje odide z delavci. Analitik, ki je nasel pravo nastavitev praga zaupanja za zaznavanje imen v evropskem e-discovery postopku, je šel. Ta uvid gre z njim.
S prednastavitvami konfiguracija ostane. Prednastavitev "EU E-Discovery -- GDPR" ohranja preverjene in odobrene nastavitve. Novi delavci jo uporabljajo ze od prvega dne. Nihce ne sme znova zgraditi tega, kar je naucila prejšnja ekipa.
To je najpomembnejše za ekipe, ki se hitro povecujejo ali se soocajo s sezonskimi konicami. Prednastavitev je institucionalni spomin. Ne gre v pokoj.
Zmanjšanje napak je merilo skladnosti
Pad s 22 % na 3 % ni le stevilo za usposabljanje. Je število za skladnost.
Vsaka konfiguracijska napaka spada v eno od dveh vrst:
- Pod-anonimizacija: PII ostane v izhodu. To ustvari tveganje za skladnost.
- Nad-anonimizacija: Koristni podatki so odstranjeni brez potrebe. To škoduje kakovosti delovnega produkta.
Pri pregledu dokumentov lahko pod-anonimizacija razkrije podrobnosti o strankah ali krši varstvene odredbe. Nad-anonimizacija zapravljata cas odvetnikov, ki se trudijo obnoviti kontekst, ki je bil zmotno odstranjen.
Prednastavitve zmanjšujejo obe vrsti napak. Prava oseba nastavi konfiguracijo. Delavci jo uporabijo. Ne razlagajo je.
Vec o tem, kako upravljanje prednastavitev dolgorocno zmanjšuje odmik konfiguracije, najdete v vodniku za skladnost konfiguracije z GDPR. Ekipe ML, ki se soocajo z enakim problemom, lahko uporabijo isto rešitev -- oglejte si ponovljive prednastavitve zasebnosti za podatke za ucenje ML.
Zakljucek
2-4 tedni usposabljanja niso vgrajeni v programsko opremo. Izhajajo iz zahteve, da vsaka oseba sama sprejme konfiguracijske odlocitve.
Prednastavitve to zahtevo odpravijo. Skrajšajo cas uvajanja in znizajo stopnje napak. Ohranjajo institucionalno znanje. Revizorji dobijo jasen zapis o nacinu sprejemanja odlocitev o obdelavi.
Hitro rastoc ekipe, sezonske dejavnosti in okolja z visoko fluktuacijo zaposlenih imajo vse od tega koristi. Usposabljanje novih delavcev v urah namesto tednih je resnična operativna prednost.