Obuka za alate za privatnost: od nedelja do sati uz pres ete
Jedna LPO firma godisnje prima 50 novih radnika na pregledu dokumenata. Bez preseta, obuka traje tri nedelje. Novi radnici moraju da naucie koji od 285+ tipova entiteta odgovaraju svakom tipu dokumenta. Moraju da odaberu pravu metodu. Moraju da podesavaju pragove pouzdanosti. Sve to zajedno zahteva vreme.
Tri nedelje obuke za 50 radnika kostaju oko 60.000 EUR godisnje. To ne ukljucuje izgubljen ucinak tokom perioda ucenja.
Nakon uvodenja preseta: jedan dan obuke. Godisnji trosak pada na 15.000 EUR. Usteda iznosi 45.000 EUR.
Zasto obuka za alate za privatnost traje tako dugo
Novi radnici suocavaju se sa tri tezka izbora pre nego sto obrade i jedan fajl.
Izbor entiteta. Platforma podrzava 285+ tipova entiteta na 48 jezika. Postoji sest kategorija detekcije: drzavni ID, finansijski, medicinski, licni kontakt, organizacioni identifikatori i prilagodeni. Biranje pravog podskupa za odredeni tip dokumenta nije brzo. Zahteva poznavanje biblioteke entiteta i primenjenih pravila.
Izbor metode. Dostupno je pet metoda anonimizacije:
- Redakcija - trajno uklanja podatke; maksimizira smanjenje podataka
- Zamena - zamenjuje stvarne podatke sintetickim vrednostima; korisno za ML skupove za obuku
- Pseudonimizacija - kreira stabilno mapiranje; cuva veze izmedju zapisa; reverzibilno kljucem
- Maskiranje - skriva podatke na nivou karaktera; cuva oblik polja
- Enkripcija - AES-256 enkripcija sa upravljanjem kljucevima; reverzibilno uz kontrolisani pristup
Dobar izbor zahteva poznavanje krajnje namene i primenjenih pravila. Novi radnici to cesto ne znaju.
Pragovi pouzdanosti. Visi prag znaci manje laznih pozitiva, ali vise propustenih PII. Nizi prag hvata vise PII, ali dodaje posao na pregledu. Novi radnici koji sami donose ovu odluku cesto grese.
Bez preseta, stopa greski u podesavanju tokom prve nedelje iznosi oko 22% u ovakvom scenariju. Neke greske ostavljaju PII na mestu. Druge uklanjaju previse.
Inverzija preseta
Preseti okrecu problem obuke.
Bez preseta: Novi radnici moraju da uce tipove entiteta, logiku metoda i podesavanje pragova. To je dug kurs. Pravi posao ceka.
Sa presetima: Novi radnici uce koji preset odgovara kom tipu dokumenta. To je jednostavno. Ne moraju da znaju svako podesavanje. Biraju pravi preset i rade.
Menadzer za uskladjenost, DPO ili strucnjak za privatnost jednom unosi ispravne izbore u preset. Radnici primenjuju te izbore. Ne moraju da ih rezonuju svaki put.
Ovako izgleda obuka pre i posle.
Pre preseta - 3 nedelje ukupno:
- 3 dana: pregled biblioteke entiteta
- 3 dana: izbor metode
- 3 dana: podesavanje pragova i pregled kvaliteta
- 3 dana: regulatorni zahtevi (GDPR, HIPAA)
- 3 dana: nadzirana praksa
Posle preseta - 1 dan ukupno:
- 2 sata: identifikacija tipa dokumenta
- 2 sata: izbor preseta po kategoriji dokumenta
- 2 sata: kada oznaciti izlaz za pregled
- 2 sata: nadzirana praksa na 3-4 primera dokumenta
Slucaj LPO firme
Ova firma vrsi pregled dokumenata za klijente iz pravnih firmi. Obradjuje cetiri tipa dokumenata: americko i evropsko e-otkrivanje, odgovore na GDPR clanac 15 DSAR zahteve, pregled ugovora i due diligence za M&A.
Firma je izgradila biblioteku preseta sa cetiri imenovana preseta:
- US E-Discovery Standard - imena, emailovi, SSN, finansijski identifikatori; Redakcija
- EU E-Discovery - GDPR - EU kategorije licnih podataka; Redakcija
- DSAR odgovor - identifikatori trecih strana, ne oni subjekta podataka; Zamena
- M&A Due Diligence - komercijalni identifikatori, finansijski podaci; Redakcija
Obuka novih radnika: cetiri primera dokumenata, jedan po presetu, plus nadzirana sesija.
Pre preseta:
- Vreme obuke: 3 nedelje
- Stopa greski u prvoj nedelji: 22%
- Godisnji trosak obuke: 60.000 EUR
Posle preseta:
- Vreme obuke: 1 dan
- Stopa greski u prvoj nedelji: 3%
- Godisnji trosak obuke: 15.000 EUR
Preostala stopa greski od 3% lako se hvata u QA. Stopa od 22% nije bila. Ona je izazvala incidente uskladjenosti koji su zahtevali eskalaciju.
Dodatna prednost: produktivnost tokom nedelja 1-3. Sa presetima, novi radnici od drugog dana proizvode koristljiv izlaz. Bez njih, prolaze tri nedelje pre nego sto rade samostalno.
Institucionalno znanje u presetu
Visoka fluktuacija osoblja je uobicajena u pregledu dokumenata. Bez preseta, znanje odlazi kada osoblje ode. Analiticar koji je nasao ispravno podesavanje praga za detekciju EU e-otkrivanja imenica je otisao. Ta uvid odlazi sa njim.
Sa presetima, konfiguracija ostaje. Preset "EU E-Discovery - GDPR" cuva testirana, odobrena podesavanja. Novi radnici ga koriste od prvog dana. Niko ne mora da ponovo gradi ono sto je prethodni tim naucio.
Ovo je najvaznije za timove koji brzo rastu ili se suocavaju sa sezonskim vrsnjacima. Preset je institucionalna memorija. On se ne penzionise.
Smanjenje greski je metrika uskladjenosti
Pad sa 22% na 3% nije samo broj obuke. To je broj uskladjenosti.
Svaka greska konfiguracije je jednog od dva tipa:
- Pod-anonimizacija: PII ostaje u izlazu. Ovo stvara rizik uskladjenosti.
- Preterana anonimizacija: Korisni podaci se uklanjaju bez potrebe. Ovo steti kvalitetu rada.
U pregledu dokumenata, pod-anonimizacija moze da izlozi detalje klijenta ili prekrsi zastitne naloge. Preterana anonimizacija trosi vreme advokata na oporavak konteksta koji je pogresno uklonjen.
Preseti smanjuju oba tipa greski. Prava osoba podesava konfiguraciju. Osoblje je primenjuje. Oni je ne interpretiraju.
Vise o tome kako upravljanje presetima smanjuje drift podesavanja tokom vremena pogledajte u vodicu za GDPR uskladjenost drift konfiguracije. ML timovi koji se suocavaju sa istim problemom mogu primeniti isti popravak - pogledajte reproduktivne presete privatnosti za ML podatke za obuku.
Zakljucak
Period obuke od 2-4 nedelje nije ugradjeni deo softvera. Dolazi od zahteva da svaka osoba donosi sopstvene konfiguracione odluke.
Preseti uklanjaju taj zahtev. Smanjuju vreme uvodjenja i snizavaju stope greski. Cuvaju institucionalno znanje. Revizori dobijaju jasan zapis o tome kako su donosene odluke o obradi.
Timovi koji brzo rastu, sezonske operacije i okruzenja sa visokom fluktuacijom svi imaju koristi. Obuka novih radnika u satima umesto nedelja je prava operativna prednost.