Privātuma rīku apmācība: no nedēļām uz stundām ar iepriekšiestatījumiem
LPO uzņēmums katru gadu pieņem darbā 50 jaunus dokumentu pārskatīšanas darbiniekus. Bez iepriekšiestatījumiem apmācība ilgst trīs nedēļas. Jaunie darbinieki ir jāiemāca, kuri no 285+ entītiju tipiem atbilst katram dokumenta veidam. Viņiem jāizvēlas pareizā metode. Jāpielāgo uzticamības sliekšņi. Tas viss prasa laiku.
Trīs nedēļu apmācība 50 darbiniekiem izmaksā aptuveni 60 000 EUR gadā. Tas neiekļauj zaudēto ražīgumu mācīšanās laikā.
Pēc iepriekšiestatījumu pievienošanas: viena diena apmācībai. Gada izmaksas samazinās līdz 15 000 EUR. Tas ir ietaupījums 45 000 EUR apmērā.
Kāpēc privātuma rīku apmācība aizņem tik ilgi
Jaunie darbinieki pirms pirmā faila apstrādes saskaras ar trim sarežģītiem lēmumiem.
Entītiju izvēle. Platforma atbalsta 285+ entītiju tipus 48 valodās. Pastāv sešas noteikšanas kategorijas: valdības ID, finanšu, medicīniskie, personīgā kontakta, organizācijas identifikatori un pielāgotie. Pareizās apakškopu izvēle konkrētam dokumenta veidam nav ātra — tas prasa zināšanas par entītiju bibliotēku un piemērojamiem noteikumiem.
Metodes izvēle. Pieejamas piecas anonimizācijas metodes:
- Redaktēt — dzēš datus neatgriezeniski; maksimāli samazina datus
- Aizvietot — apmaina reālos datus ar sintētiskām vērtībām; noderīgi ML apmācības kopām
- Pseidonimizēt — izveido stabilu kartēšanu; saglabā saites starp ierakstiem; atgriezenisks ar atslēgu
- Maskēt — slēpj datus rakstzīmju līmenī; saglabā lauka formu
- Šifrēt — AES-256 šifrēšana ar atslēgu pārvaldību; atgriezenisks ar kontrolētu piekļuvi
Laba izvēle prasa zināt pakārtoto izmantošanu un piemērojamos noteikumus. Jaunie darbinieki ne vienmēr zina ne vienu, ne otru.
Uzticamības sliekšņi. Augstāks slieksnis nozīmē mazāk viltus pozitīvu rezultātu, bet vairāk nepamanītu PII. Zemāks slieksnis atklāj vairāk PII, bet pievieno pārskatīšanas darbu. Jaunie darbinieki, kas patstāvīgi pieņem šo lēmumu, bieži kļūdās.
Bez iepriekšiestatījumiem pirmās nedēļas iestatīšanas kļūdu īpatsvars šādā situācijā sasniedz aptuveni 22%. Dažas kļūdas atstāj PII uz vietas. Citas noņem pārāk daudz.
Iepriekšiestatījumu inversija
Iepriekšiestatījumi apgriež apmācības problēmu.
Bez iepriekšiestatījumiem: Jaunie darbinieki ir jāiemāca entītiju tipi, metožu loģika un sliekšņu pielāgošana. Tas ir garš kurss. Reālais darbs gaida.
Ar iepriekšiestatījumiem: Jaunie darbinieki iemācās, kurš iepriekšiestatījums atbilst katram dokumenta veidam. Tas ir vienkārši. Viņiem nav jāzina katrs iestatījums. Viņi izvēlas pareizo iepriekšiestatījumu un strādā.
Atbilstības vadītājs, DPO vai privātuma vadītājs pareizās izvēles vienu reizi kodē iepriekšiestatījumā. Darbinieki piemēro šīs izvēles. Viņi tās neinterpretē katru reizi no jauna.
Lūk, kā apmācība izskatās pirms un pēc.
Pirms iepriekšiestatījumiem — 3 nedēļas kopā:
- 3 dienas: entītiju bibliotēkas pārskats
- 3 dienas: metodes izvēle
- 3 dienas: sliekšņu pielāgošana un kvalitātes pārskatīšana
- 3 dienas: regulatīvās prasības (GDPR, HIPAA)
- 3 dienas: uzraudzīta prakse
Pēc iepriekšiestatījumiem — 1 diena kopā:
- 2 stundas: dokumenta veida identifikācija
- 2 stundas: iepriekšiestatījuma izvēle pēc dokumenta kategorijas
- 2 stundas: kad atzīmēt izvadi pārskatīšanai
- 2 stundas: uzraudzīta prakse ar 3–4 dokumentu piemēriem
LPO uzņēmuma gadījums
Šis uzņēmums veic dokumentu pārskatīšanu juridiskajiem klientiem. Tas apstrādā četrus dokumentu veidus: ASV un ES e-atklāsmi, GDPR 15. panta DSAR atbildes, līgumu pārskatīšanu un M&A pienācīgu rūpību.
Uzņēmums izveidoja iepriekšiestatījumu bibliotēku ar četriem nosauktiem iepriekšiestatījumiem:
- ASV E-atklāsmes standarts — vārdi, e-pasti, SSN, finanšu identifikatori; Redaktēt
- ES E-atklāsme — GDPR — ES personas datu kategorijas; Redaktēt
- DSAR atbilde — trešo pušu identifikatori, nevis datu subjekta paša dati; Aizvietot
- M&A pienācīgā rūpība — komerciālie identifikatori, finanšu dati; Redaktēt
Jauno darbinieku apmācība: četri dokumentu piemēri, viens katram iepriekšiestatījumam, plus uzraudzīta sesija.
Pirms iepriekšiestatījumiem:
- Apmācības laiks: 3 nedēļas
- Pirmās nedēļas kļūdu īpatsvars: 22%
- Gada apmācības izmaksas: 60 000 EUR
Pēc iepriekšiestatījumiem:
- Apmācības laiks: 1 diena
- Pirmās nedēļas kļūdu īpatsvars: 3%
- Gada apmācības izmaksas: 15 000 EUR
3% atlikušo kļūdu īpatsvaru ir viegli pamanīt QA procesā. 22% īpatsvars nebija tāds. Tas radīja atbilstības incidentus, kas prasīja eskalāciju.
Papildu priekšrocība: ražīgums 1.–3. nedēļā. Ar iepriekšiestatījumiem jaunie darbinieki no otrās dienas sniedz izmantojamu rezultātu. Bez tiem paiet trīs nedēļas, pirms viņi strādā patstāvīgi.
Institucionālās zināšanas iepriekšiestatījumā
Liela darbinieku mainība ir izplatīta dokumentu pārskatīšanā. Bez iepriekšiestatījumiem zināšanas aiziet līdz ar darbiniekiem. Analītiķis, kurš atrada pareizo uzticamības iestatījumu ES e-atklāsmes vārdu noteikšanai, ir aizgājis. Šī atziņa aiziet līdz ar viņu.
Ar iepriekšiestatījumiem konfigurācija paliek. "ES E-atklāsme — GDPR" iepriekšiestatījums satur testētos, apstiprinātος iestatījumus. Jaunie darbinieki to izmanto no pirmās dienas. Nevienam nav jāatjauno tas, ko iepriekšējā komanda iemācījās.
Tas ir vissvarīgāk komandām, kuras ātri aug vai saskaras ar sezonālajiem maksimumiem. Iepriekšiestatījums ir institucionālā atmiņa. Tas nepensionējas.
Kļūdu samazinājums ir atbilstības rādītājs
Kritums no 22% līdz 3% nav tikai apmācības skaitlis. Tas ir atbilstības skaitlis.
Katra konfigurācijas kļūda ir viens no diviem veidiem:
- Nepietiekama anonimizācija: PII paliek izvadē. Tas rada atbilstības risku.
- Pārmērīga anonimizācija: Noderīgi dati tiek noņemti bez vajadzības. Tas kaitē darba produkta kvalitātei.
Dokumentu pārskatīšanā nepietiekama anonimizācija var atklāt klientu datus vai pārkāpt aizsardzības rīkojumus. Pārmērīga anonimizācija tērē advokātu laiku, atgūstot kontekstu, kas tika kļūdaini noņemts.
Iepriekšiestatījumi samazina abus kļūdu veidus. Pareizā persona iestata konfigurāciju. Darbinieki to piemēro. Viņi to neinterpretē.
Plašāku informāciju par to, kā iepriekšiestatījumu pārvaldība samazina iestatīšanas novirzi laika gaitā, skatiet konfigurācijas novirzes GDPR atbilstības rokasgrāmatā. ML komandas, kuras saskaras ar to pašu problēmu, var piemērot to pašu risinājumu — skatiet reproducējamus privātuma iepriekšiestatījumus ML apmācības datiem.
Secinājums
2–4 nedēļu apmācības periods nav iebūvēts programmatūrā. Tas rodas, pieprasot katrai personai pieņemt savus konfigurācijas lēmumus.
Iepriekšiestatījumi noņem šo prasību. Tie samazina ieviešanas laiku un pazemina kļūdu īpatsvaru. Tie saglabā institucionālās zināšanas. Auditori saņem skaidru ierakstu par to, kā tika pieņemti apstrādes lēmumi.
Strauji augošas komandas, sezonālās operācijas un vidēs ar augstu kadru mainību gūst labumu. Jaunu darbinieku apmācība stundās, nevis nedēļās, ir reāla operatīvā priekšrocība.