Tietosuojakoulutus: Viikoista Tunteihin esiasetuksilla
Eräs LPO-yritys palkkaa 50 uutta asiakirjatarkistajaa vuosittain. Ilman esiasetuksia koulutus kestää kolme viikkoa. Henkilöstön on opittava, mitkä 285+ entiteettityypeistä soveltuvat kuhunkin asiakirjatyyppiin, valittava oikea menetelmä ja kalibroitava luottamuskynnykset. Tämän tekeminen oikein vie aikaa.
Kolmen viikon koulutus 50 tarkistajalle maksaa noin 60 000 euroa vuodessa. Tähän ei sisälly oppimisjakson tuottavuusmenetykset.
Esiasetuksien käyttöönoton jälkeen: yksi päivä koulutusta. Vuotuiset kustannukset laskevat 15 000 euroon. Säästö on 45 000 euroa.
Miksi tietosuojatyökalujen koulutus vie niin kauan
Uusi henkilöstö kohtaa kolme vaikeaa valintaa ennen kuin käsittelee ainuttakaan tiedostoa.
Entiteettien valinta. Alusta tukee yli 285 entiteettityyppiä 48 kielellä. Tunnistamisessa on kuusi kategoriaa: valtiollisen henkilöllisyyden todistukset, taloustiedot, terveystiedot, henkilökohtaiset yhteystiedot, yritystunnisteet ja mukautetut tunnisteet. Oikean osajoukon valitseminen tietylle asiakirjatyypille ei ole nopeaa. Se vaatii tuntemusta entiteettikirjastosta ja sovellettavista säännöistä.
Menetelmän valinta. Käytettävissä on viisi anonymisointimenetelmää:
- Häivyttäminen — poistaa tiedot pysyvästi; maksimoi tietojen vähentämisen
- Korvaaminen — korvaa todelliset tiedot synteettisillä arvoilla; hyödyllinen ML-opetusaineistoille
- Pseudonymisointi — luo vakaan vastaavuuden; säilyttää tietueiden väliset yhteydet; kumottavissa avaimella
- Peittäminen — piilottaa tiedot merkkitasolla; säilyttää kentän muodon
- Salaus — AES-256-salaus avainten hallinnalla; kumottavissa hallitulla pääsyllä
Hyvän valinnan tekeminen edellyttää tietoa jatkokäytöstä ja sovellettavista säännöistä. Uusi henkilöstö ei aina tunne kumpaakin.
Luottamuskynnykset. Korkeampi kynnys tarkoittaa vähemmän vääriä positiivisia mutta enemmän havaitsematta jääneitä henkilötietoja. Alempi kynnys löytää enemmän henkilötietoja mutta lisää tarkistustyötä. Uusi henkilöstö, joka tekee tämän päätöksen itse, erehtyy usein.
Ilman esiasetuksia konfigurointivirheiden aste ensimmäisellä viikolla on tällaisessa tilanteessa noin 22 %. Jotkin virheet jättävät henkilötietoja tiedostoon. Toiset poistavat liikaa.
Esiasetuksen käänteinen logiikka
Esiasetukset kääntävät koulutusongelman ylösalaisin.
Ilman esiasetuksia: Henkilöstön on opittava entiteettityypit, menetelmälogiikka ja kynnysarvojen kalibrointi. Tämä on pitkä prosessi. Varsinainen työ odottaa.
Esiasetuksilla: Henkilöstön on opittava, mikä esiasetus sopii kuhunkin asiakirjatyyppiin. Se on yksinkertaista. Heidän ei tarvitse tuntea jokaista asetusta. He valitsevat oikean esiasetuksen ja tekevät työtä.
Compliancepäällikkö, tietosuojavastaava tai tietosuorapäällikkö koodaa oikeat valinnat kerran esiasetukseen. Henkilöstö soveltaa niitä valintoja. He eivät mieti niitä joka kerta uudelleen.
Näin koulutus näyttää ennen ja jälkeen.
Ennen esiasetuksia — yhteensä 3 viikkoa:
- 3 päivää: entiteettikirjaston yleiskatsaus
- 3 päivää: menetelmän valinta
- 3 päivää: kynnysarvojen kalibrointi ja laaduntarkistus
- 3 päivää: sääntelyvaatimukset (GDPR, HIPAA)
- 3 päivää: ohjattu harjoittelu
Esiasetuksien jälkeen — yhteensä 1 päivä:
- 2 tuntia: asiakirjatyypin tunnistaminen
- 2 tuntia: esiasetuksen valinta asiakirjakategorian mukaan
- 2 tuntia: milloin tuloste merkitään tarkistettavaksi
- 2 tuntia: ohjattu harjoittelu 3–4 esimerkkiasiakirjalla
LPO-yrityksen tapaus
Tämä yritys tekee asiakirjatarkistuksia lakitoimistojen asiakkaille. Se käsittelee neljää asiakirjatyyppiä: yhdysvaltalainen ja eurooppalainen e-discovery, GDPR:n 15 artiklan mukaiset DSAR-vastaukset, sopimusten tarkistus ja M&A due diligence.
Yritys rakensi esiasetuskirjaston neljällä nimetyllä esiasetuksella:
- US E-Discovery Standard — nimet, sähköpostit, SSN:t, taloustunnisteet; häivyttäminen
- EU E-Discovery — GDPR — EU:n henkilötietoluokat; häivyttäminen
- DSAR-vastaus — kolmansien osapuolten tunnisteet, ei rekisteröidyn; korvaaminen
- M&A Due Diligence — yritystunnisteet, taloustiedot; häivyttäminen
Uuden henkilöstön koulutus: neljä esimerkkiasiakirjaa, yksi kutakin esiasetusta kohden, sekä ohjattu istunto.
Ennen esiasetuksia:
- Koulutusaika: 3 viikkoa
- Virheaste ensimmäisellä viikolla: 22 %
- Vuotuiset koulutuskustannukset: 60 000 euroa
Esiasetuksien jälkeen:
- Koulutusaika: 1 päivä
- Virheaste ensimmäisellä viikolla: 3 %
- Vuotuiset koulutuskustannukset: 15 000 euroa
Jäljelle jäävä 3 %:n virheaste on helppo havaita laaduntarkistuksessa. 22 %:n virheaste ei ollut. Se tuotti compliance-tapahtumia, jotka vaativat eskalointia.
Lisähyöty: tuottavuus viikoilla 1–3. Esiasetuksilla uusi henkilöstö tuottaa käyttökelpoisia tuloksia toisesta päivästä alkaen. Ilman esiasetuksia kolme viikkoa kuluu ennen kuin he työskentelevät itsenäisesti.
Institutionaalinen tieto esiasetuksessa
Korkea henkilöstönvaihtuvuus on yleistä asiakirjatarkistuksessa. Ilman esiasetuksia tieto lähtee lähtijöiden mukana. Analyytikko, joka oli löytänyt oikean luottamuskynnyksen nimikohtaisen tunnistamisen tehostamiseen EU-e-discoveryssä, lähti. Tuo oivallus katosi hänen mukanaan.
Esiasetuksilla konfiguraatio pysyy. "EU E-Discovery — GDPR" -esiasetus säilyttää testatut ja hyväksytyt asetukset. Uusi henkilöstö käyttää niitä ensimmäisestä päivästä lähtien. Kenenkään ei tarvitse rakentaa uudelleen sitä, mitä edellinen tiimi oli oppinut.
Tämä on erityisen tärkeää nopeasti kasvavilla tiimeillä tai sesonkiluonteisissa huippukuormituksissa. Esiasetus on institutionaalinen muisti. Se ei jää eläkkeelle.
Virheiden väheneminen on compliance-mittari
Lasku 22 %:sta 3 %:iin ei ole vain koulutusluku. Se on compliance-luku.
Jokainen konfigurointivirhe on toista kahdesta tyypistä:
- Alianonymisointi: Henkilötietoja jää tulosteeseen. Tämä luo compliance-riskin.
- Ylianonymisointi: Hyödyllisiä tietoja poistetaan tarpeettomasti. Tämä heikentää työn laatua.
Asiakirjatarkistuksessa alianonymisointi voi paljastaa asiakastietoja tai rikkoa suojausmääräyksiä. Ylianonymisointi saa asianajajat tuhlaamaan aikaa virheellisesti poistetun kontekstin palauttamiseen.
Esiasetukset vähentävät molempia virhelajeja. Oikea henkilö asettaa konfiguraation. Henkilöstö soveltaa sitä. He eivät tulkitse sitä.
Lisätietoa siitä, miten esiasetushallinta vähentää konfiguraation ajautumista ajan myötä, löydät konfiguraation ajautuminen ja GDPR-riski -oppaasta. ML-tiimit, jotka kohtaavat saman ongelman, voivat soveltaa samaa ratkaisua — katso toistettavat tietosuojaesiasetukset ML-opetusaineistoille.
Yhteenveto
2–4 viikon perehdytysjakso ei ole sisäänrakennettu ohjelmistoon. Se johtuu siitä, että jokainen henkilö tekee omat konfigurointipäätöksensä.
Esiasetukset poistavat tämän vaatimuksen. Ne lyhentävät perehdytysaikaa ja laskevat virheastetta. Ne säilyttävät institutionaalisen tiedon. Tarkistajat saavat selkeän kirjauksen siitä, miten käsittelypäätökset on tehty.
Nopeasti kasvavat tiimit, sesonkiluonteiset toiminnot ja suuren henkilöstönvaihtuvuuden ympäristöt hyötyvät kaikki. Uuden henkilöstön kouluttaminen tunneissa viikkojen sijaan on todellinen operatiivinen etu.