A Dokumentáció PII Felhalmozódási Problémája
A belső tudásbázisok — Confluence, Notion, SharePoint, GitBook — egy speciális PII-problémát halmoznak fel, amely szinte teljesen láthatatlan a standard megfelelőségi eszközök számára: az ügyfelek személyes adatai beágyazódnak a folyamat-dokumentációhoz használt képernyőfotókba.
A forgatókönyv ezer ügyfélszolgálati és műveleti csapatnál játszódik le:
Egy ügyfélszolgálati munkatárs szokatlan fiók-konfigurációt fedez fel. Képernyőfotót készít az ügyfél fiókjáról a folyamatban lévő tudásbázis-cikkhez. A képernyőfotó tartalmazza az ügyfél nevét a felhasználói felület fejlécében, az e-mail-címét a fiókbeállításokban és az előfizetési adatait.
A tudásbázis-cikk publikálódik a belső wikibe. 150 ügyfélszolgálati munkatárs fér hozzá. 12 alvállalkozói ügynök fér hozzá. 5 fejlesztő, aki a munkafolyamatot hibakeresési célból olvassa, fér hozzá.
Az ügyfél soha nem adta beleegyezését adatainak belső dokumentációs rendszerekben való megőrzéséhez. Az adatkezelési megállapodás meghatározza az adatmegőrzési időszakot az ügyfélszolgálati rendszerekre — de a wiki-cikkre nem vonatkozik ez az időszak. Évek múlva a wiki-cikk még mindig megvan; az ügyfél rég nem ügyfél; a személyes adatai még mindig megjelennek az oldalon.
A Mérték az Idő Múlásával
Egy 200 fős ügyfélszolgálati csapat, amely naponta átlagosan 2 dokumentációs képernyőfotót készít, évente 520 × 200 = 104 000 potenciális PII-tartalmú képet hoz létre. A legtöbb ezek közül soha nem kerül felülvizsgálatra PII-tartalom szempontjából. Mindegyik hozzáadódik a belső wiki PII-archívumhoz, amely az alkalmazottak jönnek-mennek, és senki sem veszi észre a személyes adatok felhalmozódást.
Ez a tudásbázis PII felhalmozódásnak nevezett jelenség a GDPR 5(1)(e) cikkét sérti (a személyes adatokat nem lehet tovább megőrizni, mint amennyire a feldolgozási célokhoz szükséges) és a GDPR 5(1)(a) cikkét (az adatoknak "célhoz kötöttnek" kell lenniük — az ügyfélszolgálati dokumentáció általában nem képezi a személyes adatok megőrzésének jogalapját).
Technikai Megoldás: A Tudásbázis PII Audit
1. lépés: A wiki-tartalom szövegének kinyerése A Confluence, Notion és SharePoint API-val rendelkeznek a tartalom kinyeréséhez. A wikioldalak strukturált szövegként kinyerhetők, a képek és csatolmányok elkülönítve.
2. lépés: Szövegtartalom PII-elemzése A kinyert szöveg átfuttatható PII-észlelési motoron, amely azonosítja az összes szövegalapú személyes adatot: neveket, e-maileket, telefonszámokat, fiók-azonosítókat.
3. lépés: A képernyőfotók kezelése A wikibe beágyazott képek optikai karakterfelismerést (OCR) igényelnek a szöveges tartalom kinyeréséhez, majd PII-észlelést a kinyert szövegen. Ez összetettebb, és képfeldolgozási eszközöket igényel.
4. lépés: Orvoslás Azonosított PII esetén: a szöveges tartalom névtelenítése helyett, a jobb megközelítés a tartalomszerkesztés — a képernyőfotók cseréje névtelenített verziókra, vagy a valódi ügyféladatokat mutató képernyőfotók eltávolítása és szintetikus adatokat mutató képernyőfotókkal való helyettesítése.
Megelőzés: A jobb hosszú távú megközelítés egy irányelvt és egy eszközt ötvöz:
- Irányelvek: Soha ne dokumentáljon folyamatokat valódi ügyféladatokat tartalmazó képernyőfotókkal. Használjon tesztkörnyezeteket vagy szintetikus adatokat.
- Eszközök: Az ügyfélszolgálati eszközök integrálhatók PII-maszkolással, amely az ügyfél adatait takarja a munkatárs felhasználói felületén — eltávolítva a személyes adatokat a képernyőfotókból a készítés előtt.
Források: