A táblázatok nem egyszerű dokumentumok
Egy Word-fájl szöveges folyam. Egy Excel-fájl valami egészen más. A cellák más cellákra mutatnak. A képletek tartományokon futnak. A kimutatástáblák névvel ellátott adatokat csoportosítanak. A makrók az egész munkafüzeten végighaladnak. A legtöbb iratfektetési eszköz szöveges dokumentumként kezeli az Excelt. Ez a rossz megközelítés.
Íme egy egyszerű példa. Az A oszlop ügyfeleket neveket tartalmaz. A D oszlopban ez a képlet szerepel: =VLOOKUP(A2, CustomerTable, 5, FALSE). Ez a képlet név alapján keresi meg a számlaegyenleget. Lecseréli a nevet az A oszlopban. Nem frissíti a képletet vagy a keresési táblát. A képlet továbbra is az eredeti névhez tartozó valós egyenleget adja vissza. A fájl tisztának tűnik. Mégsem az.
Ez gyakori jelenség a vállalati Excel-fájlokban. Az adatok kapcsolatokban élnek — nem csupán cellákban. Ha a cellaértékeket anélkül cseréljük ki, hogy nyomon követnénk ezeket a kapcsolatokat, a személyes azonosításra alkalmas adat (PII) kitett marad.
A GDPR 28. cikke és a külső megosztás
A GDPR 28. cikke az adatfeldolgozókkal való adatmegosztást szabályozza. Ha személyes adatokat küld egy tanácsadónak, szállítónak vagy könyvvizsgálónak, technikai biztosítékokat kell alkalmaznia.
Tegyük fel, hogy egy 50 000 soros ügyfél-fájlt kell megosztania egy elemzési szállítóval. A PDF-exportálás eltávolítja a képleteket. Ez nagy fájlokat is tönkretesz összetett formázással. A CSV is eltávolítja a képleteket és a kimutatástáblákat. Egyik sem ad a szállítónak használható adatkészletet.
Az egyetlen működő lehetőség: anonimizálás a natív Excel-formátumon belül. Az azonosító értékek cseréje. A struktúra megőrzése. A szállító egy működő fájlt kap. Ön teljesíti a GDPR biztosítéki követelményét.
Légréses környezetek
A kormányzati és védelmi közbeszerzési ajánlati felhívások 67%-a hivatkozik légréses környezeti követelményekre (DISA 2024). A védelmi vállalkozók személyzeti adatokat, logisztikai nyilvántartásokat és közbeszerzési fájlokat kezelnek Excelben. Nem használhatnak felhőalapú eszközöket. Az adatok nem hagyhatják el az ellenőrzött hálózatot.
Az asztali alkalmazás megoldja ezt. A helyi gépen dolgozza fel az Excel-fájlokat. A feldolgozás során nem történik hálózati kommunikáció. A kimeneti fájl sosem hagyja el a légréses környezetet. A belső csapatok a megtisztított fájlokat megoszthatják az ellenőrzött hálózaton belül.
Ez megfelel a kormányzati szerződéses megfelelőséghez szükséges technikai profilnak.
A cellaintelligencia három szintje
A jó Excel-anonimizálás egyszerre három szinten működik.
Értékszint: PII keresése és cseréje az egyes cellákban. A nevek, e-mail-címek, telefonszámok és nemzeti azonosítók jelzése ugyanazzal a felismerési rendszerrel történik, mint a dokumentumfeldolgozásnál.
Képletszint: PII-cellákra hivatkozó képleteket tartalmazó cellák keresése. Ezeknek a hivatkozásoknak az anonimizált értékekre való frissítése. Vagy a képlet felváltása az eredményével, hogy megakadályozza a képlet alapú PII-kitettséget.
Struktúraszint: A kimutatástáblák adatgyorsítótárainak törlése. Rejtett sorok és oszlopok feldolgozása. Olyan VBA-makrókód kezelése, amely konkrét cellacímeket vagy értékeket használ.
Mindhárom szintnek egyszerre kell futnia. Az értékek javítása képletek javítása nélkül a PII-t a helyén hagyja. A képletek javítása gyorsítótárak törlése nélkül ugyanezt teszi.
Ez a kihívás minden fájlformátumot érint. A PII-felismerést befolyásoló formátumtöredezettségről szóló cikkünkben átfogóbb képet kaphat.
API-szinten strukturált adatokkal dolgozó csapatok számára lásd: GDPR-adatminimalizálás valós idejű API-kban.
Ha a csapata nagy DSAR-exportokat futtat, tekintse meg a GDPR DSAR kötegelt feldolgozásáról szóló útmutatót.