Zergatik Excel Zure Arrisku Handieneko Fitxategi Mota Den
Excel fitxategiak negozio gehienetan GDPR arrisku handienetarikoak dira. Sendabelari-erregistroek errenkada bakoitzeko datu sentikorragoak eduki ditzakete. Baina kalkulu-orriak PII azkar pilatzen du -- eta betetze-taldeek askotan galtzen dituzte.
Hiru gauza egiten dituzte zaila Excel fitxategiak kudeatzea.
Bolumena: XLSX fitxategi batek 50.000 errenkada eta 100 zutabe eduki ditzake. Hori bost milioi gelaxka da. Eskuzko berrikuspenik ezin du denak egiaztatu.
Sare-diseinua: Testua norabide batean isurtzen da. Excelek datuak errenkadetan eta zutabeetan banatzen ditu. Datu pertsonalak sare horretan edonon ezkutatu daitezke.
Eduki mistoa: Soldata-mailak, departamentu-kodeak eta lan-mailen mailak SSNekin eta posta elektronikoaren helbideekin fitxategi berean daude. Dena ezabatzen bada, fitxategia erabilgaitz geratzen da.
Atxikipen luzea: Langile-zerrendak eta bezero-erregistroak Excelan urteetan irauten dute. GDPR 5(1)(e) artikuluak datuen "beharrezkoa den baino gehiago ez" gordetzeko exijitzen du. "Lagungarria izan daitekeen" fitxategiek askotan data hori baino askoz gehiago irauten dute.
Zergatik Huts Egiten Duten Testu-Analisi Estandarrak Kalkulu-Orrietan
Testu-analisi tresnak agirientzako eraiki ziren. Kalkulu-orrietako huts-egin arrunta batzuetan hausten dira.
SSN-Zenbaki-gisa Arazoa
Excel-ek Gizarte Segurantza Zenbakiak marratxorik gabe (123456789) zenbaki soil gisa gordetzen ditu -- ez testu gisa. ###-##-#### bilatzeko eraikitako eskaner batek galduko ditu. Tresna onak jakin behar du "SSN" izeneko zutabe bateko 9 digituko zenbakia Gizarte Segurantza Zenbakia dela.
Data-Zenbaki-gisa Arazoa
Excelek datak serie-zenbaki gisa gordetzen ditu. 2024ko otsailak 6a 45329 gisa gordetzen da. CSV esportazio batek "45329" erakutsiko du "Jaiotze Data" zutabean. Eskanerrak zenbaki hori benetako data batera bihurtu behar du balioa markatu aurretik.
SSN Partziala Arazoa
Zenbait sistemak SSNaren azken lau digitoak bakarrik erakusten ditu (*--1234). Zenbaki osoa blokeatutako zutabe batean dago. Balio partzialak oraindik anonimizatu behar da -- SSN oso bat bezala ez badirudi ere.
Formula PIIa Arazoa
Zenbait gelaxkek PII beste gelaxketatik eraikitzen dute. =CONCATENATE(B2," ",C2) duen gelaxkak izen osoa erakusten du. B eta C zutabeak garbitzen badituzu, izen oso hori oraindik formula-gelaxkan ikusgai dago. Gordetako balioak bakarrik irakurtzen dituen tresna batek -- formula-estekak ez -- PII lekuan utziko du.
Orri Anitzen Arazoa
Koaderno handi batek bost orri eduki ditzake: Bezero Zerrenda, Eskariak, Laguntza Txartelak, Fakturaketa eta Analitika. Bezero-izenak bostetan agertzen dira. "John Smith" orri batean token bera bihurtu behar da -- "PERSON_0047" -- beste orri guztietan. Bi token ezberdinak erregistro-estekak hausten dituzte.
Zutabe-Goiburuak Seinale Gisa
Kalkulu-orrietako PII detekzioaren hobekuntza onena zutabe-goiburuaren analisia da.
"SSN" izeneko zutabe batek tresnari esaten dio zutabe horretan balio guztiak Gizarte Segurantza Zenbakiak direla. Horrek funtzionatzen du balioak partzialak, formatu arraroa edo zenbaki gisa gordetakoak direnean ere.
| Zutabe-goiburua | Seinalatzen duena |
|---|---|
| SSN / Gizarte Segurantza / Zerga ID | Tratatu 9 digituko zenbakiak SSN gisa |
| Posta elektronikoa / E-posta / Posta elektronikoaren helbidea | Markatu eredu partzialak ere |
| Telefonoa / Harreman-telefonoa / Mugikorra | Onartu edozein telefono-formatu |
| JD / Jaiotze Data / Urtebetetzea | Bihurtu serie-zenbakiak datetan |
| Izena / Abizena / Izen Osoa | Jaitsi izenen detekzio-muga |
| Helbidea / Kalea / Hiria / Posta Kodea | Konbinatu hurbileko kokapena |
| Paziente ID / MRN / Erregistro Zenbakia | Aplikatu osasun-ID ereduak |
Zutabe-testuinguruak eduki-eskaneoa ez du ordezkatzen. Gehitzen du. "SSN" izeneko zutabe bat 100 baliorekin: eduki-eskaneoak 99 formatua ondo dituenak harrapatzen ditu. Zutabe-testuinguruak arraroa dirudiena harrapatzen du.
Egitura Mantendu, Izenak Kendu
Exceleko GDPR kasu gehienetan helburua ez da fitxategia suntsitzea. Pertsonen datuak kentzea da, fitxategia erabilgarri egiten duten zatiak mantenduz.
15.000 errenkadako langile-erregistro fitxategi baterako, betetze-ofiziar batek behar du:
Kendu:
- Langile-izenak: PERSON_XXXX tokenak
- SSNak: ZERRENDA-EZKATUA
- Posta elektronikoaren helbideak: ZERRENDA-EZKATUA
- Telefono-zenbakiak: ZERRENDA-EZKATUA
- Etxe-helbideak: ZERRENDA-EZKATUA
Mantendu:
- Departamentu-kodeak
- Lan-tituluak (orokorreko rolak bakarrik)
- Soldata-mailak (kategoria zabalak)
- Errendimendu-puntuazioak (taldeko datuak)
- Hasiera-datak (tentura-estatistiketarako)
- Kudeatzaile-kodeak (pseudonimizatuta badaude)
"Pertsonak identifikatzen dituen datuaren" eta "lanak deskribatzen dituen datuaren" arteko aldea ezagutzen duen tresna batek HR analisirako oraindik funtzionatzen duen fitxategia ematen dizu -- eta GDPR datu-minimizazio arauak betetzen ditu.
Kasu Erreala: M&A HR Datu Transferentzia
Erosle konpainia batek hartutako enpresatik langile-erregistroak jasotzen ditu: 40 zutabedun 15.000 errenkadako XLSX bat. Fitxategiak kanpoko HR enpresa batera joan behar du onura-planifikaziorako. GDPRk dio zereginerako beharrezkoa den datuak bakarrik parteka daitezkeela.
Prozesatu aurretik: 40 zutabe izen osoekin, SSNekin, posta elektronikoekin, etxe-helbideekin, larrialdiko kontaktuekin eta banku-datuekin.
Zutabe-testuinguruarekin prozesatu ondoren:
- 12 zutabek zuzenean identifikatzen dute jendea (izenak, SSNak, posta elektronikoak, telefonoa, helbideak, banku-datuak): token koherenteekin ordezkatuta
- 3 zutabek zeharka identifikatzen dute jendea (langile ID, kudeatzaile-kode, lan-kode): fitxategian bat datozen token pseudonimoetan ordezkatuta
- 25 zutabe datu agregatuak dira (soldata-maila, departamentua, tentura, maila): aldatu gabe
Denbora: 8 minutu 600.000 gelaxkarako
Irteera: XLSX diseinua bera, 40 zutabe, 15 anonimizatuta, 25 aldatu gabe
Ikuskatze-erregistroa: Entitate-mota, konfiantza-puntuazioa eta erabilitako zutabe-seinalea duen gelaxka-mailako erregistroa ekintza bakoitzarako
HR enpresak bere lanerako datu-multzo osoa jasotzen du -- izen edo IDrik gabe. Betetze-erregistroak froga jasotzen du datuak egokiak bakarrik partekatu zirela.
Erronka hau ez da Excelera mugatzen. Fitxategi-formatu guztiek beren moduan huts egiten dute. Ikusi nola eragiten dion formatu-zatiketek PII detekzioari fitxategi-mota guztietako ikuspuntua.
Hiru GDPR 5. Artikuluko Arauak, Prozesu Bat
Kalkulu-orrietako anonimizazio estrukturatua hiru arau aldi berean betetzen ditu.
Datu minimizazioa (Art. 5(1)(c)): Zereginerako beharrezkoak diren zutabeak bakarrik doaz hartzaileari. Identifikatzeko zutabeak ezabatuta daude.
Biltegi-muga (Art. 5(1)(e)): Jatorrizko fitxategia barruan dago lege-atxikipen-betebeharrengatik. Kopia garbi bat partekatzeko egiten da -- atxikipen-behar txikiagoarekin edo gabe.
Osotasuna eta konfidentzialtasuna (Art. 5(1)(f)): Identifikatzeko daturik ez da kontrol-eremuaren kanpora ateratzen. Kopia garbiak bakarrik partekatzen dira.
Prozesuko ikuskatze-erregistroa zure 5(2). artikuluko froga ere bada. Arau bakoitza nola bete zen erakusten du fitxategi bakoitzarentzat.
Zure taldeak DSARak edo datu-esportazio handiak kudeatzen baditu, logika bera API mailan ere aplikatzen da. Ikusi nola funtzionatzen duen GDPR datu-minimizazioak denbora errealeko APIetan.