Kwa Nini Excel Ni Aina Yako ya Faili Yenye Hatari Zaidi
Faili za Excel ni moja ya hatari kubwa zaidi za GDPR katika biashara nyingi. Rekodi za matibabu zinaweza kubeba data nyeti zaidi kwa kila mstari. Lakini lahajedwali hukusanya PII haraka — na timu za uzingatiaji mara nyingi huziachilia.
Mambo matatu yanafanya faili za Excel kuwa vigumu kusimamia.
Kiasi: Faili moja ya XLSX inaweza kushikilia mistari 50,000 na safu 100. Hiyo ni seli milioni tano. Ukaguzi wa mkono hauwezi kuzikagua zote.
Mpangilio wa gridi: Maandishi hutiririka katika mwelekeo mmoja. Excel hueneza data katika mistari na safu. Data ya kibinafsi inaweza kujificha popote katika gridi hiyo.
Maudhui mchanganyiko: Vipimo vya malipo, msimbo wa idara, na madaraja ya kazi hukaa katika faili ile ile kama SSN na anwani za barua pepe. Kufuta kila kitu hufanya faili kuwa haina thamani.
Uhifadhi mrefu: Orodha za wafanyakazi na rekodi za wateja hubaki katika Excel kwa miaka. Kifungu cha 5(1)(e) cha GDPR kinasema data lazima ihifadhiwe "si muda mrefu zaidi kuliko inavyohitajika." Faili ambazo "zinaweza kuwa na manufaa" mara nyingi hubaki mbali zaidi ya kiwango hicho.
Kwa Nini Skanzi za Kawaida za Maandishi Zinashindwa kwenye Lahajedwali
Zana za uchanganuzi wa maandishi zilijengwa kwa hati. Zinaharibika kwenye lahajedwali kwa njia chache za kawaida.
Tatizo la SSN-kama-Nambari
Excel huhifadhi Nambari za Usalama wa Jamii bila deshi (123456789) kama nambari za kawaida — si maandishi. Skana iliyojengwa kutafuta `###-##-####` itazikosa. Zana nzuri lazima ijue kwamba nambari ya tarakimu 9 katika safu inayoitwa "SSN" ni Nambari ya Usalama wa Jamii.
Tatizo la Tarehe-kama-Nambari
Excel huhifadhi tarehe kama nambari za mfululizo. Februari 6, 2024 huhifadhiwa kama 45329. Maudhui ya CSV yataonyesha "45329" katika safu ya "Tarehe ya Kuzaliwa". Skana lazima ibadilishe nambari hiyo hadi tarehe halisi kabla ya kuweza kualamu thamani.
Tatizo la SSN ya Sehemu
Mifumo mingine inaonyesha tarakimu nne tu za mwisho za SSN (***-**-1234). Nambari kamili iko katika safu iliyofungwa. Thamani ya sehemu bado lazima ifutwe — hata kama haionyeshi kama SSN kamili.
Tatizo la Formula ya PII
Baadhi ya seli hujenga PII kutoka seli nyingine. Seli yenye `=CONCATENATE(B2," ",C2)` inaonyesha jina kamili. Ukifuta safu B na C, jina kamili bado linaonekana katika seli ya formula. Zana inayosoma thamani zilizohifadhiwa tu — si viungo vya formula — itaacha PII mahali pake.
Tatizo la Lahajedwali Nyingi
Daftari kubwa linaweza kuwa na lahajedwali tano: Orodha ya Wateja, Maagizo, Tiketi za Msaada, Bili, na Uchambuzi. Majina ya wateja yanaonekana katika zote tano. "John Smith" katika lahajedwali moja lazima awe tokeni ile ile — "PERSON_0047" — katika kila lahajedwali lingine. Tokeni mbili tofauti huvunja viungo vya rekodi.
Vichwa vya Safu kama Ishara
Uboreshaji mkubwa zaidi katika ugunduzi wa PII ya lahajedwali ni uchanganuzi wa kichwa cha safu.
Safu inayoitwa "SSN" inaiambia zana kwamba thamani zote katika safu hiyo ni Nambari za Usalama wa Jamii. Hii inafanya kazi hata kama thamani ni za sehemu, zimepangwa kwa njia ya ajabu, au zimehifadhiwa kama nambari.
| Kichwa cha safu | Kinachoisymbolia |
|---|---|
| SSN / Social Security / Tax ID | Zingatia nambari za tarakimu 9 kama SSN |
| Email / E-mail / Email Address | Alamu hata mifumo ya barua pepe ya sehemu |
| Phone / Telephone / Mobile / Cell | Kubali muundo wowote wa simu |
| DOB / Date of Birth / Birthday | Badilisha nambari za mfululizo hadi tarehe |
| First Name / Last Name / Full Name | Punguza kizingiti kwa ugunduzi wa jina |
| Address / Street / City / ZIP | Unganisha sehemu za karibu za eneo |
| Patient ID / MRN / Record Number | Tumia mifumo ya kitambulisho cha afya |
Muktadha wa safu hauachilii ukaguzi wa maudhui. Unaongeza. Safu inayoitwa "SSN" yenye thamani 100: ukaguzi wa maudhui hupata 99 zilizopangwa vizuri. Muktadha wa safu hupata moja inayoonekana ya ajabu.
Hifadhi Muundo, Ondoa Majina
Lengo katika kesi nyingi za Excel za GDPR si kuharibu faili. Ni kuondoa data ya kibinafsi huku ukihifadhi sehemu zinazofanya faili kuwa na manufaa.
Kwa faili ya rekodi za wafanyakazi yenye mistari 15,000, afisa wa uzingatiaji anahitaji:
Ondoa:
- Majina ya wafanyakazi → tokeni za PERSON_XXXX
- SSN → IMEFUTWA
- Anwani za barua pepe → IMEFUTWA
- Nambari za simu → IMEFUTWA
- Anwani za nyumbani → IMEFUTWA
Hifadhi:
- Misimbo ya idara
- Majina ya kazi (majukumu ya jumla tu)
- Vipimo vya malipo (makundi mapana)
- Alama za utendaji (data ya kikundi)
- Tarehe za kuanza (kwa takwimu za umri wa kazi)
- Misimbo ya wasimamizi (ikiwa imefanywa kuwa isiyo ya kawaida)
Zana inayojua tofauti kati ya "data inayotaja watu" na "data inayoelezea kazi" inakupa faili inayofanya kazi bado kwa uchambuzi wa HR — na inakidhi kanuni za kupunguza data za GDPR.
Kesi Halisi: Uhamishaji wa Data ya HR ya M&A
Kampuni inayonunua inapata rekodi za wafanyakazi kutoka kwa kampuni inayonunuliwa: XLSX yenye mistari 15,000 na safu 40. Faili lazima iende kwa kampuni ya nje ya HR kwa mipango ya faida. GDPR inasema data inayohitajika tu kwa kazi hiyo inaweza kushirikiwa.
Kabla ya usindikaji: Safu 40 zenye majina kamili, SSN, barua pepe, anwani za nyumbani, mawasiliano ya dharura, na maelezo ya benki.
Baada ya usindikaji wa muktadha wa safu:
- Safu 12 zinatambua watu moja kwa moja (majina, SSN, barua pepe, simu, anwani, data ya benki): zimebadilishwa na tokeni thabiti
- Safu 3 zinatambua watu kwa njia ya pande (kitambulisho cha wafanyakazi, msimbo wa msimamizi, msimbo wa kazi): zimebadilishwa na tokeni zisizo za kawaida zinazofanana ndani ya faili
- Safu 25 ni data ya mkusanyiko (kiwango cha malipo, idara, umri wa kazi, daraja): zimebakizwa bila kubadilishwa
Muda: Dakika 8 kwa seli 600,000
Matokeo: Mpangilio sawa wa XLSX, safu 40, 15 zilizofutwa, 25 hazikubadilishwa
Kumbukumbu ya ukaguzi: Rekodi ya kiwango cha seli ya kila hatua yenye aina ya enti, alama ya ujasiri, na ishara ya safu iliyotumika
Kampuni ya HR inapata seti kamili ya data kwa kazi yake — bila majina au vitambulisho. Rekodi ya uzingatiaji inapata uthibitisho kwamba data sahihi tu ilishirikiwa.
Changamoto hii si ya kipekee kwa Excel. Kila muundo wa faili unashindwa kwa njia yake. Angalia jinsi mgawanyiko wa muundo unavyoathiri ugunduzi wa PII kwa mtazamo wa aina za faili.
Kanuni Tatu za Kifungu cha 5 cha GDPR, Mchakato Mmoja
Ufutaji wa lahajedwali uliopangwa hukidhi kanuni tatu mara moja.
Kupunguza data (Ibara 5(1)(c)): Safu zinazohitajika tu kwa kazi zinaenda kwa mpokeaji. Safu za kutambua zinafutwa.
Ukomo wa uhifadhi (Ibara 5(1)(e)): Faili ya asili inabaki kwa uhifadhi wa kisheria. Nakala safi inafanywa kwa kushiriki — yenye uhitaji mfupi au bila uhitaji wa uhifadhi.
Uadilifu na usiri (Ibara 5(1)(f)): Hakuna data ya kutambua inayoondoka kwenye eneo la udhibiti. Nakala safi tu zinashirikiwa.
Kumbukumbu ya ukaguzi kutoka kwa mchakato pia ni uthibitisho wako wa Ibara 5(2). Inaonyesha jinsi kila kanuni ilivyokidhiwa kwa kila faili.
Ikiwa timu yako inashughulikia DSAR au maudhui makubwa ya data, mantiki ile ile inatumika katika kiwango cha API. Angalia jinsi kupunguza data ya GDPR kunavyofanya kazi katika API za wakati halisi.
Kwa timu zinazoshughulikia kiasi kikubwa chini ya muda mfupi, angalia usindikaji wa kundi la GDPR DSAR kwa kiwango kwa mifumo ya mtiririko wa kazi inayotumika hapa pia.