PII Inajificha katika Kumbukumbu za Programu
Kumbukumbu za programu ni moja ya maeneo ya GDPR yasiyozingatiwa zaidi katika uhandisi. Si kwa sababu wahandisi wanakwepa sheria. Kwa sababu maelezo ya watumiaji huingia katika faili za kumbukumbu kwa bahati.
Kumbukumbu moja ya ombi la JSON inaweza kuwa na sehemu nne za PII:
{
"timestamp": "2025-11-14T09:22:13Z",
"level": "ERROR",
"endpoint": "/api/users/profile",
"user_email": "sarah.johnson@company.com",
"client_ip": "82.123.45.67",
"user_agent": "Mozilla/5.0",
"error": "ValidationError: phone format",
"input_value": "+49 176 1234 5678"
}
Ingizo moja hilo linashikilia barua pepe, IP, na nambari ya simu. Zidisha hilo kwa mamilioni ya simu za API kila siku. Matokeo ni shughuli kubwa ya PII. Inahitaji msingi wa kisheria, mipaka, na udhibiti.
Kushiriki Kumbukumbu na Wahusika wa Nje Kunaongeza Hatari ya GDPR
Timu zinashiriki faili za kumbukumbu na wahusika wa nje kila wakati:
- Makampuni ya majaribio ya kalamu yanapata rekodi ili kupanga tabia ya programu
- Washauri wa nje hutumia sampuli za kumbukumbu kutafuta maeneo ya polepole
- Majukwaa ya kumbukumbu (Elastic, Datadog, Splunk) yanapokea mtiririko kamili wa matokeo
- Wakandarasi wa SRE hufikia rekodi wakati wa matukio
- Timu za uundaji katika vyombo vingine vya kisheria zinapokea faili za utatuzi
Kila ushirikiano huibua maswali ya Kifungu cha 28 cha GDPR. Je, mpokeaji ni msindikaji? Je, kuna Makubaliano ya Usindikaji wa Data? Je, wana msingi wa kisheria kuona maelezo ya watumiaji katika faili hizo?
Majukwaa ya kumbukumbu ni pengo la kawaida. Kutuma matokeo yenye barua pepe za watumiaji halisi na IP hadi Elastic Cloud au Datadog huunda kiungo cha usindikaji. Kiungo hicho kinahitaji DPA, vifungu vya kawaida, na chombo cha uhamishaji ikiwa jukwaa liko nje ya EU. Kila kimoja huchukua muda na ukaguzi wa kisheria.
Njia rahisi: ondoa maelezo ya watumiaji kabla faili kuondoka kwenye mfumo wako. Soma muhtasari wetu wa uzingatiaji kwa kanuni kamili za Kifungu cha 28.
Kwa Nini Muundo wa JSON Hufanya Ugunduzi Kuwa Mgumu
Faili za kumbukumbu za JSON zinatofautiana katika muundo. Ukaguzi wa kawaida wa maandishi hautoshi.
Kina cha upachikaji: Maelezo ya watumiaji yanaonekana katika kina chochote. Sehemu `request.headers.x-forwarded-for` inashikilia anwani za IP. Sehemu `response.body.errors[0].field_value` inaweza kushikilia ingizo la mtumiaji. Ukaguzi wa maandishi tambarare hukosa sehemu zilizozikwa katika njia zilizopachikwa.
Mipangilio tofauti: Kila mwisho wa API huzalisha umbo lake la matokeo. Faili za uthibitisho hazifanani na faili za malipo. Faili za sasisho la wasifu hazifanani na zote mbili. Njia ya njia-iliyowekwa hukosa maelezo ya watumiaji yanayoonekana katika njia za ajabu katika muktadha wa makosa.
Thamani za kiufundi zikichanganyika na PII: Njia za kasoro, misimbo ya makosa, na alama za muda lazima ibaki yote yote. Kuondoa kwa jumla hufuta sehemu zinazohitajika na kufanya faili kuwa haina thamani.
Njia sahihi ni ugunduzi unaotegemea maudhui. Tafuta maelezo ya watumiaji kwa kile walicho — mfumo wa barua pepe, muundo wa IP, enti iliyotajwa — si mahali walipo katika muundo. Hii inashughulikia mipangilio inayobadilika bila usanidi wowote kwa kila mwisho.
Uingizwaji Thabiti Huhifadhi Kumbukumbu Zikiwa na Manufaa
Mahitaji ya msingi ni uadilifu wa kirejeleo. Ikiwa `sarah.johnson@company.com` inaonekana katika ingizo 47 katika mlolongo wa ombi, zote 47 lazima zipangwe na thamani ile ile.
Kanuni za upangaji:
- `sarah.johnson@company.com` → `user1@example.com` (thamani ile ile katika faili nzima)
- `82.123.45.67` → `192.0.2.1` (IP ya nyaraka za RFC 5737 — wazi si ya kweli)
- `+49 176 1234 5678` → `+49 XXX XXX XXXX` (imefunikwa)
Kwa upangaji huo, msanidi programu anaweza kufuatilia `user1@example.com` katika ingizo 47, kujenga upya mlolongo wa ombi, na kurekebisha hitilafu — bila kuona maelezo yoyote ya kweli ya mtumiaji.
Sehemu hizi za metadata zinabaki bila kubadilishwa:
- Alama za muda (si data ya mtumiaji)
- Misimbo na aina za makosa (si data ya mtumiaji)
- Njia za kasoro (zinaweza kuwa na vitambulisho vya kiufundi, si data ya mtumiaji)
- Mbinu za HTTP, njia, misimbo ya hali (si data ya mtumiaji)
- Thamani za metriki na takwimu za latency (si data ya mtumiaji)
Matokeo ni faili inayofanya kazi kwa kazi ya utatuzi. Haina maelezo yoyote ya kweli ya mtumiaji. Angalia glosari yetu kwa tofauti kati ya kufuta na kufanya jina bandia chini ya GDPR.
Matumizi: Kushiriki Kumbukumbu za Majaribio ya Kalamu
Kampuni ya SaaS ilifanya ukaguzi wa usalama wa kila robo mwaka na timu ya nje ya majaribio ya kalamu. Upeo ulihitaji matokeo ya API ya uzalishaji ya siku 90 kupanga mtiririko wa uthibitisho na kuchambua mifumo ya makosa.
Kiasi cha kawaida: faili za JSON za MB 180. Idadi ya PII: barua pepe 4,200 za kipekee za watumiaji, IP 1,800 za kipekee, nambari 340 za sehemu za akaunti katika muktadha wa makosa.
Bila kuondoa maelezo ya watumiaji kwanza, kushiriki faili hizo kungehitaji:
- DPA na timu ya majaribio ya kalamu
- Chombo cha uhamishaji cha Kifungu cha 46 cha GDPR (kampuni ilikuwa nje ya EU)
- Ukaguzi wa arifa ya mada ya data
Kila kimoja kinaongeza kazi ya kisheria na muda.
Kwa kuondoa PII iliyotumika:
- Muda wa usindikaji: dakika 25 kwa MB 180
- Matokeo: faili za MB 180 zenye muundo sawa, barua pepe na IP zote zimebadilishwa na thamani salama
- Matokeo: timu ya majaribio ya kalamu ilipokea muktadha kamili; hakuna maelezo ya kweli ya mtumiaji yaliyowafikia
- Matokeo ya GDPR: DPA haikuhitajika — matokeo yaliyofutwa si data ya mtumiaji chini ya GDPR
Angalia Maswali Yanayoulizwa Mara Kwa Mara yetu kwa maswali ya kawaida kuhusu nini kinachohesabiwa kama kisichojulikana chini ya GDPR.
Kuunganisha Uondoaji wa PII katika CI/CD
Kwa timu zinazoshiriki matokeo kwa msingi wa kawaida, hatua hii inaweza kufanya kazi ndani ya mifululizo iliyopo.
Mzunguko wa kumbukumbu:
- Hati ya mzunguko inafanya kazi usiku
- Hatua ya uondoaji inafanya kazi kabla ya kuhifadhi au kutuma kwa jukwaa lolote la kumbukumbu
- Faili zilizofutwa zinaenda kwa mifumo ya nje
- Faili za asili zinabaki ndani na uhifadhi kamili
Hati ya kabla ya kushiriki:
- Mhandisi anahitaji kushiriki sampuli na mkandarasi
- Anafanya hati: `input=raw-logs/ output=clean-logs/`
- Anashiriki folda ya `clean-logs/`
- Hakuna ukaguzi wa mkono wa PII unaohitajika
Njia ya mwandamani:
- Mwandamani huondoa mtiririko wa matokeo kabla ya kupeleka mbele
- Uondoaji wa wakati halisi unadumisha manufaa kwa uchambuzi wa kumbukumbu
- Jukwaa linapokea maelezo ya kweli ya watumiaji sifuri
Kuunganisha Sera ya Uhifadhi
Kifungu cha 5(1)(e) cha GDPR kinahitaji ukomo wa uhifadhi. Uondoaji wa PII unafaa katika sera yoyote ya uhifadhi.
- Matokeo ya kawaida huhifadhiwa kwa siku 7 (kwa kazi ya utatuzi ya kila siku)
- Matoleo yaliyofutwa huhifadhiwa kwa siku 90 (kwa uchambuzi wa mwenendo na ukaguzi wa tukio)
- Hatua ya uondoaji inafanya kazi siku ya 7
Hii inakidhi ukomo wa uhifadhi. Inaondoa hatari ya kuhifadhi matokeo ya kawaida muda mrefu.