By · Last updated 2026-06-05

Rudi kwa BlogKitaalamu

Kufuta Kumbukumbu za GDPR: Endelea na Utatuzi

Kumbukumbu za programu hukusanya kwa kimya barua pepe za watumiaji, IP, na nambari za akaunti. Hapa kuna jinsi ya kushiriki kumbukumbu na wahusika wa tatu, wakandarasi, na majukwaa ya uangalizi bila kuvunja GDPR.

June 5, 20267 dakika kusoma
JSON logsGDPR complianceDevOps privacylog anonymizationdata minimization

PII Inajificha katika Kumbukumbu za Programu

Kumbukumbu za programu ni moja ya maeneo ya GDPR yasiyozingatiwa zaidi katika uhandisi. Si kwa sababu wahandisi wanakwepa sheria. Kwa sababu maelezo ya watumiaji huingia katika faili za kumbukumbu kwa bahati.

Kumbukumbu moja ya ombi la JSON inaweza kuwa na sehemu nne za PII:

{
  "timestamp": "2025-11-14T09:22:13Z",
  "level": "ERROR",
  "endpoint": "/api/users/profile",
  "user_email": "sarah.johnson@company.com",
  "client_ip": "82.123.45.67",
  "user_agent": "Mozilla/5.0",
  "error": "ValidationError: phone format",
  "input_value": "+49 176 1234 5678"
}

Ingizo moja hilo linashikilia barua pepe, IP, na nambari ya simu. Zidisha hilo kwa mamilioni ya simu za API kila siku. Matokeo ni shughuli kubwa ya PII. Inahitaji msingi wa kisheria, mipaka, na udhibiti.

Kushiriki Kumbukumbu na Wahusika wa Nje Kunaongeza Hatari ya GDPR

Timu zinashiriki faili za kumbukumbu na wahusika wa nje kila wakati:

  • Makampuni ya majaribio ya kalamu yanapata rekodi ili kupanga tabia ya programu
  • Washauri wa nje hutumia sampuli za kumbukumbu kutafuta maeneo ya polepole
  • Majukwaa ya kumbukumbu (Elastic, Datadog, Splunk) yanapokea mtiririko kamili wa matokeo
  • Wakandarasi wa SRE hufikia rekodi wakati wa matukio
  • Timu za uundaji katika vyombo vingine vya kisheria zinapokea faili za utatuzi

Kila ushirikiano huibua maswali ya Kifungu cha 28 cha GDPR. Je, mpokeaji ni msindikaji? Je, kuna Makubaliano ya Usindikaji wa Data? Je, wana msingi wa kisheria kuona maelezo ya watumiaji katika faili hizo?

Majukwaa ya kumbukumbu ni pengo la kawaida. Kutuma matokeo yenye barua pepe za watumiaji halisi na IP hadi Elastic Cloud au Datadog huunda kiungo cha usindikaji. Kiungo hicho kinahitaji DPA, vifungu vya kawaida, na chombo cha uhamishaji ikiwa jukwaa liko nje ya EU. Kila kimoja huchukua muda na ukaguzi wa kisheria.

Njia rahisi: ondoa maelezo ya watumiaji kabla faili kuondoka kwenye mfumo wako. Soma muhtasari wetu wa uzingatiaji kwa kanuni kamili za Kifungu cha 28.

Kwa Nini Muundo wa JSON Hufanya Ugunduzi Kuwa Mgumu

Faili za kumbukumbu za JSON zinatofautiana katika muundo. Ukaguzi wa kawaida wa maandishi hautoshi.

Kina cha upachikaji: Maelezo ya watumiaji yanaonekana katika kina chochote. Sehemu `request.headers.x-forwarded-for` inashikilia anwani za IP. Sehemu `response.body.errors[0].field_value` inaweza kushikilia ingizo la mtumiaji. Ukaguzi wa maandishi tambarare hukosa sehemu zilizozikwa katika njia zilizopachikwa.

Mipangilio tofauti: Kila mwisho wa API huzalisha umbo lake la matokeo. Faili za uthibitisho hazifanani na faili za malipo. Faili za sasisho la wasifu hazifanani na zote mbili. Njia ya njia-iliyowekwa hukosa maelezo ya watumiaji yanayoonekana katika njia za ajabu katika muktadha wa makosa.

Thamani za kiufundi zikichanganyika na PII: Njia za kasoro, misimbo ya makosa, na alama za muda lazima ibaki yote yote. Kuondoa kwa jumla hufuta sehemu zinazohitajika na kufanya faili kuwa haina thamani.

Njia sahihi ni ugunduzi unaotegemea maudhui. Tafuta maelezo ya watumiaji kwa kile walicho — mfumo wa barua pepe, muundo wa IP, enti iliyotajwa — si mahali walipo katika muundo. Hii inashughulikia mipangilio inayobadilika bila usanidi wowote kwa kila mwisho.

Uingizwaji Thabiti Huhifadhi Kumbukumbu Zikiwa na Manufaa

Mahitaji ya msingi ni uadilifu wa kirejeleo. Ikiwa `sarah.johnson@company.com` inaonekana katika ingizo 47 katika mlolongo wa ombi, zote 47 lazima zipangwe na thamani ile ile.

Kanuni za upangaji:

  • `sarah.johnson@company.com` → `user1@example.com` (thamani ile ile katika faili nzima)
  • `82.123.45.67` → `192.0.2.1` (IP ya nyaraka za RFC 5737 — wazi si ya kweli)
  • `+49 176 1234 5678` → `+49 XXX XXX XXXX` (imefunikwa)

Kwa upangaji huo, msanidi programu anaweza kufuatilia `user1@example.com` katika ingizo 47, kujenga upya mlolongo wa ombi, na kurekebisha hitilafu — bila kuona maelezo yoyote ya kweli ya mtumiaji.

Sehemu hizi za metadata zinabaki bila kubadilishwa:

  • Alama za muda (si data ya mtumiaji)
  • Misimbo na aina za makosa (si data ya mtumiaji)
  • Njia za kasoro (zinaweza kuwa na vitambulisho vya kiufundi, si data ya mtumiaji)
  • Mbinu za HTTP, njia, misimbo ya hali (si data ya mtumiaji)
  • Thamani za metriki na takwimu za latency (si data ya mtumiaji)

Matokeo ni faili inayofanya kazi kwa kazi ya utatuzi. Haina maelezo yoyote ya kweli ya mtumiaji. Angalia glosari yetu kwa tofauti kati ya kufuta na kufanya jina bandia chini ya GDPR.

Matumizi: Kushiriki Kumbukumbu za Majaribio ya Kalamu

Kampuni ya SaaS ilifanya ukaguzi wa usalama wa kila robo mwaka na timu ya nje ya majaribio ya kalamu. Upeo ulihitaji matokeo ya API ya uzalishaji ya siku 90 kupanga mtiririko wa uthibitisho na kuchambua mifumo ya makosa.

Kiasi cha kawaida: faili za JSON za MB 180. Idadi ya PII: barua pepe 4,200 za kipekee za watumiaji, IP 1,800 za kipekee, nambari 340 za sehemu za akaunti katika muktadha wa makosa.

Bila kuondoa maelezo ya watumiaji kwanza, kushiriki faili hizo kungehitaji:

  • DPA na timu ya majaribio ya kalamu
  • Chombo cha uhamishaji cha Kifungu cha 46 cha GDPR (kampuni ilikuwa nje ya EU)
  • Ukaguzi wa arifa ya mada ya data

Kila kimoja kinaongeza kazi ya kisheria na muda.

Kwa kuondoa PII iliyotumika:

  • Muda wa usindikaji: dakika 25 kwa MB 180
  • Matokeo: faili za MB 180 zenye muundo sawa, barua pepe na IP zote zimebadilishwa na thamani salama
  • Matokeo: timu ya majaribio ya kalamu ilipokea muktadha kamili; hakuna maelezo ya kweli ya mtumiaji yaliyowafikia
  • Matokeo ya GDPR: DPA haikuhitajika — matokeo yaliyofutwa si data ya mtumiaji chini ya GDPR

Angalia Maswali Yanayoulizwa Mara Kwa Mara yetu kwa maswali ya kawaida kuhusu nini kinachohesabiwa kama kisichojulikana chini ya GDPR.

Kuunganisha Uondoaji wa PII katika CI/CD

Kwa timu zinazoshiriki matokeo kwa msingi wa kawaida, hatua hii inaweza kufanya kazi ndani ya mifululizo iliyopo.

Mzunguko wa kumbukumbu:

  1. Hati ya mzunguko inafanya kazi usiku
  2. Hatua ya uondoaji inafanya kazi kabla ya kuhifadhi au kutuma kwa jukwaa lolote la kumbukumbu
  3. Faili zilizofutwa zinaenda kwa mifumo ya nje
  4. Faili za asili zinabaki ndani na uhifadhi kamili

Hati ya kabla ya kushiriki:

  1. Mhandisi anahitaji kushiriki sampuli na mkandarasi
  2. Anafanya hati: `input=raw-logs/ output=clean-logs/`
  3. Anashiriki folda ya `clean-logs/`
  4. Hakuna ukaguzi wa mkono wa PII unaohitajika

Njia ya mwandamani:

  1. Mwandamani huondoa mtiririko wa matokeo kabla ya kupeleka mbele
  2. Uondoaji wa wakati halisi unadumisha manufaa kwa uchambuzi wa kumbukumbu
  3. Jukwaa linapokea maelezo ya kweli ya watumiaji sifuri

Kuunganisha Sera ya Uhifadhi

Kifungu cha 5(1)(e) cha GDPR kinahitaji ukomo wa uhifadhi. Uondoaji wa PII unafaa katika sera yoyote ya uhifadhi.

  • Matokeo ya kawaida huhifadhiwa kwa siku 7 (kwa kazi ya utatuzi ya kila siku)
  • Matoleo yaliyofutwa huhifadhiwa kwa siku 90 (kwa uchambuzi wa mwenendo na ukaguzi wa tukio)
  • Hatua ya uondoaji inafanya kazi siku ya 7

Hii inakidhi ukomo wa uhifadhi. Inaondoa hatari ya kuhifadhi matokeo ya kawaida muda mrefu.

Vyanzo

Tayari kulinda data yako?

Anza kuanonymisha PII na aina 285+ za vitu katika lugha 48.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.