anonym.legal

By · Last updated 2026-06-05

Nazaj na blogVarnost umetne inteligence

Orodja AI za kodiranje razkrivajo produkcijske osebne podatke

Testne naprave s pravimi zapisi strank. Datoteke dnevnikov s produkcijskimi podatki za razhroscevanje. GitHub je leta 2024 odkril 39 milijonov razk skrivnosti.

June 5, 20268 min branja
AI coding assistantproduction PIIdeveloper securityMCP ServerGitHub Copilot

Zakaj orodja AI za kodiranje razkrivajo prave zapise strank

Vecina uhajanja osebnih podatkov iz razvojnih ekip ni krsitev. So stranski ucinki vsakodnevnega dela.

Produkcijski podatki vstopijo v testna okolja. Od tam dosezejo orodja AI za kodiranje -- in prodajalce, ki jih poganjajo.

GitHubova raziskava iz leta 2025 je to potrdila. Razvijalci so med letom 2024 razkrili 39 milijonov skrivnosti v javnih repozitorijih. API kljuci in osebni podatki so se pojavili. Vecina je prisla iz testnih naprav in dnevnikov razhroscevanja. Oglejte si pregled varovalnih ukrepov za varnost, da izveste, kako ekipe obravnavajo to tveganje.

Posodobljeno za leto 2026: Sprejetje orodij AI za kodiranje je hitro naraslo. Prav tako se je povecala izpostavljenost.

Kako pravi zapisi vstopijo v razvojna okolja

Poti so pogoste in predvidljive.

Datoteke testnih naprav: Enotni testi potrebujejo realisticne vnose. Najhitrejsa pot je kopiranje vrstic iz produkcije. Razvijalec nacrtuje zamenjavo "pozneje". Pozneje redko pride. Pravi e-postni naslovi in ID-ji racunov ostanejo skozi ducine objav.

Dnevniki razhroscevanja: Napake ni mogoce reproducirati lokalno. Razvijalec potegne dnevnik iz zivega sistema. Ta dnevnik ima e-postne naslove strank, IP-naslove in sejne znake. Datoteka pristane v korenu projekta in je objavljena.

Migracijski skripti: Spremembe sheme vkljucujejo vzorcne vrstice za testna okolja. DBA kopira prave vrstice kot vzorce. Skript -- s pravimi vnosi strank -- vstopi v nadzor razlicic.

Datoteke dokumentacije in README: Primeri uporabe folosijo "realisticne" vnose. Realisticno pogosto pomeni kopirano od pravih uporabnikov. README se konca s pravimi ID-ji narocil in naslovi racunov.

Konfiguracijske datoteke: Razvojne konfiguracije nosijo kljuce za uprizoritev, ki dosegajo prave podatke strank. Te datoteke so objavljene s skrivnostmi znotraj.

Kaj orodja AI dejansko prejmejo

Ko razvijalci uporabljajo orodja AI za kodiranje, vec kanalov poslja zasebne informacije ven.

Celoten kontekst datoteke: Orodje morda prejme cele datoteke. To vkljucuje testne naprave s pravimi vnosi, izvlecke dnevnikov ali konfiguracijske datoteke z zivimi kljuci.

Prilepljene vsebine iz odlozisca: Razvijalci prilepijo kodo v pogovor za pregled. Obkrozajoci kontekst pogosto vsebuje podrobnosti strank.

Indeksiranje IDE: Cursor in GitHub Copilot indeksirata lokalne datoteke za kontekst. Vsaka projektna datoteka s pravimi vrsticami postane del tega indeksa.

Sporocila o napakah: Razvijalci prilepijo sledove sklada v pogovor AI med razhroscevanjem. Sledovi sklada lahko nosijo ID-je strank.

Vsak kanal poslja zasebne informacije API-ju prodajalca AI. To ustvarja tveganje po GDPR in HIPAA. Oglejte si nas pregled skladnosti za to, kako se ta pravila nanasajo na razvojne naprave.

GDPR in HIPAA: Kljucna dejstva za razvojne ekipe

Ta pravila se nanasajo na uporabo orodij AI za kodiranje.

Clen 28 GDPR -- Obdelovalec: Posiljanje osebnih informacij prodajalcu AI tega prodajalca naredi za obdelovalca podatkov. Potreben je sporazum o obdelavi podatkov. Vecina prodajalcev ponuja DPA-je. Razvijalci, ki uporabljajo orodja AI zunaj formalnega nakupa, morda nimajo podpisanega DPA.

Clen 6 GDPR -- Zakonita podlaga: Razvojno testiranje zahteva zakonito podlago za obdelavo osebnih informacij. Legitimni interes morda velja -- toda zahteva test uravnotezenja. Uporaba pravih vrstic strank, ko bi delale lazne, ta test ne prestane.

HIPAA -- BAA: Zdravstveni razvijalci morajo imeti sporazum o poslovnem partnerju z prodajalcem AI. OpenAI, Anthropic in GitHub Copilot ponujajo BAA-je za podjetniške uporabnike. Individualna uporaba zunaj podjetniskega nactta morda ni pokrita.

Minimizacija: Pravi vnosi strank v testnih napravah krsijo pravilo minimizacije. Lazne vrstice sluzijo istemu namenu brez stroskov zasebnosti.

Nas FAQ pokriva pogosta vprasanja o teh pravilih.

Prakticni koraki za razvojne ekipe

Zacnite s hitro revizijo. Vecina ekip najde tezave v prvi uri.

Takojsnja dejanja:

  1. Revizija testnih naprav -- iskanje vzorcev e-poste, telefona in ID-ja.
  2. Preverite produkcijske datoteke dnevnikov v mapah projektov za ID-je strank.
  3. Posodobite .gitignore, da izlocite datoteke dnevnikov in podatkovne datoteke, specificne za okolje.
  4. Zamenjajte prave vnose s sinteticnimi generatorji, kot sta Faker ali Mimesis.

Revizija sama pogosto razkrije leta nakopicene izpostavljenosti. Ena ekipa je nasla prave e-postne naslove strank v 14 testnih datotekah, ki jih je ustvarilo sest razlicnih razvijalcev v treh letih. Nobeden od razvijalcev ni nameraval pustiti jih tam.

Pred vsako sejo z orodjem AI:

  • Zazenite zaznavanje osebnih podatkov na datotekah, preden jih delite.
  • Za orodja IDE, kot je Cursor: izlocite mape za teste iz indeksiranja.
  • Za orodja na osnovi klepeta: pregledajte prilepljeno kodo za osebne informacije.

Dodatek streznika MCP:

Streznik MCP anonym.legal poveže zaznavanje osebnih podatkov v Claude Desktop in Cursor. Koraki so preprosti:

  1. Odprite datoteko v urejevalniku.
  2. Pokliite streznik MCP: zaznajte osebne podatke v datoteki.
  3. Preglejte oznacene postavke.
  4. Redigirajte na mestu.
  5. Delite cisto datoteko z orodjem AI.

To doda manj kot 30 sekund na datoteko. Odpravlja rocno breme preverjanja osebnih podatkov. Oglejte si nase nactte s cenami, da dodate dostop do streznika MCP svoji ekipi.

Sinteticni vnosi -- trajna resitev:

Nikoli ne uporabljajte pravih vrstic v testnih napravah. Sinteticne knjiznice ustvarjajo realisticne vnose brez izpostavljanja pravih uporabnikov. Faker (Python/Node.js), Factory Boy (Python) in Bogus (.NET) ustvarjajo veljavne vnose za katerokoli shemo. Vsaka knjiznica vam omogoca, da nastavite nacin in izvedete realisticna imena, e-postne naslove in telefonske stevilke -- vse lazno.

Studija primera: Ekipa SaaS najde prave vnose v Cursorju

Najdba je prisla med revizijo GDPR. Ekipa SaaS, ki uporablja Cursor, je nasla prave e-postne naslove strank v enotnih testnih napravah. Razvijalec je 18 mesecev prej kopiral 50 vrstic strank iz produkcije. Te vrstice so bile objavljene v nadzor razlicic in indeksirane s strani Cursorja.

V 18 mesecih je Cursor dostopal do datotek naprav priblizno 11.000-krat v 8 razvijalcevnih sejah IDE. Vsaka seja je morda poslala vsebino naprave API-ju Cursor.

Kaj je ekipa storila:

  1. Zamenjala je vseh 50 pravih vrstic z laznimi vnosi, generiranimi s Fakerjem.
  2. Posodobila je .gitignore, da izlocuje datoteke dnevnikov.
  3. Dodala je streznik MCP za zaznavanje osebnih podatkov na zahtevo pred deljenjem kode.
  4. Dolocila je normo: nobeni produkcijski vnosi v nobeni objavljeni datoteki.

Streznik MCP je bila kljucna sprememba. Razvijalci zdaj zazenejo zaznavanje pred sejami Cursor na kodi, ki je usmerjena na stranke. Brez dodatnega napora razen klica MCP.

Preberite vec v razdelku studije primerov.

Viri

Varnostna raziskava GitHub 2024.

Clen 28 GDPR.

Smernice BAA HIPAA.

Ste pripravljeni zaščititi svoje podatke?

Začnite z anonimizacijo PII z več kot 285 tipi entitet v 48 jezikih.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.