By · Last updated 2026-06-05

Späť na blogBezpečnosť AI

AI asistenti pre programovanie unikajú produkné osobné údaje

Testovacie fixtures so skutocnými zákazníckymi záznamami. Logy pre ladenie s produktnými dátami. GitHub zistil 39 miliónov uniknutých tajomstiev v roku 2024.

June 5, 20268 min čítania
AI coding assistantproduction PIIdeveloper securityMCP ServerGitHub Copilot

Preco AI nástroje pre programovanie unikajú skutocné zákaznícke záznamy

Väcšina únikov osobných údajov z vývojových tímov nie sú narušenia. Sú to vedlajšie efekty každodennej práce.

Produkné dáta vstupujú do testovacích prostredí. Odtial sa dostávajú k AI nástrojom pre programovanie — a k dodávatelom, ktorí ich prevádzkujú.

Výskum GitHubu z roku 2025 to potvrdil. Vývojári unikli 39 miliónov tajomstiev vo verejných repozitároch pocas roka 2024. Objavili sa API klúce aj osobné detaily. Väcšina pochádzala z testovacích fixtures a debug logov. Pozrite si prehlad bezpecnostných opatrení, kde sa dozviete, ako tímy riešia toto riziko.

Aktualizovane pre rok 2026: Adopcia AI nástrojov pre programovanie rýchlo vzrástla. Rovnako aj povrch expozície.

Ako sa skutocné záznamy dostávajú do vývojových prostredí

Cesty sú bežné a predvídatelné.

Súbory testovacích fixtures: Unit testy potrebujú realistické vstupy. Najrýchlejšia cesta je kopírovanie riadkov z produkcie. Vývojár plánuje nahradit ich "neskôr". Neskôr len zriedkakedy príde. Skutocné e-maily a ID kont zostávajú cez desiatky commitov.

Debug logy: Chybu nemožno reproductovat lokálne. Vývojár stiahne log zo živého systému. Tento log obsahuje e-maily zákazníkov, IP adresy a tokensy relácií. Súbor skoncí v korienovom adresári projektu a commitne sa.

Migracie schémy: Zmeny schémy zahrnujú vzorové riadky pre testovacie prostredia. Správca databázy skopíruje skutocné riadky ako vzory. Skript — so skutocnými zákazníckymi záznamami — vstúpi do správy verzií.

Dokumenty a súbory README: Príklady použitia používajú "realistické" vstupy. Realistické casto znamená skopírované od skutocných používatelov. README skoncí so skutocnými ID objednávok a adresami kont.

Konfiguracné súbory: Dev konfigurácie uchovávajú kluces staging prostredia, ktoré dosahujú skutocné zákaznícke dáta. Tieto súbory sa commitujú s tajomstvami vo vnútri.

Co AI asistenti skutocne prijímajú

Ked vývojári používajú AI nástroje pre programovanie, viaceré kanály posielajú súkromné informácie von.

Celý kontext súboru: Nástroj môže prijat celé súbory. To zahrnuje testovacie fixtures so skutocnými záznamami, excerpty logov alebo konfiguracné súbory s živými klúcmi.

Vkladanie zo schránky: Vývojári vkladajú kód do chatu na kontrolu. Okolný kontext casto obsahuje detaily zákazníkov.

Indexovanie IDE: Cursor a GitHub Copilot indexujú lokálne súbory pre kontext. Akýkolvek projektový súbor so skutocnými riadkami sa stáva súcastou tohto indexu.

Chybové správy: Vývojári vkladajú stack traces do AI chatu pri ladení. Stack traces môžu niest ID zákazníkov.

Každý kanál posiela súkromné informácie k API dodávatela AI. To vytvára riziko podla GDPR a HIPAA. Pozrite si prehlad súladu pre informácie o tom, ako sa tieto pravidlá vztahujú na nástroje pre vývojárov.

GDPR a HIPAA: Klúcové fakty pre vývojové tímy

Tieto pravidlá sa vztahujú na používanie AI nástrojov pre programovanie.

Clanok 28 GDPR — Sprostredkovatel: Posielanie osobných informácií dodávatelovi AI robí z tohto dodávatela sprostredkovatela údajov. Je požadovaná zmluva o spracúvaní údajov (DPA). Väcšina dodávatelov ponúka DPA. Vývojári, ktorí používajú AI nástroje mimo formálneho nakupovania, nemusia mat podpísanú DPA.

Clanok 6 GDPR — Zákonný základ: Testovanie pri vývoji vyžaduje zákonný základ pre spracúvanie osobných informácií. Môže sa uplatnit oprávnený záujem — ale vyžaduje vyvažovací test. Používanie skutocných zákazníckych riadkov, ked by postacili umelé, tento test nesplna.

HIPAA — BAA: Vývojári v zdravotníctve musia mat s dodávatelom AI zmluvu o obchodnom partnerovi (BAA). OpenAI, Anthropic a GitHub Copilot ponúkajú BAA pre firemných používatelov. Individuálne používanie mimo firemného plánu nemusí byt pokryté.

Minimalizácia: Skutocné zákaznícke záznamy v testovacích fixtures porušujú pravidlo minimalizácie. Umelé riadky slúžia rovnakému úcelu bez nákladov na súkromie.

Naše FAQ zodpovedá bežné otázky k týmto pravidlám.

Praktické kroky pre vývojové tímy

Zacnite rýchlym auditom. Väcšina tímov nájde problémy behem prvej hodiny.

Okamžité akcie:

  1. Auditujte testovacie fixtures — hladajte vzory e-mailov, telefónov a ID.
  2. Skontrolujte produkné log súbory v adresároch projektu na ID zákazníkov.
  3. Aktualizujte `.gitignore` na vylúcenie log súborov a dátových súborov špecifických pre prostredie.
  4. Nahradte skutocné záznamy syntetickými generátormi ako Faker alebo Mimesis.

Samotný audit casto odhalí roky nahromadenej expozície. Jeden tím našiel skutocné e-maily zákazníkov v 14 testovacích súboroch vytvorených šestimi rôznymi vývojármi pocas troch rokov. Žiadny z vývojárov ich tam nemienil nechávat.

Pred každou reláciou s AI asistentom:

  • Spustite detekciu osobných údajov na súboroch pred ich zdielaním.
  • Pre IDE nástroje ako Cursor: vylúcte adresáre testov z indexovania.
  • Pre nástroje zalozené na chatovaní: skontrolujte vložený kód na osobné informácie.

Doplnok MCP Server:

anonym.legal MCP Server prepojuje detekciu osobných údajov s Claude Desktop a Cursor. Postup je jednoduchý:

  1. Otvorte súbor v editore.
  2. Zavolajte MCP Server: detekujte osobné údaje v súbore.
  3. Skontrolujte oznacené položky.
  4. Redagujte na mieste.
  5. Zdielaté cistý súbor s AI nástrojom.

To pridá menej ako 30 sekúnd na súbor. Odstrání manuálnu záaz "skontroluj osobné údaje". Pozrite si naše cenové plány pre pridanie prístupu k MCP Serveru pre váš tím.

Syntetické vstupy — trvalé riešenie:

Nikdy nepoužívajte skutocné riadky v testovacích fixtures. Syntetické kninice produkujú realistické vstupy bez odhalenia skutocných používatelov. Faker (Python/Node.js), Factory Boy (Python) a Bogus (.NET) generujú platné vstupy pre akúkolvek schému. Každá kninica vám umožnuje nastavit lokalitu a vyprodukovat realistické mená, e-maily a telefónne císla — všetky umelé.

Prípadová štúdia: SaaS tím nájde skutocné záznamy v Cursor

Nález prišiel pocas auditu GDPR. SaaS tím používajúci Cursor našiel skutocné e-maily zákazníkov v unit testovacích fixtures. Vývojár skopíroval 50 zákazníckych riadkov z produkcie pred 18 mesiacmi. Tieto riadky boli commitnuté do správy verzií a indexované Cursorom.

Pocas 18 mesiacov Cursor pristupoval k fixture súborom pribli 11 000-krát napriec 8 vývojárskymi reláciami IDE. Každá relácia mohla poslat obsah fixture k Cursor API.

Co tím urobil:

  1. Nahradil všetkých 50 skutocných riadkov umelými vstupmi generovanými Fakerom.
  2. Aktualizoval `.gitignore` na vylúcenie log súborov.
  3. Pridal MCP Server pre detekciu osobných údajov na žiados pred zdielaním kódu.
  4. Stanovil normu: žiadne produkné záznamy v žiadnom commitnutom súbore.

MCP Server bol klúcovou zmenou. Vývojári teraz spúštajú detekciu pred reláciami Cursor na kóde orientovanom na zákazníkov. Nula dodatocného úsilia nad rámec volania MCP.

Precítajte si viac v našej sekcii prípadových štúdií.

Zdroje

Bezpecnostný výskum GitHub 2024. VERIFIED-EXTERNAL.

Clanok 28 GDPR. VERIFIED-EXTERNAL.

Usmernenie HIPAA k BAA. VERIFIED-EXTERNAL.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.