By · Last updated 2026-06-05

Tornar al BlogSeguretat de la IA

Els assistents de codificacio amb IA filtren PII de produccio

Fixtures de proves unitaries amb registres reals de clients. Fitxers de registre amb dades de produccio per a la depuracio. GitHub va trobar 39 milions de secrets filtrats el 2024.

June 5, 20268 min llegit
AI coding assistantproduction PIIdeveloper securityMCP ServerGitHub Copilot

Per que les eines de codificacio amb IA filtren registres reals de clients

La majoria de fuites de PII dels equips de desenvolupament no son violacions. Son efectes secundaris del treball diari.

Les dades de produccio entren als entorns de prova. Des d'alli, arriben a les eines de codificacio amb IA i als proveïdors que les gestionen.

La recerca de GitHub de 2025 ho va confirmar. Els desenvolupadors van filtrar 39 milions de secrets en repositoris publics durant el 2024. Claus API i detalls personals van aparèixer. La majoria provenien de fixtures de prova i registres de depuracio. Consulteu el nostre resum de salvaguardes de seguretat per saber com els equips aborden aquest risc.

Actualitzat per al 2026: L'adopcio d'eines de codificacio amb IA ha crescut rapidament. Tambe ho ha fet la superficie d'exposicio.

Com els registres reals entren als entorns de desenvolupament

Les vies son habituals i previsibles.

Fitxers de fixtures de prova: Les proves unitaries necessiten entrades realistes. El cami mes rapid es copiar files de produccio. El desenvolupador planeja substituir-les "mes endavant". Mes endavant rarament arriba. Els correus electronics i ID de compte reals es queden a traves de desenes de confirmacions.

Registres de depuracio: Un error no es pot reproduir localment. Un desenvolupador extreu un registre del sistema en viu. Aquest registre te correus electronics de clients, adreces IP i tokens de sessio. El fitxer queda al directori arrel del projecte i es confirma al repositori.

Scripts de migracio: Els canvis d'esquema inclouen files de mostra per als entorns de prova. Un DBA copia files reals com a mostres. El script, amb entrades reals de clients, entra al control de versions.

Docs i fitxers README: Els exemples d'us utilitzen entrades "realistes". Realistes sovint vol dir copiades d'usuaris reals. El README acaba amb ID de comandes i adreces de compte reals.

Fitxers de configuracio: Les configuracions de desenvolupament porten claus d'staging que arriben a dades reals de clients. Aquests fitxers es confirmen amb secrets dins.

Que reben realment els assistents d'IA

Quan els desenvolupadors utilitzen eines de codificacio amb IA, multiples canals envien informacio privada a l'exterior.

Context de fitxer complet: L'eina pot rebre fitxers sencers. Aixo inclou fixtures de prova amb entrades reals, extractes de registre o fitxers de configuracio amb claus de produccio.

Enganxades del portapapers: Els desenvolupadors enganxen codi al xat per a revisio. El context circumdant sovint te detalls de clients.

Indexacio de l'IDE: Cursor i GitHub Copilot indexen els fitxers locals per al context. Qualsevol fitxer del projecte amb files reals forma part d'aquest index.

Missatges d'error: Els desenvolupadors enganxen rastres de pila al xat d'IA quan depuren. Els rastres de pila poden contenir ID de clients.

Cada canal envia informacio privada a l'API del proveidor d'IA. Aixo crea risc del RGPD i de HIPAA. Consulteu el nostre resum de conformitat per a saber com s'apliquen aquestes normes a les eines de desenvolupament.

RGPD i HIPAA: fets clau per als equips de desenvolupament

Aquestes normes s'apliquen a l'us d'eines de codificacio amb IA.

Article 28 del RGPD: Encarregat del tractament: Enviar informacio personal a un proveidor d'IA fa que aquest proveidor sigui un encarregat del tractament de dades. Es requereix un Acord de Tractament de Dades. La majoria de proveïdors ofereixen DPA. Els desenvolupadors que usen eines d'IA fora de la compra formal poden no tenir un DPA signat.

Article 6 del RGPD: Base juridica: Les proves de desenvolupament requereixen una base juridica per al tractament d'informacio personal. L'interes legitim pot aplicar-se, pero necessita una prova d'equilibri. Usar files reals de clients quan les falses servirien per a la mateixa finalitat no supera aquesta prova.

HIPAA: BAA: Els desenvolupadors de salut han de tenir un Acord d'Associats Comercials amb el proveidor d'IA. OpenAI, Anthropic i GitHub Copilot ofereixen BAA per als usuaris empresarials. L'us individual fora d'un pla empresarial pot no estar cobert.

Minimitzacio: Les entrades reals de clients en fixtures de prova trenquen la norma de minimitzacio. Les files falses compleixen la mateixa finalitat sense el cost de privacitat.

Les nostres FAQ cobreixen preguntes habituals sobre aquestes normes.

Passos practics per als equips de desenvolupament

Comenca amb una auditoria rapida. La majoria d'equips troben problemes en la primera hora.

Accions immediates:

  1. Audita les fixtures de prova: cerca patrons de correu electronic, telefon i ID.
  2. Comprova els fitxers de registre de produccio als directoris del projecte en cerca d'ID de clients.
  3. Actualitza .gitignore per excloure fitxers de registre i fitxers de dades especifics de l'entorn.
  4. Substitueix les entrades reals per generadors sintetica com Faker o Mimesis.

L'auditoria sola sovint treu a la llum anys d'exposicio acumulada. Un equip va trobar correus electronics reals de clients en 14 fitxers de prova creats per sis desenvolupadors diferent al llarg de tres anys. Cap dels desenvolupadors havia tingut la intencio de deixar-los alli.

Abans de qualsevol sessio d'assistent d'IA:

  • Executa la deteccio de PII en els fitxers abans de compartir-los.
  • Per a eines IDE com Cursor: exclou els directoris de proves de la indexacio.
  • Per a eines basades en xat: revisa el codi enganxat per a informacio personal.

Complement del servidor MCP:

El servidor MCP d'anonym.legal connecta la deteccio de PII a Claude Desktop i Cursor. Els passos son simples:

  1. Obre un fitxer a l'editor.
  2. Crida el servidor MCP: detecta PII en el fitxer.
  3. Revisa els elements marcats.
  4. Redacta in situ.
  5. Comparteix el fitxer net amb l'eina d'IA.

Aixo afegeix menys de 30 segons per fitxer. Elimina la carrega manual de "comprovar el PII". Consulteu els nostres plans de preus per afegir l'acces al servidor MCP al vostre equip.

Entrades sintetiques: la solucio duradora:

Mai no s'han d'usar files reals en les fixtures de prova. Les biblioteques sintetiques produeixen entrades realistes sense exposar usuaris reals. Faker (Python/Node.js), Factory Boy (Python) i Bogus (.NET) generen entrades valides per a qualsevol esquema. Cada biblioteca permet establir una configuracio regional i generar noms, correus electronics i numeros de telefon realistes, tots falsos.

Cas d'us: equip SaaS troba entrades reals a Cursor

La troballa es va produir durant una auditoria del RGPD. Un equip SaaS que utilitzava Cursor va trobar correus electronics reals de clients en fixtures de proves unitaries. Un desenvolupador havia copiat 50 files de clients de produccio 18 mesos enrere. Aquestes files s'havien confirmat al control de versions i indexat per Cursor.

Al llarg de 18 mesos, Cursor va accedir als fitxers de fixtures aproximadament 11.000 vegades al llarg de 8 sessions d'IDE de desenvolupadors. Cada sessio podria haver enviat el contingut de les fixtures a l'API de Cursor.

Que va fer l'equip:

  1. Va substituir les 50 files reals per entrades falses generades per Faker.
  2. Va actualitzar .gitignore per excloure els fitxers de registre.
  3. Va afegir el servidor MCP per a la deteccio de PII a demanda abans de compartir codi.
  4. Va establir una norma: cap entrada de produccio en cap fitxer confirmat.

El servidor MCP va ser el canvi clau. Els desenvolupadors ara executen la deteccio abans de les sessions de Cursor en codi orientat al client. Zero esforc addicional mes enlla de la crida MCP.

Llegiu mes a la nostra seccio de casos d'us.

Fonts

Recerca de seguretat de GitHub 2024. VERIFICAT-EXTERN.

Article 28 del RGPD. VERIFICAT-EXTERN.

Orientaci de BAA de HIPAA. VERIFICAT-EXTERN.

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.