By · Last updated 2026-06-05

Voltar ao BlogSegurança de IA

Código, Testes e Dados de Clientes: Como as Equipes...

Fixtures de teste unitário com registros reais de clientes. Arquivos de log com dados de produção para depuração.

June 5, 20268 min de leitura
AI coding assistantproduction PIIdeveloper securityMCP ServerGitHub Copilot

Por que ferramentas IA de código expõem dados reais de clientes

A maioria dos vazamentos de dados pessoais em equipes de desenvolvimento não são brechas. São efeitos colaterais do trabalho diário.

Dados de produção entram em ambientes de teste. De lá, chegam às ferramentas IA de código — e aos fornecedores que as operam.

A pesquisa de 2025 do GitHub confirmou isso. Desenvolvedores vazaram 39 milhões de segredos em repositórios públicos em 2024. Chaves de API e informações pessoais apareceram. A maioria veio de fixtures de teste e logs de depuração. Veja nossa visão geral de proteções de segurança para saber como as equipes abordam esse risco.

Atualizado para 2026: A adoção de ferramentas IA de código cresceu rápido. Assim como a superfície de exposição.

Como entradas reais chegam aos ambientes dev

As rotas são comuns e previsíveis.

Arquivos de fixtures de teste: Testes unitários precisam de entradas realistas. O caminho mais rápido é copiar linhas da produção. O desenvolvedor planeja substituí-las "depois." Depois raramente chega. E-mails e IDs de conta reais ficam através de dezenas de commits.

Logs de depuração: Um bug não pode ser reproduzido localmente. Um desenvolvedor extrai um log do sistema em produção. Esse log tem e-mails de clientes, endereços IP e tokens de sessão. O arquivo fica na raiz do projeto e é commitado.

Scripts de migração: Mudanças de esquema incluem linhas de exemplo para ambientes de teste. Um DBA copia linhas reais como amostras. O script — com entradas reais de clientes — entra no controle de versão.

Docs e arquivos README: Exemplos de uso empregam entradas "realistas." Realista muitas vezes significa copiado de usuários reais. O README termina com IDs de pedido e endereços de conta reais.

Arquivos de configuração: Configs de desenvolvimento carregam chaves de staging que alcançam dados reais de clientes. Esses arquivos são commitados com segredos incluídos.

O que os assistentes IA realmente recebem

Quando desenvolvedores usam ferramentas IA de código, vários canais enviam informações privadas para fora.

Contexto de arquivo inteiro: A ferramenta pode receber arquivos completos. Isso inclui fixtures de teste com entradas reais, extratos de logs ou arquivos de configuração com chaves ativas.

Colar da área de transferência: Desenvolvedores colam código no chat para revisão. O contexto ao redor muitas vezes tem informações de clientes.

Indexação no IDE: Cursor e GitHub Copilot indexam arquivos locais para contexto. Qualquer arquivo de projeto com linhas reais faz parte desse índice.

Mensagens de erro: Desenvolvedores colam rastreamentos de pilha no chat IA ao depurar. Rastreamentos de pilha podem carregar IDs de clientes.

Cada canal envia informações privadas para a API do fornecedor IA. Isso cria risco de GDPR e HIPAA. Veja nossa visão geral de conformidade para como essas regras se aplicam a ferramentas de desenvolvimento.

GDPR e HIPAA: fatos-chave para equipes dev

Essas regras se aplicam ao uso de ferramentas IA de código.

GDPR Artigo 28 — Processador: Enviar informações pessoais a um fornecedor IA o torna um processador de dados. Um Acordo de Processamento de Dados é exigido. A maioria dos fornecedores oferece DPAs. Desenvolvedores que usam ferramentas IA fora do processo formal de compra podem não ter um DPA assinado.

GDPR Artigo 6 — Base legal: Testes de desenvolvimento requerem base legal para processar informações pessoais. Interesse legítimo pode se aplicar — mas precisa de um teste de equilíbrio. Usar linhas reais de clientes quando falsas serviriam falha nesse teste.

HIPAA — BAA: Desenvolvedores de saúde devem ter um Acordo de Associado de Negócios com o fornecedor IA. OpenAI, Anthropic e GitHub Copilot oferecem BAAs para usuários empresariais. Uso individual fora de um plano empresarial pode não estar coberto.

Minimização: Entradas reais de clientes em fixtures de teste violam a regra de minimização. Linhas falsas servem o mesmo propósito sem custo de privacidade.

Nosso FAQ cobre perguntas frequentes sobre essas regras.

Passos práticos para equipes dev

Comece com uma auditoria rápida. A maioria das equipes encontra problemas na primeira hora.

Ações imediatas:

  1. Auditar fixtures de teste — buscar padrões de e-mail, telefone e ID.
  2. Verificar arquivos de log de produção em diretórios do projeto para IDs de clientes.
  3. Atualizar .gitignore para excluir arquivos de log e arquivos de dados específicos do ambiente.
  4. Substituir entradas reais por geradores sintéticos como Faker ou Mimesis.

A auditoria sozinha muitas vezes revela anos de exposição acumulada. Uma equipe encontrou e-mails reais de clientes em 14 arquivos de teste criados por seis desenvolvedores diferentes em três anos. Nenhum havia pretendido deixá-los lá.

Antes de qualquer sessão com assistente IA:

  • Executar detecção de dados pessoais em arquivos antes de compartilhá-los.
  • Para ferramentas IDE como Cursor: excluir diretórios de teste da indexação.
  • Para ferramentas de chat: revisar o código colado em busca de informações pessoais.

Add-on MCP Server:

O anonym.legal MCP Server conecta detecção de dados pessoais ao Claude Desktop e Cursor. Os passos são simples:

  1. Abrir um arquivo no editor.
  2. Chamar o MCP Server: detectar dados pessoais no arquivo.
  3. Revisar itens sinalizados.
  4. Redigir no lugar.
  5. Compartilhar o arquivo limpo com a ferramenta IA.

Isso adiciona menos de 30 segundos por arquivo. Remove a carga manual de "verificar dados pessoais." Veja nossos planos de preços para adicionar acesso ao MCP Server à sua equipe.

Entradas sintéticas — a solução duradoura:

Nunca use linhas reais em fixtures de teste. Bibliotecas sintéticas produzem entradas realistas sem expor usuários reais. Faker (Python/Node.js), Factory Boy (Python) e Bogus (.NET) geram entradas válidas para qualquer esquema. Cada biblioteca permite definir um locale e produzir nomes, e-mails e telefones realistas — todos falsos.

Estudo de caso: equipe SaaS encontra entradas reais no Cursor

A descoberta veio durante uma auditoria GDPR. Uma equipe SaaS usando Cursor encontrou e-mails reais de clientes em fixtures de teste unitário. Um desenvolvedor havia copiado 50 linhas de clientes da produção 18 meses antes. Essas linhas foram commitadas no controle de versão e indexadas pelo Cursor.

Em 18 meses, o Cursor acessou os arquivos de fixtures cerca de 11.000 vezes em 8 sessões IDE de desenvolvedores. Cada sessão pode ter enviado o conteúdo dos fixtures para a API do Cursor.

O que a equipe fez:

  1. Substituiu todas as 50 linhas reais por entradas falsas geradas pelo Faker.
  2. Atualizou .gitignore para excluir arquivos de log.
  3. Adicionou MCP Server para detecção de dados pessoais sob demanda antes de compartilhar código.
  4. Estabeleceu uma norma: nenhuma entrada de produção em arquivos commitados.

O MCP Server foi a mudança principal. Desenvolvedores agora executam detecção antes de sessões do Cursor com código voltado ao cliente. Zero esforço extra além da chamada MCP.

Leia mais em nossa seção de estudos de caso.

Fontes

GitHub Security Research 2024. VERIFIED-EXTERNAL.

GDPR Artigo 28. VERIFIED-EXTERNAL.

Guia HIPAA BAA. VERIFIED-EXTERNAL.

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.