By · Last updated 2026-06-05

Voltar ao BlogSegurança de IA

Prevenção vs. Detecção: Por Que a Anonimização em...

Quando um funcionário digita o nome de um cliente no ChatGPT, os dados saem do controle organizacional em tempo real.

June 5, 20267 min de leitura
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Prevenção de PII em tempo real: Parar vazamentos de dados IA antes de ocorrerem.

Atualizado para 2026.

Em março de 2023, um engenheiro da Samsung colou código-fonte no ChatGPT. O código saiu do controlo da Samsung de imediato. Nenhuma ferramenta o intercetou a tempo. Os controlos de segurança posteriores não conseguem parar vazamentos de dados IA. Este evento provou-o.

As ferramentas de deteção indicam o que aconteceu após o facto. Verificações de log, DLP de endpoint e registos de auditoria funcionam assim. Para vazamentos IA, após o facto é tarde demais. Os dados já chegaram ao modelo IA.

A dimensão do problema

Um estudo Cyberhaven de 2025 analisou o uso de IA em empresas. Os resultados foram reveladores.

  • 11% de todos os prompts do ChatGPT contêm dados privados ou sensíveis.
  • O trabalhador médio usa ferramentas IA 14 vezes por dia.
  • Os utilizadores frequentes interagem 30 a 50 vezes por dia.
  • A 11%, isso significa 3 a 5 envios sensíveis por trabalhador por dia.

Numa empresa com 500 utilizadores frequentes, isto soma mais de 2.000 envios sensíveis por dia. Cada um pode ser uma violação do Artigo 83 do RGPD. O risco não é apenas legal. A reputação e a confiança também estão em jogo.

Tipos comuns de conteúdo sensível em prompts IA:

  • Nomes e dados de contacto de clientes.
  • Números de conta e registos de pagamento.
  • Notas médicas de profissionais de saúde.
  • Detalhes de casos jurídicos.
  • Notas de avaliação de funcionários de RH.
  • Projeções financeiras ou de vendas internas.

O estudo não separa partilha intencional de acidental. Ambos criam o mesmo risco legal. Um trabalhador que se esquece de remover o nome de um cliente causa a mesma infração que um que ignora a regra de propósito. A intenção não muda o resultado.

Por que a deteção é insuficiente

A monitorização de rede não consegue ler tráfego HTTPS sem bloqueio TLS. O bloqueio TLS adiciona overhead e levanta preocupações de privacidade. Os navegadores modernos muitas vezes rejeitam-no.

Os agentes DLP de endpoint monitorizam a área de transferência e as teclas pressionadas. Mas têm latência. Quando um agente deteta um padrão, o prompt pode já estar enviado.

Os registos de auditoria do fornecedor registam o que foi partilhado após ser partilhado. Ajudam na resposta a incidentes. Não param vazamentos.

A formação de pessoal é uma política, não um controlo. O estudo Cyberhaven mostra que 11% dos prompts ainda contêm dados sensíveis em empresas com políticas claras. A formação não para erros acidentais.

Bloquear ferramentas IA remove ganhos de produtividade. Os trabalhadores passam a usar dispositivos ou contas pessoais. Isso coloca a atividade fora de qualquer supervisão.

Nenhum destes métodos para conteúdo sensível em tempo real.

Prevenção no ponto de entrada

A única defesa fiável é a mascaragem antes do envio. Um nome de cliente substituído por [PERSON_1] antes de sair do navegador nunca é visto pelo modelo IA.

Assim funciona a mascaragem em linha:

  1. Um trabalhador escreve um e-mail de cliente no Claude ou ChatGPT.
  2. A extensão do navegador deteta dados pessoais em tempo real.
  3. As entidades são marcadas com rótulos de tipo: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. O trabalhador revê os itens marcados.
  5. Um clique substitui todas as entidades por tokens.
  6. O prompt mascarado é enviado.

A IA recebe um prompt como: «Cliente [PERSON_1] em [EMAIL_1] tem conta [ACCOUNT_1]

A IA trata o pedido sem ver nomes ou números reais. O trabalhador conhece o cliente real pelo contexto.

Esta abordagem tem vantagens claras:

  • Os dados pessoais ficam fora dos sistemas IA externos.
  • Os dados de clientes não são adicionados a conjuntos de treino IA.
  • Os trabalhadores mantêm acesso a ferramentas IA. A produtividade mantém-se alta.

Não para a partilha deliberada se um trabalhador contornar a ferramenta. Os ficheiros anexos precisam de um fluxo de trabalho separado. Nenhum controlo é perfeito. Mas a mascaragem em linha elimina o grupo acidental. Esse grupo representa a maioria dos incidentes. O resultado é uma grande redução do risco sem mudança no fluxo de trabalho diário.

Caso de estudo: escritório de advogados

Os associados de um escritório usavam o Claude para redigir resumos de contratos. O seu método: copiar secções do contrato, colar no Claude, pedir um resumo.

Antes do uso da extensão Chrome — primeiros 6 meses:

  • 3 incidentes de dados de clientes detetados durante a revisão de conformidade.
  • Cada incidente: um nome de cliente e um número de processo apareceram no prompt.
  • Todos os 3 foram acidentais.

Após o uso da extensão Chrome — 6 meses seguintes:

  • Zero incidentes de dados de clientes.
  • Os associados receberam alertas em tempo real ao colar secções com nomes de clientes.
  • Um clique substituiu «Johnson Controls Processo 2024-0347» por «[PERSON_1] Processo [REFERENCE_1]
  • O método ficou igual.

O sócio gerente disse: «Os nossos associados conheciam a política antes da extensão. A extensão tornou a conformidade o caminho mais fácil.»

Veja como outras empresas trataram isto nos nossos casos de estudo. Reveja os controlos na visão geral de segurança.

Documentação RGPD para equipas de conformidade

As empresas que usam mascaragem IA baseada em navegador devem documentá-la como controlo técnico.

Registo das atividades de tratamento (RAT): Indique que os prompts IA passam por mascaragem do lado do cliente antes de chegar aos fornecedores. Liste os tipos de entidades, a versão do motor e os registos de implementação como evidência.

Acordos de processamento de dados: Quando nenhum dado pessoal chega ao fornecedor IA, as obrigações DPA simplificam-se. Os dados que gere nunca saem do seu sistema.

Registos de auditoria: Os registos da extensão capturam o número de entidades por sessão, a taxa de mascaragem e os tipos de entidades por volume. Estas métricas alimentam diretamente os relatórios de conformidade.

Reveja os requisitos do RGPD para ferramentas IA no nosso guia de conformidade legal e glossário. As perguntas frequentes estão no nosso FAQ.

Conclusão

O incidente da Samsung mostrou que os vazamentos IA acontecem mais rápido do que qualquer controlo posterior pode reagir. O estudo Cyberhaven quantifica-o: 11% dos prompts, várias vezes por trabalhador, todos os dias.

A mascaragem em tempo real antes do envio resolve a causa raiz. Quando os dados pessoais nunca chegam ao modelo IA, não há nada a detetar, registar ou limpar. Os trabalhadores mantêm as suas ferramentas IA. As empresas mantêm o seu estado de conformidade.

A deteção diz-lhe quando a prevenção falhou. Para vazamentos de dados IA, o custo do falhanço — multas, danos à reputação, perda de confiança — justifica a prevenção em primeiro lugar.

Explore os preços para a sua empresa. Leia a nossa declaração do fundador sobre por que a prevenção é o nosso princípio central de design.

Fontes

  • Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
  • Vazamento de dados Samsung-ChatGPT, março 2023 — Bloomberg.
  • RGPD artigos 4 e 32: Dados pessoais e medidas técnicas — gdpr-info.eu.

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.