Prevenção de PII em tempo real: Parar vazamentos de dados IA antes de ocorrerem.
Atualizado para 2026.
Em março de 2023, um engenheiro da Samsung colou código-fonte no ChatGPT. O código saiu do controlo da Samsung de imediato. Nenhuma ferramenta o intercetou a tempo. Os controlos de segurança posteriores não conseguem parar vazamentos de dados IA. Este evento provou-o.
As ferramentas de deteção indicam o que aconteceu após o facto. Verificações de log, DLP de endpoint e registos de auditoria funcionam assim. Para vazamentos IA, após o facto é tarde demais. Os dados já chegaram ao modelo IA.
A dimensão do problema
Um estudo Cyberhaven de 2025 analisou o uso de IA em empresas. Os resultados foram reveladores.
- 11% de todos os prompts do ChatGPT contêm dados privados ou sensíveis.
- O trabalhador médio usa ferramentas IA 14 vezes por dia.
- Os utilizadores frequentes interagem 30 a 50 vezes por dia.
- A 11%, isso significa 3 a 5 envios sensíveis por trabalhador por dia.
Numa empresa com 500 utilizadores frequentes, isto soma mais de 2.000 envios sensíveis por dia. Cada um pode ser uma violação do Artigo 83 do RGPD. O risco não é apenas legal. A reputação e a confiança também estão em jogo.
Tipos comuns de conteúdo sensível em prompts IA:
- Nomes e dados de contacto de clientes.
- Números de conta e registos de pagamento.
- Notas médicas de profissionais de saúde.
- Detalhes de casos jurídicos.
- Notas de avaliação de funcionários de RH.
- Projeções financeiras ou de vendas internas.
O estudo não separa partilha intencional de acidental. Ambos criam o mesmo risco legal. Um trabalhador que se esquece de remover o nome de um cliente causa a mesma infração que um que ignora a regra de propósito. A intenção não muda o resultado.
Por que a deteção é insuficiente
A monitorização de rede não consegue ler tráfego HTTPS sem bloqueio TLS. O bloqueio TLS adiciona overhead e levanta preocupações de privacidade. Os navegadores modernos muitas vezes rejeitam-no.
Os agentes DLP de endpoint monitorizam a área de transferência e as teclas pressionadas. Mas têm latência. Quando um agente deteta um padrão, o prompt pode já estar enviado.
Os registos de auditoria do fornecedor registam o que foi partilhado após ser partilhado. Ajudam na resposta a incidentes. Não param vazamentos.
A formação de pessoal é uma política, não um controlo. O estudo Cyberhaven mostra que 11% dos prompts ainda contêm dados sensíveis em empresas com políticas claras. A formação não para erros acidentais.
Bloquear ferramentas IA remove ganhos de produtividade. Os trabalhadores passam a usar dispositivos ou contas pessoais. Isso coloca a atividade fora de qualquer supervisão.
Nenhum destes métodos para conteúdo sensível em tempo real.
Prevenção no ponto de entrada
A única defesa fiável é a mascaragem antes do envio. Um nome de cliente substituído por [PERSON_1] antes de sair do navegador nunca é visto pelo modelo IA.
Assim funciona a mascaragem em linha:
- Um trabalhador escreve um e-mail de cliente no Claude ou ChatGPT.
- A extensão do navegador deteta dados pessoais em tempo real.
- As entidades são marcadas com rótulos de tipo: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
- O trabalhador revê os itens marcados.
- Um clique substitui todas as entidades por tokens.
- O prompt mascarado é enviado.
A IA recebe um prompt como: «Cliente [PERSON_1] em [EMAIL_1] tem conta [ACCOUNT_1].»
A IA trata o pedido sem ver nomes ou números reais. O trabalhador conhece o cliente real pelo contexto.
Esta abordagem tem vantagens claras:
- Os dados pessoais ficam fora dos sistemas IA externos.
- Os dados de clientes não são adicionados a conjuntos de treino IA.
- Os trabalhadores mantêm acesso a ferramentas IA. A produtividade mantém-se alta.
Não para a partilha deliberada se um trabalhador contornar a ferramenta. Os ficheiros anexos precisam de um fluxo de trabalho separado. Nenhum controlo é perfeito. Mas a mascaragem em linha elimina o grupo acidental. Esse grupo representa a maioria dos incidentes. O resultado é uma grande redução do risco sem mudança no fluxo de trabalho diário.
Caso de estudo: escritório de advogados
Os associados de um escritório usavam o Claude para redigir resumos de contratos. O seu método: copiar secções do contrato, colar no Claude, pedir um resumo.
Antes do uso da extensão Chrome — primeiros 6 meses:
- 3 incidentes de dados de clientes detetados durante a revisão de conformidade.
- Cada incidente: um nome de cliente e um número de processo apareceram no prompt.
- Todos os 3 foram acidentais.
Após o uso da extensão Chrome — 6 meses seguintes:
- Zero incidentes de dados de clientes.
- Os associados receberam alertas em tempo real ao colar secções com nomes de clientes.
- Um clique substituiu «Johnson Controls Processo 2024-0347» por «[PERSON_1] Processo [REFERENCE_1].»
- O método ficou igual.
O sócio gerente disse: «Os nossos associados conheciam a política antes da extensão. A extensão tornou a conformidade o caminho mais fácil.»
Veja como outras empresas trataram isto nos nossos casos de estudo. Reveja os controlos na visão geral de segurança.
Documentação RGPD para equipas de conformidade
As empresas que usam mascaragem IA baseada em navegador devem documentá-la como controlo técnico.
Registo das atividades de tratamento (RAT): Indique que os prompts IA passam por mascaragem do lado do cliente antes de chegar aos fornecedores. Liste os tipos de entidades, a versão do motor e os registos de implementação como evidência.
Acordos de processamento de dados: Quando nenhum dado pessoal chega ao fornecedor IA, as obrigações DPA simplificam-se. Os dados que gere nunca saem do seu sistema.
Registos de auditoria: Os registos da extensão capturam o número de entidades por sessão, a taxa de mascaragem e os tipos de entidades por volume. Estas métricas alimentam diretamente os relatórios de conformidade.
Reveja os requisitos do RGPD para ferramentas IA no nosso guia de conformidade legal e glossário. As perguntas frequentes estão no nosso FAQ.
Conclusão
O incidente da Samsung mostrou que os vazamentos IA acontecem mais rápido do que qualquer controlo posterior pode reagir. O estudo Cyberhaven quantifica-o: 11% dos prompts, várias vezes por trabalhador, todos os dias.
A mascaragem em tempo real antes do envio resolve a causa raiz. Quando os dados pessoais nunca chegam ao modelo IA, não há nada a detetar, registar ou limpar. Os trabalhadores mantêm as suas ferramentas IA. As empresas mantêm o seu estado de conformidade.
A deteção diz-lhe quando a prevenção falhou. Para vazamentos de dados IA, o custo do falhanço — multas, danos à reputação, perda de confiança — justifica a prevenção em primeiro lugar.
Explore os preços para a sua empresa. Leia a nossa declaração do fundador sobre por que a prevenção é o nosso princípio central de design.
Fontes
- Cyberhaven: AI Data Exposure Study 2025 — cyberhaven.com.
- Vazamento de dados Samsung-ChatGPT, março 2023 — Bloomberg.
- RGPD artigos 4 e 32: Dados pessoais e medidas técnicas — gdpr-info.eu.