Voltar ao BlogGDPR & Conformidade

EU AI Act Agosto 2026: Anonimização de Dados de...

A execução completa da Lei de IA da UE começa em 2 de agosto de 2026. Multas de até €35M ou 7% do faturamento global.

March 16, 20269 min de leitura
EU AI Acttraining dataArticle 10GDPR complianceAI regulation2026 deadlinedata governance

A Contagem Regressiva Começou

Atualizado para 2026

O prazo da Lei de IA da UE é real. As regras do Artigo 10 aplicam-se a partir de 2 de agosto de 2026. Se a sua equipe constrói ou opera um sistema de IA de alto risco, precisa agir agora. O tempo é curto.

As multas superam o RGPD. O máximo é €35 milhões ou 7% do volume de negócios anual global, o que for maior. O RGPD tem um teto de €20 milhões ou 4%. Nenhuma outra lei de IA tem multas mais altas.

Quais Sistemas de IA São de Alto Risco?

A Lei de IA classifica os sistemas por nível de risco. Os sistemas de alto risco (Anexo III) cobrem IA utilizada em:

  • Educação — acesso a escolas ou avaliação de estudantes
  • Emprego — triagem de CVs, pontuação de entrevistas, monitorização de trabalhadores
  • Serviços essenciais — pontuação de crédito, preços de seguros, despacho de emergência
  • Aplicação da lei — previsão criminal, identificação biométrica
  • Saúde — software de dispositivos médicos, triagem de pacientes
  • Infraestrutura — gestão de energia, água ou transporte
  • Justiça — ferramentas de pesquisa jurídica, sistemas de recomendação de sentenças

Trabalha em alguma dessas áreas? O Artigo 10 aplica-se a si.

Artigo 10: Quatro Regras Chave

O Artigo 10 estabelece regras para os conjuntos de dados utilizados por sistemas de IA de alto risco. Aqui estão as quatro principais.

1. Governança Escrita

Os conjuntos de dados devem seguir "práticas adequadas de governança e gestão de dados." Precisa de passos escritos para recolha, verificações de qualidade e revisão contínua.

2. Testes de Viés

Os registos devem ser verificados para detetar "possíveis vieses" que possam causar resultados injustos. São necessários testes ativos. Evitar viés intencional não é suficiente.

3. Exatidão e Cobertura

Os conjuntos de dados devem ser "relevantes, suficientemente representativos e sem erros." Os crawls web que omitem certos grupos podem não cumprir este padrão.

4. Categorias Especiais

O Artigo 10(5) é a regra mais direta. Quando um sistema de alto risco usa registos de categoria especial — saúde, etnia, religião, política, biometria — só pode processá-los quando for "estritamente necessário" para verificações de viés. Deve também aplicar "salvaguardas adequadas." A anonimização é uma das salvaguardas mais robustas.

Em resumo: a maioria dos conjuntos de dados de modelos de IA contém registos pessoais. O Artigo 10 diz para usar o mínimo necessário, com fortes salvaguardas técnicas.

Consulte a nossa página de conformidade legal e a visão geral de segurança para mais detalhes.

Níveis de Multas

A Lei de IA da UE tem três níveis de multas. Todos superam o RGPD para o mesmo tipo de infração:

RegulaçãoMulta Máx.Teto de Volume de Negócios
RGPD€20 milhões4% global
Lei IA UE (alto risco)€15 milhões3% global
Lei IA UE (proibido)€35 milhões7% global

As infrações de conjuntos de dados enquadram-se no nível de alto risco (€15M / 3%). Se um regulador determinar que usar registos pessoais sem salvaguardas é uma prática proibida, aplica-se o nível superior.

Exemplos reais: €500M de volume de negócios × 3% = €15M de multa. €5B × 3% = €150M de multa.

Por Que a Anonimização Resolve o Problema

Os registos corretamente anonimizados ficam fora do âmbito do RGPD. Isso remove a maior parte do encargo do Artigo 10.

As regras mais difíceis — tratamento de categorias especiais, monitorização de viés, direitos dos titulares de dados — só se aplicam quando um conjunto de dados contém registos pessoais. Remova esses registos primeiro. O encargo desaparece em grande parte.

A CNIL (autoridade francesa de proteção de dados) deixou isso claro no início de 2026. As suas orientações de IA indicam que a anonimização de informações pessoais não estritamente necessárias para o desempenho do modelo é a principal medida técnica para cumprir o Artigo 10.

Esta não é uma posição marginal. É a posição dominante do regulador de IA mais avançado tecnicamente da UE.

O Que a Anonimização Significa na Prática

Limpar conjuntos de dados de modelos de IA não é o mesmo que limpar registos de produção em tempo real. Os conjuntos de dados de modelos podem conter:

  • Documentos com dados pessoais — contratos, e-mails, relatórios, tickets de suporte
  • Registos estruturados — tabelas de clientes usadas para construir modelos preditivos
  • Conteúdo etiquetado — imagens ou texto com anotações que incluem identificadores pessoais
  • Registos sintéticos — onde a geração pode preservar padrões identificadores

Deve detetar dados pessoais em todos estes formatos. Falhar um tipo expõe todo o conjunto de dados.

A API da anonym.legal lida com processamento em lote para grandes conjuntos de dados de IA. Deteta 285+ tipos de entidades em 48 idiomas. Para empresas de IA europeias com conjuntos de dados multilingues, a cobertura entre idiomas é fundamental.

Para mais sobre deteção de entidades, consulte o guia do sistema de tokens e a referência de tipos de entidades.

Passos Práticos: Anonimizar o Seu Conjunto de Dados

Passo 1: Auditar primeiro

Execute uma passagem de deteção antes de anonimizar qualquer coisa:

curl -X POST https://anonym.legal/api/presidio/analyze \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "'"$(cat document.txt)"'",
    "language": "pt"
  }'

Passo 2: Anonimização em lote

Para grandes conjuntos de dados, use o endpoint batch:

import requests
import os
from pathlib import Path

def anonymize_batch(documents: list[dict]) -> list[dict]:
    response = requests.post(
        "https://anonym.legal/api/presidio/anonymize-batch",
        json={"items": documents, "language": "pt"},
        headers={"Authorization": f"Bearer {os.environ['ANONYM_API_KEY']}"}
    )
    return response.json()["results"]

source_dir = Path("./dataset")
docs = [
    {"id": f.name, "text": f.read_text()}
    for f in source_dir.glob("*.txt")
]

batch_size = 50
for i in range(0, len(docs), batch_size):
    results = anonymize_batch(docs[i:i+batch_size])
    for result in results:
        out = source_dir / "clean" / result["id"]
        out.write_text(result["text"])
        print(f"Feito: {result['id']} — {len(result['items'])} entidades removidas")

Passo 3: Documentar tudo

O Artigo 10 exige registos escritos. Para cada conjunto de dados, mantenha:

  • O modelo de deteção e a versão utilizados
  • Que tipos de entidades foram encontrados e como cada um foi substituído
  • Contagens de entidades removidas por conjunto de dados
  • A data da anonimização e a versão do conjunto de dados

Isso cumpre as "práticas de governança e gestão de dados" exigidas pelo Artigo 10(2)(a).

Perguntas Frequentes

A anonimização prejudica a qualidade do modelo?

Na maioria dos casos, não. O modelo aprende padrões da estrutura do texto, não de detalhes pessoais. Nomes, números de telefone e endereços podem ser substituídos por marcadores como [NOME] ou [TELEFONE] e o modelo ainda aprende os mesmos padrões. Muitas equipas de investigação descobriram que conjuntos de dados anonimizados produzem modelos de qualidade igual.

E os conjuntos de dados noutros idiomas?

A API suporta 48 idiomas. Os conjuntos de dados mistos também são suportados — pode especificar o idioma por documento no pedido em lote. Consulte as perguntas frequentes para uma lista completa de idiomas.

Lei de IA do Colorado: Dois Prazos

A Lei de IA do Colorado entra em vigor em 30 de junho de 2026 — cinco semanas antes do prazo da UE. Impõe regras semelhantes para "sistemas de IA de alto risco" ao abrigo da lei estadual. O foco principal é a discriminação algorítmica.

As equipas na UE e no Colorado enfrentam dois prazos ao mesmo tempo. Anonimizar os seus conjuntos de dados ajuda a cumprir ambas as leis: o Artigo 10 (UE) e as regras anti-discriminação do Colorado. Os passos técnicos são os mesmos.

Aja Agora

Cinco meses é suficiente — se começar hoje. Não é suficiente se esperar até junho.

Um calendário prático:

  1. Semanas 1–2: Audite os seus conjuntos de dados — descubra que registos pessoais estão presentes
  2. Semanas 3–6: Construa e teste o seu pipeline de anonimização
  3. Semanas 7–10: Redija a sua documentação de governança; obtenha revisão jurídica
  4. Semanas 11–16: Valide — confirme que os conjuntos anonimizados cumprem os requisitos de qualidade do Artigo 10
  5. 2 de agosto: Data de aplicação — conformidade em vigor

A API da anonym.legal integra-se no seu pipeline existente sem grandes alterações. Consulte os preços para planos de volume. As perguntas frequentes respondem a dúvidas comuns sobre o Artigo 10.

A Lei de IA da UE está pronta para ser aplicada. A sua organização estará pronta a 2 de agosto?

Comece com a checklist de conformidade RGPD →

Limites e Questões em Aberto

A anonimização para conformidade com a Lei de IA está ainda a evoluir. Aqui estão as principais lacunas.

Os limiares não estão definidos. A Lei de IA da UE não especifica que nível de anonimização é "suficiente." Até o Gabinete Europeu de IA emitir orientações, enfrenta incerteza legal.

O risco de re-identificação persiste. As investigações mostram que os grandes modelos de linguagem podem memorizar e reproduzir conteúdo dos seus conjuntos de dados. A anonimização antes do desenvolvimento do modelo não resolve completamente este problema.

Os registos sintéticos têm limites. A geração sintética preserva padrões estatísticos mas pode introduzir vieses subtis ou perder casos extremos raros.

O Artigo 10 ainda está a ser interpretado. A frase "medidas técnicas adequadas" necessita de interpretação. A aplicação precoce pelas APD nos Estados-Membros da UE ainda não estabeleceu padrões claros. Acompanhe as orientações do CEPD e as decisões dos Estados-Membros ao longo de 2026.

Fontes

  • Lei de IA UE, Regulamento (UE) 2024/1689, Artigos 9–17, JO L 2024/1689
  • Lei de IA UE, Artigo 10 — Dados e governança de dados
  • Recomendações CNIL sobre conjuntos de dados de IA, janeiro de 2026
  • Lei de IA do Colorado, SB 205, em vigor desde 30 de junho de 2026
  • Calendário Lei de IA UE: práticas proibidas desde 2 de fevereiro de 2025; sistemas de alto risco desde 2 de agosto de 2026

Pronto para proteger seus dados?

Comece a anonimizar PII com mais de 285 tipos de entidades em 48 idiomas.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.