By · Last updated 2026-06-05

Tornar al BlogSeguretat de la IA

Prevencio de PII en Temps Real per a Fuites de Dades d'IA

Quan un empleat escriu el nom d'un client a ChatGPT, les dades surten del control de l'organitzacio en temps real. El DLP posterior al fet no pot desfer el dany.

June 5, 20267 min llegit
AI data preventionChatGPT PIIreal-time anonymizationDLP alternativeChrome Extension

Prevencio de PII en Temps Real: Aturar les Fuites de Dades d'IA Abans que Succeeixin

Actualitzat per al 2026.

El marc 2023, un enginyer de Samsung va enganxar codi font a ChatGPT. El codi va sortir del control de Samsung immediatament. Cap eina ho va detectar a temps. Els controls de seguretat posteriors al fet no poden aturar les fuites de dades d'IA. Aquest succés ho va demostrar.

Les eines de deteccio t'indiquen que ha passat despres dels fets. Les comprovacions de registres, el DLP d'endpoint i els registres d'auditoria funcionen d'aquesta manera. Per a les fuites d'IA, despres dels fets es massa tard. Les dades ja han arribat al model d'IA.

L'Escala del Problema

Un estudi de Cyberhaven del 2025 va analitzar com les empreses utilitzen la IA. Les conclusions van ser sorprenents.

  • L'11% de tots els prompts de ChatGPT contenen dades privades o sensibles.
  • El treballador mitja utilitza eines d'IA 14 vegades al dia.
  • El personal d'us intensiu interactua entre 30 i 50 vegades diariament.
  • Amb un 11%, aixo significa entre 3 i 5 enviaments sensibles per treballador al dia.

En una empresa amb 500 treballadors d'us intensiu, aixo suma mes de 2.000 enviaments sensibles al dia. Cadascun pot ser una infrac. de l'Article 83 del RGPD. El risc no es nomes legal. La confiana i la reputacio tambe estan en joc.

Els tipus de contingut sensible mes comuns en els prompts d'IA inclouen:

  • Noms de clients i dades de contacte.
  • Numeros de compte i registres de pagament.
  • Notes mediques de professionals sanitaris.
  • Detalls de casos d'advocats.
  • Notes d'avaluacio del personal dels equips de RRHH.
  • Projeccions internes d'ingressos o vendes.

L'estudi no distingeix entre comparticio intencional i accidental. Tots dos creen el mateix risc legal. Un treballador que oblida eliminar el nom d'un client causa la mateixa infrac. que un que ignora la norma. La intencio no canvia el resultat.

Per que la Deteccio es Insuficient

Les comprovacions de xarxa no poden llegir el transit HTTPS sense bloqueig TLS. El bloqueig TLS afegeix costos generals i genera preocupacions de privadesa. Els navegadors moderns sovint el rebutgen.

Els agents de DLP d'endpoint vigilen el porta-retalls i l'entrada de tecles. Pero tenen latencia. Per al moment que un agent marca un patro, el prompt ja pot haver estat enviat.

Els registres d'auditoria de proveidor registren el que s'ha compartit despres que s'hagi compartit. Ajuden amb la resposta. No aturen les fuites.

La formacio del personal es una politica, no un control. L'estudi de Cyberhaven mostra que l'11% dels prompts encara contenen contingut sensible en empreses amb politiques clares. La formacio no atura la comparticio accidental ni les llacunes durant la tasca.

Bloquejar les eines d'IA elimina els guanys de productivitat. Els treballadors llavors utilitzen dispositius o comptes personals. Aixo col.loca el treball fora de qualsevol supervisio.

Cap d'aquests metodes atura el contingut sensible d'arribar als sistemes d'IA en temps real.

Prevencio en el Punt d'Entrada

L'unica defensa segura es l'emmascarament abans d'enviar el prompt. Un nom de client substituit per [PERSON_1] abans de sortir del navegador mai el veu el model d'IA.

Aixi es com funciona l'emmascarament en linia:

  1. Un treballador escriu un correu electronic d'un client a Claude o ChatGPT.
  2. El complement del navegador detecta dades personals en temps real.
  3. Les entitats es marquen amb etiquetes de tipus: PERSON, EMAIL_ADDRESS, ACCOUNT_NUMBER.
  4. El treballador revisa els elements marcats.
  5. Un clic substitueix totes les entitats per tokens.
  6. S'envia el prompt emmascarat.

L'IA rep un prompt com aquest: "El client [PERSON_1] a [EMAIL_1] te el compte [ACCOUNT_1]."

L'IA gestiona la sol.licitud. Mai veu noms ni numeros reals. El treballador coneix el client real pel context.

Aquest enfocament te avantatges clars:

  • Les dades personals romanen fora dels sistemes d'IA externs.
  • Els detalls dels clients no s'afegeixen als conjunts d'entrenament de l'IA.
  • Els treballadors mantenen l'acces a les eines d'IA. La productivitat es manté alta.

No atura la comparticio deliberada si un treballador bypassa l'eina. Les pujades d'arxius necessiten un flux de treball separat. Cap control es perfecte. Pero l'emmascarament en linia elimina el grup accidental. Aquest grup constitueix la majoria d'incidents. El resultat es una gran reduccio del risc sense canvis en el flux de treball diari.

Cas Practic: Despatx d'Advocats

El personal d'un despatx d'advocats utilitzava Claude per redactar notes de contractes. El seu metode: copiar seccions del contracte, enganxar-les a Claude, sol.licitar un resum.

Abans de l'us de Chrome Extension -- primers 6 mesos:

  • 3 incidents de dades de clients detectats durant la revisio.
  • Cada incident: un nom de client mes un numero de referencia d'assumpte apareixia al prompt.
  • Els 3 van ser accidentals.

Despres de l'us de Chrome Extension -- propers 6 mesos:

  • Zero incidents de dades de clients.
  • El personal rebia alertes en temps real en enganxar seccions amb noms de clients.
  • Un clic substituia "Johnson Controls Assumpte 2024-0347" per "[PERSON_1] Assumpte [REFERENCE_1]".
  • El metode es va mantenir igual.

El soci director va dir: "El nostre personal coneixia la politica abans del complement. El complement va fer que el compliment fos el cami mes facil."

Vegeu com altres empreses han gestionat aixo als nostres casos d'estudi. Reviseu els controls a la visi general de seguretat.

Registres RGPD per a Equips de Compliment

Les empreses que utilitzen emmascarament d'IA basat en navegador han de documentar-lo com a control tecnic.

Registres de tractament (ROPA): Indiqueu que els prompts d'IA passen per emmascarament del costat del client abans d'arribar als proveadors. Enumereu els tipus d'entitats, la versio del motor i els registres de desplegament com a evidencia.

Acords de processador de dades: Quan no arriben dades personals al proveador d'IA, les obligacions de DPA son simples. Les dades personals que teniu mai surten del vostre sistema.

Registres d'auditoria: Els registres del complement capturen el recompte d'entitats per sessio, la taxa d'emmascarament i els tipus d'entitats per volum. Aquestes metriques s'incorporen als informes de compliment.

Reviseu les normes RGPD per a eines d'IA a la nostra guia de compliment legal i glossari. Les preguntes frequents estan al nostre FAQ.

Conclusio

L'incident de Samsung va demostrar que les fuites d'IA passen mes rapid que qualsevol control posterior al fet pot actuar. L'estudi de Cyberhaven li va posar un numero: l'11% dels prompts, moltes vegades per treballador, cada dia.

L'emmascarament en temps real abans d'enviar soluciona la causa principal. Quan les dades personals mai arriben a l'IA, no hi ha res per detectar, registrar ni netejar. Els treballadors mantenen les seves eines d'IA. Les empreses mantenen el seu estat de compliment.

La deteccio us indica quan la prevencio ha fallat. Per a les fuites de dades d'IA, el cost del fallada -- multes, dany a la reputacio, perdua de confiana -- justifica la prevencio primer.

Exploreu els preus per a la vostra empresa. Llegiu la nostra declaracio del fundador sobre per que la prevencio primer es el nostre principi de disseny central.

Fonts

  • Cyberhaven: Estudi d'Exposicio de Dades d'IA 2025 -- cyberhaven.com.
  • Filtracio de Dades de Samsung a ChatGPT, marc 2023 -- Bloomberg.
  • RGPD Articles 4 i 32: Dades personals i mesures tecniques -- gdpr-info.eu.

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.