By · Last updated 2026-04-15

Bumalik sa BlogSeguridad ng AI

Bakit Nabibigo ang Patakaran sa Pagpigil ng PII Leak sa ChatGPT

77% ng mga enterprise AI user ang nag-copy-paste ng data sa mga chatbot query. Halos 40% ng mga na-upload na file ay naglalaman ng PII o PCI data. Iminungkahi ang update sa HIPAA Security Rule.

April 15, 20268 min basahin
ChatGPT PII leak preventionChrome extension DLPenterprise AI policytechnical controls browsercopy-paste PII protection

Ang Problema sa Copy-Paste

77% ng mga enterprise AI user ay nag-copy-paste ng data sa mga chatbot query. Hindi ito isang marginal na gawi. Ito ang default na paraan ng paggamit ng mga empleyado ng mga tool ng AI sa trabaho.

Simple ang pattern. Ang isang empleyado ay nahaharap sa isang gawain. Binubuksan niya ang isang dokumento, kinokopya ang kaugnay na teksto, at ini-paste ito sa ChatGPT. Nakakakuha siya ng kapaki-pakinabang na tugon.

Walang anumang sa workflow na iyon ang nag-filter para sa personal na data. Ang pag-paste ay nangyayari bago niya tanungin: "mayroon bang PII dito?" Sa oras na mabasa niya ang tugon ng AI, kumpleto na ang paghahatid.

Natuklasan ng pananaliksik ng Cyberhaven na halos 40% ng mga na-upload na file sa mga tool ng AI ay naglalaman ng PII o PCI data. Karamihan sa mga upload na iyon ay hindi walang ingat. Ang mga empleyado ay nagtatrabaho sa file na itinalaga sa kanila. Ang data ng customer dito ay isang bagay sa gilid.

Bakit Hindi Sumusukat ang Pagsasanay

Ang pagsasanay sa patakaran ay nahaharap sa isang istrukturadong limitasyon. Sinisikap nitong baguhin ang ugaling pag-uugali sa pamamagitan ng pana-panahong edukasyon.

Ang agwat sa pagitan ng mga sesyon ng pagsasanay ay ang problema. Karamihan sa mga programa ng enterprise ay tumatakbo taon-taon. Ang isang manggagawa na sinanay sa paghawak ng data ng AI noong Enero ay nag-ooperate sa pamamagitan ng ugali noong Oktubre. Lumilipas ang pag-alala. Nananatili ang mga ugali.

Nailalaro ng iminungkahing update sa HIPAA Security Rule noong Marso 2025 ito. Nangangailangan ito ng mga taunang audit ng encryption — hindi lamang taunang pagsasanay. Inaasahan ng mga regulator na ang mga teknikal na kontrol ang pangunahing pananggalang. Ang pagsasanay ay ang suplemento.

Pinalala pa ng mga tool ng AI ang problema sa pagsasanay. Ang gawi ay bago. Hindi nagkaroon ng mga ugali sa paghawak ng data ng AI ang mga empleyado sampung taon na ang nakalipas tulad ng ginawa nila sa email. At ang paglabas ay hindi nakikita. Nakakakita ang empleyado ng kapaki-pakinabang na tugon. Walang mensaheng error. Walang agarang negatibong feedback.

Nang walang feedback, ang gawi ay hindi nagtatama ng sarili.

Paano Nini-intercept ng Chrome Extension ang Paste

Ang Chrome Extension ay nag-ooperate sa antas ng clipboard. Nakaupo ito sa pagitan ng aksyon ng kopya at ng input field ng tool ng AI.

Ganitong gumagana ang interception. Kinokopya ng empleyado ang teksto mula sa kanyang work application. Lumilipat siya sa tab ng ChatGPT at nag-paste. Natatukoy ng extension ang PII sa nilalaman ng clipboard sa sandali ng pag-paste — bago lumitaw ang nilalaman sa input field.

Lumilitaw ang isang preview modal. Ipinapakita nito nang eksakto kung ano ang magbabago:

"Pangalan ng customer na 'Maria Schmidt' na pinalitan ng '[PERSON_1]'; Email na 'maria.schmidt@company.de' na pinalitan ng '[EMAIL_1]'"

Maaaring magpatuloy ang empleyado sa na-anonymize na bersyon. Maaari rin niyang kanselahin kung ang pagpapalit ay hindi gumagana para sa kanyang gawain.

Ginagawa ng disenyong ito ang dalawang bagay. Una, ito ay malinaw. Nakikita ng mga empleyado kung ano ang ginagawa ng tool. Nagtatayo ito ng tiwala at umiiwas sa pakiramdam na ang mga kontrol sa privacy ay pagmamasid. Pangalawa, ginagawang malinaw ang desisyon sa pag-classify. Ang isang tao ay nagpapatunay ng bawat hakbang sa anonymization. Ang desisyon ay hindi awtomatikong iniaalis.

Isang Praktikal na Halimbawa

Isaalang-alang ang koponan ng suporta ng customer ng isang European e-commerce na kumpanya. Gumagamit ang mga ahente ng ChatGPT para mag-draft ng mga tugon. Nag-paste sila ng mga email ng customer na naglalaman ng mga pangalan, numero ng order, at mga address.

Kapag aktibo ang extension, ang bawat pag-paste ay nag-trigger ng tseke ng anonymization. Nagsusumite ang ahente ng isang na-anonymize na prompt. Ang tugon ng ChatGPT ay tumutukoy sa mga anonymized na token. Binabasa ng ahente ang mga mungkahi at isinasama ang mga ito sa aktwal na tugon.

Nananatiling mataas ang kalidad ng suporta. Ang GDPR Article 5 na data minimization ay natutugunan. Ang personal na data ng customer ay hindi kailanman umaabot sa mga server ng OpenAI.

Hindi maaaring makamit ng pagsasanay sa patakaran ang resultang ito. Maaaring makamit ng isang teknikal na kontrol sa antas ng clipboard.

Patakaran bilang Suplemento, Hindi Pangunahing Kontrol

Ang pagsasanay sa patakaran ay may lugar. Nagtatakda ito ng mga inaasahan. Nagtatayo ito ng baseline na kamalayan. Ngunit hindi nito maaaring i-intercept ang isang pag-paste sa real time.

Signal ng update sa panuntunan ng HIPAA kung saan patungo ang compliance. Mga namu-audit na teknikal na kontrol, hindi lamang mga dokumentadong programa ng pagsasanay. Ang mga enterprise na umaasa lamang sa pagsasanay ay nahaharap sa isang agwat sa audit na tanging isang teknikal na antas lamang ang makakapunan.

Tingnan din ang:

Mga Pinagmulan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.