By · Last updated 2026-05-08

Bumalik sa BlogGDPR & Pagsunod

Anonymize kumpara sa Pseudonymize: €20M ang Nakataya

Ang GDPR ay nagtatrato ng anonymized at pseudonymized na datos nang ganap na magkaiba. Ang tunay na anonymization ay ganap na inaalis ang saklaw ng GDPR. Ang pseudonymization ay nagpapanatili ng saklaw ng GDPR.

May 8, 20268 min basahin
GDPR anonymization pseudonymizationArticle 4 recital 26personal data scope20 million EUR fineanonymization compliance determination

Anonymize kumpara sa Pseudonymize: €20M ang Nakataya

Itinatakda ng Article 83 ang pinakamataas na multa sa €20 milyon o 4% ng taunang kita sa buong mundo. Isang legal na tanong ang nagdadala ng panganib na iyon: naaangkop ba ang batas sa iyong dataset?

Ang anonymization ay nag-aalis ng saklaw. Ang pseudonymization ay hindi. Ang agwat na iyon ay malaki.

Ang Dalawang Kahulugan sa Plain Terms

Itinatakda ng Recital 26 ang pamantayan para sa anonymization. Ang isang tao ay dapat na "hindi o hindi na ma-identify." Ang pagsubok ay malawak. Sinasaklaw nito ang bawat paraan na "makatwirang malamang na gagamitin." Kasama rito ang controller. Sinasaklaw din nito ang anumang processor at anumang third party.

Inilalarawan ng Article 4(5) ang pseudonymisation. Ang mga rekord ay pseudonymized kapag ang isang susi ay maaaring i-reverse ang mga ito. Alisin ang susi, at mayroon ka pa ring datos. Ang karagdagang datos na iyon ay dapat manatiling hiwalay. Hindi ito anonymization.

Ang mga pseudonymized na rekord ay personal na rekord pa rin. Ang batas ay naaangkop nang buo. Walang exemption sa saklaw. Punto.

Ano ang Halaga ng Maling Label

Ang pagtrato sa isang pseudonymized na dataset bilang anonymous ay lumilikha ng limang problema nang sabay-sabay:

  • Maling mga entry sa ROPA sa ilalim ng Article 30
  • Walang proseso sa karapatan ng paksa para sa access, pagtanggal, o portability
  • Walang schedule ng pagpapanatili — walang trigger sa pagtanggal
  • Walang mga safeguard sa paglilipat para sa cross-border na trabaho
  • Walang landas na pagtanggal para sa mga kahilingan sa karapatang burahin

Ang bawat agwat ay isang hiwalay na paglabag. Lahat ng lima ay maaaring nasa isang pipeline.

Ang Signal ng Pagpapatupad ng 2025

Noong 2025, nagpatakbo ang EDPB ng joint enforcement exercise. Pinangalanan ng ulat ang isang paulit-ulit na kabiguan: "hindi epektibong mga teknik sa anonymization na ginagamit bilang kahalili sa pagtanggal." Ang mga DPA ay nag-o-audit na ngayon ng kalidad ng anonymization. Sinusuri nila nang higit pa sa kung may hakbang lamang. Ang hakbang ay dapat gumana.

Ang isang tokenized na dataset na may lookup table ay pseudonymized. Hindi ito anonymous. Mayroon itong susi. Ang susi ay maaaring i-reverse ito. Ang pagtawag dito na anonymous ay eksaktong ang kabiguan na tina-target ng ulat ng 2025.

Pagpili ng Tamang Pamamaraan

Tunay na anonymization — nasa labas ng saklaw. Gumamit ng Redact. Ang PII ay wala na nang walang link pabalik. Maaari ka ring Mag-hash ng mga high-entropy na halaga nang walang preimage path. I-dokumento ang batayan. Walang legal na tungkulin na naka-attach sa output.

Pseudonymization — nasa loob ng saklaw. Gumamit ng Replace, Mask, o Encrypt. Ang batas ay naaangkop nang buo. Binabawasan ng pseudonymization ang pinsala mula sa isang paglabag. Hindi nito binabawasan ang mga legal na tungkulin.

Kontroladong reversibility — pananaliksik o audit. Gumamit ng Encrypt na may mga client-held key. Ang key custody ay dapat matugunan ang mga tuntunin ng key separation ng EDPB 05/2022. Itala ang domain sa DPIA.

Isang Tunay na Kaso ng Paggamit

Nagbebenta ang isang kumpanya ng "anonymized" na rekord ng customer sa mga mananaliksik. Inilalapat nila ang pamamaraang Redact. Wala na ang PII. Walang token table. Walang hash preimage. Ang re-identification ay walang landas.

Isinusulat ito ng DPO sa DPIA. Pamamaraang ginamit. Mga uri ng identifier. Bakit hindi ito maaaring i-undo. Antas ng residual risk. Ang output ay nasa labas ng saklaw. Ang mga karapatan ng paksa at mga tuntunin sa paglilipat ay hindi naaangkop sa mga research copy.

Ang pamamaraan ay tumutugma sa claim. Iyon ang tamang proseso. Ito ay nakakatagal sa isang audit.

Bakit Mahalaga ang Rekord

Hindi maaaring basta-basta umangkin ng anonymization ang isang kumpanya. Ang claim ay dapat may rekord. Ang DPIA ay dapat magpakita ng apat na bagay. Kung aling mga identifier ang nasasaklaw. Kung aling pamamaraan ang ginamit. Bakit walang landas ang re-identification. Ano ang antas ng residual risk.

Nang wala ang rekord na iyon, itinuturing ng isang audit ang dataset bilang nasa saklaw. Ang buong hanay ng mga tungkulin ay naaangkop. Ang entry sa ROPA ay dapat mayroon. Ang mga safeguard sa paglilipat ay dapat mayroon. Ang landas na pagtanggal ay dapat mayroon. Walang tungkulin na mawawala nang walang patunay.

Para sa kung paano nakikipag-ugnayan ang mga karapatan sa pagtanggal sa mga anonymized na rekord, tingnan ang GDPR right to erasure and the EDPB 2025 guidance. Para sa mga tuntunin sa paglilipat kapag nagbabahagi ng mga rekord sa cross-border, tingnan ang data transfer compliance and the TikTok fine.

Mga Pinagkukunan

Handa nang protektahan ang iyong data?

Simulan ang anonymization ng PII gamit ang 285+ uri ng entidad sa 48 wika.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.