By · Last updated 2026-03-15

Itzuli BlogeraLegal Tech

Behin Betiko Anonimizazioa: Froga Suntsitzearen Arriskua

ChatGPT sarreren %34,8k datu sentikorrak ditu (Cyberhaven). Konponbideak -- behin betiko anonimizazioak -- bere arrisku juridikoa du: froga suntsipena. GDPR 4. Artikulua hau nabarmentzen du.

March 15, 202610 min irakurri
reversible encryptionspoliation risklegal discovery complianceGDPR pseudonymizationAES-256-GCM

2026rako eguneratua

Konponbide Bat, Arrisku Berri Bi

Etxe askok orain AI ihesei aurre egiten diete testu batera iritsi aurretik izenak eta IDak kenduz. Norabide bakarreko hash-a, erredakzio gogorra edo erabateko ezabaketa guztiak seguru dirudite. AI-k testu garbia lortzen du. Xehetasun sentikorrak etxe barruan geratzen dira.

Logikak segurtasun aldean eusten du. Cyberhaven-en 2025eko K4 azterketak aurkitu zuen ChatGPT-ra bidaltzen den edukiaren %34,8k datu sentikorrak dituztela. Ponemon-en 2024ko txostenak AI haustara kostu batez bestekoaren 2,1 milioi dolartan jarri zituen. Arriskua erreala da eta kostua altua.

Baina erabateko kenketak arrisku baten truke beste bat ematen du: frogen suntsipena.

Auzitegi edo auditoretzetara azpien dauden etxeentzat, jordinako erregistroak berreskuratzeko gaitasuna suntsitzeak federal eta estatuko arauetan froga suntsitzea bezala kontatu daiteke.

AI Partekatzeen Eskala

eSecurity Planet eta Cyberhaven-en ikerketak aurkitu zuen langileen %77k datu sentikorrak partekatzen dituztela AI tresnekin astero. Honek legezko, osasun, finantza eta teknologia eremuak hartzen ditu.

Partekaturiko edukiak sarri barne hartzen du:

  • Bezero gutunak eta kasu oharrak
  • Kontratu zirriborroak eta akordio baldintzak
  • Barne planak eta negozio erregistroak
  • Finantza ereduak eta proiekzioak
  • Legezko memorandumak eta kasu oharrak
  • Pazienteen erregistroak eta kliniko oharrak
  • GG fitxategiak eta langile mezuak

Erabateko ezabaketa AI kontrola denean, bertatik pasatzen den dokumentu bakoitzak bere balio legala galdu dezake. Dokumentu horiek auzitegi batean agertzen badira -- oso litekeena urte askotako epean eremu erregulatuan dauden etxeentzat -- etxeak potentziala froga galdu du.

Ikusi gure betetze-ikuspen juridikoa nola betetzen dituen anonym.legal-ek aurkikuntza betebeharrak. Token sistema gidan ere beha dezakezu nola funtzionatzen duen maskaratze kanalizazioak praktikan.

GDPR: Itzulgarritasuna Beharrezkoa Da

GDPR 4(5). artikuluak pseudonimizazioa definitzen du datu pertsonalak prozesatzea moduan, eta horrek esan nahi du "ezin direla gehiago lotu pertsona datu zehatz bati informazio osagarria erabili gabe, informazio osagarri hori bereizita gordea dugula ezinbestean."

Gako puntua: berriro lotzea ahalbidetzen duen gako osagarria gorde behar da. Gordetako gakoen bidez berriro lotu daitezkeen erregistroak GDPR-peko pseudonimizazioak bezala kontatzen dira.

Inola berriro lotu ezin diren erregistroak ez dira pseudonimizatuak. Anonimizatuak dira. Aldea axola da:

  • Tokenez markatutako erregistroek GDPR betebehar batzuk mantentzen dituzte baina erabilera legalerako berreskura daitezke.
  • Erabat ezabatuak diren erregistroak GDPR esparruz kanpo egon daitezke baina ezin dira inola berreskuratu.

Europako Datu Babeserako Batzordearen 05/2022 Gidalerroek berriro berretsi dute itzulgarritasuna definizioa oinarrizko zatia dela. Norabide bakarreko ezabaketa erabiltzen duten etxeek ez dute GDPR pseudonimizazioa egiten. Erregistroak berreskuratzeko gaitasuna mozten ari dira.

Ikasi gehiago gure betetze-gunean eta babes-ikuspegia.

Federal Arauak: Froga Suntsitze Proba

Federal Rules of Civil Procedure peko alderdiek espero diren legezko ekintzetarako garrantzitsuak izan daitezkeen erregistroak gorde behar dituzte. Betebehar hau abiatzen da auzitegi bat arrazoizko aurreikusgarria denean -- ez aurkezten denean.

37(e) Arauak auzitegiei zigorrak ezartzeko baimena ematen die gordetzea huts egiten duen alderdiari. Zigorrek barne har dezakete:

  • Inferentzia kontrako argibideak
  • Froga ezestea
  • Kasu-amaierako zigorrak kasu larrienetan

Hau nola gauzatzen den da hau. Etxe batek AI lan-fluxuak erabiltzen ditu ohiko negozio jardueraren eduki sentikorra erabat kentzen dutenak. Erregistro horiek geroago auzitegi baten garrantzitsu bihurtzen dira. Etxeak aldatu ditu jordinako testua berreskuratu ezin dadin. Hori gordetze betebeharraren ondoren gertatu bazen, froga-suntsitze ageria ondorioztatu.

Hau ez da bazterreko kasua. Eremu erregulatuan errepikatutako legezko ageriarekin dauden etxeek dokumentu mota zabaletako etengabeko auzitegi aurreikusgarriak aurre egiten dituzte. Erabateko ezabaketa arrisku-pean dauden erregistroen ebakidurarik gabe lan-fluxu guztian zabaltzeak -- froga suntsitze arrisku handia sortzen du.

Itzulgarria vs. Ezinezkoa: Desberdintasun Nagusia

Itzulgarri eta norabide bakarreko maskatu arteko desberdintasuna diseinuan dago.

Norabide Bakarreko: itzultzeko biderik ez

Izen baten SHA-256 hash-a hash finko bat sortzen du. Izena ezin da hortik atera. Erredakzio gogorrak testua kendu du, jordinako edukia joan da.

Itzulgarria: berreskurapena posiblea da

Gako gordeta duten token ordezkapena eta AES-256-GCM enkriptazioak erregistroak deshinegin daitezkeen modutan eraldatzen dituzte. Tokenaz ordezkatutako izen bat bilaketa taula baten bidez berreskuratu daiteke. AES-256-GCM edukia gako egokiarekin desenkriptatuta berreskura daiteke. Jordinako testua eskuragarri geratzen da.

AI babesean, bi metodoak modu berdinean funtzionatzen dute. AI tokenak prozesatzen ditu eta ez du sekula benetako erregistroak ikusten.

Betebehar juridikoan, soilik itzulgarri token maskatua funtzionatzen du. Norabide bakarreko metodoak berreskurapena ebakitzen dute eta aipatutako froga suntsitze arriskua sortzen dute.

Ikusi nola kudeatzen duen gure token sistemak hori burutik buruetara. Testuinguru sakonago baterako, ikusi glosategia eta FAQ.

Diseinu Bikoitz-Bete

AI segurtasuna eta legezko zabalkuntza betebeharrak betetzen dituen diseinuak itzulgarri AES-256-GCM token maskatuak erabiltzen ditu:

  1. Erregistroak edozein AI tresnetara iritsi aurretik prozesatzen dira.
  2. Elementu sentikorrak -- izenak, IDak, PHI, eduki pribilegiatu -- token egituratuekin trukatzen dira.
  3. Token mapa bereiztutako biltegi batean gordetzen da datu motarekin bat datozen sarbide kontrolekin.
  4. AI prozesatzea token kopiaren gainean egiten da. AI-k ez du sekula benetako erregistroak ikusten forma erabilgarrian.
  5. Emaitzak token mapa erabiliz berreskuratzen dira ohiko negozio erabilerarako.
  6. Token mapa legezko behar egiten denean lege-atxikimenduaren pean jartzen da.

Diseinupe honetan, ez da jordinako edukirik inoiz galtzen. AI hornitzaileak ez du sekula forma erabilgarrian ikusten. Token mapak berreskurapena posible mantentzen du legeak eskatzen duenean. Froga suntsitze arriskua desagertzen da -- ez da erregistrorik suntsitzen. Soilik deshinegin daitekeen modutan maskatuta daude.

GDPR 4(5). artikulua betetzen da: informazio osagarria (token mapa) bereizita gordetzen da teknika eta prozesatzeko behar diren babesak dituela. Federal Rules gordetzeko betebehar betetzen da: jordinako erregistroak berreskuratu daitezke lege-atxikimendua aplikatzen denean.

Aztertu gure entitate detekzio ikuspegia, babes ikuspegia, eta planak eta tasak xehetasun osoentzat.

Aukera Binarioa

Etxeek bide argia dute:

  • Datuak behin betiko kendu -- AI ihes arazoa konpondu baina arrisku juridikoa sortu.
  • Itzulgarri token maskatuak erabili -- babes eta betetze beharrak aldi berean bete.

2,1 milioi dolarreko AI haustara batez bestekoaren kostuak segurtasun erabakia bultzatzen du. Baina froga suntsitze zigorrak ere ez dira merkeak. Diruaren jokoa handiko kasuetan, kostuak magnitude ordenan iragin dezake. Bi arriskuek leku du erabakian.

AI politika soildua bi muturretan estaltzen du. Erregistro sentikorrak etxetik forma erabilgarrian irteten galarazten ditu. Eta erregistro berdinak eskuragarri mantentzen ditu auzitegi edo erregulatzaile batek eskatzen duenean. Itzulgarri token maskatua bi hori aldi berean egiten duen metodo bakarra da.

Ikusi gure sortzailearen adierazpena eta kasu azterlanak atzeko planoan.

Iturriak

  • Cyberhaven K4 2025: AI Tresnetako Datu Agerian -- lotura
  • IBM / Ponemon Institute: Datu Haustara Txostena 2024 -- lotura
  • EDPB Guidelines 05/2022 Pseudonimizazioaren Gainean -- lotura
  • Federal Rules of Civil Procedure 37(e) Araua -- lotura
  • E-Discovery LLC: Garrantziaren Araberako Erredakzioak eta Lege Estandarrak -- lotura

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.