FUNDATZAILEAREN ADIERAZPENA
Zergatik hasi nuen ekosistema hau — 28 urteko konbikzio profesionala
Zure datuak. Zure giltzak. Zure arauak.
Ekosistema honetan dagoen produktu bakoitza konpromiso arkitektoniko bakar batean oinarritzen da: zure datuak, zure giltzak, zure kontrola. Zure pasahitza inoiz ez da zure gailutik ateratzen. Zure dokumentuak inoiz ez dira gordetzen. Zure enkriptazio giltza bakarrik zurea da. AEBetako legeak, hornitzailearen agindua, datu-brokerra — inoiz partekatu ez dena iritsi ezin da.
Atzeko Aldea
28 urtean teknologia, segurtasuna eta antolakuntza betetzea elkartzen lan egin dut. 1998an fundatu nuen curta.solutions. Ordutik, 26 herrialdetako araututako erakundeekin lan egin dut — finantza zerbitzuetan, osasungintzan, legeriaren arloan, gobernuan, fabrikazioan eta teknologian — IT arkitekturan, segurtasunean, digitalizazioan eta betetzean laguntza emanez.
28 urtean behatutakoak ez da eboluzio motel bat. Krisi bat da, moteltzean — generatzaile AIren iritsierarekin eta pribatutasun arauen globalizazioarekin batera iritsi den iritsiera.
Nire Konbikzioa
Pertsona, erakunde eta instituzio bakoitzak informazioa hautaz partekatzeko eskubidea duela uste dut — arautzaileari arautzaileak ikusi behar duen bakarra agertzea, bazkide batekin datu espresuki baimendutakoak partekatzeko, eta bizitza komertzial eta publikoan parte hartzeko, pribatua mantendu behar dena entregatu gabe.
Eskubide hau praktikan erabiltzeko modukoa izan behar duela uste dut — ez bakarrik betetze departamentuak eta enpresa software aurrekontuak dituzten erakundeentzat. Pribatutasuna ez da eskalaren pribilegioa izan behar.
AEBetako legeak mundu osoko edozein datu AEBetako enpresa batek eduki dezakeen lekuan iritsi da, eta langileen %77k kontrolatzen ez dituzten AI tresnetan datu sentikorra ematen dute, datuak erabiltzailearen kontrolpean inoiz ez irtetea bermatzen duen arkitektura bakarra da. Ez kontratu bermeak. Ez pribatutasun politikak. Arkitektura teknikoa.
Zero-knowledge autentifikazioa. Lehenik tokiko prozesamendua. Itzuli daitekeen enkriptazioa non giltza erabiltzailearena den. Offline-kapable funtzionamendua. EU jurisdikzioa, salbuespenik gabe. Hauek ez dira produktuen ezaugarriak. Datu pertsonalak babesten dituzten tresna guztientzat gutxieneko estandarra dira.
Eta 28 urteko esperientziak munduko informazio sentikorrenak kudeatzen dituzten erakundeetan — arautze asmoaren eta teknika errealitatearen arteko hutsunea ikusten — ulertzea eta ekosistemak oraindik falta duenari ekiteko ardura eman dit.
Datu pertsonalak anonimizatzeko eskubidea ez da teknika ezaugarri bat. Eskubide funtsezkoa da. Eta praktikan erabiltzeko modurik ez duen eskubidea ez da eskubide bat.
Behatutako Arazoak
Arautze Frakzioa: Araudi Gehiegi, Hizkuntza Komun Bat Ez
Munduan funtzionatzen duen erakunde ertain batek aldi berean 48+ lege nazional eta eskualdeko pribatutasun arauak navigatu behar ditu — GDPR, UK GDPR, CCPA, LGPD, PDPA, PIPL, DPDPA, APPI, PIPEDA eta beste dozenaka. EUko 24 DPA nazionalek printzipioz koherentea den baina praktikan desberdina den gida loteslea ematen dute. Alemaniako BfDIren irizpideak ez du automatikoki Frantziako CNIL, Irlandako DPC edo Herbehereetako APren irizpideak betetzen. Sektore espezifikoen geruzak — HIPAA, PCI-DSS, NIS2, AI Legea — betetze arauak gehitzen ditu, elkarrekin harmonizatuak ez direnak.
Emaitza ez da betetze markoa. 48 helburu desberdinekin mugitzen den helburu bat da.
Paperezko Munstroa: Inork Irakurri Ez Dituen Akordioak, Inork Berretsi Ez Dituen Kontrolak
Erakundeek ehunka azpiprozesatzaileekin datu prozesatzeko akordioak mantentzen dituzte, Transferentzioko Estándar Kontratu Klausulak 30+ orrialdekoak, Prozesatzeko Jardueren Erregistroak, DPIAk, TIAk, LIAk — bakoitzak gehienetan lege taldeek independenteki berretsi ezin duten teknika sarrera eskatzen du. Praktikan: erakundeek sinatu behar duten guztia sinatzen dute, artxibatu behar duten guztia artxibatzen dute, eta teknika errealitatea kontratuaren deskribapenarekin bat etortzea espero dute. Paperezko munstroak betetze itxura sortzen du. Gutxitan sortzen du horren substantzia.
Teknika Ezegonkortasuna: Tresnak Betebeharrekin Bat Ez Datoz
Generatzaile AI oinarritutako PII detekzioa ez da deterministikoa. Dokumentu bera bi aldiz prozesatzeak emaitza desberdinak ematen ditu. Betetzearekin bateragarria ez dena — non zehazki datuak detektatu eta zuzenean kudeatu behar diren erakutsi behar duzu, errepikakorrak eta egiaztagarriak.
Microsoft Presidio, spaCy, Stanza — ingeniaritza plataformak, ez betetze tresnak. Ekoizpenean ezartzea entitate mota eta hizkuntza bakoitzeko ezarpen pertsonalizatuak idaztea eskatzen du, aurre/post-prozesamendu pipelineak eraikitzea, dokumentu formatuetara integratzea, eta arauak aldatzen doazen heinean guztia mantentzea. Normalean 30–80 orduko espezialista ingeniaritza denbora behar da dokumentu bakar bat prozesatu aurretik. Erakunde gehienek ez dute etxean horrelako aditua.
Suediako lan kontratu batean pertsonen zenbakia, Alemaniako zerga inprimakian Steuer-ID, Poloniako aseguruen dokumentuan PESEL, Italiako fakturan Codice Fiscale — bakoitzak ez du hizkuntza detekzioa bakarrik eskatzen, baizik eta dokumentu motaren arabera entitate aitortzea. Ingelesaren gainean prestatu diren hizkuntza ereduak 69% PII galera tasa ematen dute ez-ingeleseko testuan. Legea ez da hizkuntzaren arabera bereizten.
Microsoft Purview, AWS Macie, Google Cloud DLP — garestiak, hodei konexioa eskatzen dute, erakundeak blokeatzen dituzte. Kritikoagoa: guztiak AEBetan egoitzan daude. 2018ko CLOUD Act-ek mundu osoko datuak agerian uzteko betebeharra ezartzen die AEBetako gobernuaren eskaera baliozkoa denean. FISA Atala 702k indibidualen agindurik gabe informazio bilketa ahalbidetzen du. Schrems IIk EU-AEB Pribatutasun Iragazkia baliogabetu zuen zehazki arrazoi honengatik. AEBetako hodei hornitzaile batekin sei figura urteko kontratu batek ez du GDPR betetze datu prozesamendurik sortzen.
AI Kontrolatu Ezina: Merkatua Erantzunik Ez Du
Langileen %77k informazio sentikorra AI tresnekin partekatzen du astero behintzat. AI tresna guztien %34,8k informazio sentikor gisa kalifikatzen duen sarrera du pribatutasun marko batean. Langileek ChatGPT, Copilot, Claude, Gemini erabiltzen dituzte kontratuak idazteko, oharrak laburbiltzeko, spreadsheetak aztertzeko — etengabe, automatikoki, eta ez dute jakin zer den sarrera batean itsatsita.
Tradizional DLP sistemek ez dute naturala den hizkuntza sarreraren eduki semantikoa ulertzen. Ez dute bereizten garatzaile batek AIri kode patroi bat azaltzeko eskatzen dionetik, garatzaile batek 50,000 erregistroko ekoizpen datu-basea leiho berean itsatsita. AI ereduak dena prozesatzen dute. Ez dute babesteko, ez abisurik, ez DPO batek fidatu dezakeen auditoretza-bidea eskaintzen.
Ezinbestekoa den teknika geruza falta da politika praktikan betearazteko. Geruza hori ez da merkatuko prezio punturik inon existitzen, langileek benetan erabiltzen dituzten AI tresnen artean funtzionatzen duen inongo formatan. Hori da ekosistema honek itxi nahi duen hutsuneetako bat.
Aukerak Gabetzea: Betetze Eskubidea Eskalaren Pribilegio Gisa
Praktika bakar bat, komunitate erakunde bat, agintari publiko txiki bat, ikerketa instituzio bat — guztiak GDPR berberaren, ezabatzeko eskubide berberaren, eta haustura jakinarazteko betebehar berberaren menpe daude, baina lege talde, ingeniaritza baliabide, edo enpresa software aurrekonturik gabe. Betetze ekosistemak erakunde handiei egoki zerbitzatu die, garesti bada ere. Beste guztiei agindu bat eta betetze hori asebideko praktikarik ez dutenak zerbitzatu die.
Ekosistemaren Erantzuna — Plataforma Bat, Adierazpen Anitz
Plataforma estaldura eta sarbide nagusia. Hibrido bikoitzeko PII detekzioa (260+ entitate, 48 hizkuntza, 121 betetze aurreko) ezarpen modelo guztietan — SaaS, kudeatutako hodei pribatu, eta auto-kudeatua. Produktu guztiak detekzio motor bera eta fundazio printzipio bera partekatzen dute: boterea erabiltzailearen eskuetan.
Enpresako aire-gabetutako edizioa. 390+ entitate, 317 pertsonalizatutako regex patroi, %100 offline prozesamendua, irudi OCR 37 hizkuntzatan. Hodei menpekotasun zero — datuak inoiz ez dira gailutik ateratzen.
Hodei lehen PII plataforma sarbide zabalena duena. Chrome Luzapena denbora errealean AI atxilotzeko, MCP Zerbitzaria, Office Gehigarria, itzuli daitekeen enkriptazioa. Doan €29/hilean — betetze bakoitzaren aurrekonturako.
Mahai gaineko lehen, %100 tokiko. Presidio sidecar gailuan, 7 dokumentu formatu + OCR, batch prozesamendua, enkriptatutako biltegia. Behin-behineko baimena — ez da harpidetarik, ez hodeirik, aktibatu ondoren guztiz offline.
Demonstratzeko plataforma publikoa. Konturik behar ez — testua itsatsi, berehala anonimizatu, motorra ekintzan ikusi. Ekosistemak zer egiten duen esperimentatzeko modurik azkarrena.
Plataforma Estaldura — SaaS · Kudeatutako Pribatu · Auto-Kudeatua · 3 ezarpen modelo
- //Erakundeek diote garatzaileen %67k sekretuak kodean akatsak egin dituela — deterministiko regexek NLPk galdu dituenak harrapatzen dituzte eta alderantziz
- //Helburu orokorreko AI detekzioak ez-ingeleseko testuan %69ko galera tasa lortzen du — bikoitzeko geruzak spaCy + XLM-RoBERTa gap-a itxi egiten du 48 hizkuntzatan
- //Taldeen artean koherentea ez den ezabaketa #1 ICO eta DPA auditaren aurkikuntza da — aurrekoak detekzio portaera identikoak indartzen ditu erabiltzaile bakoitzean, saio bakoitzean
- //2024ko datu hausturen %95ek giza akatsei lotuta daude — partekatutako aurrekoek per-perso konfigurazio erabakien aldaerak ezabatzen dituzte
- //Multi-hornitzaile PII pilak auditoretza-bideak sortzen dituzte — 3+ PII tresna erabiltzen dituzten erakundeen %60k baino gehiagok tresnen arteko uztaurriak izaten dituzte
- //Formatu fragmentazioa: erakundeek PDF, DOCX, XLSX, CSV, JSON aldi berean prozesatzen dituzte — formatu bakoitzak aurreko hurbilpen berezi bat, tresna berezi bat, auditoreko erregistro berezi bat eskatzen zuen
- //Enpresako PII tresnek $50,000–$500,000/urteko kostua dute — kostu murriztapenak dituzten erakundeek historikoki ez dute inolako aukera izan
- //CLOUD Act + FISA Atala 702 AEBetako 'GDPR-betetze' prozesamendua kontratu fikzio bat bihurtzen du — EUko hostinga bakarrik esposizio hori guztiz ezabatzen du
Enpresako Aire-Gabetua — 390+ entitate · 317 pertsonalizatutako regex · %100 offline · Irudi OCR
- //Industria espezifiko PII — nukleo instalazioen kodeak, militar zerbitzu zenbakiak, propietatezko barne IDak — inongo tresna komertzialek estaltzen ez dituztenak; pertsonalizatutako aitortzaileek aste batzuk behar dituzte Presidio gordinan ingeniaritza espezializatua
- //Estaldura osatugabeak detekzioaren sabaiak dira: inongo tresna orokork ez du PII moten, hizkuntzen, formatuen estaldura guztia ematen — 317 kuratutako patroiak hutsuneak itxi egiten dituzte pakete prestatuen bidez
- //Hornitzailearen paradoxa: PII babesteko hornitzailearekin partekatu behar duzu. Hodei prozesamendua prozesatzaileari konfiantza izatea eskatzen du — arkitektura kontradikzio bat da datu sentikorrenak kudeatzen dituzten erakundeentzat
- //Air-gabetutako inguruneek (defentsa, inteligentzia, azpiegitura kritikoa, ikerketa laborategiak) inongo preziorik gabe hodei menpekotasuneko tresnak erabili ezin dituzte — offline-lehenak arkitektura oztopoa guztiz ezabatzen du
- //Microsoft Purviewek argi eta garbi ezin du JPEG/PNG eskaneatu — irudietan PII testua enpresako DLP pilan ikusezin geratzen da diseinuagatik
- //SparkCat malwarea (iOS/Android, 2025eko abendua) OCR erabili zuen irudiak ateratzeko kripto poltsikoen berreskurapen esaldiak — irudietan oinarritutako testu PII aktiboki erasotzen den helburua da, ez arrisku teorikoa
- //2022 eta 2024 artean hodei bidezko datu hausturen %300ko igoera — zero-knowledgek gure zerbitzarien haustura ezer ez du agerian uzten, ezer ez baitago gorde
- //ISO 27001:2022 ziurtatua eta eguneroko full-stack pentestingarekin — araututako eskuratzeak eskatzen duen segurtasun postura dokumentatua, egiaztatua eta independenteki aztertu da
Hodeiko PII Plataforma — Doan €29/hilean · Chrome Luzapena · MCP Zerbitzaria · Office Gehigarria
- //LLM sarreraren %8,5ek PII du — sarrera aurretik denbora errealean atxilotzea da funtzionatzen duen bakarra; atzera begirako detekzioak garrantzitsua den leiho bakarra galdu egiten du
- //Tradizional DLPk datuak erakundetik irten ondoren pizten du — Chrome Luzapenak sarreran atxilotzen du, inongo modellek sentikorra den eduki bat jasotzen edo prozesatzen aurretik
- //Generatzaile AI detekzioa ez da deterministikoa — dokumentu bera emaitza desberdinak ematen ditu irteera desberdinetan; inongo probabilistiko sistemak ez du arautze defentsa bat osatzeko oinarri izan dezake
- //Presidio bakarrik testuinguruarekiko dependentzia duten entitateak galdu egiten ditu; XLM-RoBERTa bakarrik faltsuak sortzen ditu lege formalean — hirugarren klasifikazio geruzak faltsuak ezabatu egiten ditu betetze taldeek automatizatutako tresnei ez uzteko
- //Lege aurkikuntza, mediku erregistroen sarbide eskaerak, arautze auditoretza — anonimizatutako datuak batzuetan desanonimizatu behar dira baimendutako alderdiek eta bakarrik haiek; iraunkortasuneko metodoek hau ezinezkoa egiten dute
- //Erabiltzailearen saio giltza inoiz ez da bere gailutik ateratzen — ez gure zerbitzarietatik, ez hodeitik, ez azpiprozesatzaile batetik. Desanonimizazioa itzultzeko eskubidea erabiltzaileari dagokio, ez guri.
- //Praktika bakar batek global banku batekin berdin du ezabatzeko eskubidearen betebeharra — baina betetze departamenturik edo €500K/urteko enpresa software aurrekonturik gabe
- //764 EU erakunde aldi berean ezabatzeko eskubidearen porrotengatik ikertzen ari dira — ez dutelako haustea egitea asmoa, baizik eta betetzeko tresnak prezioak iritsitakoak
Mahai gaineko Lehen · %100 Tokiko Prozesamendua · 7 Dokumentu Formatu + OCR · Behin-behineko Lizentzia
- //2022 eta 2024 artean hodei bidezko datu hausturen %300ko igoera — hodeira inoiz ez sartzen den datuak ezin da hodei hausturan agerian utzi
- //CLOUD Act + FISA AEBetako prozesamendua lege aldetik ziurgabetasunak sortzen ditu EU erakundeentzat — tokiko prozesamendua muga guztiz ezabatzen du, transferentziarik ez dela ziurtatuz
- //Formatu fragmentazioak erakundeak hainbat tresna mantentzera behartzen ditu — tresna bakoitzak detekzio politika berezi bat, auditoretza erregistro berezi bat, porrot modu berezi bat sortzen du
- //Log fitxategiak PII azalerarik ezkutatuak dira — garatzaileek datu-baseetan zentratzen dira baina logek API giltzak, erabiltzaile IDak, IP helbideak dituzte; CSV eta JSON egituratutako dokumentuekin batera jatorrizkoak dira
- //Air-gabetutako ekoizpen inguruneak — fabrikazio solairuak, gobernu seguruak, ikerketa laborategiak — sareko sarbidea eskatzen duen lizentzia egiaztapenik ez dute onartzen; aktibazio behin-behinekoak ondoren guztiz offline funtzionamendua da arkitektura bideragarria
- //Behin-behineko lizentziak ez dute errepikakorrik SaaS menpekotasunik: erabiltzaileak bere instalazioa jabetzen du; hornitzailearen harpidetza ezeztatzeak tresna kritiko baten prozesamendu momentu batean desgaitzen ez du.
- //dbt pipeline berreraikitzeek CSV/JSON datuetan maskatze politikak suntsitzen dituzte — EDPB 2024k hau GDPR Art. 5(1)(a) urratzen du argitzen du; biltegi enkriptatuarekin historia gordeak prozesatutako fitxategi bakoitzak auditoretza, berreskuratzeko erregistro bat duela bermatzen du
- //Datuak ezabatzeko betetzearekin GDPR betetzeak prozesatzen dituzten erakundeek batch gaitasuna behar dute — ez 5 fitxategi egunean SaaS muga, operatiboki ezinezkoa den lan egiteko.
Arazoaren Eskala
Hau ez da irtenbideak huts egitea. Sistema baten emaitza sistemikoak dira, betetze inguruneak bere azpiegitura gainditu du.