By · Last updated 2026-06-05

Itzuli BlogeraGDPR & Betetze

Excel PIIa: Ehunka Zutabe Anonimizatu

Excel negozio-eragiketetan PII-dentsitate handieneko agiri-motetako bat da. Hona zergatik huts egiten duten testu-analisi estandarrak kalkulu-orrietan eta zer den zutabe-testuinguruaren soluzio.

June 5, 20268 min irakurri
Excel GDPRspreadsheet anonymizationXLSX complianceHR datadata minimization

Zergatik Excel Zure Arrisku Handieneko Fitxategi Mota Den

Excel fitxategiak negozio gehienetan GDPR arrisku handienetarikoak dira. Sendabelari-erregistroek errenkada bakoitzeko datu sentikorragoak eduki ditzakete. Baina kalkulu-orriak PII azkar pilatzen du -- eta betetze-taldeek askotan galtzen dituzte.

Hiru gauza egiten dituzte zaila Excel fitxategiak kudeatzea.

Bolumena: XLSX fitxategi batek 50.000 errenkada eta 100 zutabe eduki ditzake. Hori bost milioi gelaxka da. Eskuzko berrikuspenik ezin du denak egiaztatu.

Sare-diseinua: Testua norabide batean isurtzen da. Excelek datuak errenkadetan eta zutabeetan banatzen ditu. Datu pertsonalak sare horretan edonon ezkutatu daitezke.

Eduki mistoa: Soldata-mailak, departamentu-kodeak eta lan-mailen mailak SSNekin eta posta elektronikoaren helbideekin fitxategi berean daude. Dena ezabatzen bada, fitxategia erabilgaitz geratzen da.

Atxikipen luzea: Langile-zerrendak eta bezero-erregistroak Excelan urteetan irauten dute. GDPR 5(1)(e) artikuluak datuen "beharrezkoa den baino gehiago ez" gordetzeko exijitzen du. "Lagungarria izan daitekeen" fitxategiek askotan data hori baino askoz gehiago irauten dute.

Zergatik Huts Egiten Duten Testu-Analisi Estandarrak Kalkulu-Orrietan

Testu-analisi tresnak agirientzako eraiki ziren. Kalkulu-orrietako huts-egin arrunta batzuetan hausten dira.

SSN-Zenbaki-gisa Arazoa

Excel-ek Gizarte Segurantza Zenbakiak marratxorik gabe (123456789) zenbaki soil gisa gordetzen ditu -- ez testu gisa. ###-##-#### bilatzeko eraikitako eskaner batek galduko ditu. Tresna onak jakin behar du "SSN" izeneko zutabe bateko 9 digituko zenbakia Gizarte Segurantza Zenbakia dela.

Data-Zenbaki-gisa Arazoa

Excelek datak serie-zenbaki gisa gordetzen ditu. 2024ko otsailak 6a 45329 gisa gordetzen da. CSV esportazio batek "45329" erakutsiko du "Jaiotze Data" zutabean. Eskanerrak zenbaki hori benetako data batera bihurtu behar du balioa markatu aurretik.

SSN Partziala Arazoa

Zenbait sistemak SSNaren azken lau digitoak bakarrik erakusten ditu (*--1234). Zenbaki osoa blokeatutako zutabe batean dago. Balio partzialak oraindik anonimizatu behar da -- SSN oso bat bezala ez badirudi ere.

Formula PIIa Arazoa

Zenbait gelaxkek PII beste gelaxketatik eraikitzen dute. =CONCATENATE(B2," ",C2) duen gelaxkak izen osoa erakusten du. B eta C zutabeak garbitzen badituzu, izen oso hori oraindik formula-gelaxkan ikusgai dago. Gordetako balioak bakarrik irakurtzen dituen tresna batek -- formula-estekak ez -- PII lekuan utziko du.

Orri Anitzen Arazoa

Koaderno handi batek bost orri eduki ditzake: Bezero Zerrenda, Eskariak, Laguntza Txartelak, Fakturaketa eta Analitika. Bezero-izenak bostetan agertzen dira. "John Smith" orri batean token bera bihurtu behar da -- "PERSON_0047" -- beste orri guztietan. Bi token ezberdinak erregistro-estekak hausten dituzte.

Zutabe-Goiburuak Seinale Gisa

Kalkulu-orrietako PII detekzioaren hobekuntza onena zutabe-goiburuaren analisia da.

"SSN" izeneko zutabe batek tresnari esaten dio zutabe horretan balio guztiak Gizarte Segurantza Zenbakiak direla. Horrek funtzionatzen du balioak partzialak, formatu arraroa edo zenbaki gisa gordetakoak direnean ere.

Zutabe-goiburuaSeinalatzen duena
SSN / Gizarte Segurantza / Zerga IDTratatu 9 digituko zenbakiak SSN gisa
Posta elektronikoa / E-posta / Posta elektronikoaren helbideaMarkatu eredu partzialak ere
Telefonoa / Harreman-telefonoa / MugikorraOnartu edozein telefono-formatu
JD / Jaiotze Data / UrtebetetzeaBihurtu serie-zenbakiak datetan
Izena / Abizena / Izen OsoaJaitsi izenen detekzio-muga
Helbidea / Kalea / Hiria / Posta KodeaKonbinatu hurbileko kokapena
Paziente ID / MRN / Erregistro ZenbakiaAplikatu osasun-ID ereduak

Zutabe-testuinguruak eduki-eskaneoa ez du ordezkatzen. Gehitzen du. "SSN" izeneko zutabe bat 100 baliorekin: eduki-eskaneoak 99 formatua ondo dituenak harrapatzen ditu. Zutabe-testuinguruak arraroa dirudiena harrapatzen du.

Egitura Mantendu, Izenak Kendu

Exceleko GDPR kasu gehienetan helburua ez da fitxategia suntsitzea. Pertsonen datuak kentzea da, fitxategia erabilgarri egiten duten zatiak mantenduz.

15.000 errenkadako langile-erregistro fitxategi baterako, betetze-ofiziar batek behar du:

Kendu:

  • Langile-izenak: PERSON_XXXX tokenak
  • SSNak: ZERRENDA-EZKATUA
  • Posta elektronikoaren helbideak: ZERRENDA-EZKATUA
  • Telefono-zenbakiak: ZERRENDA-EZKATUA
  • Etxe-helbideak: ZERRENDA-EZKATUA

Mantendu:

  • Departamentu-kodeak
  • Lan-tituluak (orokorreko rolak bakarrik)
  • Soldata-mailak (kategoria zabalak)
  • Errendimendu-puntuazioak (taldeko datuak)
  • Hasiera-datak (tentura-estatistiketarako)
  • Kudeatzaile-kodeak (pseudonimizatuta badaude)

"Pertsonak identifikatzen dituen datuaren" eta "lanak deskribatzen dituen datuaren" arteko aldea ezagutzen duen tresna batek HR analisirako oraindik funtzionatzen duen fitxategia ematen dizu -- eta GDPR datu-minimizazio arauak betetzen ditu.

Kasu Erreala: M&A HR Datu Transferentzia

Erosle konpainia batek hartutako enpresatik langile-erregistroak jasotzen ditu: 40 zutabedun 15.000 errenkadako XLSX bat. Fitxategiak kanpoko HR enpresa batera joan behar du onura-planifikaziorako. GDPRk dio zereginerako beharrezkoa den datuak bakarrik parteka daitezkeela.

Prozesatu aurretik: 40 zutabe izen osoekin, SSNekin, posta elektronikoekin, etxe-helbideekin, larrialdiko kontaktuekin eta banku-datuekin.

Zutabe-testuinguruarekin prozesatu ondoren:

  • 12 zutabek zuzenean identifikatzen dute jendea (izenak, SSNak, posta elektronikoak, telefonoa, helbideak, banku-datuak): token koherenteekin ordezkatuta
  • 3 zutabek zeharka identifikatzen dute jendea (langile ID, kudeatzaile-kode, lan-kode): fitxategian bat datozen token pseudonimoetan ordezkatuta
  • 25 zutabe datu agregatuak dira (soldata-maila, departamentua, tentura, maila): aldatu gabe

Denbora: 8 minutu 600.000 gelaxkarako

Irteera: XLSX diseinua bera, 40 zutabe, 15 anonimizatuta, 25 aldatu gabe

Ikuskatze-erregistroa: Entitate-mota, konfiantza-puntuazioa eta erabilitako zutabe-seinalea duen gelaxka-mailako erregistroa ekintza bakoitzarako

HR enpresak bere lanerako datu-multzo osoa jasotzen du -- izen edo IDrik gabe. Betetze-erregistroak froga jasotzen du datuak egokiak bakarrik partekatu zirela.

Erronka hau ez da Excelera mugatzen. Fitxategi-formatu guztiek beren moduan huts egiten dute. Ikusi nola eragiten dion formatu-zatiketek PII detekzioari fitxategi-mota guztietako ikuspuntua.

Hiru GDPR 5. Artikuluko Arauak, Prozesu Bat

Kalkulu-orrietako anonimizazio estrukturatua hiru arau aldi berean betetzen ditu.

Datu minimizazioa (Art. 5(1)(c)): Zereginerako beharrezkoak diren zutabeak bakarrik doaz hartzaileari. Identifikatzeko zutabeak ezabatuta daude.

Biltegi-muga (Art. 5(1)(e)): Jatorrizko fitxategia barruan dago lege-atxikipen-betebeharrengatik. Kopia garbi bat partekatzeko egiten da -- atxikipen-behar txikiagoarekin edo gabe.

Osotasuna eta konfidentzialtasuna (Art. 5(1)(f)): Identifikatzeko daturik ez da kontrol-eremuaren kanpora ateratzen. Kopia garbiak bakarrik partekatzen dira.

Prozesuko ikuskatze-erregistroa zure 5(2). artikuluko froga ere bada. Arau bakoitza nola bete zen erakusten du fitxategi bakoitzarentzat.

Zure taldeak DSARak edo datu-esportazio handiak kudeatzen baditu, logika bera API mailan ere aplikatzen da. Ikusi nola funtzionatzen duen GDPR datu-minimizazioak denbora errealeko APIetan.

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.