By · Last updated 2026-04-13

Itzuli BlogeraTeknikoa

Airean Banandutako Pribatutasuna: PII Lineaz Kanpo Anonimizatu

FedRAMP eta ITAR inguruneek gauza bat dute amankomunean: hodeia ez da aukera. GDPR 4(5). Artikuluaren peko itzulgarria den sasi-anonimizazioa.

April 13, 20269 min irakurri
air-gapped anonymizationSCIF document processingITAR complianceFedRAMP offline toolsoffline PII detection

Aire-Banaketa Araua

Sare batzuek ez dute Internetik. Ez politikagatik, diseinuagatik baizik.

SCIF bat (Informazio Konpartimentatu Sentikorraren Instalazioa) Faraday-kaiola gela bat da. Seinale haririk gabeak ez du sartzen edo irteten. ITAR-k (Armek Nazioarteko Trafikoa Arautzeko Erregelamendua) onartutako alderdiei estalitako eduki teknikoa bidaltzea debekatzen du. Hodeiko hornitzaileak ez daude ITAR-onartuta. Talde hauentzat, "hodeiko SaaS" ez da kudeatu beharreko arriskua.

Gune hauentzat, hodeiko tresnak ez dira funtzionatzen. Punto.

Sareko lotura bizia behar duen tresna ezin da hemen exekutatu. Lizentzia-zerbitzaria deitzen duen tresna blokeatuta dago. PII detekziorako hodeiko API batera fitxategiak bidaltzen dituen tresna ezin da SCIF baten barruan funtzionatu. Hauek ez dira bazterrekoak. Defentsa-taldeetarako eguneroko murrizketak dira.

ITAR Kasua

Defentsa-enpresako datu-zientzialari batek ITAR peko langileen erregistroak ditu. Fitxategiak partekatu aurretik izenak eta IDak kendu behar ditu. Bere sarea airean bananduta dago.

Ez dago hodeiko konponbiderik. Bide bakarra tokiko gailuan exekutatzen den tresna da. Modeloak tokian gorde behar ditu. Kanpoko deirik gabe irteera garbia sortu behar du.

Tauri 2.0-n oinarritutako Mahaigaineko Aplikazioak hori egiten du. Instalazioa egin ondoren, ez da sare-deirik egiten exekuzio batean. SpaCy NER modeloak eta adierazpen erregularrak guztiak tokiko CPUan exekutatzen dira. Irteera gailuan geratzen da erabiltzaileak esportatu arte.

Zergatik Garrantzi Duen Itzulgarritasunak

Lan sailkatuak sarritan itzulgarria den sasi-anonimizazioa behar du. Taldeek benetako izenak kodeengatik trukatzen dituzte. Erregistroak erabilgarri mantentzen dituzte. Identitate errealak babesten dituzte.

GDPR-ren 4(5). artikuluak sasi-anonimizazioa babes-neurri formal gisa definitzen du. Arriskua murrizten du. Sasi-anonimizatutako erregistroek betebehar juridiko gutxiago dituzte, bilaketa-tokena datu-multzotik aparte gordetzen bada.

IAPP ikerketak (2024) aurkitu zuen tresnen %23-k bakarrik onartzen dutela benetako itzulgarritasuna. Gehienek norabide bakarreko estaltzea edo ordezkapen osoa egiten dute. Erregistro bat berridatzi eta gero, desagertu egiten da.

Gobernu-talde batzuk lana konpartimentuz banatzen dute. Talde batek sasi-anonimizatutako fitxategiak jasotzen ditu. Analisia egiten dute. Bigarren taldeak bilaketa-tokena du. Erregistroak soilik legeak hori eskatzen duenean berrizendatzen dituzte. Diseinu banatze hau hainbat taldetako lan-fluxu sailkatuen ikuspegitik bakarra da modu seguruan egiteko.

Zero-ezagutza modeloak urrats gehiago ematen du. Bilaketa-tokena bezero-gailuan sortzen da. Ez da inoiz kanpora bidaltzen. Hornitzaileari hurbiltzea eskatzen bada, ezin du tokena eman. Inoiz ez zuen eduki. Horrek ingurune sailkatu askotan custody-kateak arauak asetzen ditu.

EDPB Token Banaketa

EDPB 05/2022 Gidalerroak token sasi-anonimizazioa aparte mantendu behar dela dio. Ez da sasi-anonimizatutako erregistroak duen alderdi berak eduki behar. Edo alderdi hori bi erregistroak eta tokena aldi berean irakurtzea galarazten duten kontrolen pean blokeatuta egon behar du.

Hiru gauza batera arau hori betetzen dute:

  • Tokena bezero-gailuan sortu, ez bidali kanpora
  • Prozesatze guztia tokian egin, ezer ez utzi airean banandutako gunea
  • Irteera eta tokena bereizita esportatu, bi fitxategi bereizietan, bi bide bereizitan

Diseinu honek EDPB araua eta aire-banaketa murrizketa aldi berean betetzen ditu.

Ikuspegi osoagoa lortzeko, gure segurtasun-ikuspegi orokorrak erakusten du tokiko prozesatzeak hirugarren mailako katea nola mozten duen. Gure betetze-gidak GDPR transferentzia arauak biltzen ditu. Ikus gure FAQ konfigurazio-laguntzarako.

Anonym.legal-en Mahaigaineko Aplikazioak PII detekzio guztia tokiko gailuan exekutatzen du. Ez da beharrezkoa Internetik instalatu ostean. Windows, macOS eta Linux onartzen ditu. Bundled NLP modeloek 24 hizkuntza biltzen dituzte.

2026rako eguneratua

Iturriak

Prest zure datuak babesteko?

Hasi PII anonimizatzen 285+ entitate mota 48 hizkuntzatan.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.