By · Last updated 2026-04-13

Takaisin BlogiinTekninen

Ilmaverkkoon eristetty tietosuoja: anonymisointi offline-tilassa

FedRAMP- ja ITAR-ympäristöillä on yksi yhteinen piirre — pilvipalvelu ei ole vaihtoehto. Palautuva pseudonymisointi GDPR:n 4(5) artiklan mukaisesti.

April 13, 20269 min lukuaika
air-gapped anonymizationSCIF document processingITAR complianceFedRAMP offline toolsoffline PII detection

Ilmaverkkoisuussääntö

Joissakin verkoissa ei ole Internetiä. Ei politiikan vuoksi — suunnittelun vuoksi.

SCIF (Sensitive Compartmented Information Facility) on Faraday-häkki. Langattomat signaalit eivät pääse sisään tai ulos. ITAR (International Traffic in Arms Regulations) kieltää suojatun teknisen sisällön lähettämisen hyväksymättömille osapuolille. Pilvipalveluntarjoajat eivät ole ITAR-hyväksyttyjä. Näille ryhmille "pilvi-SaaS" ei ole hallittava riski.

Näillä sivustoilla pilvipalvelut eivät toimi. Piste.

Työkalu, joka tarvitsee live-verkkoyhteyden, ei voi toimia täällä. Lisenssipalvelimeen yhteyden ottava työkalu on estetty. Työkalu, joka lähettää tiedostoja pilvi-API:iin tunnistusta varten, ei voi toimia SCIF:n sisällä. Nämä eivät ole reunatapauksia. Ne ovat puolustustiimien päivittäisiä rajoitteita.

ITAR-tapaus

Puolustusyrityksen datatieteilijällä on ITAR:n alaisia henkilöstötietueita. Hänen on poistettava nimet ja tunnisteet ennen tiedostojen jakamista. Hänen verkkonsa on ilmaverkkoon eristetty.

Pilvikorjaus ei ole olemassa. Ainoa polku on työkalu, joka toimii paikallisella laitteella. Sen on tallennettava mallinsa paikallisesti. Sen on tuotettava puhdas tulos ilman ulkoisia yhteyksiä.

Tauri 2.0 -pohjainen työpöytäsovellus tekee tämän. Asennuksen jälkeen ajon aikana ei tehdä verkkokutsuja. spaCy NER -mallit ja regex-mallit kaikki toimivat paikallisella CPU:lla. Tulos pysyy laitteella, kunnes käyttäjä vie sen.

Miksi palautuvuus on tärkeää

Luokiteltu työ vaatii usein palautuvaa pseudonymisointia. Tiimit vaihtavat oikeat nimet koodeihin. He pitävät tietueet käyttökelpoisina. He suojaavat todelliset identiteetit.

GDPR:n 4(5) artikla määrittelee pseudonymisoinnin viralliseksi tietosuojatoimenpiteeksi. Se vähentää riskiä. Pseudonymisoidut tietueet kantavat vähemmän oikeudellisia velvoitteita — jos hakutunnus tallennetaan erillään datasarjasta.

IAPP:n tutkimus (2024) havaitsi, että vain 23 % työkaluista tukee todellista palautuvuutta. Useimmat tekevät yksisuuntaisen peittämisen tai täyden korvaamisen. Kun tietue ylikirjoitetaan, se on poissa.

Joissakin hallitustiimeissä työ jaetaan osioittain. Yksi tiimi saa pseudonymisoidut tiedostot. He tekevät analyysin. Toinen tiimi hallitsee hakutunnusta. He tunnistavat tietueet uudelleen vain lain vaatiessa. Tämä jaettu rakenne on ainoa turvallinen lähestymistapa moniosiosille luokitelluille työnkuluille.

Zero-knowledge-malli menee askeleen pidemmälle. Hakutunnus luodaan asiakaslaiteella. Sitä ei koskaan lähetetä ulos. Jos toimittajalle esitetään haaste, he eivät voi luovuttaa tunnusta. Heillä ei koskaan ollut sitä. Tämä täyttää ketjun hallintasäännöt monissa luokitelluissa ympäristöissä.

EDPB:n tunnuksen erottaminen

EDPB:n ohjeet 05/2022 sanovat, että pseudonymisointitunnus on pidettävä erillään. Sen ei saa istua saman osapuolen hallussa, jolla on pseudonymisoidut tietueet. Tai sen on oltava lukittu kontrollien taakse, jotka estävät tuota osapuolta lukemasta sekä tietueita että tunnusta samanaikaisesti.

Kolme asiaa yhdessä täyttävät tämän säännön:

  • Tunnus luodaan asiakaslaiteella — ei koskaan lähetetä ulos
  • Kaikki käsittely tehdään paikallisesti — mikään ei poistu ilmaverkkoon eristetystä sivustosta
  • Tulos ja tunnus viedään erikseen — kaksi erillistä tiedostoa, kaksi erillistä polkua

Tämä rakenne täyttää EDPB:n säännön ja ilmaverkkoisuusrajoitteen samanaikaisesti.

Täydellisen kuvan saamiseksi tietoturvakatsauksemme näyttää, miten paikallinen käsittely katkaisee kolmannen osapuolen ketjun. Yhteensopivuusoppaamme kattaa GDPR:n siirtosäännöt. Katso FAQ:mme asennusavun saamiseksi.

anonym.legal-työpöytäsovellus suorittaa kaiken PII-tunnistuksen paikallisella laitteella. Internet-yhteyttä ei tarvita asennuksen jälkeen. Se tukee Windowsia, macOS:ia ja Linuxia. Pakatut NLP-mallit kattavat 24 kieltä.

Päivitetty 2026

Lähteet

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.