By · Last updated 2026-04-13

ブログに戻るテクニカル

エアギャッププライバシー:クラウドが選択肢でないときに機密文書を匿名化する方法

FedRAMPおよびITAR環境には共通点があります — クラウドは選択肢ではありません。GDPR第4条第5項に基づく可逆的擬似匿名化は、コンプライアンスリスクを軽減します。匿名化ツールのうち、真の可逆性を提供するものはわずか23%です(IAPP 2024)。

April 13, 20269 分で読めます
air-gapped anonymizationSCIF document processingITAR complianceFedRAMP offline toolsoffline PII detection

エアギャップの原則

一部のネットワークにはインターネットがありません。ポリシーによるものではなく、設計によるものです。

SCIF(Sensitive Compartmented Information Facility)はファラデーケージで遮蔽された部屋です。無線信号は入ることも出ることもできません。ITAR(国際武器取引規則)は、管理対象の技術情報を未承認の当事者に送信することを禁じています。クラウドプロバイダーはITAR認可を受けていません。これらの組織にとって「クラウドSaaS」は管理すべきリスクではなく、物理的に不可能なことです。

このような環境では、クラウドツールは機能しません。

アクティブなネットワーク接続を必要とするツールはここでは使用できません。リモートサーバーでライセンスを確認するツールは最初から除外されます。検出のためにファイルをクラウドAPIに送信するツールはSCIF内で動作できません。これらは特殊なケースではなく、防衛チームにとっての日常的な制約です。

ITARのユースケース

防衛企業のデータサイエンティストがITAR規制下で人事記録を処理しています。ファイルを共有する前に、名前とIDを除去する必要があります。彼女のネットワークはエアギャップ環境にあります。

クラウドによる解決策はありません。唯一の方法は、ローカルデバイスで動作するツールです。モデルはローカルに保存されている必要があります。外部への通信なしに匿名化された出力を生成しなければなりません。

Tauri 2.0ベースのデスクトップアプリはまさにそのように動作します。インストール後、文書処理中にネットワーク呼び出しは発生しません。spaCy NERモデルと正規表現パターンはすべてローカルCPU上で実行されます。出力はユーザーがエクスポートするまでデバイスに留まります。

可逆性が重要な理由

機密作業では、可逆的な仮名化が必要になることがよくあります。チームは本名をコードに置き換えます。記録は分析に使用できる状態を保ちます。本人の身元は保護されます。

GDPR第4条(5)は、仮名化をデータ保護措置として正式に定義しています。リスクを低減します。仮名化されたレコードは、検索トークンがデータセットとは別に保管されている場合、法的義務が少なくなります。

IAPP調査(2024年)では、23%のツールのみが真の可逆性をサポートしていることが判明しました。ほとんどは永続的な置換または単純なマスキングを行います。レコードが上書きされると、元に戻すことはできません。

一部の政府チームは、コンパートメントごとに作業を分担しています。一つのチームは仮名化されたファイルを受け取り分析を行います。もう一つのチームはトークンを保持し、法律で必要な場合にのみ記録を再識別します。この分割設計は、多チームの機密ワークフローにおける唯一の安全なアプローチです。

ゼロ知識モデルはさらに一歩進んでいます。検索トークンはクライアントデバイスで作成されます。送信されることはありません。ベンダーが召喚を受けても、トークンを提出することはできません。ベンダーはそれを持っていなかったのです。これは、多くの機密環境でのトークン保管要件を満たします。

EDPBのトークン分離要件

EDPBガイドライン05/2022は、仮名化トークンを別々に保管することを要求しています。仮名化されたレコードを保持する当事者と同じ当事者のもとに置いてはなりません。または、その当事者がレコードとトークンを同時に読み取れないようにする制御のもとに保管しなければなりません。

この規則を満たす三つの特性があります。

  • トークンはクライアントデバイスで作成される — 送信されない
  • すべての処理はローカル — エアギャップ環境から何も出ない
  • 出力とトークンは別々にエクスポート — 2つのファイル、2つの経路

この設計はEDPBのルールとエアギャップの制約を同時に満たします。

全体像については、セキュリティ概要でローカル処理がサードパーティチェーンを排除する方法をご覧ください。コンプライアンスガイドはGDPRの転送規則をカバーしています。導入のヘルプはFAQをご参照ください。

anonym.legalのデスクトップアプリは、すべてのPII検出をローカルデバイスで実行します。インストール後はインターネット不要です。Windows、macOS、Linuxに対応しています。バンドルされたNLPモデルは24言語をカバーしています。

2026年版に更新済み

出典

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.