LibreOffice PII匿名化拡張機能
LibreOfficeは世界で約2億人のユーザーを抱えています。この数字はThe Document Foundationによるものです。政府機関、大学、企業がLibreOfficeを利用しています。多くのユーザーが高額なソフトウェアライセンスを避けるために使用しています。しかし最近まで、ドキュメント内の個人識別情報(PII)を検出・削除するための統合ツールは存在しませんでした。
従来の方法は手間がかかりました。テキストをWebアプリにコピーする。匿名化する。貼り付け直す。これにより書式が破壊されます。表、スタイル、レイアウトが崩れます。複雑なWriterドキュメントでは、この方法は機能しません。
anonym.legalの拡張機能がこの問題を解決します。アプリ内で直接動作します。Writer、Calc、Impressで285種類以上のエンティティタイプを検出します。
2分以内でインストール
拡張機能は.oxtファイルとして提供されます。これはすべての拡張機能の標準形式です。
クイックインストール:
- anonym.legal/api/download/libreofficeから
.oxtファイルをダウンロード - ファイルをダブルクリック
- プロンプトを確認
- 再起動
手動インストール:
- アプリケーションを開く
- ツール → 拡張機能マネージャーへ進む
- 追加をクリックし、
.oxtファイルを選択 - 再起動
再起動後、anonym.legalのサイドバーが表示 → サイドバーから表示されます。ログインして開始します。
検出の仕組み
2つのエンジンが連携してPIIを検出します。
| エンジン | 検出対象 | 信頼度 |
|---|---|---|
| 正規表現 | メール、マイナンバー、IBAN、クレジットカード、電話番号 | 1.0 |
| spaCy NLP | 氏名、組織、場所 | 0.85以上 |
検出はanonym.legal APIで実行されます。テキストはドイツの認定サーバーに送信されます。サーバーはISO 27001認証を取得しています。結果は拡張機能に返されます。ドキュメントファイルは送信されません。テキストのみが送信されます。
アプリケーション別の動作:
- Writer: 全文抽出または選択範囲のみ
- Calc: 全シートにわたるタブ区切り値としてセル単位で抽出
- Impress: 全スライドからテキストオブジェクトを抽出
5つの匿名化方法
| 方法 | 例 | 元に戻せる? | GDPR分類 |
|---|---|---|---|
| 置換 | 山田太郎 → PERSON | いいえ | 匿名化(前文第26条) |
| マスク | yamada@example.com → y***@e***.com | いいえ | 匿名化 |
| 墨消し | 090-1234-5678 → [墨消し済み] | いいえ | 匿名化 |
| ハッシュ(SHA-256/512) | マイナンバー → a1b2c3d4... | いいえ | 仮名化(WP29) |
| 暗号化(AES-256-GCM) | 氏名 → ENC:xyz... | はい | 仮名化(第4条(5)) |
1回の処理で複数の方法を組み合わせることができます。氏名は置換し、メールは暗号化するなど。各エンティティタイプに個別のルールを設定できます。
Writerでは書式が維持される
これがコピー&ペースト方式に対する重要な優位点です。拡張機能はテキストを匿名化する際、すべての書式を保持します。
保持される7つのフォントプロパティ:
- フォントファミリー、サイズ、太字、斜体、色、下線、取り消し線
保持される4つの段落プロパティ:
- 配置、最初の行のインデント、左マージン、右マージン
「山田太郎」が太字14ptのTimes New Romanで表示されている場合、「PERSON」も同じスタイルで表示されます。表、ヘッダー、フッターはすべてそのまま保たれます。拡張機能はドキュメントモデル内で動作します。テキストをエクスポートして再インポートしません。
注意: 書式追跡はWriterのみに適用されます。CalcとImpressはテキストレベルの置換のみを実行します。
適用前にプレビュー
プレビューには最大50件の検出エンティティが表示されます。各行には以下が含まれます:
- エンティティタイプ(PERSON、EMAIL_ADDRESS、PHONE_NUMBERなど)
- 元のテキスト
- 提案された置換
- 信頼スコア
各エンティティを個別に承認または拒否できます。ワンクリックですべて選択またはすべて解除できます。適用をクリックするまで何も変わりません。Writerでは、Ctrl+Zで最後の操作を元に戻せます。
プリセットが全デバイスで同期
設定をプリセットとして保存します。エンティティタイプ、方法、しきい値を選択します。すべてのドキュメントで再利用できます。時間を節約できます。
有料プランでは、プリセットがすべてのanonym.legal製品で同期されます。WebアプリでプリセットをBGP設定します。デスクトップアプリとOfficeアドインに5分以内に表示されます。暗号化キーはゼロ知識ラッピングを使用します。パスワードだけが復号できます。
OfficeアドインがWordで同じワークフローを処理する方法については、法律事務所向けWordアドインによる墨消しをご覧ください。
LibreOffice vs. Microsoft Office
両方の拡張機能は同じバックエンドを共有しています。WriterとWordで同じテキストから同じ結果が得られます。エンジンは同一です。
| 機能 | LibreOffice拡張機能 | Officeアドイン |
|---|---|---|
| エンティティタイプ | 285以上 | 285以上 |
| 言語 | 48 | 48 |
| 方法 | 5 | 5 |
| 書式追跡 | Writerのみ | Wordのみ |
| プレビュー | 最大50エンティティ | 最大50エンティティ |
| ZK認証 | あり | あり |
| プリセット同期 | あり(有料プラン) | あり(有料プラン) |
| プラットフォーム | Windows、macOS、Linux | Windows、Mac、Web、iPad |
OSをまたいだPIIコンプライアンスについては、クロスプラットフォームPIIコンプライアンス:Mac、Linux、Windowsをご覧ください。
システム要件
- LibreOffice 3.0以降
- Python 3(ほとんどのインストールに同梱)
- インターネット接続(PII検出APIに必要)
- anonym.legalアカウント(無料プラン:月200トークン)
始め方
- 拡張機能をダウンロード
- ダブルクリックしてインストール、再起動
- 表示 → サイドバー → anonym.legalパネルを開く
- ログイン
- ドキュメントを開き、分析をクリック、結果を確認、適用をクリック
完全なドキュメント:LibreOffice拡張機能ドキュメント
出典
- The Document Foundation — LibreOfficeの世界利用者数は約2億人以上と推定
- anonym.legal PIIデテクションテスト — 精度95.5%、42/44件の独立テスト
- GDPR前文第26条 — 匿名化によりGDPRの適用範囲外となる;第4条(5) — 仮名化の定義