By · Last updated 2026-06-05

ブログに戻るテクニカル

GDPR準拠JSONログ匿名化: DevOps

DevOps環境におけるログ処理でのPIIの自動検出と匿名化。ログ集約とGDPR準拠の両立。

June 5, 20267 分で読めます
JSON logsGDPR complianceDevOps privacylog anonymizationdata minimization

アプリケーションログにPIIが隠れている

アプリのログは、エンジニアリングにおいて最も見落とされがちなGDPRの対象領域のひとつです。エンジニアが法律を無視しているわけではありません。ユーザーの個人情報が気づかないうちにログファイルに入り込んでいるのです。

単一のJSONリクエストログには、4つのPIIフィールドが含まれることがあります:

{
  "timestamp": "2025-11-14T09:22:13Z",
  "level": "ERROR",
  "endpoint": "/api/users/profile",
  "user_email": "sarah.johnson@company.com",
  "client_ip": "82.123.45.67",
  "user_agent": "Mozilla/5.0",
  "error": "ValidationError: phone format",
  "input_value": "+49 176 1234 5678"
}

このたった1つのエントリには、メールアドレス、IPアドレス、電話番号が含まれています。これを1日数百万回のAPIコールに掛け算してください。その結果は、大規模なPII処理活動です。法的根拠、保持期間の制限、そして技術的な管理が必要です。

第三者へのログ共有がGDPRリスクを生む

チームは常にログファイルを外部と共有しています:

  • ペネトレーションテスト会社 — アプリの動作を把握するために本番ログを受け取る
  • 外部コンサルタント — パフォーマンス問題の診断にログサンプルを使用する
  • ログプラットフォーム (Elastic、Datadog、Splunk) — 完全な出力ストリームを受信する
  • SREコントラクター — インシデント対応中にログにアクセスする
  • 他の法人のエンジニアチーム — デバッグのためにファイルを受け取る

各共有はGDPR第28条の問題を引き起こします。受信者はデータ処理者ですか?データ処理契約は存在しますか?そのファイル内のユーザーデータを見る法的根拠がありますか?

ログプラットフォームはよくある抜け穴です。本物のユーザーメールアドレスやIPを含む出力をElastic CloudやDatadogに送ると、処理上の関係が生まれます。そのリンクには、DPA、標準条項、そしてプラットフォームがEU域外にある場合は転送メカニズムが必要です。これらすべてに時間と法的審査が必要です。

よりシンプルな方法: ファイルがシステムを離れる前にユーザーデータを取り除くことです。第28条の完全なフレームワークについては、コンプライアンス概要をご覧ください。

JSON構造が検出を難しくする理由

JSONログファイルは構造が異なります。汎用テキストスキャンでは不十分です。

ネスト深度: ユーザーデータはどの深さにも現れます。request.headers.x-forwarded-forフィールドにはIPアドレスが含まれます。response.body.errors[0].field_valueフィールドには、エラーからのユーザー入力が含まれる場合があります。フラットテキストスキャンは、ネストされたパスに埋もれたフィールドを見逃します。

一貫性のないスキーマ: 各APIエンドポイントは独自の出力形式を生成します。認証ファイルは支払いファイルとは異なります。プロファイル更新ファイルはその両方とも異なります。固定パスアプローチは、エラーコンテキスト内の予期しないパスに現れるユーザーデータを見逃します。

PIIと混在する技術的な値: スタックトレース、エラーコード、タイムスタンプはそのまま残す必要があります。一括削除は必要なフィールドを消去し、ファイルを使い物にならなくします。

正しいアプローチはコンテンツベースの検出です。ユーザーデータを「何であるか」で見つけます — メールパターン、IP形式、名前付きエンティティ — 「どこにあるか」ではありません。これにより、エンドポイントごとの設定なしに可変スキーマを処理できます。

一貫した置換でログの有用性を保つ

重要な要件は参照整合性です。sarah.johnson@company.comがリクエストチェーン全体の47エントリに現れる場合、47つすべてが同じ値にマッピングされる必要があります。

マッピングルール:

  • sarah.johnson@company.comuser1@example.com (ファイル全体で同じ値)
  • 82.123.45.67192.0.2.1 (RFC 5737ドキュメントIP — 明らかに実在しない)
  • +49 176 1234 5678+49 XXX XXX XXXX (マスキング)

このマッピングにより、開発者は47のエントリを通じてuser1@example.comを追跡し、リクエストチェーンを再構築し、バグを修正できます — 本物のユーザーデータを見ることなく。

以下のメタデータフィールドは変更されません:

  • タイムスタンプ (ユーザーデータではない)
  • エラーコードとタイプ (ユーザーデータではない)
  • スタックトレース (技術的IDを含む場合があるが、ユーザーデータではない)
  • HTTPメソッド、パス、ステータスコード (ユーザーデータではない)
  • メトリック値とレイテンシ値 (ユーザーデータではない)

結果は、デバッグ作業に使えるファイルです。本物のユーザーデータは含まれません。GDPRにおける匿名化と仮名化の違いについては、用語集をご覧ください。

ユースケース: ペネトレーションテスト用のログ共有

あるSaaS企業が、外部のペネトレーションテストチームと四半期ごとのセキュリティレビューを実施しました。スコープには、認証フローのマッピングとエラーパターンの分析のために90日分の本番APIの出力が必要でした。

生データ量: 180MBのJSONファイル。PIIの数: ユニークなユーザーメール4,200件、ユニークなIP 1,800件、エラーコンテキスト内の部分的なアカウント番号340件。

ユーザーデータを最初に削除せずにそれらのファイルを共有するには以下が必要でした:

  • ペネトレーションテスト会社とのDPA
  • GDPR第46条の転送メカニズム (会社がEU域外に所在)
  • データ主体への通知レビュー

これらすべてに法的作業と時間が必要です。

PIIの削除を適用した場合:

  • 処理時間: 180MBで25分
  • 出力: すべてのメールとIPが安全な値に置き換えられた、構造的に同一の180MBのファイル
  • 結果: ペネトレーションテストチームは完全なコンテキストを受け取った。本物のユーザーデータは渡らなかった
  • GDPRの結果: DPA不要 — 削除済み出力はGDPR上のユーザーデータではない

GDPRにおいて何が匿名とみなされるかの一般的な質問については、FAQをご覧ください。

CI/CDへのPII削除の統合

出力を定期的に共有するチームにとって、このステップは既存のパイプラインに組み込むことができます。

ログローテーション:

  1. ローテーションスクリプトが毎晩実行される
  2. アーカイブ化またはログプラットフォームへの送信前に削除ステップが実行される
  3. 削除済みファイルが外部システムへ送られる
  4. 元のファイルは完全な保持期間で社内に保管される

共有前スクリプト:

  1. エンジニアがコントラクターとサンプルを共有する必要がある
  2. スクリプトを実行: input=raw-logs/ output=clean-logs/
  3. clean-logs/フォルダを共有する
  4. 手動のPIIレビューは不要

サイドカーアプローチ:

  1. サイドカーが転送前に出力ストリームを削除する
  2. リアルタイム削除によりログ分析の有用性が維持される
  3. プラットフォームは本物のユーザーデータを受け取らない

保持ポリシーへの統合

GDPR第5条(1)(e)はストレージの制限を要求しています。PIIの削除はどの保持ポリシーにも適合します。

  • 生の出力を7日間保持 (日常のデバッグ作業用)
  • 削除済みバージョンを90日間保持 (トレンド分析とインシデントレビュー用)
  • 削除ステップが7日目に実行される

これによりストレージの制限が満たされます。生の出力を長期間保持するリスクが排除されます。

情報源

データを保護する準備はできましたか?

48言語で285以上のエンティティタイプを使用してPIIを匿名化し始めましょう。

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.