By · Last updated 2026-03-03

블로그로 돌아가기기술

에어갭 PII: 방어를 위한 오프라인 우선 방식

기업 보안 정책의 41%는 기밀 문서의 클라우드 처리를 금지합니다. 에어갭 네트워크에서 PII 익명화가 어떻게 작동하는지 알아보세요.

March 3, 20268 분 읽기
offlineair-gapdesktopITARGDPRgovernmentdefenselocal processing

네트워크가 없는 환경

한 데이터 과학자가 방산 기업에서 일합니다. 3,000건의 인사 기록이 있습니다. 이름, 주민등록번호, 보안 등급을 제거해야 합니다. 그 후 CUI 협약에 따라 연구 파트너와 데이터를 공유할 수 있습니다.

그녀의 네트워크에는 인터넷이 없습니다. 설계상 그렇게 되어 있습니다.

찾을 수 있는 모든 웹 기반 도구를 테스트해봅니다. 모두 외부 서버로 데이터를 전송합니다. 모든 클라우드 플랫폼은 계정과 실시간 연결이 필요합니다. "온프레미스" 도구조차 원격 라이선스 서버를 호출하는 경우가 많습니다.

이것이 에어갭 배포 문제입니다. 대부분의 사람들이 예상하는 것보다 훨씬 더 많은 팀이 직면하는 문제입니다.

오프라인 PII 제거가 필요한 대상

방산 기업 및 정부 기관이 가장 많이 직면합니다. DISA의 FedRAMP 프로그램은 데이터가 승인된 네트워크 경계 내에 있어야 합니다. ITAR은 기술 데이터를 미국이 통제하는 시스템으로 제한합니다. JWICS와 SIPRNet 같은 네트워크는 설계상 물리적으로 격리되어 있습니다.

하지만 오프라인 필요성은 기밀 시설을 훨씬 넘어섭니다:

분리된 네트워크를 가진 병원. PACS 이미징 시스템, EHR 플랫폼, 연구 데이터베이스는 정책상 인터넷이 없는 네트워크에 위치하는 경우가 많습니다.

거래소와 청산 기관. 독점적 거래 시스템과 SWIFT 연결 시스템은 엄격한 네트워크 차단을 사용합니다.

산업 제어 시스템. SCADA 네트워크와 중요 인프라는 핵심 보안 조치로 에어갭을 사용합니다. 스턱스넷 이후 강화로 이것이 표준이 되었습니다.

유럽 데이터 규정. 독일의 주 데이터 보호법과 유사한 EU 법률은 민감한 정부 및 의료 기록에 로컬 데이터 처리를 요구합니다. 2025년 5월 TikTok의 5억 3,000만 유로 GDPR 과징금이 있었습니다. 중국으로의 데이터 전송을 이유로 한 것이었습니다. 이 과징금으로 더 많은 팀이 로컬 도구로 이동했습니다. 컴플라이언스 개요에서 적용되는 GDPR 이전 규정을 확인하세요.

클라우드 도구가 에어갭 네트워크에서 실패하는 이유

대부분의 데이터 제거 도구는 SaaS 모델을 따릅니다:

사용자 기기 → HTTPS → 벤더 API → NLP 모델 → 응답 → 사용자 기기

이 설계는 처리 기기에서 인터넷 접근이 필요합니다. 벤더 서버에 대한 신뢰가 필요합니다. 데이터가 외부 네트워크를 통과한다는 의미입니다.

에어갭 네트워크에서는 첫 번째 단계 자체가 물리적으로 불가능합니다. 규제 환경에서는 두 번째부터 네 번째 단계도 각각 컴플라이언스 규정을 위반할 수 있습니다.

자체 호스팅 Presidio가 일반적인 대안입니다. 하지만 Docker 기술과 Python 설정이 필요합니다. 또한 인터넷 접근이 필요한 spaCy 모델 다운로드도 필요합니다. 지속적인 IT 지원도 필요합니다. 대부분의 팀에게는 이 모든 것이 부족합니다.

클라우드의 편리함과 자체 호스팅의 복잡함 사이의 격차가 바로 로컬 데스크톱 도구가 채우는 영역입니다.

로컬 PII 제거 작동 방식

좋은 오프라인 도구는 필요한 모든 것을 포함합니다:

번들 NLP 모델. spaCy 모델(각 40-80 MB)과 명명된 개체 감지를 위한 트랜스포머 모델이 설치 프로그램에 포함됩니다. 실행 시 다운로드가 필요 없습니다.

로컬 감지 파이프라인. 정규식, NLP, ML이 모두 로컬 CPU에서 실행됩니다 — GPU가 있으면 활용합니다. anonym.legal 내부의 Presidio 기반 엔진은 실행 중 네트워크 호출을 하지 않습니다.

암호화된 로컬 볼트. 구성, 프리셋, 키는 로컬에 저장됩니다. 볼트는 AES-256-GCM 암호화와 Argon2id 키 파생을 사용합니다. 클라우드 동기화 없음. 원격 백업 없음. 볼트는 기기에 남습니다.

로컬 파일 I/O. 입력 파일은 로컬 저장소에서 옵니다. 출력 파일은 로컬 저장소로 돌아갑니다. 네트워크 인터페이스를 통해 데이터가 이동하지 않습니다.

작은 공격 표면. 데스크톱 앱은 Tauri 2.0(Rust 기반)을 사용합니다. Tauri는 Electron(Chromium 기반) 도구보다 공격 표면이 훨씬 작습니다. 바이너리는 대략 1/10 크기입니다. 기본적으로 더 적은 OS API를 호출합니다.

세 가지 실제 컴플라이언스 시나리오

ITAR 문서 — 500개 파일

방산 기업이 라이선스 예외 하에 외국 파트너와 기술 문서를 공유해야 합니다. 파일에는 미국인 이름과 인사 데이터가 포함되어 있습니다. 두 가지 모두 먼저 제거해야 합니다.

핵심 요건: 허가된 워크스테이션에서만 처리. 허가된 네트워크 외부로 데이터 전송 금지. 작업이 완료되었음을 보여주는 감사 추적. 500개 이상 파일에 대한 배치 지원.

데스크톱 앱은 500개 이상의 DOCX 파일을 배치 모드로 로컬에서 처리합니다. 실행 중 네트워크 호출이 없습니다. 감사 로그는 로컬 볼트에 남습니다. 출력물은 ITAR 라이선스 예외 요건을 충족합니다.

독일 연방 기관 — 민원 기록

독일 연방 기관이 시민 민원 기록에서 개인 정보를 제거해야 합니다. 그 후 기록을 연구 기관으로 보냅니다. BfDI 지침은 정부 시스템이 아닌 곳에서의 처리를 금지합니다.

데스크톱 앱은 기관의 Windows 11 워크스테이션에서 실행됩니다. 모든 처리가 로컬입니다. IT 보안팀이 트래픽 모니터링으로 이를 확인합니다 — 실행 중 외부 연결 없음.

병원 연구 — EHR 비식별화

병원 연구팀이 임상 시험을 위해 환자 기록에서 정보를 제거해야 합니다. HIPAA Safe Harbor는 18가지 식별자 유형 제거를 요구합니다. 임상 네트워크에는 인터넷 접근이 없습니다.

데스크톱 앱은 CSV와 JSON 형식의 EHR 내보내기를 배치 처리합니다. 개인정보보호책임자가 데이터셋이 연구 파트너에게 전달되기 전에 Safe Harbor 규칙에 대한 출력물을 검토합니다.

오프라인 도구에서 찾아야 할 것

기능중요한 이유
설치 후 완전 오프라인처리 중 인터넷 의존성 없음
번들 NLP 모델다운로드 단계 불필요
배치 처리수동 작업 없이 대용량 처리
로컬 암호화 볼트구성과 키의 안전한 저장
감사 로그컴플라이언스 검토에 필요한 기록
Windows, macOS, Linux 지원허가된 워크스테이션 유형 포함
텔레메트리 없음 옵션텔레메트리를 통한 데이터 유출 방지
파일 형식 지원DOCX, PDF, TXT, CSV, JSON, Excel

데이터 규정이 팀을 로컬 도구로 이끄는 이유

TikTok의 5억 3,000만 유로 과징금이 더 광범위한 과징금 물결을 촉발했습니다. 클라우드 도구를 사용한 EU 팀들이 새로운 질문을 던집니다. 벤더 서버에서의 처리가 GDPR 제5장과 국내 데이터법을 충족합니까?

"귀하의 데이터는 어디로 갑니까?"에 대한 가장 깔끔한 답은 이것입니다: 아무 데도 — 기기를 떠나지 않습니다. 로컬 처리는 GDPR 이전 문제를 완전히 없앱니다.

독일 팀의 경우, DSGVO의 제44-46조에 대한 엄격한 해석은 로컬 처리를 현명한 선택으로 만듭니다. 엄격한 네트워크 제한이 없더라도 마찬가지입니다. 보안 개요에서 로컬 처리가 제3자 데이터 체인을 제거하는 방법을 설명합니다.

실용적인 배포 참고 사항

에어갭 시스템에 설치. 설치 프로그램 — Windows .exe 또는 .msi, macOS .dmg, Linux .AppImage 또는 .deb — 은 USB 또는 보안 파일 전송을 통해 에어갭 네트워크로 전송됩니다. 설치 후 인터넷이 필요 없습니다.

언어 지원. 24개 언어별 모델이 앱과 함께 제공됩니다. 전체 세트를 추가 다운로드 없이 오프라인으로 사용할 수 있습니다.

하드웨어 요건. NLP 파이프라인은 GPU 없이 현대 워크스테이션에서 실행됩니다. 1,000개 문서의 배치 처리는 일반적으로 5-15분이 걸립니다. 속도는 문서 크기와 CPU 속도에 따라 다릅니다.

오프라인 라이선스 설정. 라이선스 서버에 연결할 수 없는 네트워크를 위해 오프라인 라이선스 설정을 사용할 수 있습니다.

에어갭이 적합하지 않은 경우

에어갭 시스템은 특정 문제를 해결합니다. 하지만 실질적인 부담도 추가됩니다.

업데이트 번거로움. 모델과 소프트웨어를 최신 상태로 유지하려면 수동 단계가 필요합니다. 뒤처지는 팀은 새로운 PII 패턴을 놓칠 수 있습니다.

연결 오버헤드. 에어갭 시스템은 클라우드 SIEM 도구나 원격 감사 대시보드에 연결할 수 없습니다. 커스텀 데이터 다이오드 솔루션이 필요합니다. 이는 비용을 높입니다.

정확도 트레이드오프. 클라우드 도구는 지속적으로 훈련 데이터를 업데이트합니다. 오프라인 모델은 스냅샷입니다. 시간이 지남에 따라 새로운 언어 패턴에 뒤처질 수 있습니다.

모든 위협 모델에 필요하지 않음. 정부, 의료, 법적 의무가 없는 팀은 클라우드 도구가 더 실용적일 수 있습니다. 강력한 암호화, SOC 2 Type II 감사, 데이터 처리 계약이 대부분의 경우를 포함합니다. 에어갭은 위협 모델이 진정으로 숙련된 공격자에 의한 네트워크 기반 데이터 도용을 포함할 때만 가치가 있습니다.

대부분의 중소기업과 일반 기업 팀에게는 전송 중 및 저장 중 강력한 암호화로 적절한 보호가 됩니다. 탄탄한 계약 통제를 추가하면 완전한 에어갭의 오버헤드 없이 대부분의 사용 사례를 포함합니다. 올바른 배포 모델 선택에 대한 자세한 내용은 FAQ를 참조하세요.


anonym.legal의 데스크톱 앱(Windows, macOS, Linux)은 번들된 NLP 모델로 PII를 완전히 로컬에서 처리합니다. 설치 후 인터넷 연결이 필요 없습니다. 배치 처리는 요금제 티어에 따라 1-5,000개 파일을 지원합니다.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.