By · Last updated 2026-06-03

블로그로 돌아가기법률 기술

법률 PII: 변호사-의뢰인 비밀 특권 탐지

사건 참조 번호, 변호사 등록 번호, 법원 사건 번호, 의뢰인 사건 ID는 표준 PII 도구가 놓치는 법적으로 민감한 식별자입니다.

June 3, 20267 분 읽기
attorney-client privilegelegal document reviewcase numberslaw firm privacylegal tech

AI 시대의 변호사-의뢰인 비밀 특권: 익명화 도구가 반드시 탐지해야 할 법률 PII

표준 PII 도구는 이름, 이메일, 주민등록번호를 잡아냅니다. 사건 참조 ID, 변호사 등록 번호, 의뢰인 사건 태그는 놓칩니다. 이것들은 심각한 특권 침해 위험을 가집니다. 일반 도구는 이 공백을 그대로 남겨둡니다.

로펌은 매일 파일을 AI 도구에 전송합니다. 그 파일에는 표준 도구가 감지하지 못하는 특권 민감 마커가 담겨 있습니다.

로펌이 AI 어시스턴트를 통해 파일을 처리할 때, 그 파일에는 표준 PII와 함께 다음 법률 ID가 포함됩니다:

  • 의뢰인 사건 태그: 전체 사건 파일과 연결되며 의뢰인을 특정합니다
  • 사건 참조 ID: 법원이 부여한 코드로 세부 사항이 담긴 공개 기록과 연결됩니다
  • 변호사 등록 번호: 각 주 공개 디렉터리에서 검색 가능한 변호사 ID
  • 법원 사건 번호: 전체 소송 이력이 있는 공개 신청 시스템과 연결됩니다
  • 재판부 배정 코드: 민감한 상황에서 담당 판사를 식별합니다

이 중 하나라도 외부 AI 벤더에 전송되면 잠재적 특권 문제가 발생합니다.

이 ID에 커스텀 탐지가 필요한 이유

법원 사건 번호 형식은 법원 단위로 다릅니다. 하나의 형식으로 모든 연방 및 주 법원을 커버할 수 없습니다.

연방 민사 사건은 두 자리 연도, 'cv', 사건 번호 순서를 사용합니다. 형사 사건은 같은 자리에 'cr'을 씁니다. 주 법원은 공통 표준 없이 지역마다 다릅니다.

변호사 등록 번호는 주마다 다릅니다. 캘리포니아는 숫자 형식을 씁니다. 뉴욕은 등록부 형식을 씁니다. 텍사스는 자체 변호사 ID 형식을 씁니다. 전국 공통 형식은 없습니다.

의뢰인 사건 태그는 사무소 고유 형식입니다. 각 사무소가 자체 형식을 만듭니다. 연도-의뢰인-사건. 업무 그룹 코드. 일련 ID.

표준 PII 도구는 커스텀 설정 없이는 이 중 어느 것도 알 수 없습니다.

공백은 실재합니다. 문서 도구가 전체 사건 맥락을 수신합니다. 사건 번호는 공개 기록과 연결됩니다. 의뢰인 태그가 존재합니다. 도구는 PII가 제거되었다고 보고합니다. 이름과 이메일은 제거되었습니다. 특권 민감 ID는 그렇지 않습니다.

법률 AI 스타트업 사례

법률 AI 스타트업이 로펌을 위한 문서 도구를 만듭니다. 증거 개시 파일을 검색하고, 관련 조항을 찾고, 잠재적으로 특권이 있는 내용을 표시합니다. 엔터프라이즈 고객은 처리 전에 표준 PII와 함께 의뢰인 사건 태그의 마스킹을 요구합니다.

컴플라이언스 장벽: AI 도구가 의뢰인 사건 태그가 포함된 파일 데이터를 처리합니다. 공개 법원 서류와 결합하면 해당 태그로 사건을 특정할 수 있습니다. 엔터프라이즈 법무 운영팀은 이를 수용 불가로 표시합니다.

커스텀 엔티티 탐지 전:

  • 딜 검토에서 컴플라이언스 공백 발견
  • 커스텀 NLP 모델을 위해 엔지니어링 대기열 3개월+
  • 엔터프라이즈 계약 보류

커스텀 엔티티 API 도입 후:

  • 컴플라이언스 담당자가 온보딩 시 사건 태그 형식 정의
  • 샘플 파일로 형식 테스트: 2일
  • 파이프라인에 커스텀 엔티티 추가: 1일
  • 엔터프라이즈 계약 진행

차이는 3일 대 3개월 이상입니다. 작업은 형식 설정과 API 통합입니다. NLP 모델 학습이 필요하지 않습니다.

카테고리별 일반 형식

연방 법원 사건 번호:

연방 민사 사건 형식: 두 자리 연도 + 'cv' + 46자리 사건 번호. 예: 24-cv-12345. 형사 사건은 같은 위치에 'cr'을 씁니다. 파산 사건은 'bk'를 씁니다. 항소 사건은 두 자리 연도와 회로별로 다른 45자리 숫자를 사용합니다.

주 법원 형식 (예시):

캘리포니아 고등법원은 6자리 접두사 시스템을 사용합니다. 뉴욕은 연도와 일련번호가 있는 색인 형식을 씁니다. 텍사스는 연도, 일련번호, 법원 코드가 있는 사건 형식을 사용합니다.

의뢰인 사건 태그 (일반 사무소 형식):

대부분의 사무소에서 세 가지 공통 형식이 나타납니다:

  • 두 자리 연도, 의뢰인 ID, 사건 일련번호 (예: 24-ACME-001)
  • 업무 그룹 이니셜, 연도, 4자리 일련번호 (예: LIT240042)
  • 의뢰인 접두사와 6자리 ID (예: SMITHCO-000123)

미국 변호사 등록 ID:

대부분의 주에서 4~8자리 숫자를 사용하며, 주 수준 접두사가 붙기도 합니다. USDC 입회 ID는 법원 구역마다 다르며 공통 형식이 없습니다.

특권 인식 처리 파이프라인

문서 검토 AI의 경우 계층화된 파이프라인이 전체 범위를 처리합니다.

계층 1 — 표준 PII 탐지

이름, 이메일, 전화번호, 주소, 주민등록번호. 높은 정확도. 잘 확립된 도구가 이 계층을 잘 처리합니다.

계층 2 — 커스텀 코드 탐지

사건 코드, 사건 번호 ID, 변호사 ID. 온보딩 시 설정하는 사무소 고유 형식. 이 계층이 표준 도구가 놓치는 공백을 메웁니다.

계층 3 — 특권 검토 (인간)

자동 탐지 후 변호사가 표시된 마커를 검토합니다. ATTORNEY-CLIENT 헤더. WORK PRODUCT 라벨. CONFIDENTIAL 마킹. 이 계층에서의 인간 검토는 선택 사항이 아닙니다.

계층 4 — 맥락 예외 검토

특권 위험이 없는 공개 기록 사건 번호 vs. 위험이 있는 의뢰인 사건 태그. 변호사의 판단이 필요합니다. 자동화할 수 없습니다.

계층 1과 2는 대량 업무를 처리합니다. 계층 3과 4는 특권 결정이 변호사 판단에 속하도록 유지합니다. AI 도구 사용으로 특권이 이미 포기된 경우는 변호사-의뢰인 특권과 AI를 참조하세요.

개발자를 위한 설정

온보딩 설정

엔터프라이즈 온보딩 시 의뢰인 사건 태그 형식을 수집하세요. 사무소마다 형식이 다릅니다. 사무소별 커스텀 엔티티로 저장하세요. 해당 계정의 모든 처리에 적용하세요.

기본 프리셋

사전 제작된 프리셋이 커스텀 작업 없이 일반적인 맥락을 커버합니다:

  • "연방 법원 문서" — 민사, 형사, 파산 연방 사건 번호 형식
  • "주 법원 문서 (CA/NY/TX)" — 세 주요 관할권의 주별 형식
  • "내부 운영" — 사건 태그와 표준 PII
  • "외부 법무법인 포털" — 청구서 참조, 사건 태그, 표준 PII

감사 문서화

처리 기록에 각 탐지 실행에 커스텀 코드가 포함되었음을 표시해야 합니다. 이는 분석 방법에 대한 업무 산출물 보호를 지원합니다.

소송에서 마스킹 비용이 어떻게 확장되는지는 e-discovery PII 자동화와 법적 검토 비용 절감을 참조하세요.

결론

특권 민감 ID는 표준 PII만큼, 종종 그 이상으로 위험합니다. 사건 번호와 사건 태그를 놓치는 도구는 문서 워크플로에 실질적인 공백을 남깁니다.

해결책은 NLP 모델이 아닙니다. 형식 설정입니다. 로펌용 도구를 만드는 개발자에게 이는 3일 수정과 3개월 프로젝트의 차이입니다. 로펌에게는 방어 가능한 AI 지원 검토와 특권 포기 위험의 차이입니다.

출처

데이터 보호를 시작할 준비가 되셨나요?

48개 언어로 285개 이상의 엔티티 유형으로 PII 익명화를 시작하세요.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.