AI 시대의 FOIA: 기관들이 검토 시간을 주에서 시간으로 단축하는 방법
연방 정부는 2024년에 FOIA 처리에 약 5억 달러를 지출했습니다. 대부분은 수동 검토였습니다. DOJ FOIA 적체는 100,000건을 초과했습니다. HHS는 CMS 부서가 수동 처리로 인해 수용할 수 없는 적체를 초래하고 있어 AI 기반 검토를 탐색했다고 문서화했습니다. ARPA-H는 2025년에 "인공지능을 활용하여 검토를 수행하고 실사에 대한 전자 발견을 활용하기 위해" AI 검토 소프트웨어를 명시적으로 찾았습니다.
수동 FOIA 검토가 확장할 수 없다는 인식은 이제 제도화되었습니다. 질문은 "자동화해야 할까?"에서 "법적, 법원에 수용 가능한 출력을 생성하는 자동화를 어떻게 구현할까?"로 바뀌었습니다.
연방 FOIA 적체 위기
5 U.S.C. §552에 따라, 연방 기관은 FOIA 요청에 대해 20 영업일 이내에 응답해야 합니다. 기관은 요청자에게 통지하고 "비정상적인 상황"을 언급하여 기한을 연장할 수 있습니다. 실제로 많은 기관은 응답 시간이 일수가 아닌 몇 개월에서 몇 년으로 측정됩니다.
100,000건 이상의 DOJ 적체는 각 요청이 단 20분의 검토를 포함한다고 가정할 때 약 20억 분의 수동 검토 시간을 나타냅니다. 정부 청구 요금으로, 이는 수십억 달러의 노동 비용에 해당하며, 대부분은 표준 PII의 기계적 식별 및 검토에 해당합니다.
적체를 유발하는 요청은 변호사의 판단을 요구하는 복잡한 법적 질문이 아닙니다. 이름, 주소 및 전화번호를 찾기 위해 수천 페이지를 하이라이터로 스캔하는 작업에서 80%의 작업이 이루어지는 문서 중심의 요청입니다. 이는 알고리즘이 몇 초 만에 수행하는 작업입니다.
ARPA-H와 HHS가 인식한 것
ARPA-H(고급 연구 프로젝트 건강국)는 FOIA 문서 처리를 처리하기 위해 특별히 설계된 AI 검토 소프트웨어를 찾는 조달 공고를 발표했습니다. 요구 사항은 다음과 같습니다:
- FOIA 면제 6 및 7(C) PII의 자동 식별 및 검토
- 대량 문서 세트의 배치 처리
- 혼합 형식 지원 (PDF, Word, 이메일 형식)
- 감사 추적 문서화
- FOIA 응답에 적합한 법적 출처
HHS/CMS는 운영 검토에서 유사한 요구 사항을 문서화하며, 증가하는 요청량과 정적인 인력이 결합되어 수동 처리가 수학적으로 지속 불가능하다고 언급했습니다.
이들은 최첨단 AI를 추구하는 기관이 아닙니다. 이들은 법적 준수 위기에 직면한 기관이며, 해결책이 자동화를 요구한다는 것을 인식하고 있습니다.
주 및 지방 정부: 소외된 문제
연방 정부의 FOIA 문제는 크지만 자원이 있습니다. 기관들은 전담 FOIA 사무소, 법적 검토 예산 및 확립된 작업 흐름을 가지고 있습니다. 주 및 지방 정부는 동일한 법적 의무를 가지고 있지만 자원은 극히 일부입니다.
캘리포니아의 CPRA(캘리포니아 공공 기록법)는 10일 이내에 응답할 것을 요구합니다. 3명의 법률 팀이 있는 카운티는 수동 검토를 통해 2,000건의 문서 요청을 그 시간 안에 처리할 수 없습니다. 선택지는 다음과 같습니다:
- 거부하거나 지연 (법적 노출 생성)
- 대규모 요청을 위해 임시 법률 직원 고용 (비용이 많이 들고, 온보딩이 느림)
- 기계적 검토 단계 자동화
옵션 3은 이제 실행 가능합니다. 연방 기관에 제공되는 동일한 배치 처리 기능은 기업 조달 일정 없이 카운티 법무 부서에서도 접근할 수 있습니다.
EU 회원국 DSAR: 동일한 문제, 다른 관할권
GDPR 제15조 데이터 주체 접근 요청(DSAR)은 EU 조직에 대해 유사한 도전을 만듭니다. FOIA(정부 특정)와 달리, DSAR 의무는 개인 데이터를 처리하는 모든 조직에 적용됩니다. 연간 수익이 1천만 유로인 SaaS 회사는 대기업과 동일한 양의 DSAR을 받을 수 있으며, 응답할 자원은 적습니다.
실제 DSAR 문제는 FOIA와 유사합니다: 특정 개인에 대한 모든 데이터를 생성하고, 응답에서 제3자 PII를 검토하여 30일 이내에 제출해야 합니다. 이메일 아카이브, 지원 티켓 및 주문 기록을 포함하는 각 DSAR은 제3자 검토를 위해 수백 개의 문서를 검토해야 할 수 있습니다.
매달 20-50개의 DSAR을 받는 조직은 현재 수동 처리 비율에서 DSAR 응답에 전념하는 1명 이상의 FTE가 필요합니다. 배치 자동화는 이를 파트타임 작업으로 줄여줍니다.
데스크탑 애플리케이션: 오프라인 정부 처리
기밀 또는 민감한 기록을 처리하는 정부 기관은 웹 기반 도구가 해결할 수 없는 제약에 직면합니다: 기관 인프라를 떠날 수 없는 데이터입니다.
데스크탑 앱(anonym.plus)은 이를 직접 해결합니다:
- 모든 처리는 기관의 하드웨어에서 로컬로 발생합니다
- 외부 서버로 데이터 전송 없음
- 실행당 1-5,000개의 파일 배치 처리
- 혼합 형식 지원: PDF, DOCX, XLSX, TXT, CSV, JSON, XML
- 처리된 파일의 ZIP 패키징
- 파일별 처리 메타데이터와 함께 CSV/JSON 내보내기
공기 차단 네트워크 또는 엄격한 데이터 거주 요구 사항이 있는 기관의 경우, 로컬 처리는 선택 사항이 아닙니다 — 유일한 실행 가능한 접근 방식입니다. 데스크탑 앱은 오프라인 환경에서 동일한 탐지 정확도(XLM-RoBERTa, 285개 이상의 엔티티 유형)를 제공합니다.
정부 맥락에서의 구현 고려 사항
감사 추적 요구 사항: 정부 검토 작업 흐름은 무엇이 검토되었는지, 어떤 근거로, 누가, 언제 검토했는지에 대한 문서화가 필요합니다. 배치 작업에서의 처리 메타데이터는 처음 두 요소를 제공합니다. 검토 작업 흐름을 통해 라우팅(기관 직원의 예외 검토)은 후자의 두 요소를 제공합니다.
문서 세트 간의 일관성: 일부 문서에서 이름을 검토하고 다른 문서에서는 검토하지 않는 FOIA 응답은 법적 노출을 생성합니다. 일관된 구성을 가진 자동화된 처리는 서로 다른 검토자가 서로 다른 판단을 적용하여 발생하는 불일치를 제거합니다.
민감하지만 비밀이 아닌(SBU) 처리: 많은 정부 문서는 비밀이 아닌 SBU입니다. 로컬 처리는 네트워크 전송 없이 SBU 자료를 처리합니다. 적절한 DPA 계약이 있는 EU 호스팅 서버에서의 웹 기반 처리는 비SBU 자료를 처리합니다.
법원에 수용 가능한 검토 형식: 검토 방법(검은 바 대체)은 전통적인 FOIA 검토의 물리적 외관과 일치하며 법원에 수용 가능한 생산에 적합합니다. 대체 토큰 접근 방식([REDACTED - 면제 6])은 명시적인 면제 인용과 함께 보다 세분화된 문서화를 제공합니다.
결론
FOIA는 법적 요구 사항입니다. 20 영업일 응답 기한은 희망 사항이 아닙니다 — 준수하지 않으면 법적 노출과 DPA/법원 개입이 발생합니다. 요청량이 수동 처리 용량을 초과하면 체계적인 실패가 뒤따릅니다.
AI 기반 배치 검토는 기관의 법적 판단을 대체하지 않습니다. 이는 수동 검토 시간의 70-80%를 소비하는 표준 PII를 식별하고 제거하는 기계적 단계를 제거합니다. 기관의 법률 직원은 맥락이 중요한 10-20%의 예외 문서에 다시 집중할 수 있습니다.
ARPA-H는 이를 인식했습니다. HHS/CMS도 이를 인식했습니다. 가장 큰 적체에 직면한 기관들은 자동화로 나아가고 있습니다. DSAR 의무에 직면한 주 및 지방 정부와 EU 조직에도 동일한 해결책이 적용됩니다.
출처: