FOIA: AI מקצר את הצנזור משבועות לשעות
עודכן ל-2026.
הממשל הפדרלי הוציא כ-500 מיליון דולר על עיבוד FOIA ב-2024. רוב העלות הייתה צנזור ידני. פיגור משרד המשפטים עבר 100,000 בקשות פתוחות.
ARPA-H פרסמה מכרז ב-2025 לתוכנת צנזור AI. HHS מצאה שאגף CMS שלה זקוק לכלים מבוססי AI. עבודה ידנית יצרה פיגורים שהצוות לא יכול היה לנקות.
השאלה השתנתה. כבר לא מדובר בשאלה אם לאוטומט. מדובר בשאלה כיצד לעשות זאת בדרך שתחזיק בבית המשפט.
בעיית הפיגור הפדרלי
לפי 5 U.S.C. §552, סוכנויות חייבות להגיב תוך 20 ימי עסקים. בפועל, רבות לוקחות חודשים. חלקן לוקחות שנים.
פיגור של 100,000+ בקשות במשרד המשפטים שווה לכ-2 מיליארד דקות של בדיקה ידנית. זה מניח רק 20 דקות לבקשה. לפי תעריפי חיוב ממשלתיים, עלות העבודה מגיעה למיליארדים.
רוב הזמן הולך למשימה אחת. צוות סורק דפים לחיפוש שמות, כתובות ומספרי טלפון. זה לא דורש שיקול דעת של עורך דין. זה דורש התאמת דפוסים. אלגוריתם עושה זאת תוך שניות.
מה ביקשו ARPA-H ו-HHS
ARPA-H ביקשה תוכנת צנזור AI לעיבוד מסמכי FOIA. הדרישות המוצהרות שלהם היו:
- זיהוי אוטומטי של נתונים אישיים לפי פטורים 6 ו-7(C).
- עיבוד אצווה של מערכי מסמכים גדולים.
- תמיכה בפורמטים מעורבים: PDF, Word ואימייל.
- תיעוד שרשרת ביקורת.
- פלט שניתן להגנה לתגובת FOIA.
HHS/CMS הגיעה לאותה מסקנה. נפחים גדלים וצוות קבוע הפכו את הבדיקה הידנית לבלתי בת-קיימא. סוכנויות אלה לא רדפו אחרי טכנולוגיה חדשה. הן פתרו משבר ציות.
ממשל מדינתי ומקומי: פחות משאבים, אותם כללים
סוכנויות פדרליות מחזיקות משרדי FOIA ייעודיים ותקציבים משפטיים. ממשלות מדינה ורשויות מקומיות עומדות באותן חובות משפטיות עם הרבה פחות משאבים.
CPRA של קליפורניה דורשת תגובות תוך 10 ימים קלנדריים. מחוז עם צוות משפטי של שלושה אנשים לא יכול לעבור 2,000 מסמכים בחלון זמן זה. האפשרויות מוגבלות:
- סירוב או עיכוב — מה שיוצר סיכון משפטי.
- גיוס צוות זמני — יקר ואיטי.
- אוטומציה של שלב הצנזור המכני.
אפשרות 3 כיום בהישג יד. אותו עיבוד אצווה שסוכנויות פדרליות משתמשות בו זמין למחלקות משפטיות של מחוזות. אין צורך בלוחות זמנים ארוכים של רכש. ראו את סקירת הציות שלנו לאופן שבו כללי תיעוד ציבורי חלים על פני תחומי שיפוט.
DSARs אירופאים: אותה בעיה
בקשות גישה לנושאי נתונים (DSARs) לפי סעיף 15 ל-GDPR יוצרות אתגר מקביל לארגונים אירופאיים. בשונה מ-FOIA, חובות DSAR חלות על כל ארגון שמטפל בנתונים אישיים. חברת SaaS קטנה יכולה לקבל את אותו נפח של DSARs כמו בנק גדול.
האתגר המעשי משקף FOIA. ארגון חייב לייצר את כל הנתונים המוחזקים על אדם ספציפי. נתונים אישיים של צד שלישי חייבים להיות מצונזרים מהתגובה. הגבלה היא 30 יום.
כל DSAR שנוגע בארכיוני אימייל, כרטיסי תמיכה ורשומות הזמנה עלול לאמת מאות מסמכים לבדיקה. לארגונים המטפלים ב-20–50 DSARs בחודש, בדיקה ידנית דורשת עובד מן המניין אחד או יותר. אוטומציה באצווה מצמצמת זאת לעבודה חלקית.
עיבוד שולחני למסמכים רגישים
חלק מהסוכנויות לא יכולות להשתמש בכלים מבוססי רשת. נתונים שחייבים להישאר בתוך מערכות הסוכנות דורשים עיבוד מקומי.
אפליקציית Desktop (anonym.plus) בנויה לשימוש זה:
- כל העיבוד פועל על החומרה של הסוכנות עצמה.
- אין שליחת נתונים לשרתים חיצוניים.
- הפעלות אצווה מטפלות ב-1–5,000 קבצים בכל פעם.
- פורמטים נתמכים: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- קבצים מעובדים ארוזים כארכיב ZIP.
- ייצוא CSV ו-JSON עם מטא-נתונים לכל קובץ כלול.
לסוכנויות עם רשתות מבודדות מאוויר או כללי שהות נתונים קפדניים, עיבוד מקומי הוא המסלול הישים היחיד. אפליקציית Desktop משתמשת באותו מודל זיהוי — XLM-RoBERTa עם 285+ סוגי ישויות — כמו פלטפורמת הרשת. היא פועלת במלואה ללא חיבור לאינטרנט.
ראו את תיעוד אפליקציית Desktop שלנו לפרטי הגדרה.
הערות יישום
שרשרות ביקורת. תהליכי עבודה ממשלתיים דורשים תיעוד של מה צונזר, על איזה בסיס ועל ידי מי. מטא-נתוני אצווה מכסים את שניים הראשונים. ניתוב מסמכי חריגה דרך בדיקת צוות מכסה את השאר.
עקביות. תגובת FOIA שמצנזרת שם במסמך אחד אך מחמיצה אותו במסמך אחר יוצרת חשיפה משפטית. תצורה אוטומטית קבועה מסירה חוסר עקביות זה.
חומרים SBU. מסמכים ממשלתיים רבים הם רגישים אך לא מסווגים. עיבוד מקומי מטפל בקבצי SBU ללא שימוש ברשת. עיבוד מבוסס-רשת עם הסכמי DPA מתאימים מכסה קבצים שאינם SBU.
פורמט פלט. שיטת Redact משתמשת בהחלפת פסים שחורים. זה תואם את המראה של צנזורי FOIA סטנדרטיים ומתאים לייצור בבית משפט. גישת האסימון — כגון [REDACTED - Exemption 6] — מוסיף ציטוט פטור מפורש לרשומות מפורטות יותר.
סיכום
FOIA היא חובה משפטית. המועד של 20 ימי עסקים אינו יעד. כאשר נפח הבקשות עולה על מה שהצוות יכול לטפל בו, כישלונות נגרמים.
צנזור אצווה מבוסס AI אינו מחליף שיקול דעת משפטי. הוא מסיר את השלב המכני — איתור וסימון נתונים אישיים סטנדרטיים אלפי מסמכים. שלב זה צורך 70–80% מזמן הבדיקה. הצוות יכול אז להתמקד ב-10–20% מהמסמכים שבהם ההקשר משנה.
ARPA-H ו-HHS/CMS ראו זאת. ממשלות מדינה ורשויות מקומיות וארגונים אירופאיים העומדים בפני חובות DSAR עומדים בפני אותו אתגר. ראו את סקירת האבטחה והציות שלנו לאופן שבו תהליכי צנזור שניתן להגן עליהם בנויים.