FOIA: A MI hetekről órákra csökkenti a redakcióhoz szükséges időt
2026-ra frissítve.
A szövetségi kormány becslések szerint 500 millió dollárt költött FOIA-feldolgozásra 2024-ben. Ennek nagy részét a kézi redakció tette ki. A DOJ várólistája meghaladta a 100 000 nyitott kérelmet.
Az ARPA-H 2025-ben közbeszerzést indított MI-alapú redakciós szoftverért. A HHS megállapította, hogy CMS divíziójának MI-alapú eszközökre van szüksége. A kézi munka akkora elmaradást halmozott fel, amelyet a munkatársak nem tudtak ledolgozni.
A kérdés megváltozott. Már nem az, hogy automatizáljunk-e. Az a kérdés, hogyan tegyük ezt úgy, hogy bíróság előtt is megállja a helyét.
A szövetségi elmaradás problémája
Az 5 U.S.C. §552 alapján az ügynökségeknek 20 munkanapot van arra, hogy válaszoljanak. A gyakorlatban sokan hónapokat, egyesek éveket vesznek igénybe.
A DOJ 100 000+ kérelmes várólistája körülbelül 2 milliárd perc kézi felülvizsgálatnak felel meg. Ez kérelmenként mindössze 20 percet feltételez. Kormányzati díjszabásnál a munkaerőköltség milliárdos nagyságrendű.
Ennek az időnek a nagy részét egyetlen feladat emészti fel. A munkatársak laponként keresik a neveket, lakcímeket és telefonszámokat. Ehhez nem kell jogászi ítélőképesség. Mintafelismerés kell. Egy algoritmus másodpercek alatt elvégzi.
Mit követelt az ARPA-H és a HHS?
Az ARPA-H MI-alapú redakciós szoftvert keresett FOIA-dokumentumok feldolgozásához. A meghatározott követelmények a következők voltak:
- A 6. és 7(C) kivétel alá eső személyes adatok automatikus azonosítása.
- Nagy dokumentumkészletek kötegelt feldolgozása.
- Vegyes formátumok támogatása: PDF, Word és e-mail.
- Auditnapló-dokumentáció.
- Védhető kimenet a FOIA-válaszhoz.
A HHS/CMS ugyanerre a következtetésre jutott. A növekvő mennyiségek és a stagnáló létszám fenntarthatatlanná tette a kézi felülvizsgálatot. Ezek az ügynökségek nem az új technológiát hajszolták. Egy megfelelőségi válságot oldottak meg.
Állami és helyi szint: kevesebb erőforrás, ugyanolyan szabályok
A szövetségi ügynökségek dedikált FOIA-irodákkal és jogi keretekkel rendelkeznek. Az állami és helyi önkormányzatok ugyanolyan jogi kötelezettségekkel szembesülnek, jóval kevesebb erőforrással.
Kalifornia CPRA-ja 10 naptári napon belüli választ ír elő. Egy háromfős jogi csapattal rendelkező megye nem tud 2000 dokumentumot ennyi idő alatt feldolgozni. A lehetőségek korlátozottak:
- Megtagadás vagy késlekedés — ami jogi kockázatot jelent.
- Ideiglenes munkatársak felvétele — drága és lassú.
- A mechanikus redakciós fázis automatizálása.
A 3. lehetőség ma már elérhető. Ugyanaz a kötegelt feldolgozás, amelyet a szövetségi ügynökségek használnak, a megyei jogi osztályok számára is rendelkezésre áll. Nincs szükség hosszas közbeszerzési folyamatokra. Tekintse meg a megfelelőségi áttekintőnket, amelyben részletezzük, hogyan vonatkoznak a közérdekű nyilvántartásokra vonatkozó szabályok az egyes joghatóságokra.
EU DSARok: ugyanaz a probléma
A GDPR 15. cikk szerinti érintetti hozzáférési kérelmek (DSAR) párhuzamos kihívást jelentenek az EU-s szervezeteknek. A FOIA-val ellentétben a DSAR-kötelezettségek minden olyan szervezetre vonatkoznak, amely személyes adatokat kezel. Egy kis SaaS-vállalat ugyanolyan mennyiségű DSAR-t kaphat, mint egy nagy bank.
A gyakorlati kihívás tükrözi a FOIA-t. Egy szervezetnek minden, egy adott személyről tárolt adatot elő kell állítania. A harmadik felek személyes adatait ki kell redakálni a válaszból. A határidő 30 nap.
Egy e-mail-archívumokat, támogatói jegyeket és rendelési rekordokat is érintő DSAR több száz dokumentum ellenőrzését jelentheti. Havonta 20–50 DSAR-t kezelő szervezeteknél a kézi felülvizsgálat egy vagy több teljes munkaidős munkatársat igényel. A kötegelt automatizálás ezt részmunkaidős feladattá csökkenti.
Asztali feldolgozás érzékeny nyilvántartásokhoz
Egyes ügynökségek nem használhatnak webalapú eszközöket. Az ügynökségi rendszereken belül maradó adatokhoz helyi feldolgozásra van szükség.
Az asztali alkalmazás (anonym.plus) erre a felhasználási esetre készült:
- Minden feldolgozás az ügynökség saját hardverén fut.
- Semmilyen adat nem kerül külső szerverekre.
- Kötegelt futtatás egyszerre 1–5000 fájlon.
- Támogatott formátumok: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- A feldolgozott fájlok ZIP-archívumba kerülnek.
- CSV és JSON export fájlonkénti metaadatokkal egyaránt elérhető.
Légréses hálózatokkal vagy szigorú adatelhelyezési szabályokkal rendelkező ügynökségek számára a helyi feldolgozás az egyetlen járható út. Az asztali alkalmazás ugyanazt az észlelési modellt — XLM-RoBERTa 285+ entitástípussal — használja, mint a webes platform. Teljesen offline működik.
A beállítási részletekért tekintse meg az asztali alkalmazás dokumentációját.
Megvalósítási megjegyzések
Auditnaplók. A kormányzati munkafolyamatok megkövetelik, hogy rögzítsék, mit redakáltak, milyen alapon és ki által. A kötegelt metaadatok az első kettőt lefedik. A kivételes dokumentumok munkatársakon keresztüli irányítása a többit lefedi.
Következetesség. Egy FOIA-válasz, amely az egyikben redakálja a nevet, de a másikban nem, jogi kitettséget teremt. Egy rögzített automatizált konfiguráció megszünteti ezt a következetlenséget.
Érzékeny, de nem minősített anyagok. Sok kormányzati dokumentum érzékeny, de nem minősített. A helyi feldolgozás hálózati használat nélkül kezeli ezeket. A webalapú feldolgozás megfelelő adatfeldolgozási megállapodásokkal lefedi a nem érzékeny fájlokat.
Kimeneti formátum. A Redact módszer fekete sávos helyettesítést alkalmaz. Ez megfelel a szabványos FOIA-redakciók megjelenésének, és alkalmas bírósági előterjesztéshez. A token-megközelítés — pl. [REDACTED - Exemption 6] — explicit kivételhivatkozást ad a részletesebb nyilvántartásokhoz.
Összefoglalás
A FOIA jogi kötelezettség. A 20 munkanapja határidő nem cél. Amikor a kérelmek mennyisége meghaladja a munkatársak kapacitását, a mulasztások következnek.
Az MI-alapú kötegelt redakció nem helyettesíti a jogi ítélőképességet. Eltávolítja a mechanikus fázist — a személyes adatok megtalálását és jelölését ezernyi dokumentumban. Ez a fázis az áttekintési idő 70–80%-át veszi igénybe. A munkatársak ekkor azokra a 10–20%-nyi dokumentumra összpontosíthatnak, ahol a kontextus számít.
Az ARPA-H és a HHS/CMS is belátta ezt. Az állami és helyi önkormányzatok, valamint a DSAR-kötelezettségekkel szembesülő EU-s szervezetek ugyanolyan kihívással néznek szembe. Tekintse meg a biztonsági és megfelelőségi áttekintőnket, amelyben részletezzük a védhető redakciós munkafolyamatok felépítését.