FOIA: AI samazina rediģēšanu no nedēļām līdz stundām
Atjaunots 2026. gadam.
Federālā valdība 2024. gadā tērēja aptuveni 500 miljonus USD FOIA apstrādei. Lielākā daļa šo izmaksu bija manuāla rediģēšana. DOJ nokavēto pieprasījumu skaits pārsniedza 100 000.
ARPA-H 2025. gadā izsludināja iepirkumu AI rediģēšanas programmatūrai. HHS konstatēja, ka tās CMS nodaļai vajadzīgi ar AI darbināmi rīki. Manuālais darbs bija radījis nokavēto darbu apjomu, kuru darbinieki nevarēja likvidēt.
Jautājums ir mainījies. Tas vairs nav par to, vai automatizēt. Tas ir par to, kā to darīt tā, lai tas izturētu tiesas pārbaudi.
Federālā nokavēto darbu problēma
Saskaņā ar 5 U.S.C. §552, aģentūrām jāatbild 20 darba dienu laikā. Praksē daudzas atbild mēnešos. Dažas — gados.
DOJ nokavēto pieprasījumu skaits, kas pārsniedz 100 000, ir aptuveni 2 miljardi manuālās pārskatīšanas minūšu. Tas pieņem tikai 20 minūtes uz pieprasījumu. Par valdības norēķinu likmēm darbaspēka izmaksas sasniedz miljardus.
Lielākā daļa šā laika aiziet vienam uzdevumam. Darbinieki skenē lapas pēc vārdiem, adresēm un tālruņa numuriem. Tam nav vajadzīgs advokāta spriedums. Tam vajadzīga modeļa atpazīšana. Algoritms to dara sekundēs.
Ko prasīja ARPA-H un HHS
ARPA-H meklēja AI rediģēšanas programmatūru FOIA dokumentu apstrādei. Viņu norādītās prasības bija:
- Automātiska 6. izņēmuma un 7(C) personas datu identifikācija.
- Lielu dokumentu kopu partiju apstrāde.
- Jauktu formātu atbalsts: PDF, Word un e-pasts.
- Revīzijas pierakstu dokumentācija.
- Aizstāvama izvade FOIA atbildei.
HHS/CMS nonāca pie tā paša secinājuma. Pieaugošie apjomi un nekustoša darbinieku skaits padarīja manuālo pārskatīšanu nenoturamu. Šīs aģentūras nemeklēja jaunas tehnoloģijas. Tās risināja atbilstības krīzi.
Štats un pašvaldības: mazāk resursu, tie paši noteikumi
Federālajām aģentūrām ir speciālas FOIA nodaļas un juridiskie budžeti. Štatu un pašvaldību pārvaldēm ir tādas pašas juridiskās saistības ar daudz mazākiem resursiem.
Kalifornijas CPRA prasa atbildi 10 kalendāro dienu laikā. Novads ar trīs cilvēku juridisko komandu nevar izskatīt 2 000 dokumentu šajā logā. Iespējas ir ierobežotas:
-
Noraidīt vai kavēt — kas rada juridisku risku.
-
Algot pagaidu darbiniekus — dārgi un lēni.
-
Automatizēt mehāniskās rediģēšanas fāzi.
-
iespēja tagad ir sasniedzama. Tā pati partiju apstrāde, ko izmanto federālās aģentūras, ir pieejama novadu juridiskajām nodaļām. Nav vajadzīgi ilgi iepirkuma termiņi. Skatiet mūsu atbilstības pārskatu, kā publisko dokumentu noteikumi attiecas dažādās jurisdikcijās.
ES DSAR: tā pati problēma
GDPR 15. panta Datu subjekta piekļuves pieprasījumi (DSAR) rada līdzīgu izaicinājumu ES organizācijām. Atšķirībā no FOIA, DSAR saistības attiecas uz visām organizācijām, kas apstrādā personas datus. Mazs SaaS uzņēmums var saņemt tādu pašu DSAR apjomu kā liela banka.
Praktiskais izaicinājums atbilst FOIA. Organizācijai jāsniedz visi dati, kas glabājas par konkrētu personu. Trešo pušu personas dati jāizredaktē no atbildes. Termiņš ir 30 dienas.
Katrs DSAR, kas skar e-pasta arhīvus, atbalsta biļetes un pasūtījumu ierakstus, var nozīmēt simtiem pārbaudāmo dokumentu. Organizācijām, kas apstrādā 20–50 DSAR mēnesī, manuāla pārskatīšana prasa vienu vai vairākus pilnas slodzes darbiniekus. Partiju automatizācija to samazina līdz nepilnas slodzes darbam.
Galddatora apstrāde sensitīviem ierakstiem
Dažas aģentūras nevar izmantot tīmekļa rīkus. Datiem, kuriem jāpaliek aģentūras sistēmās, vajadzīga lokāla apstrāde.
Galddatora lietotne (anonym.plus) ir veidota šim lietošanas gadījumam:
- Visa apstrāde notiek uz aģentūras pašas aparatūras.
- Nekādi dati netiek sūtīti uz ārējiem serveriem.
- Partiju palaišanas apstrādā 1–5 000 failu vienlaikus.
- Atbalstītie formāti: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Apstrādātie faili tiek iepakoti kā ZIP arhīvs.
- Iekļauts CSV un JSON eksports ar failu līmeņa metadatiem.
Aģentūrām ar gaisa tukšuma tīkliem vai stingriem datu atrašanās vietas noteikumiem lokāla apstrāde ir vienīgais dzīvotspējīgais ceļš. Galddatora lietotne izmanto to pašu noteikšanas modeli — XLM-RoBERTa ar 285+ entitātu tipiem — kā tīmekļa platforma. Tā darbojas pilnīgi bezsaistē.
Skatiet mūsu Galddatora lietotnes dokumentāciju, lai uzzinātu iestatīšanas detaļas.
Ieviešanas piezīmes
Revīzijas pieraksti. Valdības darba plūsmām vajadzīgi ieraksti par to, kas tika rediģēts, uz kāda pamata un kas to darīja. Partiju metadati aptver pirmos divus. Izņēmuma dokumentu virzīšana caur darbinieku pārskatīšanu aptver pārējo.
Konsekvence. FOIA atbilde, kas rediģē vārdu vienā dokumentā, bet palaiž garām to citā, rada juridisku pakļaušanu. Fiksēta automatizēta konfigurācija novērš šo nekonsekvenci.
SBU materiāli. Daudzi valdības dokumenti ir sensitīvi, bet neklasificēti. Lokāla apstrāde apstrādā SBU failus bez tīkla izmantošanas. Tīmekļa apstrāde ar atbilstošiem DPA nolīgumiem aptver ne-SBU failus.
Izvades formāts. Redact metode izmanto melnas joslas aizstāšanu. Tas atbilst standarta FOIA rediģēšanas izskatam un ir piemērots tiesas produkcijai. Marķieru pieeja — piemēram, [REDACTED - Exemption 6] — pievieno skaidru izņēmuma citātu detalizētākiem ierakstiem.
Galvenais secinājums
FOIA ir juridisks pienākums. 20 darba dienu termiņš nav mērķis. Kad pieprasījumu apjomi pārsniedz to, ko darbinieki var apstrādāt, seko neveiksmes.
Ar AI darbināta partiju rediģēšana neaizstāj juridisko spriedumu. Tā novērš mehānisko fāzi — standarta personas datu atrašanu un atzīmēšanu tūkstošos dokumentu. Šī fāze patērē 70–80% pārskatīšanas laika. Pēc tam darbinieki var koncentrēties uz 10–20% dokumentu, kuros konteksts ir svarīgs.
ARPA-H un HHS/CMS abi to redzēja. Štatu un pašvaldību pārvaldes un ES organizācijas, kas saskaras ar DSAR pienākumiem, saskaras ar tādu pašu izaicinājumu. Skatiet mūsu drošības un atbilstības pārskatu, kā tiek strukturētas aizstāvamas rediģēšanas darba plūsmas.