FOIA: DI sutrumpina redakcija nuo savaičių iki valandų
Atnaujinta 2026 m.
JAV federaline vyriausybė 2024 m. išleido apytiksliai 500 mln. USD FOIA apdorojimui. Didžioji dalis tų išlaidų buvo rankinė redakcija. DOJ neatliktu prašymų kiekis viršijo 100 000.
ARPA-H 2025 m. paskelbė viešojo pirkimo konkursą DI redakcijos programinei įrangai. HHS nustatė, kad jos CMS padaliniui reikia DI valdomų įrankių. Rankinis darbas sukūrė neatliktu prašymų kiekius, kurių darbuotojai negalejo sutvarkyti.
Klausimas pasikeitė. Tai nebėra apie tai, ar automatizuoti. Tai apie tai, kaip tai padaryti taip, kad laikytusi teisme.
Federalinio neatliktu prašymų kiekio problema
Pagal 5 U.S.C. 552, agentūros privalo atsakyti per 20 darbo dienų. Praktiškai daugelis užtrunka menesius. Kai kurios - metus.
DOJ 100 000+ prašymų neatliku kiekis lygus maždaug 2 mlrd. minučių rankinio peržiūros. Tai darant prielaidą, kad kiekvienas prašymas užtrunka tik 20 minučių. Pagal vyriausybinius tarifus darbo sąnaudos siekia milijardus.
Didžioji dalis to laiko skiriama vienai užduočiai. Darbuotojai narstyja puslapius ieškodami vardų, adresų ir telefono numerių. Tam nereikia teisinio sprendimo. Reikia šablonų atpažinimo. Algoritmas tai atlieka per sekundes.
Ko reikalavo ARPA-H ir HHS
ARPA-H sieke DI redakcijos programines irangos FOIA dokumentu apdorojimui. Jų nustatyti reikalavimai buvo:
- Automatinis 6 ir 7(C) išimčiu asmeniniu duomenu identifikavimas.
- Didelių dokumentų rinkinių partijinis apdorojimas.
- Misrių formatu palaikymas: PDF, Word ir el. paštas.
- Audito takelio dokumentavimas.
- Gynybingas rezultatas FOIA atsakymui.
HHS/CMS priejo prie tos pačios isvados. Augantys kiekiai ir stabilus darbuotojų skaičius padarė rankine peržiurą netvaria. Šios agentūros nesiekė naujų technologijų. Jos sprende atitikties krizę.
Valstijų ir savivaldybių lygmuo: mažiau išteklių, tos pačios taisyklės
Federalinės agentūros turi specialius FOIA biurus ir teisinius biudžetus. Valstijų ir savivaldybių vyriausybės turi tas pačias teisines pareigas su daug mažesniais ištekliais.
Kalifornijos CPRA reikalauja atsakymo per 10 kalendorinių dienų. Apskrities trijų žmonių teisinė komanda negali peržiureti 2 000 dokumentų per tą langą. Galimybės ribotos:
- Atsisakyti arba vėluoti - tai sukuria teisinę riziką.
- Samdyti laikinus darbuotojus - brangu ir lėta.
- Automatizuoti mechaninę redakcijos fazę.
3 parinktis dabar pasiekiama. Tas pats partijinis apdorojimas, kurį naudoja federalinės agentūros, yra prieinamas apskričių teisinėms tarnyboms. Nereikia ilgų viešojo pirkimo laikotarpių. Kaip viešų irašų taisykles galioja visose jurisdikcijose, žr. mūsų atitikties apžvalga.
ES DSAR: ta pati problema
BDAR 15 straipsnio duomenų subjektų prieigos prašymai (DSAR) sukuria lygiagrečią iššūkį ES organizacijoms. Skirtingai nuo FOIA, DSAR pareigos taikomos visoms organizacijoms, tvarkančioms asmeninius duomenis. Maža SaaS įmonė gali gauti tą patį DSAR kiekį kaip didelis bankas.
Praktinis iššūkis atspindi FOIA. Organizacija turi pateikti visus duomenis, saugomus apie konkretų asmenį. Trečiųjų šalių asmens duomenys turi buti išbraukti iš atsakymo. Terminas yra 30 dienų.
Kiekvienas DSAR, lieciasi el. pašto archyvus, palaikymo bilietus ir uzsakymu irasus, gali reikšti šimtus dokumentų, kuriuos reikia patikrinti. Organizacijoms, tvarkančioms 20-50 DSAR per mėnesį, rankinis peržiūra reikalauja vieno ar daugiau visu etato darbuotojų. Partijų automatizavimas sumažina tai iki dalinės darbo dienos.
Darbalaukinius apdorojimas slaptoms bylos
Kai kurios agentūros negali naudoti žiniatinklio irangos. Duomenys, kurie turi likti agentūros sistemose, reikalauja vietos apdorojimo.
Darbalaukio programa (anonym.plus) sukurta šiam naudojimo atvejui:
- Visas apdorojimas vykdomas agentūros nuosavoje techninėje įrangoje.
- Jokie duomenys nesiunčiami i išorinius serverius.
- Partijų paleidimas apdoroja 1-5 000 failų vienu kartu.
- Palaikomi formatai: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
- Apdoroti failai supakuojami kaip ZIP archyvas.
- CSV ir JSON eksportas su kiekvieno failo metaduomenimis yra įtraukti.
Agentūroms su oro tarpo tinklais arba griežtomis duomenų buvimo taisyklėmis vietos apdorojimas yra vienintelis galimas kelias. Darbalaukio programa naudoja tą patį aptikimo modelį - XLM-RoBERTa su 285+ esybių tipais - kaip žiniatinklio platforma. Ji veikia visiškai neprisijungus.
Darbalaukio programos sąrankai žr. mūsų Darbalaukio programos dokumentacija.
Diegimo pastabos
Audito takleliai. Vyriausybiniai darbo srautai reikalauja irašu, kas buvo išbraukta, kokiu pagrindu ir kieno. Partijų metaduomenys apima pirmuosius du. Išimčių dokumentų nukreipimas per darbuotojų peržiurą apima likusius.
Nuoseklumas. FOIA atsakymas, išbraukiantis vardą viename dokumente, bet paleidžiantis jį kitame, sukuria teisinę riziką. Fiksuota automatizuota konfiguracija pašalina tą nenuoseklumą.
SBU medžiagos. Daugelis vyriausybinių dokumentų yra jautrūs, bet neklasifikuoti. Vietos apdorojimas tvarko SBU failus be tinklo naudojimo. Žiniatinklio apdorojimas su tinkamomis DPA sutartimis apima ne SBU failus.
Rezultato formatas. Redact metodas naudoja juodų juostų keitimą. Tai atitinka standartinės FOIA redakcijos išvaizdą ir tinka teismo gamybai. Žetono metodas - pvz., [REDACTED - Exemption 6] - prideda aiškia išimčiu citata detalesnėms bylose.
Esmė
FOIA yra teisinė pareiga. 20 darbo dienų terminas nėra tikslas. Kai prašymų kiekiai viršija tai, ką darbuotojai gali tvarkyti, nesėkmės seka.
DI galiomos partijų redakcija nepakeicia teisinio sprendimo. Ji pašalina mechaninę fazę - standartinių asmens duomenų radimas ir žymėjimas tūkstančiuose dokumentų. Ta fazė sugeria 70-80% peržiūros laiko. Darbuotojai tada gali sutelkti dėmesį i 10-20% dokumentų, kur kontekstas svarbus.
ARPA-H ir HHS/CMS tai matė. Valstijų ir savivaldybių vyriausybės bei ES organizacijos, susiduriancios su DSAR pareigomis, susiduria su tuo pačiu iššūkiu. Kaip gynybiniai redakcijos darbo srautai yra sustruktūrizuoti, žr. mūsų saugos ir atitikties apžvalga.