Takaisin BlogiinTekninen

FOIA AI-aikana: Kuinka virastot vähentävät...

Liittovaltion hallitus käytti arviolta 500 miljoonaa dollaria FOIA-prosessointiin vuonna 2024, pääasiassa manuaaliseen sensurointiin.

April 20, 20268 min lukuaika
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA AI-aikana: Kuinka virastot vähentävät sensurointiaikaa viikoista tunteihin

Liittovaltion hallitus käytti arviolta 500 miljoonaa dollaria FOIA-prosessointiin vuonna 2024. Suurin osa siitä oli manuaalista sensurointia. DOJ:n FOIA-viivästys ylitti 100 000 pyyntöä. HHS dokumentoi, että sen CMS-osasto tutki AI-pohjaista sensurointia, koska manuaalinen käsittely aiheutti hyväksymättömiä viivästyksiä. ARPA-H etsi nimenomaan AI-sensurointiohjelmistoa vuonna 2025 "hyödyntääkseen tekoälyä sensuroinnissa ja käyttäen e-löytöä huolellisuuteen."

Tunnustus siitä, että manuaalinen FOIA-sensurointi ei voi laajentua, on nyt institutionaalista. Kysymys on siirtynyt "pitäisikö meidän automatisoida?" kysymyksestä "kuinka toteutamme automaation, joka tuottaa puolustettavaa, oikeudessa hyväksyttävää tulosta?"

Liittovaltion FOIA-viivästysongelma

5 U.S.C. §552 mukaan liittovaltion virastojen on vastattava FOIA-pyyntöihin 20 työpäivän kuluessa. Virastot voivat vedota "epätavallisiin olosuhteisiin" laajentaakseen määräaikaa ilmoittamalla pyytäjälle. Käytännössä monet virastot toimivat vastausajoilla, jotka mitataan kuukausissa tai vuosissa, ei päivissä.

DOJ:n yli 100 000 pyynnön viivästys edustaa noin 2 miljardia minuuttia manuaalista tarkastusaikaa, jos jokainen pyyntö vaatii vain 20 minuuttia tarkastusta. Hallituksen laskutusasteilla se tarkoittaa miljardeja dollareita työvoimakustannuksia — suurin osa siitä standardin PII:n mekaaniseen tunnistamiseen ja sensurointiin.

Viivästystä aiheuttavat pyynnöt eivät ole monimutkaisia oikeudellisia kysymyksiä, jotka vaativat asianajajan harkintaa. Ne ovat asiakirjarikkaita pyyntöjä, joissa 80 % työstä on tuhansien sivujen läpi korostamista nimien, osoitteiden ja puhelinnumeroiden etsimiseksi — työ, jonka algoritmi suorittaa sekunneissa.

Mitä ARPA-H ja HHS tunnistivat

ARPA-H (Advanced Research Projects Agency for Health) julkaisi hankintakutsun, jossa etsittiin AI-sensurointiohjelmistoa, joka on erityisesti suunniteltu FOIA-asiakirjojen käsittelyyn. Vaatimukset:

  • FOIA:n poikkeus 6 ja 7(C) PII:n automaattinen tunnistaminen ja sensurointi
  • Suurten asiakirjasarjojen eräkäsittely
  • Sekamuotojen tuki (PDF, Word, sähköpostimuodot)
  • Tarkastuspolkuasiakirjat
  • Puolustettavaa tulosta, joka on sopiva FOIA-vastaukseen

HHS/CMS dokumentoi samanlaiset vaatimukset operatiivisessa tarkastelussaan, huomauttaen, että kasvavien pyyntömäärien ja staattisen henkilöstön yhdistelmä teki manuaalisesta käsittelystä matemaattisesti kestämätöntä.

Nämä eivät ole virastoja, jotka etsivät huipputeknologiaa tekoälyn vuoksi. Ne ovat virastoja, jotka kohtaavat lainsäädännöllisen vaatimuksen kriisin ja tunnistavat, että ratkaisu vaatii automaatiota.

Osavaltion ja paikallisen hallituksen: Alipalvelun ongelma

Liittovaltion hallituksen FOIA-haaste on suuri mutta resursoitu — virastoilla on omat FOIA-toimistot, budjetti oikeudellista tarkastusta varten ja vakiintuneet työnkulut. Osavaltion ja paikalliset hallitukset kohtaavat samat lainsäädännölliset velvoitteet vain murto-osalla resursseista.

Kalifornian CPRA (California Public Records Act) vaatii vastauksia 10 kalenteripäivän kuluessa. Piirikunnalla, jossa on 3 hengen oikeustiimi, ei ole mahdollisuutta käsitellä 2 000 asiakirjan pyyntöä manuaalisesti tuossa aikarajassa. Valinnat ovat:

  1. Kieltäytyä tai viivyttää (luoden oikeudellista altistumista)
  2. Palkata tilapäistä oikeushenkilöstöä suurille pyynnöille (kallis, hidas perehdyttää)
  3. Automatisoida mekaaninen sensurointivaihe

Vaihtoehto 3 on nyt mahdollinen. Sama eräkäsittelykyky, joka on saatavilla liittovaltion virastoille, on saavutettavissa piirin oikeusosastoille ilman yrityshankintojen aikarajoja.

EU:n jäsenvaltio DSAR: Sama ongelma, eri lainkäyttövalta

GDPR:n 15 artiklan tietosubjektin pääsypyynnöt (DSAR) luovat rinnakkaishaasteen EU:n organisaatioille. Toisin kuin FOIA (hallituskohtainen), DSAR-velvoitteet koskevat kaikkia organisaatioita, jotka käsittelevät henkilötietoja. 10 miljoonan euron vuotuisen liikevaihdon SaaS-yritys voi saada saman määrän DSAR-pyyntöjä kuin suuri yritys, mutta vähemmillä resursseilla vastata.

Käytännön DSAR-haaste heijastaa FOIA:a: tuottaa kaikki tiedot, joita on pidetty tietystä henkilöstä, kolmannen osapuolen PII sensuroituna vastauksesta, 30 päivän kuluessa. Jokainen DSAR, joka liittyy sähköpostiarkistoihin, tukilippuihin ja tilausasiakirjoihin, voi vaatia satojen asiakirjojen tarkastamista kolmannen osapuolen sensurointia varten.

Organisaatioille, jotka saavat 20-50 DSAR-pyyntöä kuukaudessa — tasolla, joka vaatii yhden tai useamman FTE:n omistautumista DSAR-vastaukseen nykyisillä manuaalisen käsittelyn nopeuksilla — eräautomaatio vähentää tämän osa-aikatyöksi.

Työpöytäsovellus: Offline-hallintoprosessointi

Hallintovirastot, jotka käsittelevät luokiteltuja tai arkaluontoisia asiakirjoja, kohtaavat rajoitteen, jota verkkopohjaiset työkalut eivät voi ratkaista: tiedot, joita ei voida siirtää viraston infrastruktuurista.

Työpöytäsovellus (anonym.plus) käsittelee tätä suoraan:

  • Kaikki käsittely tapahtuu paikallisesti viraston laitteistolla
  • Ei tietoja siirretä ulkoisille palvelimille
  • Eräkäsittely 1-5 000 tiedostoa per suoritus
  • Sekamuotojen tuki: PDF, DOCX, XLSX, TXT, CSV, JSON, XML
  • Käsiteltyjen tiedostojen ZIP-pakkaus
  • CSV/JSON-vienti tiedostokohtaisella käsittelymetatiedolla

Virastoille, joilla on ilmatilassa eristetyt verkot tai tiukat tietoresidenssivaatimukset, paikallinen käsittely ei ole valinnainen — se on ainoa mahdollinen lähestymistapa. Työpöytäsovellus tarjoaa saman tunnistus tarkkuuden (XLM-RoBERTa, 285+ entiteettityyppiä) offline-ympäristössä.

Toteutuksen huomioitavat seikat hallintokonteksteissa

Tarkastuspolkuvaatimukset: Hallituksen sensurointityönkulut vaativat dokumentointia siitä, mitä on sensuroitu, millä perusteella, kuka ja milloin. Erätoimintojen käsittelymetatiedot tarjoavat kaksi ensimmäistä elementtiä. Reititys tarkastustyönkulkujen läpi (poikkeustarkastus viraston henkilöstön toimesta) tarjoaa kaksi jälkimmäistä.

Johdonmukaisuus asiakirjasarjojen välillä: FOIA-vastaukset, jotka sensuroivat nimen joissakin asiakirjoissa mutta eivät toisissa, luovat oikeudellista altistumista. Automaattinen käsittely johdonmukaisella kokoonpanolla poistaa johdonmukaisuuden puutteen, jonka eri tarkastajat tuovat eri harkinnalla.

Arkaluontoisten mutta luokittelemattomien (SBU) käsittely: Monet hallituksen asiakirjat ovat SBU eivätkä luokiteltuja. Paikallinen käsittely käsittelee SBU-materiaaleja ilman verkkosiirtoa. Verkkopohjainen käsittely EU:ssa isännöidyillä palvelimilla asianmukaisilla DPA-sopimuksilla käsittelee ei-SBU materiaaleja.

Oikeudessa hyväksyttävä sensurointimuoto: Redact-menetelmä (musta palkki -vaihto) vastaa perinteisten FOIA-sensurointien fyysistä ulkonäköä ja on sopiva oikeudellisesti hyväksyttävään tuotantoon. Vaihtoehto token-menetelmälle ([SENSUROITU - Poikkeus 6]) selkeällä poikkeusviittauksella tarjoaa tarkempaa dokumentointia.

Johtopäätös

FOIA on lainsäädännöllinen vaatimus. 20 työpäivän vastausaika ei ole kunnianhimoinen — noudattamatta jättäminen luo oikeudellista altistumista ja DPA/oikeudellista väliintuloa. Kun pyyntöjen määrä ylittää manuaalisen käsittelyn kapasiteetin, järjestelmälliset epäonnistumiset seuraavat.

AI-pohjainen eräsensurointi ei korvaa viraston oikeudellista harkintaa. Se poistaa mekaanisen vaiheen — standardin PII:n tunnistamisen ja poistamisen kymmenistä tuhansista asiakirjoista — joka kuluttaa 70-80 % tarkastusaikaa. Viraston oikeushenkilöstö keskittyy 10-20 %:iin poikkeusasiakirjoista, joissa konteksti on tärkeä.

ARPA-H tunnisti tämän. HHS/CMS tunnisti tämän. Virastot, jotka kohtaavat suurimmat viivästykset, siirtyvät automaatioon. Osavaltion ja paikallisten hallitusten sekä EU-organisaatioiden, jotka kohtaavat DSAR-velvoitteita, osalta sama ratkaisu pätee.

Lähteet:

Valmiina suojaamaan tietojasi?

Aloita PII-anonymisointi yli 285 entiteettityypillä 48 kielellä.