By · Last updated 2026-05-28

Atpakaļ uz BloguTehniskā

FOIA: Rediģēšana no nedēļām līdz stundām

Federālā valdība 2024. gadā tērēja aptuveni 500 miljonus USD FOIA apstrādei, galvenokārt manuālai rediģēšanai. ARPA-H skaidri meklēja AI rediģēšanas programmatūru.

May 28, 20268 min lasīšanai
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI samazina rediģēšanu no nedēļām līdz stundām

Atjaunots 2026. gadam.

Federālā valdība 2024. gadā tērēja aptuveni 500 miljonus USD FOIA apstrādei. Lielākā daļa šo izmaksu bija manuāla rediģēšana. DOJ nokavēto pieprasījumu skaits pārsniedza 100 000.

ARPA-H 2025. gadā izsludināja iepirkumu AI rediģēšanas programmatūrai. HHS konstatēja, ka tās CMS nodaļai vajadzīgi ar AI darbināmi rīki. Manuālais darbs bija radījis nokavēto darbu apjomu, kuru darbinieki nevarēja likvidēt.

Jautājums ir mainījies. Tas vairs nav par to, vai automatizēt. Tas ir par to, kā to darīt tā, lai tas izturētu tiesas pārbaudi.

Federālā nokavēto darbu problēma

Saskaņā ar 5 U.S.C. §552, aģentūrām jāatbild 20 darba dienu laikā. Praksē daudzas atbild mēnešos. Dažas — gados.

DOJ nokavēto pieprasījumu skaits, kas pārsniedz 100 000, ir aptuveni 2 miljardi manuālās pārskatīšanas minūšu. Tas pieņem tikai 20 minūtes uz pieprasījumu. Par valdības norēķinu likmēm darbaspēka izmaksas sasniedz miljardus.

Lielākā daļa šā laika aiziet vienam uzdevumam. Darbinieki skenē lapas pēc vārdiem, adresēm un tālruņa numuriem. Tam nav vajadzīgs advokāta spriedums. Tam vajadzīga modeļa atpazīšana. Algoritms to dara sekundēs.

Ko prasīja ARPA-H un HHS

ARPA-H meklēja AI rediģēšanas programmatūru FOIA dokumentu apstrādei. Viņu norādītās prasības bija:

  • Automātiska 6. izņēmuma un 7(C) personas datu identifikācija.
  • Lielu dokumentu kopu partiju apstrāde.
  • Jauktu formātu atbalsts: PDF, Word un e-pasts.
  • Revīzijas pierakstu dokumentācija.
  • Aizstāvama izvade FOIA atbildei.

HHS/CMS nonāca pie tā paša secinājuma. Pieaugošie apjomi un nekustoša darbinieku skaits padarīja manuālo pārskatīšanu nenoturamu. Šīs aģentūras nemeklēja jaunas tehnoloģijas. Tās risināja atbilstības krīzi.

Štats un pašvaldības: mazāk resursu, tie paši noteikumi

Federālajām aģentūrām ir speciālas FOIA nodaļas un juridiskie budžeti. Štatu un pašvaldību pārvaldēm ir tādas pašas juridiskās saistības ar daudz mazākiem resursiem.

Kalifornijas CPRA prasa atbildi 10 kalendāro dienu laikā. Novads ar trīs cilvēku juridisko komandu nevar izskatīt 2 000 dokumentu šajā logā. Iespējas ir ierobežotas:

  1. Noraidīt vai kavēt — kas rada juridisku risku.

  2. Algot pagaidu darbiniekus — dārgi un lēni.

  3. Automatizēt mehāniskās rediģēšanas fāzi.

  4. iespēja tagad ir sasniedzama. Tā pati partiju apstrāde, ko izmanto federālās aģentūras, ir pieejama novadu juridiskajām nodaļām. Nav vajadzīgi ilgi iepirkuma termiņi. Skatiet mūsu atbilstības pārskatu, kā publisko dokumentu noteikumi attiecas dažādās jurisdikcijās.

ES DSAR: tā pati problēma

GDPR 15. panta Datu subjekta piekļuves pieprasījumi (DSAR) rada līdzīgu izaicinājumu ES organizācijām. Atšķirībā no FOIA, DSAR saistības attiecas uz visām organizācijām, kas apstrādā personas datus. Mazs SaaS uzņēmums var saņemt tādu pašu DSAR apjomu kā liela banka.

Praktiskais izaicinājums atbilst FOIA. Organizācijai jāsniedz visi dati, kas glabājas par konkrētu personu. Trešo pušu personas dati jāizredaktē no atbildes. Termiņš ir 30 dienas.

Katrs DSAR, kas skar e-pasta arhīvus, atbalsta biļetes un pasūtījumu ierakstus, var nozīmēt simtiem pārbaudāmo dokumentu. Organizācijām, kas apstrādā 20–50 DSAR mēnesī, manuāla pārskatīšana prasa vienu vai vairākus pilnas slodzes darbiniekus. Partiju automatizācija to samazina līdz nepilnas slodzes darbam.

Galddatora apstrāde sensitīviem ierakstiem

Dažas aģentūras nevar izmantot tīmekļa rīkus. Datiem, kuriem jāpaliek aģentūras sistēmās, vajadzīga lokāla apstrāde.

Galddatora lietotne (anonym.plus) ir veidota šim lietošanas gadījumam:

  • Visa apstrāde notiek uz aģentūras pašas aparatūras.
  • Nekādi dati netiek sūtīti uz ārējiem serveriem.
  • Partiju palaišanas apstrādā 1–5 000 failu vienlaikus.
  • Atbalstītie formāti: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Apstrādātie faili tiek iepakoti kā ZIP arhīvs.
  • Iekļauts CSV un JSON eksports ar failu līmeņa metadatiem.

Aģentūrām ar gaisa tukšuma tīkliem vai stingriem datu atrašanās vietas noteikumiem lokāla apstrāde ir vienīgais dzīvotspējīgais ceļš. Galddatora lietotne izmanto to pašu noteikšanas modeli — XLM-RoBERTa ar 285+ entitātu tipiem — kā tīmekļa platforma. Tā darbojas pilnīgi bezsaistē.

Skatiet mūsu Galddatora lietotnes dokumentāciju, lai uzzinātu iestatīšanas detaļas.

Ieviešanas piezīmes

Revīzijas pieraksti. Valdības darba plūsmām vajadzīgi ieraksti par to, kas tika rediģēts, uz kāda pamata un kas to darīja. Partiju metadati aptver pirmos divus. Izņēmuma dokumentu virzīšana caur darbinieku pārskatīšanu aptver pārējo.

Konsekvence. FOIA atbilde, kas rediģē vārdu vienā dokumentā, bet palaiž garām to citā, rada juridisku pakļaušanu. Fiksēta automatizēta konfigurācija novērš šo nekonsekvenci.

SBU materiāli. Daudzi valdības dokumenti ir sensitīvi, bet neklasificēti. Lokāla apstrāde apstrādā SBU failus bez tīkla izmantošanas. Tīmekļa apstrāde ar atbilstošiem DPA nolīgumiem aptver ne-SBU failus.

Izvades formāts. Redact metode izmanto melnas joslas aizstāšanu. Tas atbilst standarta FOIA rediģēšanas izskatam un ir piemērots tiesas produkcijai. Marķieru pieeja — piemēram, [REDACTED - Exemption 6] — pievieno skaidru izņēmuma citātu detalizētākiem ierakstiem.

Galvenais secinājums

FOIA ir juridisks pienākums. 20 darba dienu termiņš nav mērķis. Kad pieprasījumu apjomi pārsniedz to, ko darbinieki var apstrādāt, seko neveiksmes.

Ar AI darbināta partiju rediģēšana neaizstāj juridisko spriedumu. Tā novērš mehānisko fāzi — standarta personas datu atrašanu un atzīmēšanu tūkstošos dokumentu. Šī fāze patērē 70–80% pārskatīšanas laika. Pēc tam darbinieki var koncentrēties uz 10–20% dokumentu, kuros konteksts ir svarīgs.

ARPA-H un HHS/CMS abi to redzēja. Štatu un pašvaldību pārvaldes un ES organizācijas, kas saskaras ar DSAR pienākumiem, saskaras ar tādu pašu izaicinājumu. Skatiet mūsu drošības un atbilstības pārskatu, kā tiek strukturētas aizstāvamas rediģēšanas darba plūsmas.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.