By · Last updated 2026-05-28

Atgal į BlogąTechninė

FOIA: Redakcija nuo savaičių iki valandų

JAV federaline vyriausybe 2024 m. išleido apytiksliai 500 mln. USD FOIA apdorojimui, daugiausia rankinei redakcijai. ARPA-H tiesiogiai sieke DI redakcijos programines irangos.

May 28, 20268 min skaityti
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: DI sutrumpina redakcija nuo savaičių iki valandų

Atnaujinta 2026 m.

JAV federaline vyriausybė 2024 m. išleido apytiksliai 500 mln. USD FOIA apdorojimui. Didžioji dalis tų išlaidų buvo rankinė redakcija. DOJ neatliktu prašymų kiekis viršijo 100 000.

ARPA-H 2025 m. paskelbė viešojo pirkimo konkursą DI redakcijos programinei įrangai. HHS nustatė, kad jos CMS padaliniui reikia DI valdomų įrankių. Rankinis darbas sukūrė neatliktu prašymų kiekius, kurių darbuotojai negalejo sutvarkyti.

Klausimas pasikeitė. Tai nebėra apie tai, ar automatizuoti. Tai apie tai, kaip tai padaryti taip, kad laikytusi teisme.

Federalinio neatliktu prašymų kiekio problema

Pagal 5 U.S.C. 552, agentūros privalo atsakyti per 20 darbo dienų. Praktiškai daugelis užtrunka menesius. Kai kurios - metus.

DOJ 100 000+ prašymų neatliku kiekis lygus maždaug 2 mlrd. minučių rankinio peržiūros. Tai darant prielaidą, kad kiekvienas prašymas užtrunka tik 20 minučių. Pagal vyriausybinius tarifus darbo sąnaudos siekia milijardus.

Didžioji dalis to laiko skiriama vienai užduočiai. Darbuotojai narstyja puslapius ieškodami vardų, adresų ir telefono numerių. Tam nereikia teisinio sprendimo. Reikia šablonų atpažinimo. Algoritmas tai atlieka per sekundes.

Ko reikalavo ARPA-H ir HHS

ARPA-H sieke DI redakcijos programines irangos FOIA dokumentu apdorojimui. Jų nustatyti reikalavimai buvo:

  • Automatinis 6 ir 7(C) išimčiu asmeniniu duomenu identifikavimas.
  • Didelių dokumentų rinkinių partijinis apdorojimas.
  • Misrių formatu palaikymas: PDF, Word ir el. paštas.
  • Audito takelio dokumentavimas.
  • Gynybingas rezultatas FOIA atsakymui.

HHS/CMS priejo prie tos pačios isvados. Augantys kiekiai ir stabilus darbuotojų skaičius padarė rankine peržiurą netvaria. Šios agentūros nesiekė naujų technologijų. Jos sprende atitikties krizę.

Valstijų ir savivaldybių lygmuo: mažiau išteklių, tos pačios taisyklės

Federalinės agentūros turi specialius FOIA biurus ir teisinius biudžetus. Valstijų ir savivaldybių vyriausybės turi tas pačias teisines pareigas su daug mažesniais ištekliais.

Kalifornijos CPRA reikalauja atsakymo per 10 kalendorinių dienų. Apskrities trijų žmonių teisinė komanda negali peržiureti 2 000 dokumentų per tą langą. Galimybės ribotos:

  1. Atsisakyti arba vėluoti - tai sukuria teisinę riziką.
  2. Samdyti laikinus darbuotojus - brangu ir lėta.
  3. Automatizuoti mechaninę redakcijos fazę.

3 parinktis dabar pasiekiama. Tas pats partijinis apdorojimas, kurį naudoja federalinės agentūros, yra prieinamas apskričių teisinėms tarnyboms. Nereikia ilgų viešojo pirkimo laikotarpių. Kaip viešų irašų taisykles galioja visose jurisdikcijose, žr. mūsų atitikties apžvalga.

ES DSAR: ta pati problema

BDAR 15 straipsnio duomenų subjektų prieigos prašymai (DSAR) sukuria lygiagrečią iššūkį ES organizacijoms. Skirtingai nuo FOIA, DSAR pareigos taikomos visoms organizacijoms, tvarkančioms asmeninius duomenis. Maža SaaS įmonė gali gauti tą patį DSAR kiekį kaip didelis bankas.

Praktinis iššūkis atspindi FOIA. Organizacija turi pateikti visus duomenis, saugomus apie konkretų asmenį. Trečiųjų šalių asmens duomenys turi buti išbraukti iš atsakymo. Terminas yra 30 dienų.

Kiekvienas DSAR, lieciasi el. pašto archyvus, palaikymo bilietus ir uzsakymu irasus, gali reikšti šimtus dokumentų, kuriuos reikia patikrinti. Organizacijoms, tvarkančioms 20-50 DSAR per mėnesį, rankinis peržiūra reikalauja vieno ar daugiau visu etato darbuotojų. Partijų automatizavimas sumažina tai iki dalinės darbo dienos.

Darbalaukinius apdorojimas slaptoms bylos

Kai kurios agentūros negali naudoti žiniatinklio irangos. Duomenys, kurie turi likti agentūros sistemose, reikalauja vietos apdorojimo.

Darbalaukio programa (anonym.plus) sukurta šiam naudojimo atvejui:

  • Visas apdorojimas vykdomas agentūros nuosavoje techninėje įrangoje.
  • Jokie duomenys nesiunčiami i išorinius serverius.
  • Partijų paleidimas apdoroja 1-5 000 failų vienu kartu.
  • Palaikomi formatai: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Apdoroti failai supakuojami kaip ZIP archyvas.
  • CSV ir JSON eksportas su kiekvieno failo metaduomenimis yra įtraukti.

Agentūroms su oro tarpo tinklais arba griežtomis duomenų buvimo taisyklėmis vietos apdorojimas yra vienintelis galimas kelias. Darbalaukio programa naudoja tą patį aptikimo modelį - XLM-RoBERTa su 285+ esybių tipais - kaip žiniatinklio platforma. Ji veikia visiškai neprisijungus.

Darbalaukio programos sąrankai žr. mūsų Darbalaukio programos dokumentacija.

Diegimo pastabos

Audito takleliai. Vyriausybiniai darbo srautai reikalauja irašu, kas buvo išbraukta, kokiu pagrindu ir kieno. Partijų metaduomenys apima pirmuosius du. Išimčių dokumentų nukreipimas per darbuotojų peržiurą apima likusius.

Nuoseklumas. FOIA atsakymas, išbraukiantis vardą viename dokumente, bet paleidžiantis jį kitame, sukuria teisinę riziką. Fiksuota automatizuota konfiguracija pašalina tą nenuoseklumą.

SBU medžiagos. Daugelis vyriausybinių dokumentų yra jautrūs, bet neklasifikuoti. Vietos apdorojimas tvarko SBU failus be tinklo naudojimo. Žiniatinklio apdorojimas su tinkamomis DPA sutartimis apima ne SBU failus.

Rezultato formatas. Redact metodas naudoja juodų juostų keitimą. Tai atitinka standartinės FOIA redakcijos išvaizdą ir tinka teismo gamybai. Žetono metodas - pvz., [REDACTED - Exemption 6] - prideda aiškia išimčiu citata detalesnėms bylose.

Esmė

FOIA yra teisinė pareiga. 20 darbo dienų terminas nėra tikslas. Kai prašymų kiekiai viršija tai, ką darbuotojai gali tvarkyti, nesėkmės seka.

DI galiomos partijų redakcija nepakeicia teisinio sprendimo. Ji pašalina mechaninę fazę - standartinių asmens duomenų radimas ir žymėjimas tūkstančiuose dokumentų. Ta fazė sugeria 70-80% peržiūros laiko. Darbuotojai tada gali sutelkti dėmesį i 10-20% dokumentų, kur kontekstas svarbus.

ARPA-H ir HHS/CMS tai matė. Valstijų ir savivaldybių vyriausybės bei ES organizacijos, susiduriancios su DSAR pareigomis, susiduria su tuo pačiu iššūkiu. Kaip gynybiniai redakcijos darbo srautai yra sustruktūrizuoti, žr. mūsų saugos ir atitikties apžvalga.

Šaltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.