By · Last updated 2026-05-28

Rudi kwa BlogKitaalamu

FOIA: AI Inapunguza Ufutaji kutoka Wiki hadi Masaa

Serikali ya shirikisho ilitumia takriban $500M kwenye usindikaji wa FOIA mwaka 2024, hasa ufutaji wa mkono. ARPA-H iliomba wazi programu ya ufutaji ya AI.

May 28, 20268 dakika kusoma
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: AI Inapunguza Ufutaji kutoka Wiki hadi Masaa

Imesasishwa kwa 2026.

Serikali ya shirikisho ilitumia takriban $500M kwenye usindikaji wa FOIA mwaka 2024. Sehemu kubwa ya gharama hiyo ilikuwa ufutaji wa mkono. Foleni ya DOJ ilipita maombi 100,000 wazi.

ARPA-H ilitoa zabuni mwaka 2025 kwa programu ya ufutaji ya AI. HHS iligundua kwamba idara yake ya CMS ilihitaji zana zinazotumia AI. Kazi ya mkono iliunda foleni ambazo wafanyakazi hawakuweza kuzisafisha.

Swali limebadilika. Sio tena kuhusu kama automatishe au la. Ni kuhusu jinsi ya kuifanya kwa njia inayoshikilia mahakamani.

Tatizo la Foleni ya Shirikisho

Chini ya 5 U.S.C. §552, wizara lazima zijibu ndani ya siku 20 za biashara. Kwa vitendo, wengi huchukua miezi. Wengine huchukua miaka.

Foleni ya DOJ ya maombi 100,000+ ni sawa na takriban dakika bilioni 2 za ukaguzi wa mkono. Hilo linachukulia dakika 20 tu kwa kila ombi. Kwa viwango vya malipo ya serikali, gharama ya kazi inafikia mabilioni.

Sehemu kubwa ya muda huo inaenda kwa kazi moja. Wafanyakazi wanaskanisha kurasa kwa majina, anwani, na nambari za simu. Hiyo haihitaji uamuzi wa mwanasheria. Inahitaji kuoana na mifumo. Algorithm inafanya sekunde chache.

Mahitaji ya ARPA-H na HHS

ARPA-H iliomba programu ya ufutaji ya AI kwa usindikaji wa hati za FOIA. Mahitaji yao yaliyotajwa yalikuwa:

  • Utambuzi wa kiotomatiki wa data ya kibinafsi ya Msamaha 6 na 7(C).
  • Usindikaji wa kundi wa seti kubwa za hati.
  • Msaada wa umbizo mchanganyiko: PDF, Word, na barua pepe.
  • Nyaraka za rekodi ya ukaguzi.
  • Matokeo yanayoweza kutetewa kwa jibu la FOIA.

HHS/CMS walifikia hitimisho lile lile. Idadi inayokua na wafanyakazi wa kawaida walifanya ukaguzi wa mkono kutowezekana. Wizara hizi hazikufuata teknolojia mpya. Zilikuwa zitatua mgawanyiko wa kufuata sheria.

Serikali za Jimbo na Mitaa: Rasilimali Chache, Sheria Zile Zile

Wizara za shirikisho zina ofisi maalum za FOIA na bajeti za kisheria. Serikali za jimbo na mitaa zinakabiliwa na wajibu sawa wa kisheria na rasilimali chache zaidi.

CPRA ya California inahitaji majibu ndani ya siku 10 za kalenda. Kaunti yenye timu ya kisheria ya watu watatu haiwezi kupitia hati 2,000 katika dirisha hilo. Chaguo ni chache:

  1. Kataa au chelewa - ambayo inaunda hatari ya kisheria.
  2. Ajiri wafanyakazi wa muda - ghali na polepole.
  3. Automatishe awamu ya ufutaji wa kimitambo.

Chaguo 3 sasa liko ndani ya uwezo. Usindikaji wa kundi ule ule unaotumika na wizara za shirikisho unapatikana kwa idara za kisheria za kaunti. Hakuna nyakati ndefu za zabuni. Angalia muhtasari wetu wa kufuata sheria jinsi sheria za rekodi za umma zinavyotumika katika mamlaka mbalimbali.

DSARs za EU: Tatizo Lile Lile

Maombi ya Ufikiaji wa Mada ya Data (DSARs) ya Ibara ya 15 ya GDPR yanaunda changamoto inayofanana kwa mashirika ya EU. Tofauti na FOIA, wajibu wa DSAR unatumika kwa mashirika yote yanayoshughulikia data ya kibinafsi. Kampuni ndogo ya SaaS inaweza kupokea idadi ile ile ya DSARs kama benki kubwa.

Changamoto ya vitendo inafanana na FOIA. Shirika lazima litoe data yote inayomhusu mtu fulani. Data ya kibinafsi ya wahusika wa tatu lazima ifutwe kutoka kwa jibu. Mwisho ni siku 30.

Kila DSAR inayogusa kumbukumbu za barua pepe, tiketi za msaada, na rekodi za maagizo inaweza kumaanisha mamia ya hati kukaguliwa. Kwa mashirika yanayoshughulikia DSARs 20-50 kwa mwezi, ukaguzi wa mkono unahitaji mfanyakazi mmoja au zaidi wa wakati wote. Automatishe ya kundi inapunguza hilo hadi kazi ya nusu wakati.

Usindikaji wa Kompyuta kwa Rekodi Nyeti

Baadhi ya wizara haziwezi kutumia zana za wavuti. Data ambayo lazima ibaki ndani ya mifumo ya wizara inahitaji usindikaji wa ndani.

Programu ya Desktop (anonym.plus) imejengwa kwa matumizi haya:

  • Usindikaji wote unafanyika kwenye vifaa vya wizara yenyewe.
  • Hakuna data inayotumwa kwa seva za nje.
  • Vikundi vya kundi vinashughulikia faili 1-5,000 kwa wakati mmoja.
  • Umbizo zinazosaidiwa: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • Faili zilizosindikwa zimefungashwa kama kumbukumbu ya ZIP.
  • Usafirishaji wa CSV na JSON pamoja na metadata kwa kila faili umejumuishwa.

Kwa wizara zenye mitandao iliyofungwa au sheria kali za makazi ya data, usindikaji wa ndani ndiyo njia pekee inayofaa. Programu ya Desktop inatumia modeli ile ile ya utambuzi - XLM-RoBERTa na aina 285+ za vitengo - kama jukwaa la wavuti. Inafanya kazi nje ya mtandao kabisa.

Angalia nyaraka za Programu yetu ya Desktop kwa maelezo ya usakinishaji.

Maelezo ya Utekelezaji

Rekodi za ukaguzi. Mtiririko wa kazi wa serikali unahitaji rekodi za kilichofutwa, kwa msingi gani, na na nani. Metadata ya kundi inashughulikia viwili vya kwanza. Kupeleka hati za ubaguzi kupitia ukaguzi wa wafanyakazi kunashughulikia zilizobaki.

Uthabiti. Jibu la FOIA linalofuta jina katika hati moja lakini kukikosa katika nyingine linaunda mfiduo wa kisheria. Usanidi wa kiotomatiki uliowekwa unaondoa kutofautiana huko.

Vifaa vya SBU. Hati nyingi za serikali ni nyeti lakini hazijainishwa. Usindikaji wa ndani unashughulikia faili za SBU bila matumizi ya mtandao. Usindikaji wa wavuti na makubaliano sahihi ya DPA unashughulikia faili zisizo za SBU.

Umbizo la matokeo. Njia ya Futa inatumia ubadilishaji wa mstari mweusi. Hii inalingana na mwonekano wa ufutaji wa kawaida wa FOIA na inafaa kwa uzalishaji wa mahakama. Mbinu ya tokeni - kama vile [REDACTED - Exemption 6] - inaongeza kutoa ombi wazi la msamaha kwa rekodi za kina zaidi.

Mstari wa Chini

FOIA ni wajibu wa kisheria. Mwisho wa siku 20 za biashara si lengo. Wakati idadi ya maombi inazidi uwezo wa wafanyakazi, kushindwa kunafuata.

Ufutaji wa kundi unaotumia AI hauondoi uamuzi wa kisheria. Unaondoa awamu ya kimitambo - kupata na kuweka alama data ya kawaida ya kibinafsi katika hati elfu. Awamu hiyo inatumia 70-80% ya muda wa ukaguzi. Wafanyakazi wanaweza kisha kuzingatia 10-20% ya hati ambapo muktadha unahusika.

ARPA-H na HHS/CMS wote walidhihirishwa. Serikali za jimbo na mitaa na mashirika ya EU yanayokabiliwa na wajibu wa DSAR yanakabiliwa na changamoto ile ile. Angalia muhtasari wetu wa usalama na kufuata sheria jinsi mtiririko wa kazi wa ufutaji unaoweza kutetewa unavyoundwa.

Vyanzo

Tayari kulinda data yako?

Anza kuanonymisha PII na aina 285+ za vitu katika lugha 48.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.