By · Last updated 2026-05-28

Vissza a BlograTechnikai

FOIA: Redakció hetekből órákba

A szövetségi kormány becslések szerint 500 millió dollárt költött FOIA-feldolgozásra 2024-ben, főként kézi redakcióra. Az ARPA-H kifejezetten MI-alapú redakciós szoftvert keresett az igények kezelésére.

May 28, 20268 perc olvasás
FOIA automationgovernment AIARPA-HDSARpublic records redaction

FOIA: A MI hetekről órákra csökkenti a redakcióhoz szükséges időt

2026-ra frissítve.

A szövetségi kormány becslések szerint 500 millió dollárt költött FOIA-feldolgozásra 2024-ben. Ennek nagy részét a kézi redakció tette ki. A DOJ várólistája meghaladta a 100 000 nyitott kérelmet.

Az ARPA-H 2025-ben közbeszerzést indított MI-alapú redakciós szoftverért. A HHS megállapította, hogy CMS divíziójának MI-alapú eszközökre van szüksége. A kézi munka akkora elmaradást halmozott fel, amelyet a munkatársak nem tudtak ledolgozni.

A kérdés megváltozott. Már nem az, hogy automatizáljunk-e. Az a kérdés, hogyan tegyük ezt úgy, hogy bíróság előtt is megállja a helyét.

A szövetségi elmaradás problémája

Az 5 U.S.C. §552 alapján az ügynökségeknek 20 munkanapot van arra, hogy válaszoljanak. A gyakorlatban sokan hónapokat, egyesek éveket vesznek igénybe.

A DOJ 100 000+ kérelmes várólistája körülbelül 2 milliárd perc kézi felülvizsgálatnak felel meg. Ez kérelmenként mindössze 20 percet feltételez. Kormányzati díjszabásnál a munkaerőköltség milliárdos nagyságrendű.

Ennek az időnek a nagy részét egyetlen feladat emészti fel. A munkatársak laponként keresik a neveket, lakcímeket és telefonszámokat. Ehhez nem kell jogászi ítélőképesség. Mintafelismerés kell. Egy algoritmus másodpercek alatt elvégzi.

Mit követelt az ARPA-H és a HHS?

Az ARPA-H MI-alapú redakciós szoftvert keresett FOIA-dokumentumok feldolgozásához. A meghatározott követelmények a következők voltak:

  • A 6. és 7(C) kivétel alá eső személyes adatok automatikus azonosítása.
  • Nagy dokumentumkészletek kötegelt feldolgozása.
  • Vegyes formátumok támogatása: PDF, Word és e-mail.
  • Auditnapló-dokumentáció.
  • Védhető kimenet a FOIA-válaszhoz.

A HHS/CMS ugyanerre a következtetésre jutott. A növekvő mennyiségek és a stagnáló létszám fenntarthatatlanná tette a kézi felülvizsgálatot. Ezek az ügynökségek nem az új technológiát hajszolták. Egy megfelelőségi válságot oldottak meg.

Állami és helyi szint: kevesebb erőforrás, ugyanolyan szabályok

A szövetségi ügynökségek dedikált FOIA-irodákkal és jogi keretekkel rendelkeznek. Az állami és helyi önkormányzatok ugyanolyan jogi kötelezettségekkel szembesülnek, jóval kevesebb erőforrással.

Kalifornia CPRA-ja 10 naptári napon belüli választ ír elő. Egy háromfős jogi csapattal rendelkező megye nem tud 2000 dokumentumot ennyi idő alatt feldolgozni. A lehetőségek korlátozottak:

  1. Megtagadás vagy késlekedés — ami jogi kockázatot jelent.
  2. Ideiglenes munkatársak felvétele — drága és lassú.
  3. A mechanikus redakciós fázis automatizálása.

A 3. lehetőség ma már elérhető. Ugyanaz a kötegelt feldolgozás, amelyet a szövetségi ügynökségek használnak, a megyei jogi osztályok számára is rendelkezésre áll. Nincs szükség hosszas közbeszerzési folyamatokra. Tekintse meg a megfelelőségi áttekintőnket, amelyben részletezzük, hogyan vonatkoznak a közérdekű nyilvántartásokra vonatkozó szabályok az egyes joghatóságokra.

EU DSARok: ugyanaz a probléma

A GDPR 15. cikk szerinti érintetti hozzáférési kérelmek (DSAR) párhuzamos kihívást jelentenek az EU-s szervezeteknek. A FOIA-val ellentétben a DSAR-kötelezettségek minden olyan szervezetre vonatkoznak, amely személyes adatokat kezel. Egy kis SaaS-vállalat ugyanolyan mennyiségű DSAR-t kaphat, mint egy nagy bank.

A gyakorlati kihívás tükrözi a FOIA-t. Egy szervezetnek minden, egy adott személyről tárolt adatot elő kell állítania. A harmadik felek személyes adatait ki kell redakálni a válaszból. A határidő 30 nap.

Egy e-mail-archívumokat, támogatói jegyeket és rendelési rekordokat is érintő DSAR több száz dokumentum ellenőrzését jelentheti. Havonta 20–50 DSAR-t kezelő szervezeteknél a kézi felülvizsgálat egy vagy több teljes munkaidős munkatársat igényel. A kötegelt automatizálás ezt részmunkaidős feladattá csökkenti.

Asztali feldolgozás érzékeny nyilvántartásokhoz

Egyes ügynökségek nem használhatnak webalapú eszközöket. Az ügynökségi rendszereken belül maradó adatokhoz helyi feldolgozásra van szükség.

Az asztali alkalmazás (anonym.plus) erre a felhasználási esetre készült:

  • Minden feldolgozás az ügynökség saját hardverén fut.
  • Semmilyen adat nem kerül külső szerverekre.
  • Kötegelt futtatás egyszerre 1–5000 fájlon.
  • Támogatott formátumok: PDF, DOCX, XLSX, TXT, CSV, JSON, XML.
  • A feldolgozott fájlok ZIP-archívumba kerülnek.
  • CSV és JSON export fájlonkénti metaadatokkal egyaránt elérhető.

Légréses hálózatokkal vagy szigorú adatelhelyezési szabályokkal rendelkező ügynökségek számára a helyi feldolgozás az egyetlen járható út. Az asztali alkalmazás ugyanazt az észlelési modellt — XLM-RoBERTa 285+ entitástípussal — használja, mint a webes platform. Teljesen offline működik.

A beállítási részletekért tekintse meg az asztali alkalmazás dokumentációját.

Megvalósítási megjegyzések

Auditnaplók. A kormányzati munkafolyamatok megkövetelik, hogy rögzítsék, mit redakáltak, milyen alapon és ki által. A kötegelt metaadatok az első kettőt lefedik. A kivételes dokumentumok munkatársakon keresztüli irányítása a többit lefedi.

Következetesség. Egy FOIA-válasz, amely az egyikben redakálja a nevet, de a másikban nem, jogi kitettséget teremt. Egy rögzített automatizált konfiguráció megszünteti ezt a következetlenséget.

Érzékeny, de nem minősített anyagok. Sok kormányzati dokumentum érzékeny, de nem minősített. A helyi feldolgozás hálózati használat nélkül kezeli ezeket. A webalapú feldolgozás megfelelő adatfeldolgozási megállapodásokkal lefedi a nem érzékeny fájlokat.

Kimeneti formátum. A Redact módszer fekete sávos helyettesítést alkalmaz. Ez megfelel a szabványos FOIA-redakciók megjelenésének, és alkalmas bírósági előterjesztéshez. A token-megközelítés — pl. [REDACTED - Exemption 6] — explicit kivételhivatkozást ad a részletesebb nyilvántartásokhoz.

Összefoglalás

A FOIA jogi kötelezettség. A 20 munkanapja határidő nem cél. Amikor a kérelmek mennyisége meghaladja a munkatársak kapacitását, a mulasztások következnek.

Az MI-alapú kötegelt redakció nem helyettesíti a jogi ítélőképességet. Eltávolítja a mechanikus fázist — a személyes adatok megtalálását és jelölését ezernyi dokumentumban. Ez a fázis az áttekintési idő 70–80%-át veszi igénybe. A munkatársak ekkor azokra a 10–20%-nyi dokumentumra összpontosíthatnak, ahol a kontextus számít.

Az ARPA-H és a HHS/CMS is belátta ezt. Az állami és helyi önkormányzatok, valamint a DSAR-kötelezettségekkel szembesülő EU-s szervezetek ugyanolyan kihívással néznek szembe. Tekintse meg a biztonsági és megfelelőségi áttekintőnket, amelyben részletezzük a védhető redakciós munkafolyamatok felépítését.

Források

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.