By · Last updated 2026-06-05

Vissza a BlograGDPR & Megfelelés

GDPR adatminimalizálás: Valós idejű API az adatforráshoz

A GDPR 5. cikk (1)(c) bekezdése megköveteli, hogy csak a szükséges adatokat gyűjtsük össze. A valós idejű API-integráció megakadályozza a túlzott adatgyűjtést az űrlapbeküldés szakaszában — mielőtt.

June 5, 20267 perc olvasás
GDPR data minimizationArticle 5real-time detectionAPI integrationform validation

GDPR adatminimalizálás: Valós idejű API

2026-ra frissítve

A GDPR 5. cikk (1)(c) bekezdése azt mondja: csak azt gyűjtse össze, amire szüksége van. Ez az adatminimalizálási szabály. A legtöbb csapat az űrlaptervezésen, nem rossz szándékon keresztül szegi meg. A szabad szöveges mezők neveket, címeket és azonosítószámokat szívnak be, amelyeket senki sem tervezett.

Az adatbázis utólagos megtisztítása nem javítja ezt. A jogsértés az adatok gyűjtésekor történt. A forrásból való megakadályozás az egyetlen valódi megoldás. Az űrlapbeküldésnél elvégzett valós idejű API-ellenőrzés megakadályozza a túlzott adatgyűjtést, mielőtt elkezdődne.

Lássa a megfelelési áttekintőnket és a biztonsági gyakorlatainkat, hogyan támogatjuk a GDPR 5. cikkét.

Miért gyűjtenek az űrlapok túl sok adatot

A webalkalmazások szabad szöveges mezői tervezett személyes adatot gyűjtenek:

  • Ügyfélszolgálati jegyek „ok” mezői, amelyek orvosi históriával és biztosítási számokkal vannak kitöltve
  • Felmérési „egyéb megjegyzések” szakaszok teljes neveket és telefonszámokat tartalmazva
  • HR-„megjegyzések” oszlopok évek óta tárolt strukturálatlan személyes részletekkel
  • Rendelési „megjegyzések” mezők problémák megoldásához megadott ügyfél-azonosítószámokkal

A minimalizálási szabály megköveteli, hogy ez a személyes adat soha ne kerüljön be a rendszerekbe. Az utólagos tisztítás a tünetet kezeli. A valós idejű észlelés eltávolítja az okot.

Miért nem elegendő az utólagos tisztítás

A tárolt személyes adatokat megtisztító csapatok négy problémával szembesülnek.

Teljesség. A mintaillesztés megtalálja a nyilvánvaló személyes adatokat, mint e-mail-cím és azonosítószámok. Kihagyja a kontextusfüggő hivatkozásokat. „A nővérem, Sophie ugyanolyan problémával volt” tartalmaz egy nevet, amelyet a legtöbb vizsgálat kihogy.

Jogi időzítés. A jogsértés gyűjtéskor történik. Az adatok hónapokkal later megtisztítása nem javítja. Ha egy szabályozó felülvizsgálja azt az időszakot, amikor az adatokat tárolták, a jogsértés már nyilvántartásban van.

Hiányos törlés. Az adatbázisok biztonsági másolatot készítenek. A rendszerek naplókat írnak. Az elemző eszközök adatokat exportálnak. Még a fő adatbázisból való törlés után is maradhatnak másolatok a biztonsági fájlokban és auditnaplókban.

Szivárgáskitettség. A gyűjtés és a tisztítás között a felesleges személyes adat a rendszerekben ül. Egy ebben az ablakban bekövetkező szivárgás a túlzottan gyűjtött adatot a hatókörbe helyezi.

A forrásból való gyűjtés megakadályozása mindnégyet megoldja. Az adat, amely soha nem kerül be, nem lehet megsértve, nem igényel törlést és nem számít jogsértésnek.

Észlelési minták az űrlapérvényesítéshez

Három módja van a valós idejű személyes adat-észlelés hozzáadásának egy űrlaphoz.

Ügyféloldali (Chrome-bővítmény). A bővítmény figyeli a beillesztési eseményeket a böngészőmezőkben. Amikor egy felhasználó személyes adatot tartalmazó szöveget illeszt be, azonnal kiemeli az entitásokat. A felhasználó eltávolítja azokat a beküldés előtt. Nincs szükség API-hívásra — az észlelés helyileg fut. Lásd a szószedetet az entitástípusok meghatározásáért.

Szerveroldali (API-integráció). Az űrlap a szerverre kerül. Az adatbázis-írás előtt a kódja meghívja az észlelési API-t. Az API visszaadja az entitástípusokat megbízhatósági pontszámokkal. A magas megbízhatóságú egyezések blokkolják a beküldést egy egyértelmű üzenettel. A közepes megbízhatóságú egyezések felülvizsgálati lépést kérnek. Az adatok tiszták, mielőtt tárolnák.

Hibrid (ajánlott). Az ügyféloldali kiemelés gyors visszajelzést ad a felhasználóknak. A szerveroldali ellenőrzések biztosítják a megfelelési garanciát. Ha egy felhasználó figyelmen kívül hagyja az ügyféloldali figyelmeztetést, a szerver-ellenőrzés még mindig elkapja a személyes adatot. Semmi sem kerül az adatbázisba ellenőrzés nélkül. Lásd a GYIK-et az észlelési küszöbértékekre vonatkozó kérdésekhez.

Példa: Egészségügyi betegportál

Egy betegportál lehetővé teszi a betegek számára, hogy egy szabad szöveges mezőben írják le tüneteiket az időpontfoglalás előtt. A mező rendszeresen kap olyan bejegyzéseket, amelyek más betegek neveit, azonosítószámait és otthoni címeit tartalmazzák. Ezek egyike sem tartozik a foglalási rendszerbe.

Valós idejű észlelés előtt:

  • Személyes adat a tünetmezőben: a beküldések körülbelül 12%-a
  • Tisztítási módszer: heti kötegelési folyamat
  • Megfelelési státusz: reaktív — az 5. cikk (1)(c) bekezdése szerinti jogsértés gyűjtéskor következett be

API-integráció beküldésnél után:

  • Az API magas megbízhatóságú személyes adatot észlel, mielőtt bármit az adatbázisba írna
  • A beteg ezt látja: „Az üzenete személyes adatot látszik tartalmazni. Kérjük, távolítsa el azt a beküldés előtt.”
  • A beteg felülvizsgálja és újra beküld
  • Az adatbázis csak a tünetleírást kapja

Ebben a forgatókönyvben a mezőben lévő személyes adat a beküldések körülbelül 12%-áról 1% alá csökkent. A megfelelés most szerveroldali észlelési naplókkal van igazolva, nem utólagos tisztítási futamokkal.

Auditnaplók a gyűjtési ponton

A szabályozók különbözőképpen kezelik a reaktív csapatokat azoktól, amelyeknek vannak ellenőrzéseik. A GDPR 25. cikke — tervezési és alapértelmezett adatvédelem — jutalmazza az utóbbiakat.

A gyűjtési ponton végzett észlelés hasznos auditnaplókat hoz létre:

  • Észlelési napló. Minden űrlapvizsgálat mentésre kerül a talált entitástípusokkal, megbízhatósági pontszámokkal, végrehajtott intézkedéssel és eredménnyel.
  • Havi jelentések. Az összefoglalók az észlelési arányt mutatják mező és entitástípus szerint, és azt, hogyan reagálnak a felhasználók.
  • Konfigurációs nyilvántartások. Küszöbértékek beállításai, érintett mezők és figyelt entitástípusok — ez egyértelmű, felügyelt szabályzatot mutat.

Ezek a nyilvántartások segítenek a szabályozói felülvizsgálatokban. Támogatják a belső auditot és az adatkezelési nyilvántartásokat is. Lásd a esettanulmányokat a gyűjtési ponton végzett ellenőrzések példáiért.

AI-eszközök és adatminimalizálás

Az ügyfélszolgálati ügynökök gyakran beillesztik az ügyféle-mail-jeit az AI-szövegező eszközökbe. Ezek az e-mailek tartalmazhatnak neveket, címeket és számlaszámokat. Ennek AI-modellhez küldése meghaladhatja a szükségeset.

Az MCP-szerver egy észlelési lépést ad a szöveg a modellhez való jutása előtt. Az ügyféladatok [ÜGYFÉL]-re változnak. A specifikus részletek megtisztítódnak. Az AI a megtisztított szöveg alapján tervez egy választ. Az ügynök csak azt adja vissza, amire a válasznak szüksége van.

Ez megfelel az AI-használat adatminimalizálási szabályának. A modell csak azt kapja, ami szükséges — ami általában egyáltalán nem tartalmaz személyes adatot. Lásd az entitásokat az észlelt entitástípusok teljes listájáért.

Források

Készen áll az adatai védelmére?

Kezdje el a PII anonimizálását 285+ entitástípuson 48 nyelven.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.