By · Last updated 2026-06-05

Tagasi BlogisseGDPR ja Vastavus

GDPR andmete minimeerimine: reaalajas API

GDPR artikkel 5(1)(c) nõuab ainult vajalike andmete kogumist. Reaalajas API integratsioon takistab üle-kogumist vormi esitamise etapis - enne kui andmed jõuavad andmebaasi.

June 5, 20267 min lugemist
GDPR data minimizationArticle 5real-time detectionAPI integrationform validation

GDPR andmete minimeerimine: reaalajas API

Uuendatud 2026. aastal

GDPR artikkel 5(1)(c) ütleb: koguge ainult seda, mida vajate. See on andmete minimeerimise reegel. Enamik meeskondi rikub seda vormi disaini kaudu, mitte halva kavatsusega. Vabateksti väljad tõmbavad sisse nimesid, aadresse ja ID-numbreid, mida keegi ei planeerinud.

Andmebaasi hilisem puhastamine ei paranda seda. Rikkumine juhtus siis, kui andmed koguti. Selle peatamine allikas on ainus tõeline parandus. Reaalajas API kontroll vormi esitamisel peatab üle-kogumise enne selle algust.

Vaadake meie vastavuse ülevaadet ja turvapraktikaid, kuidas me GDPR artikkel 5 toetame.

Miks vormid üle-koguvad

Vabateksti väljad veebirakenduses koguvad isikuandmeid, mida keegi ei planeerinud:

  • Tugipileti "põhjuse" väljad täidetud meditsiiniliste ajalugude ja kindlustusnumbritega
  • Küsitluse "muud kommentaarid" jaotised, mis sisaldavad täisnimesid ja telefoninumbreid
  • Personaliosakonna "märkuste" veerud aastatega struktureerimata isiklikke andmeid
  • Tellimuse "märkuste" väljad, mis sisaldavad kliendi ID-numbreid probleemide lahendamiseks sisestatud

Miniimeerimise reegel nõuab, et see isikuandmed ei siseneks kunagi teie süsteemidesse. Retroaktiivne puhastamine ravib sümptomit. Reaalajas tuvastamine eemaldab põhjuse.

Miks retroaktiivne puhastamine jääb puudulikuks

Salvestatud isikuandmeid puhastavad meeskonnad seisavad silmitsi nelja probleemiga.

Täielikkus. Mustrite sobitamine leiab ilmse isikuandmeid, nagu e-posti aadressid ja ID-numbrid. See jätab vahele kontekstipõhised viited. "Minu õde Siret sai sama probleemi" sisaldab nime, mida enamik skannimistest vahele jätab.

Juriidiline ajastus. Rikkumine juhtub kogumisel. Andmete puhastamine kuude pärast ei paranda seda. Kui regulaator vaatab üle perioodi, mil andmeid hoiti, on rikkumine juba protokollitud.

Mittetäielik kustutamine. Andmebaasid teevad varukoopiaid. Süsteemid kirjutavad logisid. Analüütikatööriistad eksportivad andmeid. Isegi pärast põhiandmebaasist kustutamist võivad koopiad jääda varukoopia failidesse ja auditeerimislogidesse.

Rikkumise riskiavamine. Kogumise ja puhastamise vahel istub lisandunud isikuandmeid teie süsteemides. Rikkumine selles aknas paneb üle-kogutud andmed riskiulatusse.

Kogumise allikas peatamine lahendab kõik neli. Andmed, mis ei sisene kunagi, ei saa rikkuda, ei vaja kustutamist ja ei loe rikkumisena.

Vormi valideerimise tuvastamisemustrid

Realaajas isikuandmete tuvastamist vormi lisamiseks on kolm viisi.

Kliendipoolne (Chrome'i laiendus). Laiendus jälgib kleepimissündmusi brauseri väljades. Kui kasutaja kleebib teksti isikuandmetega, tõstab see üksused kohe esile. Kasutaja eemaldab need enne esitamist. API kutset pole vaja - tuvastamine töötab kohalikult. Üksuste tüüpide definitsioonide jaoks vaadake sõnastikku.

Serveripoolne (API integratsioon). Vorm postitab teie serverisse. Enne andmebaasi kirjutamist kutsub teie kood tuvastamise API-t. API tagastab üksuste tüübid koos usalduse skooridega. Kõrge usaldusega vasted blokeerivad esitamise selge sõnumiga. Keskmise usaldusega vasted küsivad ülevaatuse sammu. Andmed on puhtad enne salvestamist.

Hübriid (soovitatav). Kliendipoolne esiletõstmine annab kasutajatele kiire tagasiside. Serveripoolsed kontrollid pakuvad vastavuse garantiid. Kui kasutaja eirab kliendi hoiatust, tabab serveri kontroll ikkagi isikuandmeid. Midagi ei jõua andmebaasi kontrollimata. Vaadake meie KKK-d levinud küsimuste jaoks tuvastamise lävistuste kohta.

Näide: tervishoiu patsiendiportaal

Patsiendiportaal lubab patsientidel kirjeldada oma sümptomeid vabateksti väljas enne broneerimist. Väli saab regulaarselt kirjeid, mis sisaldavad teiste patsientide nimesid, ID-numbreid ja koduaadresse. Ükski neist ei kuulu ajakava süsteemi.

Enne reaalajas tuvastamist:

  • Isikuandmeid sümptomite väljas: umbes 12% esitlustest
  • Puhastamise meetod: iganädalane partiide protsess
  • Vastavuse staatus: reaktiivne - artikkel 5(1)(c) rikkumine juhtus kogumisel

Pärast API integratsiooni esitamisel:

  • API tuvastab kõrge usaldusega isikuandmeid enne andmebaasi kirjutamist
  • Patsient näeb: "Teie sõnum näib sisaldavat isiklikku teavet. Palun eemaldage see enne esitamist."
  • Patsient muudab ja esitab uuesti
  • Andmebaas saab ainult sümptomide kirjelduse

Selles stsenaariumis langes isikuandmeid väljas umbes 12%-lt alla 1%-le esitlustest. Vastavust näitab nüüd serveripoolsete tuvastamise logide kaudu, mitte retrospektiivsete puhastamiskäivituste kaudu.

Auditeerimiskirjed kogumisel

Regulaatorid kohtlevad reaktiivseid meeskondi erinevalt nendest, kellel on kontrollid paigas. GDPR artikkel 25 - kaitse kujunduselt ja vaikimisi - premeerib viimast.

Kogumispunkti tuvastamine loob kasulikke auditeerimiskirjeid:

  • Tuvastamislogi. Iga vormi skann salvestatakse leitud üksuste tüüpidega, usalduse skooridega, võetud meetmega ja tulemusega.
  • Igakuised aruanded. Kokkuvõtted näitavad tuvastamismäära välja ja üksuse tüübi järgi ning kuidas kasutajad reageerivad.
  • Konfiguratsioonikid. Lävistuse seaded, kaetud väljad ja jälgitavad üksuste tüübid - see näitab selget, hallatavat poliitikat.

Need kirjed aitavad regulaatorite ülevaatustel. Need toetavad ka sisemist auditit ja töötlemistegevuste registrit. Vaadake meie juhtumite ülevaadet kogumispunkti kontrollide praktikas olevate näidete jaoks.

AI tööriistad ja andmete minimeerimine

Toe agendid kleepivad sageli kliendi e-kirju AI koostamistööriistadesse. Need e-kirjad võivad sisaldada nimesid, aadresse ja kontonumbreid. Selle saatmine AI mudelisse võib minna kaugemale vajalikust.

MCP Server lisab tuvastamise sammu enne teksti mudelini jõudmist. Klientide nimed muutuvad [CUSTOMER]-ks. Konkreetsed üksikasjad puhastatakse. AI koostab vastuse puhastatud teksti kasutades. Agent lisab tagasi ainult selle, mida vastus vajab.

See vastab andmete minimeerimise reeglile AI kasutuse jaoks. Mudel saab ainult vajaliku - mis on tavaliselt üldse mitte isikuandmed. Vaadake meie üksuste lehte tuvastatud üksuste tüüpide täieliku loetelu jaoks.

Allikad

Kas olete valmis oma andmeid kaitsma?

Alustage PII anonüümitamist 285+ üksustüübi abil 48 keeles.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.