By · Last updated 2026-06-05

Atpakaļ uz BloguGDPR un Atbilstība

VDAR datu minimizācija: Reāllaika API

VDAR 5. panta 1. punkta c) apakšpunkts prasa vākt tikai nepieciešamos datus. Reāllaika API integrācija novērš pārmērīgu vākšanu veidlapas iesniegšanas stadijā - pirms dati nonāk datu bāzē.

June 5, 20267 min lasīšanai
GDPR data minimizationArticle 5real-time detectionAPI integrationform validation

VDAR datu minimizācija: Reāllaika API

Atjaunots 2026. gadam

VDAR 5. panta 1. punkta c) apakšpunkts saka: vāciet tikai to, kas nepieciešams. Tā ir datu minimizācijas prasība. Lielākā daļa komandu to pārkāpj veidlapu dizaina, nevis sliktā nodoma dēļ. Brīvā teksta lauki pievilina vārdus, adreses un ID numurus, ko neviens nebija plānojis.

Vēlāka datu bāzes tīrīšana to nelabo. Pārkāpums notika, kad jūs vācāt datus. Apturēšana pie avota ir vienīgais īstais risinājums. Reāllaika API pārbaude veidlapas iesniegšanā aptur pārmērīgu vākšanu pirms tā sākas.

Skatiet mūsu atbilstības pārskatu un drošības prakses, lai uzzinātu, kā mēs atbalstām VDAR 5. pantu.

Kāpēc veidlapas pārāk daudz vāc

Brīvā teksta lauki tīmekļa lietotnēs savāc PII, ko neviens nebija plānojis:

  • Atbalsta biļešu "iemesla" lauki aizpildīti ar medicīnisko vēsturi un apdrošināšanas numuriem
  • Aptaujas "citi komentāri" sadaļas, kas satur pilnus vārdus un tālruņa numurus
  • HR "piezīmju" kolonnas ar gadiem nestrukturētas personiskās informācijas
  • Pasūtījumu "piezīmju" lauki, kas satur klientu ID numurus, kas ievadīti, lai palīdzētu ar jautājumiem

Minimizācijas prasība prasa, lai šī PII nekad nenonāktu jūsu sistēmās. Retrospektīva tīrīšana ārstē simptomu. Reāllaika atklāšana novērš cēloni.

Kāpēc retrospektīva tīrīšana nav pietiekama

Komandas, kas tīra saglabāto PII, saskaras ar četrām problēmām.

Pilnīgums. Modeļu saskaņošana atrod acīmredzamu PII, piemēram, e-pasta adreses un ID numurus. Tā palaiž garām kontekstā balstītas atsauces. "Manai māsai Sofiai bija tā pati problēma" satur vārdu, ko lielākā daļa skenēšanas palaiž garām.

Juridiskais laiks. Pārkāpums notiek pie vākšanas. Datu tīrīšana mēnešus vēlāk to nelabo. Ja regulators pārskata periodu, kad dati tika glabāti, pārkāpums jau ir reģistrēts.

Nepilnīga dzēšana. Datu bāzes dublē. Sistēmas raksta žurnālus. Analītiskie rīki eksportē datus. Pat pēc dzēšanas no galvenās datu bāzes kopijas var palikt dublējuma failos un audita žurnālos.

Pārkāpuma iedarbība. Starp vākšanu un tīrīšanu papildu PII sēž jūsu sistēmās. Pārkāpums šajā logā ievieto pārmērīgi vāktos datus darbības jomā.

Apturēšana pie avota atrisina visus četrus. Dati, kas nekad nenonāk, nevar tikt pārkāpti, nav jādzēš un netiek skaitīti kā pārkāpums.

Atklāšanas modeļi veidlapu validēšanai

Ir trīs veidi, kā pievienot reāllaika PII atklāšanu veidlapai.

Klienta puse (Chrome paplašinājums). Paplašinājums uzrauga ielīmēšanas notikumus pārlūkprogrammas laukos. Kad lietotājs ielīmē tekstu ar PII, tas nekavējoties izceļ entītijas. Lietotājs tos noņem pirms iesniegšanas. Nav nepieciešams API izsaukums - atklāšana darbojas lokāli. Skatiet glosāriju entītiju tipu definīcijām.

Servera puse (API integrācija). Veidlapa nosūta uz jūsu serveri. Pirms datu bāzes rakstīšanas jūsu kods izsauc atklāšanas API. API atgriež entītiju tipus ar ticamības vērtējumiem. Augstas ticamības atbilstības bloķē iesniegšanu ar skaidru ziņojumu. Vidējas ticamības atbilstības rosina pārskatīšanas soli. Dati ir tīri pirms to glabāšanas.

Hibrīds (ieteicams). Klienta puses izcēlums sniedz lietotājiem ātru atgriezenisko saiti. Servera puses pārbaudes nodrošina atbilstības garantiju. Ja lietotājs ignorē klienta brīdinājumu, servera pārbaude joprojām konstatē PII. Nekas nesasniedz datu bāzi nepārbaudīts. Skatiet mūsu BUJ par bieži uzdotajiem jautājumiem par atklāšanas sliekšņiem.

Piemērs: Veselības aprūpes pacientu portāls

Pacientu portāls ļauj pacientiem aprakstīt savus simptomus brīvā teksta laukā pirms rezervēšanas. Lauks regulāri saņem ierakstus, kas ietver citu pacientu vārdus, ID numurus un mājas adreses. Nekas no tā nepieder plānošanas sistēmā.

Pirms reāllaika atklāšanas:

  • PII simptomu laukā: aptuveni 12% iesniegumu
  • Tīrīšanas metode: iknedēļas pakešprocess
  • Atbilstības statuss: reaktīvs - 5. panta 1. punkta c) apakšpunkta pārkāpums notika pie vākšanas

Pēc API integrācijas iesniegšanā:

  • API atklāj augstas ticamības PII pirms jebkāda datu bāzes rakstīšanas
  • Pacients redz: "Šķiet, ka jūsu ziņojums satur personisko informāciju. Lūdzu, noņemiet to pirms iesniegšanas."
  • Pacients pārskata un atkārtoti iesniedz
  • Datu bāze saņem tikai simptomu aprakstu

Šajā scenārijā PII laukā samazinājās no aptuveni 12% līdz mazāk nekā 1% iesniegumu. Atbilstība tagad tiek demonstrēta caur servera puses atklāšanas žurnāliem, nevis retrospektīviem tīrīšanas procesiem.

Audita ieraksti vākšanas vietā

Regulatori izturas pret reaktīvajām komandām atšķirīgi no tām, kurām ir kontroles. VDAR 25. pants - aizsardzība pēc izstrādes un pēc noklusējuma - atlīdzina pēdējo.

Vākšanas vietas atklāšana izveido noderīgus audita ierakstus:

  • Atklāšanas žurnāls. Katra veidlapas skenēšana tiek saglabāta ar atrastajiem entītiju tipiem, ticamības vērtējumiem, veikto darbību un iznākumu.
  • Ikmēneša pārskati. Kopsavilkumi rāda atklāšanas likmi pēc lauka un entītiju tipa, un to, kā lietotāji reaģē.
  • Konfigurācijas ieraksti. Sliekšņa iestatījumi, aptvertie lauki un uzraugāmie entītiju tipi - tas parāda skaidru, pārvaldītu politiku.

Šie ieraksti palīdz regulatoru pārskatīšanā. Tie atbalsta arī iekšējo revīziju un apstrādes ierakstus. Skatiet mūsu gadījumu analīzes piemēriem par vākšanas vietas kontrolēm praksē.

AI rīki un datu minimizācija

Atbalsta aģenti bieži ielīmē klientu e-pasta ziņojumus AI sagatavošanas rīkos. Šie e-pasta ziņojumi var saturēt vārdus, adreses un konta numurus. Nosūtīšana tā AI modelim var pārsniegt to, kas nepieciešams.

MCP serveris pievieno atklāšanas soli pirms teksts sasniedz modeli. Klientu vārdi kļūst par [CUSTOMER]. Konkrētas detaļas tiek iztīrītas. AI sagatavo atbildi, izmantojot iztīrīto tekstu. Aģents pievieno atpakaļ tikai to, kas atbildei nepieciešams.

Tas atbilst datu minimizācijas noteikumam AI izmantošanai. Modelis saņem tikai to, kas nepieciešams - kas parasti nav nekādas PII. Skatiet entītijas pilnam mūsu atklāto entītiju tipu sarakstam.

Avoti

Vai esat gatavi aizsargāt savus datus?

Sāciet PII anonimizāciju ar 285+ entitāšu veidiem 48 valodās.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.