By · Last updated 2026-06-05

Atgal į BlogąTechninė

Kodél dvejetainis AV aptikimas nepateisina atitikties reikalavimu

Aptikta/neaptikta vartai nepakanka atitikties kontekstams, reikalaujantiems zmogaus sprendimo. Stai kodél pasitikejimo vertinimas AV anoniminizavima pakeicia is spejimo i auditavama kontrole.

June 5, 20268 min skaityti
confidence scoringPII detectionlegal discoverycomplianceGDPR audit

Kodél dvejetainis AV aptikimas nepateisina atitikties reikalavimu

Atnaujinta 2026 m.

Kiekvienas AV irankis susiduria su viena sunkia problema. Ta pati eilutè vienoje vietoje gali buti asmens duomuo, o kitoje - ne.

"Jurgis" klientu byloje yra duomenu subjektas. "Jurgis" istoriniame darbe apie Jurgi F. Kennedy - nera. Devynzenklis numeris medicininiame iraSe yra HIPAA kodas. Tie patys devyni skaitmenys produkto kode - nera.

Taip/ne vartai to negali sutvarkyti. Jie privercia rinktis vieną is dviejų blogu sprendimu: taikyti iredagavima visoms eilutems, kurios gali buti AV, arba redaguoti tik tikrus atitikimus. Abu nepavyksta teiseje, kur kiekvienas sprendimas turi buti aizkus ir dokumentuotas.

Nuo 0 iki 100 skaleje vertinama kiekvieno objekto apmauoma suteikia trecia kelia. Ji valdo daugiapakopius taisykles, zmoniSku perziuros eiles ir pilnus audito irasaus.

Taip/ne vartu riba

Kontekstas keicia duomenu prasme. Du failai gali tureti ta pacia eilute. Viename ji yra asmens duomenys. Kitame - ne. Vartai to negali parodyti. Skaiciai gali.

Turint tik vartus, jusu dvi galimybés yra blogos. Perteklinis redagavimas naikina dokumento verte. Nepakankamas redagavimas sukuria teisini pavojų. Neras is ju neislaiko teisme.

Teisine atskleismas: kodél butini balai

Teisminiame atskleidime yra taisykles, dél kuriu ivertinimu aptikimas yra butinas.

Perteklinio redagavimo problema. Advokatu vardu arba teismo nuorodų redagavimas gadina irodymous. Teismai buvo baudeje advokatus uz perteklinį redagavima. Ta pati teismo praktika, apimanti nepakankami redagavima, apima ir si.

Nepakankamo redagavimo problema. Praleistas tikras AV sukuria rizika. Tai apima klientu privatumo pazeidimus, bar skundus ir kai kuriose vietose baudiamasias bylas.

Butinybe paaiSkinti kiekviena sprendima. Kai teismas klausia, kodél pozicija buvo redaguota, advokatai privalo paaiSkinti. "Irankis ji pazymejo" nera pakankama. "Irankis si element ivertino 94% kaip socialinio draudimo numeri. Musu taisykle automatiskai redaguoja virs 85%." Tai pakankama.

Taip/ne vartai negali to atsakyti. IVertinamas irankis su nustatytomis taisyklèmis gali. Taip pat zr.: Redagavimo gynimas: AI balai teisme.

Tripakopio perziuros sistema

Veiksmingiausias diegimas naudoja tris pakopas pagal objekto bala.

1 pakopa - automatinis (virs 85%):

  • Elementai, atitinkantys didelio tikslumo formatus (SSN, IBAN, MRN)
  • Automatiskai redaguojami be zmogaus etapo
  • Zurnalas fiksuoja objekto tipa, bala, metoda ir laika
  • Pavyzdys: "571-44-9283" 97% kaip SSN - automatiskai redaguojamas

2 pakopa - zmogaus perziura (50-85%):

  • Elementai, kurie gali buti AV, bet reikalauja sprendimo
  • Siuntiami perziuretojui priimti, atmesti arba perklasifikuoti
  • Zurnalas fiksuoja objekto tipa, bala, perziuretojo ID, sprendima ir laika
  • Pavyzdys: "Jonas Petrauskas" techniniame dokumente 67% - perziuretojas patvirtina, kad tai vardas - redaguojamas

3 pakopa - tik pasiulymas (maziau kaip 50%):

  • Maza tiksluma elementai rodomi kaip uzuominos
  • Automatiskai neredaguojami; perziuretojas gali veikti arba praleisti
  • Zurnalas fiksuoja objekto tipa, bala ir perziuretojo pasirinkima
  • Pavyzdys: "Petraitis" produkto dokumente 42% - perziuretojas nustato, kad tai imones pavadinimas - neredaguojamas

Tik 2 pakopos reikia zmogaus darbo. Visos trys pakopos gamina audito irasais.

Kaip kuriami balai

AV irankiai derina signalus, kad pagamintų viena skaiciau kiekvienam objektui.

Regex sablonai. Tikslus SSN formato atitikimas gauna aukšta bazini bala. Dalinis atitikimas gauna zemesni.

Modelio iSvestis. Vardų objektų modeliai priskiria tikimybe pagal klase. 0,93 balo PERSON suteikia didelio tikslumo rezultata.

Konteksto signalai. Tekstas aplink objekte koreaguoja bala. "Mano SSN yra 571-44-9283" ji kelia. "Produkto kodas 571-44-9283" ji mazina.

Ansambliu taisykles. Sistemos derina regex, modelio ir konteksto signalus su nustatytais svoriais. Galutinis skaicious atspindi visus irodymous.

Sis skaicious valdo kiekviena slenkstinio sprendima jusu darbo eigoje. Daugiau apie klaidingus suveikimus is taip/ne irankiu zr.: Klaidingo suveikimo mokestis AV irankiams.

Draudimo reikalavimai: tikras pavyzdys

Draudimo failai maisosi akivaizdziai AV - poliso savininko vardas, adresas, SSN - su nuo konteksto priklausanciais duomenimis: liudytoju vardai, imoniniu pavadinimais, eksperto paraSais.

Taip/ne irankis arba redaguoja visus vardus (netinkama imoniniu pavadinimams), arba praleidzia liudytoju vardus (rizika). IVertinamas irankis kiekviena elementa tvarko atskirai:

  • SSN su etikete "poliso savininko SSN" 96% - automatiskai redaguojamas
  • Poliso savininko vardas pazymetas PERSON 91% - automatiskai redaguojamas
  • Rangovų imone pazymeta ORG 78% - perzireta - perziuretojas atmeta redagavima
  • Liudytojo vardas pazymetas PERSON 82% - perzireta - perziuretojas priima
  • Eksperto vardas pazymetas PERSON 71% - perzireta - perziuretojas priima (treCiuju Saliu duomenys)

Kiekvienas sprendimas turi skaitini pagrindu. Audito pesakas yra pilnas.

Atitikties irasų kurimas

BDAR 5 straipsnio 1 dalies f punkto ir HIPAA saugos taisykles atveju ivertinami irankiai automatiskai generuoja irasaus.

Objekto lygio audito irasai fiksuoja objekto tipa, bala, sprendimo tipa (automatinis arba rankinis), perziuretojo ID ir laika. Sios eksportuojamos kaip CSV duomenu instituciju uzklausoms.

Slenksciu irasai dokumentuoja dabartines nuostatas ir kiekviena pakeitima. Kiekvienas pakeitimas apima, kas ji padare, kada ir kodél. Tai parodo valdoma, apgalvota politika.

Statistines ataskaitos apima aptikimo normas pagal objekto tipa, 2 pakopos perziuros normas ir pateisinamojo parasymo normas. Jos atsako i duomenu institucija, klausancia "parodykite musu valdiklius".

HIPAA audito pesako gairémis zr.: AiSkinama redagavimas: HIPAA auditai.

Taip/ne vartai yra spejimas. Balas yra irodymas.

Saltiniai

Pasiruošę apsaugoti savo duomenis?

Pradėkite anonimizuoti PII su 285+ subjektų tipais 48 kalbomis.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.