By · Last updated 2026-06-05

Tornar al BlogGDPR i Compliment

NAIH Hongria: TAJ-Szam i Adoazonosito Jel

La precisio de la NER en hongarcs es del 67% enfront del 82% de la mitjana de la UE, segun l'avaluacio del NAIH del 2024. Llacunes en la deteccio del TAJ-szam amb suma de control ponderada i l'adoazonosito jel.

June 5, 20267 min llegit
Hungary NAIHTAJ-szám detectionHungarian NERHungarian GDPR complianceAI DPIA

NAIH Hongria: TAJ-Szam i Requisits Tecnics del RGPD

Actualitzat per al 2026

L'autoritat de dades d'Hongria es el NAIH. El seu informe del 2024 va constatar que la precisio de la NER per a l'hongares es nomes del 67%. La mitjana de la UE es del 82%. Aquesta diferencia crea un risc real. Les eines construides per a l'angles o l'alemany perden els identificadors hongaresos a altes taxes.

Per que la NER Hongaresa Obte Puntuacions Baixes

Tres caracteristiques de l'hongares trenquen els models estandard de PLN.

Aglutinacio: L'hongares afegeix sufixos a les paraules arrel. El mateix nom pren moltes formes en una frase. "Kovacs Peter" en posicio de subjecte es converteix en "Kovacs Peternek" en un altre rol. Els models NER han de vincular totes aquestes formes a una sola persona.

Ordre dels noms: L'hongares posa primer el cognom. La majoria dels models de PLN esperen primer el nom de pila. Aquesta inversio causa deteccions perdudes.

Caracters especials: L'hongares utilitza o i u amb doble accent. No son el mateix que les dieresis alemanyes. La codificacio mixta, Windows-1250 contra UTF-8, tambe causa fallades.

Aquests tres factors expliquen la major part de la diferencia de precisio en l'informe del NAIH del 2024.

TAJ-Szam: el Numero de la Seguretat Social d'Hongria

El TAJ-szam (Tarsadalombiztositasi Azonosito Jel) es un numero de 9 digits. Apareix en historials sanitaris, nomines, prestacions socials i registres de pensions.

Suma de control: Es multipliquen els digits 1 a 8 pels pesos 3, 7, 3, 7, 3, 7, 3, 7. S'agreguen els resultats. Es fa el modul 10. Aixo dona el digit de verificacio.

Aquest algorisme es unic d'Hongria. No es el mateix que l'algorisme Luhn utilitzat en altres paisos.

Les eines generiques detecten el TAJ-szam amb nomes un 61% de precisio, segons l'informe del NAIH del 2024. El format de 9 digits sembla molts altres numeros en els documents hongaresos. Sense el pas de la suma de control, les eines marquen falsos positius i perden els reals.

Adoazonosito Jel: el DNI Fiscal d'Hongria

L'adoazonosito jel es un numero fiscal personal de 10 digits. El primer digit sempre es 8. Apareix en registres laborals, declaracions fiscals i documents financers.

Suma de control: Es prenen els digits 2 a 9. Es multipliquen pels pesos 9, 7, 3, 1, 9, 7, 3, 1. S'agreguen els resultats. Es fa el modul 10. Aquest es el digit de verificacio. Un resultat de 0 significa que el digit de verificacio es 0.

Els casos d'aplicacio del NAIH mostren que aquest numero sovint es perd en documents de recursos humans quan les eines estan configurades per a altres idiomes.

Vegeu la nostra guia de DNI fiscals nacionals de la UE per veure com aquests numeros es comparen entre els estats membres.

El Requisit de l'EIPD del NAIH per als Sistemes d'IA

L'orientacio del NAIH del 2024 requereix una EIPD completada abans que qualsevol sistema d'IA processi dades personals. Aixo es mes estricte que la prova general del RGPD. L'EIPD ha de cobrir:

  1. Fluxos de dades: dades d'entrenament, entrades i sortides
  2. Base juridica: documentada per a cada activitat
  3. Precisio linguistica: necessaria per als idiomes per sota de la mitjana de la UE
  4. Revisio humana: una manera de verificar les decisions automatitzades

L'EIPD s'ha d'actualitzar cada any quan es torna a entrenar el sistema.

Per als equips que despleguen eines d'IA en dades hongareses, l'ordre es fix: primer l'EIPD, despres el desplegament.

Controls Tecnics Minims

Tres controls formen la referencia per al compliment del NAIH:

  1. Deteccio del TAJ-szam amb suma de control modul 10: la concordanca de patrons sola no es suficient
  2. Deteccio de l'adoazonosito jel amb validacio de la suma de control: critica per a recursos humans i finances
  3. NER hongaresa amb compatibilitat amb l'aglutinacio: ha de gestionar o, u i variants de codificacio

Vegeu la nostra guia del BfDI d'Alemanya per comparar com les APD de l'Europa Central estableixen requisits tecnics. Per a una llacuna linguistica similar a l'Europa Central, vegeu la nostra guia de l'UOOU txec.

Fonts

Preparat per protegir les vostres dades?

Comenceu a anonimitzar PII amb més de 285 tipus d'entitats en 48 idiomes.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.