anonym.legal

By · Last updated 2026-06-05

Terug naar BlogGDPR & Naleving

NAIH Hongarije: TAJ-Szám en Adóazonosító Jel

NER-nauwkeurigheid voor Hongaars is 67% versus het EU-gemiddelde van 82% — uit de NAIH-beoordeling 2024. Detectieproblemen bij TAJ-szám gewogen controlesom en adóazonosító jel.

June 5, 20267 min lezen
Hungary NAIHTAJ-szám detectionHungarian NERHungarian GDPR complianceAI DPIA

NAIH Hongarije: TAJ-Szám en GDPR technische vereisten

Bijgewerkt voor 2026

De Hongaarse gegevensbeschermingsautoriteit is NAIH. Uit het rapport van 2024 blijkt dat de NER-nauwkeurigheid voor Hongaars slechts 67% bedraagt. Het EU-gemiddelde is 82%. Dit verschil brengt reëel risico met zich mee. Tools die zijn gebouwd voor Engels of Duits missen Hongaarse identifiers in hoge mate.

Waarom Hongaars NER laag scoort

Drie kenmerken van het Hongaars breken standaard NLP-modellen.

Agglutinatie: Hongaars voegt achtervoegsels toe aan basiswoorden. Dezelfde naam krijgt in een zin vele vormen. "Kovács Péter" in de onderwerpsrol wordt in een andere rol "Kovács Péternek". NER-modellen moeten al die vormen aan één persoon koppelen.

Naamsvolgorde: Hongaars plaatst de familienaam vooraan. De meeste NLP-modellen verwachten de voornaam eerst. Die omgekeerde volgorde leidt tot gemiste detecties.

Speciale tekens: Hongaars gebruikt ő en ű. Dit zijn niet dezelfde tekens als Duitse umlauten. Gemengde codering — Windows-1250 versus UTF-8 — veroorzaakt eveneens fouten.

Deze drie factoren verklaren het grootste deel van het nauwkeurigheidsverschil in het NAIH-rapport van 2024.

TAJ-Szám: Hongaars burgerservicenummer

Het TAJ-szám (Társadalombiztosítási Azonosító Jel) is een negencijferig nummer. Het komt voor in gezondheidszorg, salarisadministratie, sociale uitkeringen en pensioengegevens.

Controlesom: Vermenigvuldig de cijfers 1 tot en met 8 met de gewichten 3, 7, 3, 7, 3, 7, 3, 7. Tel de resultaten op. Neem modulo 10. Dat geeft het controlecijfer.

Dit algoritme is uniek voor Hongarije. Het is niet hetzelfde als het Luhn-algoritme dat in andere landen wordt gebruikt.

Generieke tools detecteren het TAJ-szám met slechts 61% nauwkeurigheid, aldus het NAIH-rapport van 2024. Het negencijferige formaat lijkt op veel andere nummers in Hongaarse documenten. Zonder de controlesomstap produceren tools zowel valse positieven als gemiste detecties.

Adóazonosító Jel: Hongaars fiscaal identificatienummer

Het adóazonosító jel is een persoonlijk belastingnummer van tien cijfers. Het eerste cijfer is altijd 8. Het komt voor in personeelsdossiers, belastingaangiften en financiële documenten.

Controlesom: Neem de cijfers 2 tot en met 9. Vermenigvuldig met de gewichten 9, 7, 3, 1, 9, 7, 3, 1. Tel de resultaten op. Neem modulo 10. Dat is het controlecijfer. Een uitkomst van 0 betekent dat het controlecijfer 0 is.

Uit NAIH-handhavingszaken blijkt dat dit nummer regelmatig wordt gemist in HR-documenten wanneer tools zijn ingesteld voor andere talen.

Zie onze gids voor EU nationale belasting-ID's voor een vergelijking van deze nummers door de lidstaten heen.

NAIH's DPIA-vereiste voor AI-systemen

De NAIH-richtlijn van 2024 vereist een voltooide DPIA voordat een AI-systeem persoonsgegevens verwerkt. Dit is strenger dan de algemene GDPR-toets. De DPIA moet betrekking hebben op:

  1. Gegevensstromen — trainingsgegevens, invoer en uitvoer
  2. Rechtsgrond — gedocumenteerd voor elke activiteit
  3. Taalnauwkeurigheid — vereist voor talen die onder het EU-gemiddelde scoren
  4. Menselijke controle — een manier om geautomatiseerde beslissingen te toetsen

De DPIA moet jaarlijks worden bijgewerkt wanneer het systeem opnieuw wordt getraind.

Voor teams die AI-tools inzetten op Hongaarse gegevens geldt een vaste volgorde: eerst de DPIA, dan de implementatie.

Minimale technische maatregelen

Drie maatregelen vormen de minimale basis voor NAIH-naleving:

  1. TAJ-szám-detectie met modulo-10 controlesom — patroonherkenning alleen is niet voldoende
  2. Adóazonosító jel-detectie met controlesomvalidatie — cruciaal voor HR en financiën
  3. Hongaars NER met ondersteuning voor agglutinatie — moet ő, ű en coderingsvariant aan kunnen

Zie onze BFDI Duitsland-gids voor een vergelijking van hoe Midden-Europese toezichthouders technische vereisten stellen. Voor een vergelijkbare taalkloof in Centraal-Europa, zie onze Tsjechische ÚOOÚ-gids.

Bronnen

Klaar om uw gegevens te beschermen?

Begin met het anonimiseren van PII met 285+ entiteitstypen in 48 talen.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.