By · Last updated 2026-06-05

Til baka á BloggGDPR & Samræmi

NAIH Ungverjaland: TAJ-Szám og Adóazonosító Jel

Ungversk NER-nákvæmni er 67% á móti ESB-meðaltali 82% — mat NAIH 2024. TAJ-szám vegin eftirlitssummu og adóazonosító jel uppgötvunarbil.

June 5, 20267 mín lestur
Hungary NAIHTAJ-szám detectionHungarian NERHungarian GDPR complianceAI DPIA

NAIH Ungverjaland: TAJ-Szám og GDPR-tæknilegar Kröfur

Uppfært fyrir 2026

Gagnaverndarstofnun Ungverjalands er NAIH. Skýrsla hennar 2024 leiddi í ljós að NER-nákvæmni fyrir ungversku er aðeins 67%. ESB-meðaltalið er 82%. Þetta bil skapar raunverulega áhættu. Verkfæri byggð fyrir ensku eða þýsku missa ungverskur auðkenni á miklum hlutfallum.

Af hverju ungversk NER-stig eru lág

Þrír eiginleikar ungversku brjóta hefðbundin NLP-líkön.

Agglúterasjon: Ungverska bætir viðskeytum við rótarorð. Sama nafnið tekur margar myndir í setningu. "Kovács Péter" í frumstigi verður "Kovács Péternek" í öðrum hlutverki. NER-líkön verða að tengja allar þær myndir við einn einstakling.

Nafnaröð: Ungverska setur fjölskylduheitið fyrst. Flest NLP-líkön búast við eiginnafni fyrst. Þessi snúningur veldur missum uppgötvunum.

Sérstafir: Ungverska notar ő og ű. Þessir eru ekki þeir sömu og þýsk umlaut. Blandaðar kóðanir — Windows-1250 á móti UTF-8 — valda einnig bilunum.

Þessir þrír þættir skýra flestar nákvæmnibilin í skýrslu NAIH 2024.

TAJ-Szám: Félagslegt tryggingarnúmer Ungverjalands

TAJ-szám (Társadalombiztosítási Azonosító Jel) er 9 stafa númer. Það kemur fram í heilbrigðis-, launagreiðslu-, félagslegum bótum og lífeyrisskrám.

Eftirlitssumma: Margfaldaðu stafi 1 til 8 með þyngdum 3, 7, 3, 7, 3, 7, 3, 7. Leggðu saman niðurstöðurnar. Taktu leif eftir 10. Það gefur athugunartöluna.

Þessi reiknirit er einstakt fyrir Ungverjaland. Það er ekki það sama og Luhn-reiknirit sem notað er í öðrum löndum.

Almenn verkfæri greina TAJ-szám með aðeins 61% nákvæmni, samkvæmt NAIH-skýrslu 2024. 9 stafa sniðið líkist mörgum öðrum númerum í ungverskum skjölum. Án eftirlitssummuþrefsins merkja verkfæri fölsk jákvæð og missa raunveruleg.

Adóazonosító Jel: Skattauðkenni Ungverjalands

Adóazonosító jel er 10 stafa persónulegt skattanúmer. Fyrsti stafurinn er alltaf 8. Það kemur fram í ráðningarskrám, skattskýrslum og fjárhagslegum skjölum.

Eftirlitssumma: Taktu stafi 2 til 9. Margfaldaðu með þyngdum 9, 7, 3, 1, 9, 7, 3, 1. Leggðu saman niðurstöðurnar. Taktu leif eftir 10. Það er athugunartalan. Niðurstaða 0 þýðir að athugunartalan er 0.

Framfylgdarmál NAIH sýna að þetta númer er oft misst í mannauðsskjölum þegar verkfæri eru stillt upp fyrir önnur tungumál.

Sjá ESB-þjóðlegt skattauðkennisleiðbeiningar okkar til að sjá hvernig þessi númer bera saman yfir aðildarríki.

DPIA-krafa NAIH fyrir gervigreindakerfi

Leiðbeiningar NAIH 2024 krefjast fullkláraðrar DPIA áður en gervigreindakerfi vinnur úr persónulegum gögnum. Þetta er strangara en almenna GDPR-prófið. DPIA verður að ná yfir:

  1. Gagnaflæði — þjálfunargögn, inntök og framleiðsla
  2. Lagaleg grundvöllur — skráð fyrir sérhverja starfsemi
  3. Tungumála-nákvæmni — krafist fyrir tungumál undir ESB-meðaltali
  4. Mannleg endurskoðun — leið til að athuga sjálfvirkar ákvarðanir

DPIA verður að vera uppfærð á hverju ári þegar kerfið er endurþjálfað.

Fyrir teymi sem setja upp gervigreindaverkfæri á ungverskum gögnum er röðin föst: DPIA fyrst, þá innleiðing.

Lágmarksráðstafanir

Þrjár ráðstafanir mynda grunnlínu fyrir NAIH-samræmi:

  1. TAJ-szám-uppgötvun með modulo-10 eftirlitssummu — myndauppgötvun ein og sér er ekki nóg
  2. Adóazonosító jel-uppgötvun með eftirlitssummustaðfestingu — mikilvægt fyrir mannauðs- og fjármálaþjónustu
  3. Ungversk NER með agglúterasjonsstuðningi — verður að meðhöndla ő, ű og kóðunarsafbrigði

Sjá leiðbeiningar okkar um BFDI Þýskaland til að bera saman hvernig Mið-Evrópuskar DPA-stofnanir setja tæknilegar kröfur. Til að sjá svipaðan tungumálabil í Mið-Evrópu, sjá leiðbeiningar okkar um tékkneskt ÚOOÚ.

Heimildir

Ertu tilbúinn að vernda gögnin þín?

Byrjaðu að anonymiza PII með 285+ gerðum í 48 tungumálum.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.