NAIH Ungarn: TAJ-Szám und DSGVO-Technikanforderungen
Aktualisiert für 2026
Ungarns Datenschutzbehörde ist NAIH. Ihr Bericht von 2024 zeigt: Die NER-Genauigkeit für Ungarisch liegt bei nur 67 %. Der EU-Durchschnitt beträgt 82 %. Diese Lücke schafft echtes Risiko. Tools für Englisch oder Deutsch erkennen ungarische Kennungen häufig nicht.
Warum NER für Ungarisch schlecht abschneidet
Drei Merkmale des Ungarischen überfordern gängige NLP-Modelle.
Agglutination: Ungarisch bildet Wörter durch das Anhängen von Suffixen. Ein und derselbe Name erscheint in einem Satz in vielen Formen. „Kovács Péter" als Subjekt wird in einer anderen Rolle zu „Kovács Péternek". NER-Modelle müssen alle Formen einer Person zuordnen.
Namensreihenfolge: Ungarische Namen beginnen mit dem Familiennamen. Die meisten NLP-Modelle erwarten den Vornamen zuerst. Diese Umkehrung führt zu Erkennungsfehlern.
Sonderzeichen: Ungarisch verwendet ő und ű. Diese unterscheiden sich von deutschen Umlauten. Gemischte Kodierungen — Windows-1250 vs. UTF-8 — verursachen zusätzliche Fehler.
Diese drei Faktoren erklären den größten Teil der Genauigkeitslücke im NAIH-Bericht 2024.
TAJ-Szám: Ungarns Sozialversicherungsnummer
Die TAJ-szám (Társadalombiztosítási Azonosító Jel) ist eine 9-stellige Nummer. Sie erscheint in Gesundheitsregistrierungen, Gehaltsabrechnungen, Sozialleistungen und Rentenkonten.
Prüfziffer: Multipliziere die Stellen 1 bis 8 mit den Gewichten 3, 7, 3, 7, 3, 7, 3, 7. Summiere die Ergebnisse. Berechne Modulo 10. Das Ergebnis ist die Prüfziffer.
Dieser Algorithmus ist ungarisch-spezifisch. Er unterscheidet sich vom Luhn-Algorithmus anderer Länder.
Laut dem NAIH-Bericht 2024 erkennen generische Tools die TAJ-szám nur mit 61 % Genauigkeit. Das 9-stellige Format ähnelt vielen anderen Nummern in ungarischen Dokumenten. Ohne Prüfsummen-Schritt entstehen viele Fehltreffer.
Adóazonosító Jel: Ungarns Steuer-ID
Die adóazonosító jel ist eine 10-stellige persönliche Steuer-Identifikationsnummer. Die erste Stelle ist immer 8. Sie erscheint in Beschäftigungsunterlagen, Steuererklärungen und Finanzdokumenten.
Prüfziffer: Nehme die Stellen 2 bis 9. Multipliziere mit den Gewichten 9, 7, 3, 1, 9, 7, 3, 1. Summiere. Berechne Modulo 10. Das ist die Prüfziffer. Ein Ergebnis von 0 bedeutet Prüfziffer 0.
NAIH-Vollstreckungsfälle zeigen: Diese Nummer wird in HR-Dokumenten oft übersehen, wenn Tools für andere Sprachen konfiguriert sind.
Unser EU-Leitfaden zu nationalen Steuer-IDs vergleicht diese Nummern über Mitgliedstaaten hinweg.
NAIHs DSFA-Pflicht für KI-Systeme
NAIHs Leitfaden 2024 schreibt eine abgeschlossene DSFA vor der Inbetriebnahme jedes KI-Systems vor, das personenbezogene Daten verarbeitet. Das ist strenger als der allgemeine DSGVO-Test. Die DSFA muss abdecken:
- Datenflüsse — Trainingsdaten, Eingaben und Ausgaben
- Rechtsgrundlage — für jede Verarbeitungsaktivität dokumentiert
- Sprachgenauigkeit — gefordert für Sprachen unter dem EU-Durchschnitt
- Menschliche Überprüfung — ein Verfahren zur Prüfung automatisierter Entscheidungen
Die DSFA muss jährlich aktualisiert werden, wenn das System neu trainiert wird.
Für Teams, die KI-Tools auf ungarischen Daten einsetzen, ist die Reihenfolge klar: erst DSFA, dann Deployment.
Technische Mindestanforderungen
Drei Maßnahmen bilden die Grundlage für NAIH-Konformität:
- TAJ-szám-Erkennung mit Modulo-10-Prüfsumme — Mustererkennung allein reicht nicht aus
- Adóazonosító jel-Erkennung mit Prüfsumme — besonders wichtig für HR und Finanzen
- Ungarisches NER mit Agglutinationsunterstützung — muss ő, ű und Kodierungsvarianten abdecken
Unser BFDI-Deutschland-Leitfaden zeigt, wie zentraleuropäische Behörden technische Anforderungen formulieren. Für eine ähnliche Sprachlücke in der Region empfehlen wir unseren Tschechischen ÚOOÚ-Leitfaden.