NAIH Угорщина: TAJ-szám та adóazonosító jel
TAJ-szám: угорський номер соціального страхування
Formát TAJ-szám: XXX-XXX-XXX (3 групи по 3 цифри, розділені дефісами) або XXXXXXXXX (9 цифр без форматування).
Перевірка контрольної цифри (алгоритм Луна 10):
def validate_taj(taj):
digits = ''.join(filter(str.isdigit, taj))
if len(digits) != 9:
return False
total = 0
for i, d in enumerate(digits):
n = int(d)
if i % 2 == 0: # непарні позиції × 3
n *= 3
total += n
return total % 10 == 0
Adóazonosító jel: угорський ідентифікатор платника податків
Формат: 10 цифр, завжди починається з 8.
- Цифра 1: Завжди 8
- Цифри 2–8: Кодування дати народження (кількість днів від 1867-01-01)
- Цифри 9–10: Порядковий номер та контрольна цифра
Чому потрібні спеціалізовані NLP-моделі для угорської мови
Угорська є агглютинативною мовою — слова містять дуже довгі суфіксальні ланцюжки. Ім'я «Ковач Іштван» у різних контекстах може з'являтися як:
- Kovács István (базова форма)
- Kovács Istvánnak (давальний відмінок: «для Ковача Іштвана»)
- Kovács Istvántól (відкладний відмінок: «від Ковача Іштвана»)
Models trained on English/German fail to handle these inflections.
Джерела: