anonym.legal
Назад до блогуGDPR та відповідність

NAIH Угорщина: TAJ-szám, adóazonosító jel та чому...

TAJ-szám (угорський SSN) перевіряється за алгоритмом Луна 10. Adóazonosító jel кодує дату народження.

April 21, 20267 хв читання
Hungary NAIHTAJ-szám detectionHungarian NERHungarian GDPR complianceAI DPIA

NAIH Угорщина: TAJ-szám та adóazonosító jel

TAJ-szám: угорський номер соціального страхування

Formát TAJ-szám: XXX-XXX-XXX (3 групи по 3 цифри, розділені дефісами) або XXXXXXXXX (9 цифр без форматування).

Перевірка контрольної цифри (алгоритм Луна 10):

def validate_taj(taj):
    digits = ''.join(filter(str.isdigit, taj))
    if len(digits) != 9:
        return False
    
    total = 0
    for i, d in enumerate(digits):
        n = int(d)
        if i % 2 == 0:  # непарні позиції × 3
            n *= 3
        total += n
    
    return total % 10 == 0

Adóazonosító jel: угорський ідентифікатор платника податків

Формат: 10 цифр, завжди починається з 8.

  • Цифра 1: Завжди 8
  • Цифри 2–8: Кодування дати народження (кількість днів від 1867-01-01)
  • Цифри 9–10: Порядковий номер та контрольна цифра

Чому потрібні спеціалізовані NLP-моделі для угорської мови

Угорська є агглютинативною мовою — слова містять дуже довгі суфіксальні ланцюжки. Ім'я «Ковач Іштван» у різних контекстах може з'являтися як:

  • Kovács István (базова форма)
  • Kovács Istvánnak (давальний відмінок: «для Ковача Іштвана»)
  • Kovács Istvántól (відкладний відмінок: «від Ковача Іштвана»)

Models trained on English/German fail to handle these inflections.

Джерела:

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.