By · Last updated 2026-06-05

العودة إلى المدونةالامتثال لـ GDPR

هيئة NAIH المجرية: TAJ-Szám وAdóazonosító Jel

دقة تعرّف الكيانات باللغة المجرية 67% مقابل 82% للمعدل الأوروبي — وفق تقييم NAIH لعام 2024. ثغرات في اكتشاف TAJ-szám وAdóazonosító jel.

June 5, 20267 دقيقة قراءة
Hungary NAIHTAJ-szám detectionHungarian NERHungarian GDPR complianceAI DPIA

هيئة NAIH المجرية: TAJ-Szám والمتطلبات التقنية وفق اللائحة العامة لحماية البيانات

محدَّث لعام 2026

هيئة حماية البيانات في المجر هي NAIH. كشف تقريرها لعام 2024 أن دقة تعرّف الكيانات باللغة المجرية لا تتجاوز 67%، في حين يبلغ المتوسط الأوروبي 82%. هذه الفجوة تُشكّل خطراً حقيقياً؛ إذ تُفوّت الأدوات المبنية للإنجليزية أو الألمانية المعرّفات المجرية بمعدلات مرتفعة.

لماذا تنخفض درجات تعرّف الكيانات في المجرية؟

ثلاث خصائص للغة المجرية تُربك نماذج معالجة اللغة الطبيعية القياسية.

الإلصاق (Agglutination): تُضيف المجرية لواحق إلى الكلمات الجذرية. يأخذ الاسم ذاته أشكالاً متعددة في الجملة. "Kovács Péter" في موضع المبتدأ تُصبح "Kovács Péternek" في موضع آخر. يجب أن تربط نماذج تعرّف الكيانات جميع هذه الأشكال بشخص واحد.

ترتيب الاسم: يضع الترتيب المجري اسم العائلة أولاً. تتوقع معظم نماذج معالجة اللغة الطبيعية الاسم الأول أولاً. هذا العكس يُسبب اكتشافات مُهمَلة.

الأحرف الخاصة: تستخدم المجرية الحرفين ő وű، وهما يختلفان عن حروف الـumlaut الألمانية. يُسبب التشفير المختلط — Windows-1250 مقابل UTF-8 — أيضاً إخفاقات.

هذه العوامل الثلاثة تُفسّر معظم فجوة الدقة في تقرير NAIH لعام 2024.

TAJ-Szám: رقم الضمان الاجتماعي المجري

TAJ-szám (Társadalombiztosítási Azonosító Jel) رقم مؤلف من 9 أرقام يظهر في سجلات الرعاية الصحية وكشوف الرواتب والمزايا الاجتماعية وسجلات التقاعد.

مجموع التحقق: تُضرب الأرقام من 1 إلى 8 بأوزان 3، 7، 3، 7، 3، 7، 3، 7. تُجمع النتائج وتُؤخذ بقية القسمة على 10 للحصول على رقم التحقق.

هذه الخوارزمية فريدة في المجر ولا تطابق خوارزمية Luhn المستخدمة في دول أخرى.

تكتشف الأدوات العامة TAJ-szám بدقة 61% فحسب وفق تقرير NAIH لعام 2024. تبدو صيغة الـ9 أرقام مشابهة لأرقام كثيرة في الوثائق المجرية. فبدون خطوة التحقق، تُعلّم الأدوات إيجابيات كاذبة وتُفوّت الأرقام الحقيقية.

Adóazonosító Jel: الرقم الضريبي الشخصي المجري

Adóazonosító jel هو رقم ضريبي شخصي مؤلف من 10 أرقام. الرقم الأول دائماً 8. يظهر في سجلات التوظيف والإقرارات الضريبية والوثائق المالية.

مجموع التحقق: تُؤخذ الأرقام من 2 إلى 9 وتُضرب بأوزان 9، 7، 3، 1، 9، 7، 3، 1. تُجمع النتائج وتُؤخذ بقية القسمة على 10 للحصول على رقم التحقق. النتيجة 0 تعني رقم التحقق هو 0.

تُظهر قضايا تطبيق NAIH أن هذا الرقم كثيراً ما يُفوَّت في وثائق الموارد البشرية عند إعداد الأدوات للغات أخرى.

راجع دليل الأرقام الضريبية الوطنية الأوروبية للاطلاع على مقارنة هذه الأرقام عبر الدول الأعضاء.

متطلب NAIH للتقييم المسبق لتأثير حماية البيانات في أنظمة الذكاء الاصطناعي

يشترط توجيه NAIH لعام 2024 إتمام تقييم تأثير حماية البيانات (DPIA) قبل معالجة أي نظام ذكاء اصطناعي للبيانات الشخصية. هذا أكثر صرامة من الاختبار العام بموجب اللائحة. يجب أن يشمل التقييم:

  1. تدفقات البيانات — بيانات التدريب والمدخلات والمخرجات
  2. الأساس القانوني — موثق لكل نشاط
  3. دقة اللغة — مطلوبة للغات التي تقل عن المتوسط الأوروبي
  4. المراجعة البشرية — آلية للتحقق من القرارات الآلية

yجب تحديث التقييم سنوياً عند إعادة تدريب النظام.

بالنسبة للفرق التي تنشر أدوات الذكاء الاصطناعي على البيانات المجرية، الترتيب ثابت: التقييم أولاً، ثم النشر.

الضوابط التقنية الدنيا

تُشكّل هذه الضوابط الثلاثة الحد الأدنى للامتثال لمتطلبات NAIH:

  1. اكتشاف TAJ-szám مع اختبار مجموع المودولو 10 — لا تكفي مطابقة النمط وحدها
  2. اكتشاف Adóazonosító jel مع التحقق من المجموع — ضروري للموارد البشرية والمالية
  3. تعرّف الكيانات باللغة المجرية مع دعم الإلصاق — يجب التعامل مع ő وű وأشكال الترميز المختلفة

راجع دليل BFDI الألماني للمقارنة بين كيفية وضع هيئات حماية البيانات في أوروبا الوسطى للمتطلبات التقنية. وللاطلاع على فجوة لغوية مماثلة في أوروبا الوسطى، راجع دليل ÚOOÚ التشيكي.

المصادر

هل أنت مستعد لحماية بياناتك؟

ابدأ بإخفاء المعلومات الشخصية مع أكثر من 285 نوع كيان عبر 48 لغة.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.