HDPA یونان: AFM اور AMKA کی شناخت
2026 کے لیے اپڈیٹ شدہ
یونان کی ڈیٹا پروٹیکشن اتھارٹی (HDPA) نے 2024 میں 89 نافذ العمل فیصلے جاری کیے۔ یہ 2022 میں 34 فیصلوں سے 162% زیادہ ہے۔ سیاحت HDPA کیسز کا 38% حصہ ہے۔ بحری آپریشنز مزید خطرات کا باعث بنتے ہیں۔
قومی DPA نفاذ کے تناظر کے لیے GDPR تعمیل گائیڈ دیکھیں۔
AFM: ٹیکس رجسٹریشن نمبر
ΑΦΜ ایک 9 ہندسوں کا ٹیکس نمبر ہے۔ ہر شہری، رہائشی، اور کاروبار اسے رکھتا ہے۔
چیک سم: ہندسے 1 سے 8 کو وزن 256، 128، 64، 32، 16، 8، 4، اور 2 سے ضرب دیں۔ حاصل ضرب کا مجموعہ کریں۔ modulo 11 لگائیں۔ اگر نتیجہ 10 ہو تو نمبر درست نہیں۔ ورنہ چیک ہندسہ نتیجے کا modulo 10 ہے۔
AFM رسیدوں، معاہدوں، اور سرکاری فارموں پر ظاہر ہوتا ہے۔ یہ ملک میں لوگوں اور کاروباروں دونوں کے لیے بنیادی شناختی نمبر ہے۔
شناخت کا فرق: عام NLP ٹولز AFM کو صرف 52% درستگی سے شناخت کرتے ہیں (HDPA 2024)۔ تین وجوہات اس کی وضاحت کرتی ہیں۔ پہلی: 9 ہندسوں کی شکل بہت سے حوالہ نمبروں اور تاریخ کے حصوں سے ملتی ہے۔ دوسری: دو مرحلوں کا modulo چیک سم زیادہ تر عام ٹولز میں موجود نہیں۔ تیسری: نمبر اکثر بغیر لیبل کے ہوتا ہے — یہ کسی پتے کے اندر موجود ہوتا ہے۔
منظم IDs کے بارے میں مزید کے لیے entities reference دیکھیں۔
AMKA: سوشل انشورنس نمبر
ΑΜΚΑ ایک 11 ہندسوں کا نمبر ہے۔ ہندسے 1 سے 6 پیدائش کی تاریخ DDMMYY فارمیٹ میں انکوڈ کرتے ہیں۔ ہندسہ 7 جنس کو انکوڈ کرتا ہے: مرد کے لیے طاق، عورت کے لیے جفت۔ ہندسے 8 سے 11 سیریل نمبر اور چیک ہندسہ ہیں۔
یہ ڈیزائن سویڈن کے personnummer سے ملتا جلتا ہے۔ دونوں ایک ہی GDPR مسئلہ اٹھاتے ہیں۔ نمبر حیاتیاتی جنس کو بطور ڈیٹا پوائنٹ ظاہر کرتا ہے۔
AMKA صحت کے ریکارڈز، سوشل سیکیورٹی فائلوں، اور تنخواہ میں ظاہر ہوتا ہے۔ ہر شہری اور رہائشی اسے رکھتا ہے۔ یہ صحت کی دیکھ بھال اور فوائد کا بنیادی نمبر ہے۔ اس ڈیٹا پر GDPR کے اطلاق کے لیے سیکیورٹی اور تعمیل صفحہ دیکھیں۔
اسکرپٹ سپورٹ کا فرق
یونانی متن لاطینی زبانوں سے مختلف اسکرپٹ استعمال کرتا ہے۔ یہ PII ٹولز کے لیے ایک بنیادی چیلنج ہے۔
Unicode رینج: یونانی حروف U+0370–U+03FF اور U+1F00–U+1FFF میں ہیں۔ صرف ASCII یا لاطینی اسکرپٹ کے لیے بنے ٹولز ان حروف کو پروسیس نہیں کریں گے۔
NER ماڈل: spaCy کا el_core_news ماڈل یونانی NER کو سنبھالتا ہے۔ لیکن اسے واضح سیٹ اپ کی ضرورت ہے۔ زیادہ تر ڈیفالٹ پائپ لائنز صرف انگریزی استعمال کرتی ہیں۔ وہ یونانی اسکرپٹ دستاویزات پر کوئی نتیجہ نہیں دیتیں۔
ملی جلی اسکرپٹ فائلیں: ملک کی دستاویزات اکثر یونانی اور لاطینی اسکرپٹ کو ملاتی ہیں۔ برانڈ نام اور تکنیکی اصطلاحات لاطینی میں ہوتے ہیں۔ باڈی ٹیکسٹ یونانی میں ہوتا ہے۔ ایک پائپ لائن کو دونوں کو سنبھالنا ہوگا۔
کیس فارمز: یونانی جملوں میں نام بدل جاتے ہیں۔ Γεώργιος Παπαδόπουλος موضوع کی شکل میں Γεωργίου Παπαδόπουλου جنیٹو میں بن جاتا ہے۔ ایک ٹول کو دونوں پکڑنے کے لیے morphological analysis کی ضرورت ہے۔
کثیر لسانی PII شناخت کے بارے میں سوالات کے لیے FAQ دیکھیں۔
سیاحت کی تعمیل کے خطرات
سیاحت HDPA کیسز کا 38% ہے۔ پیمانہ اور موسمی نوعیت اہم خطرات پیدا کرتے ہیں۔
PMS ریٹینشن: ہوٹل سسٹمز پاسپورٹ نمبر، پیدائش کی تاریخ، اور رابطے کی معلومات اکٹھی کرتے ہیں۔ HDPA نے پایا کہ بہت سے سسٹمز یہ ڈیٹا پانچ یا زیادہ سالوں تک رکھتے ہیں۔ زیادہ تر کا کوئی بیان شدہ مقصد نہیں تھا۔ زیادہ تر کے پاس کمزور سیکیورٹی کنٹرولز تھے۔
ادائیگی ڈیٹا: ہوٹلز مقامی اور غیر ملکی مہمانوں کے کارڈ ڈیٹا کو پروسیس کرتے ہیں۔ فولیوز میں کارڈ نمبروں کے حصے ہوتے ہیں۔ بکنگ سسٹمز میں مکمل کارڈ کی تفصیلات ہوتی ہیں۔ PCI DSS اور GDPR دونوں لاگو ہوتے ہیں۔
موسمی عملہ: ہاسپیٹیلیٹی عملہ اکثر 4 سے 6 مہینے کے معاہدوں پر کام کرتا ہے۔ HDPA نے بہت سے ایسے کیسز پائے جہاں عملے کے جانے کے بعد رسائی نہیں ہٹائی گئی۔ یہ فرق زیادہ ٹرن اوور والے شعبوں میں عام ہے۔
HDPA تعمیل کے لیے تکنیکی چیک لسٹ
یونانی زبان کی دستاویزات پروسیس کرنے کے لیے کم از کم یہ اسٹیک استعمال کریں۔ AFM شناخت کو دو مرحلوں کے modulo checksum validation کی ضرورت ہے۔ AMKA شناخت کو پیدائش کی تاریخ اور جنس کے ہندسے کی پارسنگ کی ضرورت ہے۔ spaCy el_core_news کے ذریعے یونانی اسکرپٹ NER شامل کریں۔ دونوں اسکرپٹس میں پاسپورٹ اور قومی ID شناخت شامل کریں۔
سیاحت آپریٹرز کے لیے دو تنظیمی اقدامات بھی ضروری ہیں۔ پہلا: PMS ڈیٹا ریٹینشن مدت دستاویز کریں۔ دوسرا: موسمی عملے کے جانے پر سسٹم تک رسائی ہٹائیں۔ یہ اقدامات سب سے عام HDPA نتائج کو حل کرتے ہیں۔
دستاویز سے بھرپور ہاسپیٹیلیٹی ورک فلوز کے لیے API پلانز کے لیے pricing دیکھیں۔
anonym.legal مکمل checksum validation کے ساتھ AFM اور AMKA کی شناخت کرتا ہے۔ یہ spaCy el_core_news پائپ لائن کے ذریعے یونانی اسکرپٹ NER کو سپورٹ کرتا ہے۔