Bloga DönGDPR & Uyumluluk

HDPA Yunanistan: AFM ve AMKA Tespiti — Yunan Kimlikleri Neden %52 Genel NLP Araçlarında Başarısız Oluyor

Yunan AFM, genel araçlar tarafından %52 doğrulukla tespit edildi. HDPA, 2024'te 89 karar verdi — 2022'ye göre %162 artış. Turizm ve denizcilik sektörleri farklı uyum gereklilikleriyle karşı karşıya. Yunan alfabesi NER gereklilikleri.

March 7, 20267 dk okuma
Greece HDPAAFM AMKA detectionGreek alphabet NERtourism GDPRGreek identifiers

Yunanistan'ın Hellenic Data Protection Authority (HDPA), 2024'te 89 icra kararı verdi, bu 2022'deki 34 karara göre %162'lik bir artış. Keskin icra hızlanması, hem HDPA'nın artan kapasitesini hem de turizmdeki sektör spesifik uyum hatalarını yansıtmaktadır — bu, HDPA davalarının %38'ini oluşturmaktadır — ve denizcilik operasyonları.

AFM: Yunanistan'ın Temel Ticari Kimlik Numarası

ΑΦΜ (Αριθμός Φορολογικού Μητρώου, Vergi Kaydı Numarası), Yunan vatandaşları, sakinleri ve işletmeleri için vergi yönetimi amacıyla atanan 9 haneli bir numaradır. Kontrol haneleri, ağırlıklı toplam algoritması kullanır: 1-8 hanelerini ağırlıklarla (256,128,64,32,16,8,4,2) çarpın, toplayın, 11 ile mod alın. Eğer sonuç = 10 ise, numara geçersizdir. Aksi takdirde kontrol haneleri = sonuç mod 10.

AFM, tüm Yunan ticari belgelerinde — faturalar, sözleşmeler, istihdam sözleşmeleri ve devlet formları — yer alır. Hem bireyler hem de işletmeler için Yunanistan'daki birincil ticari kimlik numarasıdır.

Tespit doğruluğu: Genel NLP araçları AFM'yi %52 doğrulukla tespit etmektedir (HDPA 2024 analizi). Başarısızlık modları:

  • AFM'nin 9 haneli formatı, Yunan belgelerindeki birçok referans numarası ve tarih bileşeni ile eşleşmektedir
  • Ağırlıklı mod-11/mod-10 iki aşamalı kontrol haneleri, genel araçlarda yaygın olarak uygulanmamaktadır
  • Yunan belgeleri genellikle AFM'yi bağlamda açık bir etiket olmadan sunmaktadır (adres bloklarında gömülü, "ΑΦΜ:" olarak etiketlenmemiş)

AMKA: Yunanistan'ın Sosyal Sigorta Kimlik Numarası

ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, Sosyal Sigorta Kayıt Numarası), doğum tarihi ve cinsiyeti kodlayan 11 haneli bir numaradır:

  • Haneler 1-6: DDMMYY formatında doğum tarihi
  • Hane 7: Cinsiyet (tek = erkek, çift = kadın)
  • Haneler 8-11: Kontrol haneli ardışık numara

Doğum tarihi + cinsiyet kodlaması, AMKA'yı İsveç'in personnummer'ına yapısal olarak benzer hale getirir — ve aynı GDPR özel kategori endişesini yaratır: numara, kayıtlı bir mesele olarak biyolojik cinsiyeti açığa çıkarır.

AMKA, tüm Yunan sağlık belgelerinde, sosyal güvenlik dosyalarında ve işveren kayıtlarında yer alır. Her Yunan vatandaşı ve yasal sakin bir AMKA'ya sahiptir, bu da onu sağlık ve sosyal yardım erişimi için sosyal güvenlik numarasının eşdeğeri yapar.

Yunan Alfabesi: NLP Altyapı Zorluğu

Yunan metni, Latin alfabesinden tamamen farklı bir yazım sistemi olan Yunan alfabesini kullanır. Bu, PII tespiti için temel bir altyapı zorluğu yaratır:

Unicode aralıkları: Yunan karakterleri, Unicode aralığı U+0370 ile U+03FF (Yunan ve Koptik bloğu) ve U+1F00 ile U+1FFF (politonik formlar için Yunan Genişletilmiş) arasında yer alır. Sadece ASCII veya Latin Genişletilmiş karakterleri işleyen araçlar, Yunan metnini hiç işleyemez.

Yunan NER modelleri: spaCy'nin el_core_news modeli, Yunan NER yeteneği sağlar — ancak açık Yunan dili yapılandırması gerektirir. Varsayılan dil yapılandırmalarını (genellikle İngilizce) kullanan kuruluşlar, Yunan yazılı belgeler için hiçbir çıktı almayacaktır.

Karışık yazı belgeleri: Yunan iş ve devlet belgeleri genellikle Yunan yazısını (ana içerik) Latin yazısı (marka adları, teknik terimler, İngilizce açıklamalar) ile karıştırır. NLP boru hatları, aynı belgede her iki yazıyı da işlemek zorundadır.

Yunan adlarının tanınması: Yunan adları nominatif durumda (Γεώργιος Παπαδόπουλος) görünür, ancak Yunan cümlelerinde genitif/akkuzatif formlarda da (Γεωργίου Παπαδόπουλου genitifte) yer alır. Durum farkındalığına sahip NER tanıma, Yunan morfolojik analizini gerektirir.

Turizm Sektörü: Mevsimsel Veri İşleme Uyum

Turizm, HDPA icra davalarının %38'ini oluşturmaktadır. Uyum zorluğu ölçek ve mevsimselliktir:

Otel PMS sistemleri: Mülk yönetim sistemleri, tüm misafirler için tam misafir bilgilerini — pasaport numaraları, milliyet, doğum tarihleri, iletişim verileri — işler. HDPA icrası, birçok otel PMS sisteminin misafir verilerini 5+ yıl boyunca belgelenmiş bir amaç olmadan ve veri hacmine orantılı güvenlik önlemleri olmadan sakladığını bulmuştur.

IBAN ve ödeme verileri: Yunan turizm işletmeleri, AB ve uluslararası misafirlerden ödeme verilerini işler. Misafir folyoları (otel faturaları) kısmi kart numaralarını içerir; rezervasyon sistemleri, son kullanma tarihleri ile birlikte tam ödeme detaylarını içerir. PCI DSS uyumu, ödeme verileri için GDPR gereklilikleri ile örtüşmektedir.

Personel veri devir hızı: Misafirperverlikte mevsimlik işçiler genellikle 4-6 aylık sözleşmeleri tamamlar. HDPA icrası, ayrılan mevsimlik personel için sistem erişimini iptal etme konusunda tekrar eden hatalar bulmuştur — bu, yüksek çalışan devir hızı olan herhangi bir sektörde yaygın bir modeldir.

Yunan dilindeki HDPA uyumu için: AFM ve AMKA tespiti ile kontrol toplamı doğrulaması, Yunan alfabesi NER desteği (spaCy el_core_news) ve Yunan pasaportu/national ID tespiti teknik gerekliliklerdir. Özellikle turizm sektörü uyumu için, otel PMS veri saklama belgeleri ve mevsimlik personel erişim iptali prosedürleri, HDPA icrasının net bir şekilde belirttiği ek organizasyonel gerekliliklerdir.

Kaynaklar:

Verilerinizi korumaya hazır mısınız?

48 dilde 285+ varlık türü ile PII anonimleştirmeye başlayın.