Гръцкият орган за защита на данните (HDPA) издаде 89 решения за принудително изпълнение през 2024 г., което е 162% увеличение от 34 решения през 2022 г. Рязкото ускоряване на принудителното изпълнение отразява както нарастващия капацитет на HDPA, така и специфичните за сектора несъответствия в туризма — което представлява 38% от HDPA случаи — и морски операции.
AFM: Основен търговски идентификатор на Гърция
ΑΦΜ (Αριθμός Φορολογικού Μητρώου, данъчен регистрационен номер) е 9-цифрен номер, присвоен на всички гръцки граждани, жители и фирми за данъчна администрация. Контролната цифра използва алгоритъм за претеглена сума: умножете цифрите 1-8 по тегла (256,128,64,32,16,8,4,2), сумата, вземете модул 11. Ако резултат = 10, числото е невалидно. В противен случай контролна цифра = резултат по модул 10.
AFM се появява във всички гръцки търговски документи — фактури, договори, трудови договори и държавни формуляри. Това е основният търговски идентификатор както за физически лица, така и за фирми в Гърция.
**Точност на откриване: ** Генеричните инструменти NLP откриват AFM с 52% точност (анализ HDPA 2024). Режими на повреда:
- 9-цифреният формат на AFM съвпада с много референтни номера и компоненти за дата в гръцки документи
- Претеглената двустепенна контролна цифра по модул-11/модуло-10 не се прилага често в общи инструменти
- Гръцките документи често представят AFM без изричен етикет в контекста (вграден в адресни блокове, без етикет "ΑΦΜ:")
AMKA: Социалноосигурителен идентификатор на Гърция
ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, социалноосигурителен регистрационен номер) е 11-цифрен номер, кодиращ рождена дата и пол:
- Цифри 1-6: Рождена дата във формат DDMMYY
- Цифра 7: Пол (нечетен = мъж, четен = женски)
- Цифри 8-11: Пореден номер с контролна цифра
Датата на раждане + кодирането на пола прави AMKA структурно подобен на шведския personnummer — и създава същата загриженост за специална категория GDPR: номерът разкрива биологичния пол като документ.
AMKA се появява във всички гръцки здравни документи, документи за социално осигуряване и досиета на работодатели. Всеки гръцки гражданин и законно пребиваващ има AMKA, което го прави еквивалентен на социалноосигурителен номер за достъп до здравеопазване и социални помощи.
Гръцка азбука: Инфраструктурното предизвикателство NLP
Гръцкият текст използва гръцката азбука - напълно различна писмена система от езиците с латиница. Това създава фундаментално инфраструктурно предизвикателство за откриване на PII:
**Unicode диапазони: ** Гръцките знаци заемат Unicode диапазон U+0370 до U+03FF (гръцки и коптски блок) и U+1F00 до U+1FFF (гръцки разширен за политонични форми). Инструментите, които обработват само ASCII или латински разширени знаци, изобщо не успяват да обработят гръцки текст.
Гръцки NER модели: Моделът el_core_news на spaCy осигурява възможност за гръцки NER — но изисква изрична конфигурация на гръцки език. Организации, използващи конфигурации на език по подразбиране (обикновено английски), няма да получат изход за документи на гръцки шрифт.
**Документи със смесени азбуки: ** Гръцките бизнес и правителствени документи често смесват гръцка азбука (основно съдържание) с латиница (имена на марки, технически термини, анотации на английски). NLP тръбопроводите трябва да обработват и двата скрипта в един и същи документ.
Разпознаване на имена на гръцки: Гръцките имена се появяват в именителен падеж (Γεώργιος Παπαδόπουλος), но също и във форми за родителен/обвинителен падеж в гръцките изречения (Γεωργίου Παπαδόπουλου в родителен падеж). Разпознаването на NER с малки и големи букви изисква гръцки морфологичен анализ.
Туристически сектор: Съответствие на сезонната обработка на данни
Туризмът представлява 38% от делата за изпълнение на HDPA. Предизвикателството за съответствие е мащабът и сезонността:
Хотелски PMS системи: Системите за управление на имоти обработват пълна информация за гостите — номера на паспорти, националност, дати на раждане, данни за контакт — за всички гости. Прилагането на HDPA установи, че много хотелски PMS системи съхраняват данни за гости в продължение на 5+ години без документирана цел и без мерки за сигурност, пропорционални на обема на данните.
**IBAN и данни за плащане: ** Гръцкият туристически бизнес обработва данни за плащания от гости от ЕС и от чужбина. Фолиата за гости (сметките на хотела) съдържат частични номера на карти; резервационните системи съдържат пълни данни за плащане с дати на изтичане. Съответствието с PCI DSS се припокрива с изискванията на GDPR за данни за плащане.
Текучество на данни за персонала: Сезонните работници в хотелиерството обикновено изпълняват договори за 4-6 месеца. Прилагането на HDPA установи повтарящи се неуспехи при отмяна на достъпа до системата за напуснали сезонни служители – модел, общ за всяка индустрия с високо текучество на служители.
За съответствие с HDPA в контекст на гръцки език: откриване на AFM и AMKA с проверка на контролна сума, поддръжка на NER за гръцка азбука (spaCy el_core_news) и откриване на гръцки паспорт/национална лична карта са техническите изисквания. Конкретно за спазването на туристическия сектор, документацията за запазване на данни на PMS на хотела и процедурите за отмяна на достъп на сезонен персонал са допълнителните организационни изисквания, които прилагането на HDPA изяснява.
Източници: