Греческий орган по защите данных (HDPA) вынес 89 решений в области правоприменения в 2024 году — рост на 162% по сравнению с 34 решениями в 2022-м. Резкое ускорение правоприменения отражает как рост потенциала HDPA, так и отраслевые сбои соответствия в туризме — на который приходится 38% дел HDPA — и в морских операциях.
AFM: основной коммерческий идентификатор Греции
ΑΦΜ (Αριθμός Φορολογικού Μητρώου, номер налогового реестра) — 9-значный номер, присваиваемый всем греческим гражданам, резидентам и компаниям для налогового администрирования. Контрольная цифра использует алгоритм взвешенной суммы: умножить цифры 1–8 на веса (256,128,64,32,16,8,4,2), суммировать, взять по модулю 11. Если результат = 10, номер недействителен. В противном случае контрольная цифра = результат по модулю 10.
AFM фигурирует во всех греческих коммерческих документах — счетах-фактурах, договорах, трудовых соглашениях и государственных формах. Это основной коммерческий идентификатор как для физических лиц, так и для компаний в Греции.
Точность обнаружения: Универсальные инструменты NLP обнаруживают AFM с точностью 52% (анализ HDPA 2024). Причины сбоев:
- 9-значный формат AFM совпадает со многими справочными номерами и компонентами дат в греческих документах
- Двухшаговая контрольная цифра по modulo-11/modulo-10 с весами нечасто реализуется в универсальных инструментах
- Греческие документы часто представляют AFM без явного ярлыка в контексте (встроен в адресные блоки, без пометки «ΑΦΜ:»)
AMKA: идентификатор греческого социального страхования
ΑΜΚΑ (Αριθμός Μητρώου Κοινωνικής Ασφάλισης, номер реестра социального страхования) — 11-значный номер, кодирующий дату рождения и пол:
- Цифры 1–6: дата рождения в формате DDMMYY
- Цифра 7: пол (нечётная = мужской, чётная = женский)
- Цифры 8–11: порядковый номер с контрольной цифрой
Кодирование даты рождения + пола делает AMKA структурно схожим со шведским personnummer — и создаёт ту же проблему специальных категорий GDPR: номер раскрывает биологический пол как факт записи.
AMKA фигурирует во всех греческих медицинских документах, декларациях социального страхования и записях работодателей. Каждый греческий гражданин и законный резидент имеет AMKA, что делает его эквивалентом номера социального страхования для доступа к медицинским и социальным льготам.
Греческий алфавит: проблема инфраструктуры NLP
Греческий текст использует греческий алфавит — совершенно другую систему письма по сравнению с языками на латинице. Это создаёт фундаментальную инфраструктурную проблему для обнаружения PII:
Диапазоны Unicode: Греческие символы занимают диапазон Unicode U+0370–U+03FF (блок «Греческий и Коптский») и U+1F00–U+1FFF (расширенный греческий для политонических форм). Инструменты, обрабатывающие только ASCII или расширенную латиницу, не могут обрабатывать греческий текст вообще.
Греческие модели NER: Модель spaCy el_core_news обеспечивает возможность греческого NER, но требует явной конфигурации для греческого языка. Организации, использующие конфигурации по умолчанию (как правило, английские), не получат никакого вывода для документов на греческом письме.
Документы со смешанными письменностями: Греческие деловые и государственные документы часто смешивают греческое письмо (основное содержание) с латиницей (торговые марки, технические термины, аннотации на английском). Пайплайны NLP должны обрабатывать обе письменности в одном документе.
Распознавание имён на греческом: Греческие имена встречаются в именительном падеже (Γεώργιος Παπαδόπουλος), а также в формах родительного/винительного падежа в греческих предложениях (Γεωργίου Παπαδόπουλου в родительном). Падежно-осведомлённое распознавание в NER требует греческого морфологического анализа.
Туристический сектор: соответствие при сезонной обработке данных
На туризм приходится 38% правоприменительных дел HDPA. Проблема соответствия — масштаб и сезонность:
Системы PMS отелей: Системы управления объектами обрабатывают полную информацию о гостях — номера паспортов, гражданство, даты рождения, контактные данные — для всех гостей. Правоприменение HDPA выявило, что многие системы PMS отелей хранят данные гостей более 5 лет без задокументированной цели и без мер безопасности, соразмерных объёму данных.
IBAN и платёжные данные: Греческий туристический бизнес обрабатывает платёжные данные гостей из ЕС и других стран. Карточки гостей (счета отеля) содержат частичные номера карт; системы бронирования — полные платёжные данные с датами истечения срока. Требования PCI DSS пересекаются с требованиями GDPR для платёжных данных.
Текучесть персонала: Сезонные работники в гостиничном бизнесе обычно работают по договорам на 4–6 месяцев. Правоприменение HDPA выявило повторяющиеся сбои при отзыве доступа к системам для ушедших сезонных сотрудников — шаблон, характерный для любой отрасли с высокой текучестью персонала.
Для соответствия HDPA в грекоязычных контекстах: обнаружение AFM и AMKA с проверкой контрольной суммы, поддержка NER на греческом алфавите (spaCy el_core_news) и обнаружение греческих паспортов/национальных удостоверений личности — технические требования. Для соответствия в туристическом секторе — документация сроков хранения данных PMS отелей и процедуры отзыва доступа сезонного персонала как дополнительные организационные требования, ясно обозначенные правоприменением HDPA.
Источники: