anonym.legal
Назад к блогуGDPR и соблюдение

Обнаружение персональных данных на немецком языке...

BfDI зафиксировало 27 829 уведомлений о нарушениях в 2024 году — абсолютный рекорд для Германии.

April 21, 20269 мин чтения
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

В 2024 году Германия направила 27 829 уведомлений о нарушениях в сфере защиты данных в Федеральное управление по защите данных и свободе информации (BfDI) и 16 земельных органов по защите данных — абсолютный рекорд, составивший 31% от всех уведомлений о нарушениях EU GDPR. Масштаб уведомлений о нарушениях в Германии отражает как высокую плотность правоприменения, так и системный технический пробел: 65% немецких предприятий используют англоязычные инструменты обнаружения персональных данных с недостаточной поддержкой немецкого языка.

Трёхуровневая структура правоприменения Германии

Правоприменение GDPR в Германии уникально сложно, поскольку распределено между 17 органами власти:

BfDI (Федеральный комиссар): Юрисдикция в отношении федеральных органов власти, телекоммуникаций, почтовых услуг и организаций с межземельными операциями.

16 Landesdatenschutzbehörden (земельные органы по защите данных): Каждая федеральная земля Германии имеет собственный орган по защите данных с независимыми полномочиями правоприменения в отношении организаций в этой земле. Наиболее активные земельные органы:

  • Бавария: Bayerisches Landesamt für Datenschutzaufsicht (BayLDA) — один из технически наиболее требовательных органов по защите данных в ЕС
  • Гамбург: Der Hamburgische Beauftragte für Datenschutz und Informationsfreiheit — первым начал правоприменение в отношении операторов американских платформ
  • Баден-Вюртемберг: Der Landesbeauftragte für den Datenschutz und die Informationsfreiheit (LfDI BW) — выпустил первое в Германии руководство по DSGVO, специфичное для ИИ

Эта трёхуровневая структура означает, что немецкие организации одновременно сталкиваются с правоприменением на федеральном и земельном уровнях. В 2024 году BayLDA проверило более 250 организаций, направив им анкеты по защите данных с требованием описать технические меры.

Сложность региона DACH: три режима, один язык

Немецкоязычные организации в регионе DACH (Германия, Австрия, Швейцария) работают в рамках трёх различных регуляторных систем с разными техническими требованиями:

Германия: EU GDPR + правоприменение BfDI/Landesdatenschutzbehörden. Немецкие идентификаторы: Steueridentifikationsnummer (11 цифр), Personalausweis (10 знаков), IBAN/формат DE.

Австрия: EU GDPR + правоприменение DSB. Австрийские идентификаторы: Sozialversicherungsnummer (SVNR, 10 цифр), eAT (электронное разрешение на проживание), номер FinanzOnline.

Швейцария: revDSG (новый Федеральный закон Швейцарии о защите данных, вступивший в силу в сентябре 2023 года) — не EU GDPR, но в значительной мере основан на нём. Швейцарские идентификаторы: AHV-Nummer (13 цифр, формат 756.XXXX.XXXX.XX), UID (идентификационный номер компании).

Организациям, работающим во всех трёх странах DACH, необходим инструмент PII, обрабатывающий немецкоязычный текст и национальные идентификаторы всех трёх стран, — а также Liechtenstein DSG (четвёртая второстепенная система для небольшого княжества между Швейцарией и Австрией).

Немецкие национальные идентификаторы

Steueridentifikationsnummer (Steuer-ID): 11-значный постоянный налоговый идентификационный номер, присваиваемый всем жителям Германии с рождения. Формат: ненулевая первая цифра + 10 следующих цифр + контрольная цифра (по алгоритму на основе модуля). Фигурирует во всех немецких налоговых, трудовых и финансовых документах.

Personalausweisnummer: Номер немецкого удостоверения личности в формате LNNNNNNNC (1 буква + 8 цифр + 1 контрольный знак). Контрольный знак вычисляется по алгоритму взвешенной суммы. Каждый гражданин Германии и резидент ЕС в Германии имеет номер Personalausweis.

Sozialversicherungsnummer (SV-Nummer): Формат: NNDDMMYYAAAA (2-значный код района + дата рождения DDMMYY + 2-буквенный инициал имени + контрольная цифра). Используется в трудовых и пенсионных документах.

Немецкий IBAN: Формат DE + 2 контрольные цифры + 8-значный банковский код (Bankleitzahl, BLZ) + 10-значный номер счёта. Стандартная валидация IBAN по mod-97, однако немецкий формат банковского кода требует дополнительной проверки.

Krankenversicherungsnummer (KVNr): 10-значный номер медицинской страховки (1 буква + 9 цифр). Буква идентифицирует страховщика; цифры включают контрольную цифру.

Пробел в 65% инструментов

Опрос BfDI 2024 года показал, что 65% немецких предприятий используют инструменты PII с недостаточной поддержкой немецкого языка. Зафиксированные конкретные сбои:

Обнаружение Steuer-ID: Поиск по шаблону без проверки контрольной цифры порождает ложные срабатывания на любой последовательности из 11 цифр в немецких документах.

Обнаружение Personalausweis: Пропускается, когда формат встречается без явной пометки «Personalausweis» — контекстное обнаружение требует немецкого NER для определения типа документа.

Распознавание немецких имён: Модели NLP, обученные на английском тексте, не распознают немецкие имена, особенно составные (Hans-Wilhelm, Anna-Katharina) и содержащие умлауты (Müller, Schröder, Böhm).

Немецкие форматы адресов: Немецкие адреса (Straße, Platz, Weg, Gasse) отличаются от английских. Модели, разбирающие немецкие адреса с помощью английских парсеров, дают систематические ошибки.

Для соответствия техническим требованиям BfDI, BayLDA и других немецких органов по защите данных стандарт таков: немецкий NER (spaCy de_core_news или аналог), обнаружение Steuer-ID и Personalausweis с проверкой контрольной суммы, поддержка SVNR для австрийских документов и поддержка AHV-Nummer для швейцарских документов.

Источники:

Готовы защитить ваши данные?

Начните анонимизацию PII с 285+ типов сущностей на 48 языках.