anonym.legal
Назад към блогаGDPR и съответствие

Откриване на PII на немски език: Защо съответствието...

BfDI отчете 27 829 уведомления за нарушения през 2024 г. — рекорд за всички времена в Германия.

April 21, 20269 мин. четене
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

Германия съобщи за 27 829 уведомления за нарушение на защитата на данните до Bundesdatenschutzbeauftragte (BfDI) и 16 DPA на държавно ниво през 2024 г. — нов рекорд за всички времена и 31% от всички уведомления за нарушение на GDPR в ЕС. Мащабът на докладването на нарушения в Германия отразява както плътността на правоприлагането, така и системния технически пропуск: 65% от германските предприятия използват инструменти за откриване на PII на английски език с неадекватна поддръжка на немски език.

Трислойната структура на правоприлагането в Германия

Прилагането на германския GDPR е уникално сложно, тъй като прилагането е разделено на 17 органа:

BfDI (Федерален комисар): Юрисдикция над федералните власти, телекомуникациите, пощенските услуги и организациите с междущатски операции.

16 Landesdatenschutzbehörden (щатски DPA): Всяка германска провинция има свой собствен DPA с независим правоприлагащ орган за организациите в тази държава. Най-активните държавни DPA:

  • Байерн (Бавария): Bayerisches Landesamt für Datenschutzaufsicht (BayLDA) — сред най-технически взискателните DPA в ЕС
  • Хамбург: Der Hamburgische Beauftragte für Datenschutz und Informationsfreiheit — пионер в правоприлагането срещу американските оператори на платформи
  • Baden-Württemberg: Der Landesbeauftragte für den Datenschutz und die Informationsfreiheit (LfDI BW) — издаде първото специално за AI ръководство DSGVO в Германия

Тази трислойна структура означава, че германските организации са изправени пред принудителни мерки от федерално и щатско ниво едновременно. BayLDA одитира 250+ организации през 2024 г., изпращайки въпросници за защита на данните, които изискват документирани технически описания на мерките.

Сложността на DACH: Три режима, един език

Немскоговорящите организации в региона DACH (Германия, Австрия, Швейцария) работят съгласно три различни регулаторни рамки с различни технически изисквания:

Германия: ЕС GDPR + BfDI/Landesdatenschutzbehörden прилагане. Специфични за немски идентификатори: Steueridentifikationsnummer (11 цифри), Personalausweis (10 знака), формат IBAN/DE.

Австрия: ЕС GDPR + DSB изпълнение. Австрийски идентификатори: Sozialversicherungsnummer (SVNR, 10 цифри), eAT (електронно разрешение за пребиваване), FinanzOnline номер.

Швейцария: revDSG (нов швейцарски федерален закон за защита на данните, в сила от септември 2023 г.) — не е GDPR на ЕС, но тясно моделирано. Швейцарски идентификатори: AHV-номер (13 цифри, формат 756.XXXX.XXXX.XX), UID (идентификация на фирмата).

Организациите, работещи във всичките три DACH държави, се нуждаят от инструмент за PII, който обработва текст на немски език и националните идентификатори на трите държави — плюс DSG на Лихтенщайн (четвърта малка рамка за малкото княжество между Швейцария и Австрия).

Германски национални идентификатори

Steueridentifikationsnummer (Steuer-ID): 11-цифрен постоянен данъчен идентификационен номер, присвоен на всички жители на Германия от раждането им. Формат: ненулева първа цифра + 10 допълнителни цифри + контролна цифра (използване на модулен алгоритъм). Появява се във всички германски данъчни, трудови и финансови документи.

Personalausweisnummer: Номер на германската национална лична карта във формат LNNNNNNNC (1 буква + 8 цифри + 1 контролен знак). Контролният знак се изчислява с помощта на алгоритъм за претеглена сума. Всеки германски гражданин и жител на ЕС в Германия има Personalausweis номер.

Sozialversicherungsnummer (SV-Nummer): Формат: NNDDMMYYAAAA (2-цифрен регионален код + дата на раждане DDMMYY + 2-буквен инициал на името + контролна цифра). Използва се в трудови и пенсионни досиета.

Немски IBAN: Формат DE + 2 контролни цифри + 8-цифрен банков код (Bankleitzahl, BLZ) + 10-цифрен номер на сметка. IBAN валидирането с помощта на контролни цифри mod-97 е стандартно, но специфичният за Германия формат на банков код изисква допълнително валидиране.

Krankenversicherungsnummer (KVNr): 10-знаков здравноосигурителен номер (1 буква + 9 цифри). Писмото идентифицира застрахователя; цифрите включват контролна цифра.

65% разлика в инструментите

Проучването на BfDI от 2024 г. установи, че 65% от германските предприятия използват инструменти за лична информация с неадекватна поддръжка на немски език. Конкретните документирани грешки:

Откриване на Steuer-ID: Съвпадение по шаблон без проверка на контролна цифра, генериране на фалшиви положителни резултати от всяка 11-цифрена числова последователност в немски документи.

Откриване на Personalausweis: Пропуска се, когато форматът се показва без изричен етикет „Personalausweis“ в документи — контекстното откриване изисква NER на немски език, за да идентифицира типа на документа.

Разпознаване на немски имена: Моделите NLP, обучени на английски текст, не разпознават немски имена, особено сложни имена (Ханс-Вилхелм, Анна-Катарина) и специфични за немски умлаути (Мюлер, Шрьодер, Бьом).

**Немски адресни формати: ** Немските адреси (Straße, Platz, Weg, Gasse) се различават от английските адресни структури. Моделите, анализиращи немски адреси с англоезични парсери, създават систематични грешки.

За съответствие с техническите изисквания на BfDI, BayLDA и други немски DPA, стандартът е: NER на немски език (spaCy de_core_news или еквивалент), откриване на Steuer-ID и Personalausweis с проверка на контролна сума, поддръжка на SVNR за австрийски документи и поддръжка на AHV-Nummer за швейцарски документи.

Източници:

Готови ли сте да защитите данните си?

Започнете анонимизация на PII с 285+ типа субекти на 48 езика.