Powrót do blogaGDPR i zgodność

Luka w identyfikatorach UE: Dlaczego narzędzia PII...

Ogólne narzędzia PII są zbudowane wokół amerykańskich identyfikatorów. Niemiecka Steuer-ID, francuskie NIR...

April 20, 20268 min czytania
EU identifier gapSteuer-ID detectionFrench NIR anonymizationSwedish PersonnummerNordic identifier GDPR

Dlaczego europejskie identyfikatory są strukturalnie różne

Narzędzia PII stworzone w USA zakładają strukturę identyfikatora opartą na amerykańskich formatach: numery ubezpieczenia społecznego (AAA-BB-CCCC), amerykańskie numery telefonów (XXX-XXX-XXXX), formaty prawa jazdy w USA według stanu oraz kody pocztowe w USA (XXXXX lub XXXXX-XXXX). Te narzędzia nie zostały zaprojektowane dla europejskich formatów identyfikatorów — a europejskie formaty nie są drobnymi wariacjami amerykańskich formatów. Są strukturalnie różne, kulturowo różne i prawnie zdefiniowane w ramach krajowego ustawodawstwa, które nie ma amerykańskiego odpowiednika.

Niemiecka Steuer-ID ilustruje różnicę strukturalną. 11-cyfrowy numer wykorzystuje specyficzny algorytm kontrolny — pierwsza cyfra nie może być 0, żadna cyfra nie może występować więcej niż trzy razy z rzędu, a matematyczna formuła dotycząca pozycji cyfr produkuje ostateczną cyfrę kontrolną. Algorytm walidacji jest publikowany przez Bundeszentralamt für Steuern. Wyrażenie regularne SSN w USA nie pasuje do Steuer-ID. Logika walidacji kontrolnej dla SSN nie zweryfikuje Steuer-ID.

Francuskie NIR (Numéro de Sécurité Sociale) ma 15 cyfr. Struktura ma znaczenie semantyczne: pozycja 1 koduje płeć (1 = mężczyzna, 2 = kobieta), pozycje 2–3 kodują ostatnie dwie cyfry roku urodzenia, pozycje 4–5 kodują miesiąc urodzenia, pozycje 6–7 kodują departament urodzenia, pozycje 8–10 kodują gminę, pozycje 11–13 kodują kolejność w gminie, a pozycje 14–15 to klucz kontrolny uzyskany przez podzielenie 13-cyfrowego numeru przez 97. NIR nie jest wykrywalny przez żadne wyrażenie regularne identyfikatora w formacie amerykańskim. Wymaga specyficznej dla kraju implementacji.

Luka w zgodności pan-europejskiej

Raport IBM na temat kosztów naruszenia danych w 2025 roku wykazał, że 10,22 miliona dolarów to średni koszt naruszenia danych w służbie zdrowia — najwyższy wśród wszystkich sektorów. Wysoki koszt naruszeń w sektorze zdrowia odzwierciedla zarówno ilość wrażliwych danych, jak i złożoność wymagań dotyczących zgodności. Gdy naruszenia dotyczą niewłaściwej de-identyfikacji udostępnionych danych badawczych — jak ma to miejsce w 50% przypadków naruszenia danych w służbie zdrowia — połączenie niewystarczającego wykrywania identyfikatorów UE i udostępnionych danych badawczych stwarza systemowe ryzyko.

Pan-europejski dostawca oprogramowania HR przetwarzający dokumenty onboardingowe dla klientów w 18 krajach UE za pomocą narzędzia PII stworzonego w USA nie wykrywa 14 z 18 krajowych identyfikatorów. Luka jest systemowa: każdy dokument przetworzony przez to narzędzie, który zawiera Steuer-ID, NIR, Personnummer, Fodselsnummer lub inny specyficzny dla UE identyfikator, pozostawia ten identyfikator narażony.

Wymagania dotyczące pełnego pokrycia UE

Minimalne pokrycie UE dla zgodności z GDPR wymaga:

DACH (Niemcy, Austria, Szwajcaria): Niemiecka Steuer-ID i Reisepass; austriacki Sozialversicherungsnummer; szwajcarski AHV-Nr (13-cyfrowy z cyfrą kontrolną)

Francja: NIR (15-cyfrowy numer ubezpieczenia społecznego), Carte Vitale, SIRET (14-cyfrowy), SIREN (9-cyfrowy)

Wielka Brytania (po Brexicie odpowiednik GDPR): NHS Number (10-cyfrowy), numer ubezpieczenia narodowego (format AA-NN-NN-NN-A), UTR (10-cyfrowy)

Kraje nordyckie: Szwedzki Personnummer (YYMMDD-XXXX), norweski Fodselsnummer (11-cyfrowy), fiński Henkilotunnus (DDMMYY-XXXX), duński CPR (DDMMYY-XXXX)

Południowa UE: Hiszpańskie DNI/NIE, włoski Codice Fiscale (16-znakowy alfanumeryczny), polski PESEL (11-cyfrowy), czeskie Rodne Cislo

Organizacje, które zastępują narzędzia stworzone w USA narzędziami z pełnym pokryciem UE, zazwyczaj odkrywają, że ich wcześniejsza de-identyfikacja osiągnęła 30–40% pokrycia identyfikatorów UE — pozostawiając większość europejskich krajowych identyfikatorów w swoich "de-zidentyfikowanych" zbiorach danych.

Źródła:

Gotowy, aby chronić swoje dane?

Rozpocznij anonimizację PII z 285+ typami podmiotów w 48 językach.