anonym.legal

By · Last updated 2026-06-01

Назад до блогуGDPR та відповідність

Національні ID ЄС, які пропускає ваш PII-інструмент

Steueridentifikationsnummer Німеччини, Numéro fiscal Франції, Codice Fiscale Італії, NIF/NIE Іспанії — інструменти з фокусом на США виявляють SSN, але пропускають більшість ідентифікаторів ЄС.

June 1, 20267 хв читання
EU national identifiersSteueridentifikationsnummerCodice FiscaleNIFmultinational GDPRtax ID detection

Національні ID ЄС, які пропускає ваш PII-інструмент

Податкові ідентифікаційні номери є дуже чутливими. Вони з'являються на квитанціях про зарплату, податкових формах і банківських заявках. Якщо вони витікають, це уможливлює шахрайство та крадіжку особистих даних.

GDPR розглядає їх як персональні дані. Їхній реальний ризик є високим. Кожна країна ЄС використовує власний формат національного ідентифікатора. Більшість PII-інструментів були створені для ринку США або Великобританії. Вони легко знаходять SSN і NINO. Вони часто пропускають Steueridentifikationsnummer, Codice Fiscale та BSN. Це формати, які європейські команди обробляють щодня.

Ландшафт податкових ID ЄС

Кожна країна ЄС має власний формат. Ось найпоширеніші з них.

Німеччина — Steueridentifikationsnummer

Steuer-ID складається з 11 цифр. Вона присвоюється при народженні. Перша цифра — від 1 до 9 (ніколи 0). Три однакові цифри поспіль не з'являються. Приклад: 12345678901. Також використовується Steuernummer: 10–11 цифр, формат варіюється залежно від землі.

Франція — Numéro fiscal de référence

SPI складається з 13 цифр. Його видає DGFiP, французький податковий орган. На податкових документах він з'являється як «Identifiant fiscal».

Італія — Codice Fiscale

Codice Fiscale — 16 буквено-цифрових символів. Він кодує прізвище, ім'я, рік народження, місяць народження, день народження та муніципалітет. Приклад: RSSMRA85M01H501Z. Формат перевіряється за контрольною сумою.

Іспанія — NIF та NIE

Іспанські громадяни використовують номер DNI плюс контрольну літеру: 8 цифр + літера, наприклад 12345678A. Іноземні резиденти використовують NIE: префікс X/Y/Z + 7 цифр + контрольна літера, наприклад X1234567A. Юридичні особи використовують CIF: літера + 8 цифр, наприклад B12345678.

Нідерланди — BSN

BSN (Burgerservicenummer) — 9 цифр. Він використовує алгоритм перевірки 11-proef. Він дуже поширений у документах з нарахування зарплати та пільг.

Польща — PESEL

PESEL — 11 цифр. Перші 6 кодують дату народження. Останні цифри кодують стать і порядковий номер.

Бельгія — Numéro de registre national

RN — 11 цифр. Він кодує дату народження, порядковий номер і контрольні цифри.

Португалія — NIF

Португальський NIF (Número de Identificação Fiscal) — 9 цифр із контрольною цифрою. Абревіатура та сама, що у Іспанії, але формат різний.

Швеція — Personnummer

Personnummer — 10 або 12 цифр. Він кодує дату народження та порядковий номер. Формати: РРРРРММДД-ХХХХ або РРММДД-ХХХХ.

Фінляндія — Henkilötunnus

HETU — 11 символів. Він кодує дату, роздільник, порядковий номер і контрольний символ. Формат: ДДММРР-ХХХС.

Що пропускають стандартні інструменти

Інструменти для США та Великобританії включають ці патерни за замовчуванням:

  • SSN США (ХХХ-ХХ-ХХХХ).
  • NINO Великобританії (XX 99 99 99 X).
  • Номери паспортів США.
  • Патерни водійських посвідчень США.
  • Основні номери кредитних карток.

Національні ідентифікатори ЄС часто відсутні. Інструменти, побудовані на наборі розпізнавачів Presidio за замовчуванням, пропускають їх. Без розширень, специфічних для ЄС, покриття ЄС відсутнє.

Реальна прогалина у відповідності

Німецька компанія з нарахування зарплати обслуговує 500 клієнтських компаній. Її процес видаляє імена, електронні адреси, IBAN та номери телефонів. Але вона пропускає Steueridentifikationsnummern. Цей формат ніколи не був у стандартному налаштуванні.

Аудит наглядового органу виявляє нередаговані Steuer-ID у PDF-файлах квитанцій про зарплату. Компанія стикається з витратами на виправлення для минулих документів. Вона стикається з примусовим виконанням з боку наглядового органу за Статтею 83 GDPR. Вона стикається з договірною відповідальністю перед своїми клієнтами.

Прогалину не виявила компанія. Її знайшов регулятор першим.

Дивіться наш посібник з відповідності GDPR, щоб провести власну перевірку охоплення.

Пріоритетний порядок для охоплення ЄС

Додавайте патерни ідентифікаторів у такому порядку, якщо ви працюєте в кількох країнах ЄС.

Рівень 1 — Найбільший обсяг:

  1. Німеччина: Steueridentifikationsnummer.
  2. Франція: Numéro fiscal.
  3. Італія: Codice Fiscale.
  4. Іспанія: NIF/NIE.
  5. Нідерланди: BSN.

Рівень 2 — Значні, але менші ринки:

  1. Польща: PESEL.
  2. Бельгія: RN.
  3. Швеція: Personnummer.
  4. Португалія: NIF.
  5. Австрія: Sozialversicherungsnummer.

Рівень 3 — Конкретні випадки використання:

Інші 17 держав-членів ЄС. Додавайте залежно від того, де ваша команда обробляє дані.

Додавання Steueridentifikationsnummer

Німецький Steuer-ID — найкращий перший патерн для додавання. Його формат чіткий і добре задокументований.

Steuer-ID — 11 цифр. Перша цифра — від 1 до 9. Жодних трьох однакових цифр поспіль. Спеціальний алгоритм перевіряє контрольну цифру.

Опис простою мовою для генерації патерну: «Німецькі податкові номери: 11 цифр. Перша цифра від 1 до 9. Решта 10 цифр можуть включати нулі.»

Після генерації патерну тестуйте його на німецьких квитанціях про зарплату та податкових свідоцтвах. Перевірте частоту виявлення та кількість хибних спрацювань. Розгортайте лише після проходження валідації.

Додайте патерн до вашого пресету для документів німецькою мовою. Для наборів документів змішаними мовами поєднайте з виявленням мови. Це застосовує правильні патерни до правильних документів.

Один пресет чи кілька?

Варіант 1 — Пресети по країнах:

Створіть один пресет для кожної країни. Маршрутизуйте документи за походженням. Це дає нижчий рівень хибних спрацювань. Вимагає більшої логіки маршрутизації.

Варіант 2 — Комбінований пресет ЄС:

Створіть один пресет з усіма активними патернами ідентифікаторів ЄС. Це простіше у використанні. Має вищий ризик хибних спрацювань на загальному тексті. Добре працює, коли ідентифікатори очікуються протягом усього документа.

Для документів з нарахування зарплати: використовуйте Варіант 1 із маршрутизацією за походженням. Для наборів документів змішаних типів: використовуйте Варіант 2 із налаштуванням порогу.

Дивіться огляд безпеки та відповідності, щоб дізнатися, як конфігурація пресетів вписується у повний процес відповідності.

Закрийте прогалину до аудиту

GDPR застосовується однаково в кожній державі-члені ЄС. Інструменти, побудовані для США, часто — ні. Codice Fiscale, BSN і Steuer-ID несуть той самий ризик, що й SSN. Вони з'являються так само часто у спільних документах.

Патерни спеціальних сутностей закривають прогалину виявлення за кілька годин. Додайте патерн Steuer-ID. Тестуйте його на зразкових квитанціях про зарплату. Розгортайте у всіх процесах. Не чекайте на постачальника інструменту. Не чекайте, поки наглядовий орган знайде прогалину.


anonym.legal дозволяє додавати спеціальні типи сутностей через інтерфейс конфігурації пресетів. Патерни валідуються на ваших зразкових документах до розгортання.

Джерела

Готові захистити свої дані?

Почніть анонімізувати PII з 285+ типами сутностей на 48 мовах.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.