By · Last updated 2026-06-05

Späť na blogGDPR a Dodržiavanie

Detekcia nemeckych osobnych udajov pre suladnost s DSGVO

BfDI zaznamenal v roku 2024 celkom 27 829 hlásení o narušení — novy rekord v Nemecku. 65 % nemeckych firiem pouzíva nástroje s nedostatocnou podporou nemciny pre detekciu osobnych udajov.

June 5, 20269 min čítania
Germany BfDIDACH complianceSteuer-ID detectionGerman language PIIDSGVO technical

Nemecká detekcia osobnych udajov pre suladnost s DSGVO

Stav: 2026

Nemecko nahlásilo v roku 2024 celkom 27 829 narušení ochrany osobnych udajov BfDI a 16 krajinským orgánom ochrany údajov — novy absolutny rekord. To zodpovedá 31 % všetkych hlásení DSGVO v EÚ. Tieto cisla neukazujú iba aktívnu kultúru hlásenia. Poukazujú aj na technickú medzeru: 65 % nemeckych firiem pouzíva nastroje na detekciu osobnych udajov s nedostatocnou podporou nemciny.

Trojúrovnova kontrola v Nemecku

Presadzovanie DSGVO v Nemecku je zlozité. Distribuuje sa medzi 17 orgánov.

BfDI (Spolkový splnomocnenec): Príslusný pre spolkové orgány, telekomunikáciu, postové sluzby a organizácie pôsobiace vo viacerych spolkových krajinách.

16 krajinských orgánov ochrany údajov: Kazda spolková krajina má vlastný orgán s nezávislymi presadzovaciami právomocami. Najaktívnejsie orgány:

  • Bayern – BayLDA: Considerovany za jeden z technicky najnárocnejsich orgánov ochrany udajov v EÚ. V roku 2024 auditoval viac ako 250 organizácií.
  • Hamburg: Priekopník pri presadzovaní pravidiel voci americkym platforemným prevádzkovatelom.
  • Baden-Württemberg – LfDI BW: Vydal prvé usmernenie DSGVO špecifické pre umelú inteligenciu v Nemecku.

Firmy v Nemecku môzu byt kontrolované súcasne na spolkovej aj krajinskoj úrovni. To podstatne zvysuje poziadavky na dokumentáciu.

Zlozitost DACH: Tri právne rámce, jeden jazyk

Nemecky hovoriace organizácie v oblasti DACH pracujú v troch rôznych právnych rámcoch.

Nemecko: EU-DSGVO s BfDI a krajinskimi orgánmi ochrany udajov. Specificke identifikátory: danové identifikacné cislo (11 cifier), cislo obcianského preukazu (10 znakov), IBAN vo formáte DE.

Rakúsko: EU-DSGVO s presadzovaním cez DSB. Rakúske identifikátory: cislo socialneho poistenia (SVNR, 10 cifier), eAT (elektronický pobytový titul), cislo FinanzOnline.

Svajciarsko: revDSG (v platnosti od septembra 2023) — nie EU-DSGVO, ale úzko zladené. Svajciarske identifikátory: cislo AHV (13 cifier, formát 756.XXXX.XXXX.XX), UID (identifikácia podniku).

Kto pôsobí vo vsetkych troch krajinách, potrebuje nástroj na detekciu osobnych udajov, ktorý spracúva nemecky text aj vsetky tri národné identifikátory. K tomu sa pridata liechtensteinsky DSG ako stvrty rámec.

Nemecké identifikátory podrobne

Danové identifikacné cislo (Steuer-ID): 11-miestne danove ID pridelované nemeckym obyvatelom od narodenia. Prvá cifra nesmie byt nula. Kontrolná cifra na konci sa vypocíta pomocou algoritmu modulo. Vyskytuje sa vo vsetkych nemeckych danových, pracovnych a financnych dokumentoch.

Cislo obcianského preukazu: Formát LNNNNNNNC (1 písmeno + 8 cifier + 1 kontrolny znak). Kontrolny znak sa urcí algoritmom vá¿eného sú¿tu. Kazdy nemecky obcan a kazdy obcan EÚ s pobytom v Nemecku ma cislo obcianského preukazu.

Cislo socialneho poistenia (SV-Nummer): Formát NNDDMMYYAAAA (2-ciferny kód oblasti + dátum narodenia + 4 menne cifry). Nie je len císelný vzor — kóduje demografické údaje. Generické nástroje ho vynechávajú, pretoze neimplementujú logiku kódovania oblasti.

IBAN vo formáte DE: DE + 2 kontrolné cifry + 8-ciferny kód banky + 10-ciferné cislo úctu. Celková dízka 22 znakov. Bankové IBAN sú osobné udaje, ked sú kombinované s menom majitela úctu.

Preco generické nástroje zlyhávajú pri nemcinych

Textová zlozitost: Nemcina vytvára zlozené podstatné mená, ktoré môzu obsahovat mená osôb ako casti dlhsich slov. Nastroje trénované na anglictine casto tieto mená prehliadnu.

Oslovenie: Nemcina rozlisuje formálne (Sie) a neformálne (du) oslovenie. Mená vo vete môzu byt skloñované. Nastroje bez nemeckej morfológie zlyhávajú pri identifikácii.

Kompozíta: Jedno dlhé nemecke slovo môze kódovat celyinformacny retazec. Naprí¿lad "Steuernummerprüfung" obsahuje danové identifikátor vo väcsej zlozenine.

Nemecká suladnost s DSGVO: Technické kroky

  1. Pokrytie identifikátorov: Nástroj musí detekovať Steuer-ID s kontrolou modulo, cislo obcianského preukazu s kontrolou vázeného sú¿tu a SV-Nummer s dekódovaním oblasti.
  2. Nemecky NER: Trénovaný na nemeckych textoch — nie iba preklad z anglictiny. Pouzite modely ako spaCy de_core_news.
  3. Trojúrovnová kontrola: Dokumentujte pre BfDI aj príslusny krajinský orgán.
  4. DACH pokrytie: Pokial pôsobíte v Rakúsku alebo Svajciarsku, rozsírte detekciu na SVNR, AHV a UID.
  5. Záznamy o narušení: BfDI vyzaduje 72-hodinové hlásenie. Bezchybné záznamy sú nevyhnutné.

BayLDA v roku 2024 auditoval viac ako 250 organizácií. Firmy bez dokumentovanej detekcie Steuer-ID celia pokutam a nápravnym opatreniam.

Pozrite si, ako anonym.legal zabezpecuje detekciu nemeckych identifikátorov: /entities.

Pripravení chrániť vaše údaje?

Začnite anonymizovať PII s 285+ typmi entít v 48 jazykoch.

About this page

We update this page when our platform or the law changes.

Read our founder note for how we work.

Each change shows up in the timestamp at the top.

Related reading

We follow these rules

  • GDPR (EU 2016/679).
  • ISO/IEC 27001:2022.
  • NIS2 (EU 2022/2555).
  • HIPAA safe harbor under 45 CFR § 164.514(b)(2).

Our promise

We do not sell your data.

We do not train models on your text.

We store your files in Germany.

You can delete your account at any time.

You own your work.

Where we run

Our servers live in Falkenstein, Germany.

We use Hetzner. They hold ISO 27001 certification.

All data stays in the EU.

Backups run every day.

Need help?

Email support@anonym.legal.

We reply within one business day.

How we test

We run a full check suite on every release.

Each surface gets its own sweep script and report.

Human reviewers spot-check the output each week.

We track recall and precision on a labelled set.

Bad runs block the deploy.

What we never do

  • We never sell your information to third parties.
  • We never train models on what you upload.
  • We never keep your work after you delete it.
  • We never share keys with any outside firm.
  • We never run ads inside the product.

Plans in plain words

We sell credits, not seats.

One credit covers one short job.

Long jobs use a few credits each.

You can top up at any time.

Unused credits roll over each month.

Read the plans page for current rates.

Who built this

A small team of engineers and lawyers built this.

We ship from Europe and work in the open.

Our founder note spells out why we started.

Where to start

How the parts fit

A browser add-on cleans text inside Chrome.

A Word plug-in handles drafts in Office.

A small desktop tool works on whole folders.

An agent protocol link feeds large models safely.

All four share one core engine and one rule set.

Words from our team

We started this work after a lunch about cookies.

One friend kept getting odd ads on her phone.

We asked why a court file leaked through a draft.

We sketched the first build on a napkin that week.

By month three we had a tiny demo for a friend.

She used it on her first case the next day.

Common questions we hear

Can the tool read scanned PDFs? Yes, with OCR.

Does it work on long files? Yes, in small chunks.

Can I roll my own rule set? Yes, save it as a preset.

Does it run offline? The desktop build runs offline.

Do you keep my files? No, the cloud build wipes after each run.

Will it learn from my work? No, we never train on inputs.

A short tour of the workflow

Upload a file or paste a snippet of prose.

Pick the entities you want gone from the draft.

Choose a method: replace, mask, hash, encrypt, or redact.

Press run and watch the side panel show each hit.

Skim the result and tweak any rule that misfired.

Save the cleaned file or send it to a teammate.