anonym.legal
Назад на блоготТехнички

Мешовит јазик документи во DACH: Плаќање и...

Австриска банка што процесира документи на германски, австриски и швајцарско-германски откри дека 78% од PDF-и содржат мешовит јазик.

March 26, 20267 мин читање
mixed-language PII detectionSwiss GDPR compliancemultilingual document processingXLM-RoBERTaDACH data protection

Регионалната варијација на DACH

Терминологијата за PII варира во DACH регионот:

Германија: Steueridentifikationsnummer, Krankenversichertennummer, IBAN (DE89 3704 0044 0532 0130 00) Австрија: Sozialversicherungsnummer (SV-Nummer), Finanzamt, Steuer-ID Швајцарска: Assurance-maladie, Nummer des Ausweises, BSN (аналогно холандската)

Поздрав документот со мешовиност - договор што содржи германски текст со австриските услови, или швајцарско емаил со германски закупни цени. Алатката за откривање на PII што е дизајнирана за една варијант губи на другата.

Предизвик 1: Регионална номенклатура Истиот концепт има различни имиња: Steuer-ID (DE), Finanzamt-Nummer (AT), Numéro d'assuré (CH-FR). Модел обучен на германски Steuer-ID пропаѓа во швајцарски Numéro d'assuré.

Подготвени да ги заштитите вашите податоци?

Започнете со анонимизација на PII со 285+ типови на ентитети на 48 јазици.