anonym.legal
กลับไปที่บล็อกเทคนิค

โครงสร้างของ Tax ID ส่วนที่นำหน้า: วิธี anonym.legal...

Tax ID ของเยอรมัน ฝรั่งเศส และสเปนใช้คำนำหน้าที่ไม่ซ้ำกัน เครื่องมือ regex อายุมักจดจำตัวเลข 11 หลักแบบสุ่ม เป็น German Steuer-ID ได้ถึง 4,000 false...

April 3, 20268 อ่านประมาณ
false positive ratePresidio precisionPII detection accuracyscore threshold configurationhybrid detection

ปัญหา: False Positive ของ Tax ID

German Steuer-ID (11 หลัก)

โครงสร้าง: ab cde fgh ijk (ว่างห่างจากตำแหน่ง 2, 5, 8, 11)

Checksum algorithm:

  • ใช้ Luhn + modulo 11
  • ตัวเลข 1-10: คูณสลับด้วย 2 และ 3
  • ตัวเลข 11: checksum

French NIR (15 หลัก)

โครงสร้าง: YYMMDDCCOOOSSS

  • YY: Year of birth
  • MM: Month (01-12)
  • DD: Day (01-31)

Checksum: 97 - (NIR mod 97)

Spanish DNI (9 chars)

โครงสร้าง: XXXXXXXX-L

  • 8 หลัก
  • 1 ตัวอักษร (เฉพาะสำหรับแต่ละ modulo 23)

ผลกระทบ

บันทึก 1,000,000 ต่อเดือน:

Regex toolfalse positiveRedacted ที่ไม่ถูกต้อง
Typical regex4%40,000 records
anonym.legal + checksum0.1%1,000 records

พร้อมที่จะปกป้องข้อมูลของคุณหรือยัง?

เริ่มทำให้ PII เป็นนิรนามด้วยประเภทเอนทิตีมากกว่า 285 ประเภทใน 48 ภาษา.