title: "ข้อมูลส่วนบุคคลทางกฎหมาย: การตรวจหาสิทธิ์ความลับ" description: "หมายเลขอ้างอิงคดี หมายเลขทะเบียนทนายความ หมายเลขคดีของศาล และ ID เรื่องของลูกค้า คือตัวระบุที่มีความอ่อนไหวทางกฎหมายซึ่งเครื่องมือตรวจหาข้อมูลส่วนบุคคลทั่วไปไม่สามารถตรวจพบได้" category: legal-tech publishedAt: 2026-06-03 tags:
- attorney-client privilege
- legal document review
- case numbers
- law firm privacy
- legal tech readingTime: 7
สิทธิ์ความลับทนายความ-ลูกค้าในยุค AI: ข้อมูลส่วนบุคคลทางกฎหมายที่เครื่องมือทำให้ไม่ระบุตัวตนของคุณต้องตรวจพบ
เครื่องมือตรวจหาข้อมูลส่วนบุคคลทั่วไปจับชื่อ อีเมล และ SSN ได้ แต่พลาด ID เรื่องคดี หมายเลขทะเบียนทนายความ และป้ายกำกับเรื่องของลูกค้า ข้อมูลเหล่านี้มีความเสี่ยงด้านสิทธิ์ความลับอย่างจริงจัง เครื่องมือทั่วไปทิ้งช่องว่างนั้นไว้
สำนักงานกฎหมายส่งไฟล์ไปยังเครื่องมือ AI ทุกวัน ไฟล์เหล่านั้นมีตัวระบุที่อ่อนไหวต่อสิทธิ์ความลับซึ่งเครื่องมือมาตรฐานไม่สามารถตรวจจับได้
เมื่อสำนักงานกฎหมายส่งไฟล์ผ่านผู้ช่วย AI ไฟล์เหล่านั้นมี ID ทางกฎหมายควบคู่กับข้อมูลส่วนบุคคลมาตรฐาน:
- ป้ายกำกับเรื่องของลูกค้า: เชื่อมโยงกับไฟล์เรื่องทั้งหมดและระบุชื่อลูกค้า
- ID อ้างอิงคดี: รหัสที่ศาลกำหนดซึ่งผูกกับบันทึกสาธารณะที่มีรายละเอียดส่วนตัว
- หมายเลขทะเบียนทนายความ: ID ทนายความที่ค้นหาได้ในไดเรกทอรีของรัฐสาธารณะ
- รหัสคดีของศาล: เชื่อมกับระบบยื่นเอกสารสาธารณะที่มีประวัติคดีครบถ้วน
- รหัสการมอบหมายผู้พิพากษา: ระบุผู้พิพากษาที่ดูแลคดีในสถานการณ์ที่อ่อนไหว
สิ่งใดก็ตามที่ส่งให้ผู้จำหน่าย AI ภายนอก ก่อให้เกิดปัญหาสิทธิ์ความลับที่อาจเกิดขึ้น
เหตุใด ID เหล่านี้จึงต้องการการตรวจหาแบบกำหนดเอง
รูปแบบคดีของศาลเป็นไปตามรูปแบบระดับเขต ไม่มีรูปแบบเดียวที่ครอบคลุมศาลของรัฐบาลกลางและรัฐทั้งหมด
คดีแพ่งของรัฐบาลกลางใช้ปีสองหลัก แล้วตามด้วย "cv" และหมายเลขคดี คดีอาญาใช้ "cr" ในตำแหน่งเดียวกัน ศาลของรัฐแตกต่างกันตามภูมิภาคโดยไม่มีมาตรฐานร่วม
หมายเลขทะเบียนทนายความเป็นเฉพาะรัฐ แคลิฟอร์เนียใช้รูปแบบตัวเลข นิวยอร์กใช้รูปแบบทะเบียน เท็กซัสใช้รูปแบบ ID บาร์เป็นของตัวเอง ไม่มีรูปแบบระดับชาติ
ป้ายกำกับเรื่องของลูกค้าเป็นเฉพาะสำนักงาน แต่ละสำนักงานสร้างรูปแบบของตัวเอง ปี-ลูกค้า-เรื่อง รหัสกลุ่มงาน ID ลำดับ
เครื่องมือตรวจหาข้อมูลส่วนบุคคลมาตรฐานไม่สามารถรู้รูปแบบเหล่านี้ได้หากไม่มีการตั้งค่าแบบกำหนดเอง
ช่องว่างนี้มีอยู่จริง เครื่องมือเอกสารได้รับบริบทเรื่องทั้งหมด รหัสคดีเชื่อมกับบันทึกสาธารณะ ป้ายกำกับลูกค้ามีอยู่ เครื่องมือรายงานว่าลบข้อมูลส่วนบุคคลแล้ว ชื่อและอีเมลถูกลบออก ID ที่อ่อนไหวต่อสิทธิ์ความลับไม่ได้ถูกลบ
กรณีสตาร์ทอัพ Legal AI
สตาร์ทอัพ Legal AI สร้างเครื่องมือเอกสารสำหรับสำนักงานกฎหมาย ผลิตภัณฑ์สแกนไฟล์การค้นพบ ระบุข้อกำหนดที่เกี่ยวข้อง และทำเครื่องหมายเนื้อหาที่อาจมีสิทธิ์ความลับ ลูกค้าระดับองค์กรต้องการการลบป้ายกำกับเรื่องของลูกค้าควบคู่กับข้อมูลส่วนบุคคลมาตรฐานก่อนประมวลผล
อุปสรรคการปฏิบัติตาม: เครื่องมือ AI ประมวลผลข้อมูลไฟล์ที่มีป้ายกำกับเรื่องของลูกค้า รวมกับเอกสารศาลสาธารณะ ป้ายกำกับเหล่านั้นอาจช่วยระบุเรื่องได้ ทีม Legal Ops ขององค์กรระบุว่าสิ่งนี้ยอมรับไม่ได้
ก่อนการตรวจหาเอนทิตีแบบกำหนดเอง:
- การตรวจสอบข้อตกลงพบช่องว่างการปฏิบัติตาม
- คิวงานวิศวกรรม 3+ เดือนสำหรับโมเดล NLP แบบกำหนดเอง
- สัญญาองค์กรระงับ
ด้วย Custom Entity API:
- เจ้าหน้าที่ปฏิบัติตามกำหนดรูปแบบป้ายกำกับเรื่องในช่วง onboarding
- ทดสอบรูปแบบกับไฟล์ตัวอย่าง: 2 วัน
- เพิ่มเอนทิตีแบบกำหนดเองลงในไปป์ไลน์: อีก 1 วัน
- สัญญาองค์กรดำเนินต่อ
ช่องว่างคือ 3 วัน เทียบกับ 3+ เดือน งานคือการตั้งค่ารูปแบบและการผสานรวม API ไม่ต้องการการฝึกโมเดล NLP
รูปแบบทั่วไปตามหมวดหมู่
คดีของศาลรัฐบาลกลาง:
คดีแพ่งของรัฐบาลกลางใช้: ปีสองหลัก + "cv" + หมายเลขคดี 4–6 หลัก ตัวอย่าง: 24-cv-12345 คดีอาญาใช้ "cr" ในตำแหน่งเดียวกัน คดีล้มละลายใช้ "bk" การอุทธรณ์ใช้ปีสองหลักและตัวเลข 4–5 หลักที่แตกต่างกันตามเขต
รูปแบบศาลของรัฐ (ตัวอย่าง):
ศาลสูงของแคลิฟอร์เนียใช้ระบบคำนำหน้าหกหลัก นิวยอร์กใช้รูปแบบดัชนีที่มีปีและลำดับ เท็กซัสใช้รูปแบบสาเหตุที่มีปี ลำดับ และรหัสศาล
ป้ายกำกับเรื่องของลูกค้า (รูปแบบสำนักงานทั่วไป):
พบรูปแบบทั่วไปสามแบบในสำนักงานส่วนใหญ่:
- ปีสองหลัก, ID ลูกค้า, ลำดับเรื่อง (เช่น 24-ACME-001)
- ตัวย่อกลุ่มงาน, ปี, แล้วลำดับสี่หลัก (เช่น LIT240042)
- คำนำหน้าลูกค้าที่มี ID หกหลัก (เช่น SMITHCO-000123)
ID ทะเบียนทนายความของสหรัฐ:
รัฐส่วนใหญ่ใช้ตัวเลข 4–8 หลัก บางครั้งมีคำนำหน้าระดับรัฐ ID การรับเข้า USDC แตกต่างกันตามเขตและไม่เป็นไปตามรูปแบบร่วม
ไปป์ไลน์การประมวลผลที่ตระหนักถึงสิทธิ์ความลับ
สำหรับ AI ตรวจสอบเอกสาร ไปป์ไลน์แบบหลายชั้นจัดการขอบเขตทั้งหมด
ชั้นที่ 1 — การตรวจหาข้อมูลส่วนบุคคลมาตรฐาน
ชื่อ อีเมล หมายเลขโทรศัพท์ ที่อยู่ SSN ความแม่นยำสูง เครื่องมือที่กำหนดไว้อย่างดีจัดการชั้นนี้ได้ดี
ชั้นที่ 2 — การตรวจหารหัสแบบกำหนดเอง
รหัสเรื่อง ID คดี ID ทะเบียนทนายความ รูปแบบเฉพาะสำนักงานที่ตั้งค่าในช่วง onboarding ชั้นนี้เติมช่องว่างที่เครื่องมือมาตรฐานพลาด
ชั้นที่ 3 — การตรวจสอบสิทธิ์ความลับ (มนุษย์)
หลังการตรวจหาอัตโนมัติ ทนายความตรวจสอบตัวระบุที่ถูกทำเครื่องหมาย หัว ATTORNEY-CLIENT ป้าย WORK PRODUCT เครื่องหมาย CONFIDENTIAL การตรวจสอบโดยมนุษย์ในชั้นนี้ไม่ใช่ตัวเลือก
ชั้นที่ 4 — การตรวจสอบข้อยกเว้นบริบท
คดีบันทึกสาธารณะที่ไม่มีความเสี่ยงสิทธิ์ความลับ เทียบกับป้ายกำกับเรื่องของลูกค้าที่มีความเสี่ยง สิ่งนี้ต้องการการตัดสินของทนายความ ไม่สามารถทำอัตโนมัติได้
ชั้น 1 และ 2 จัดการงานปริมาณสูง ชั้น 3 และ 4 รักษาการตัดสินของทนายความไว้ที่การตัดสินใจเรื่องสิทธิ์ความลับเป็นของ สำหรับสิ่งที่เกิดขึ้นเมื่อสิทธิ์ความลับถูกสละสิทธิ์แล้วจากการใช้เครื่องมือ AI ดู attorney-client privilege and AI
การตั้งค่าสำหรับนักพัฒนา
การกำหนดค่า Onboarding
รวบรวมรูปแบบป้ายกำกับเรื่องของลูกค้าในช่วง onboarding องค์กร แต่ละสำนักงานใช้รูปแบบที่แตกต่างกัน จัดเก็บเป็นเอนทิตีแบบกำหนดเองเฉพาะสำนักงาน ใช้กับการประมวลผลทั้งหมดสำหรับบัญชีนั้น
Presets เริ่มต้น
Presets ที่สร้างไว้ล่วงหน้าครอบคลุมบริบททั่วไปโดยไม่ต้องทำงานแบบกำหนดเอง:
- "Federal Court Documents" — รูปแบบคดีรัฐบาลกลางสำหรับคดีแพ่ง อาญา และล้มละลาย
- "State Court Documents (CA/NY/TX)" — รูปแบบเฉพาะรัฐสำหรับสามเขตอำนาจหลัก
- "Internal Operations" — ป้ายกำกับเรื่องบวกกับข้อมูลส่วนบุคคลมาตรฐาน
- "Outside Counsel Portal" — อ้างอิงใบเรียกเก็บเงิน ป้ายกำกับเรื่อง และข้อมูลส่วนบุคคลมาตรฐาน
เอกสารการตรวจสอบ
บันทึกการประมวลผลควรแสดงว่ารหัสแบบกำหนดเองรวมอยู่ในแต่ละรอบการตรวจหา สิ่งนี้สนับสนุนการป้องกัน work product สำหรับวิธีการวิเคราะห์
สำหรับมุมมองที่กว้างขึ้นเกี่ยวกับการปรับขนาดค่าใช้จ่ายการแก้ไขในคดีความ ดู e-discovery PII automation and legal review cost reduction
สรุป
ID ที่อ่อนไหวต่อสิทธิ์ความลับมีความเสี่ยงเทียบเท่ากับข้อมูลส่วนบุคคลมาตรฐาน — บ่อยครั้งมากกว่า เครื่องมือที่พลาดรหัสคดีและป้ายกำกับเรื่องทิ้งช่องว่างจริงในเวิร์กโฟลว์เอกสาร
การแก้ไขไม่ใช่โมเดล NLP แต่คือการตั้งค่ารูปแบบ สำหรับนักพัฒนาที่สร้างเครื่องมือสำนักงานกฎหมาย นั่นคือความแตกต่างระหว่างการแก้ไข 3 วันกับโปรเจกต์ 3 เดือน สำหรับสำนักงานกฎหมาย นั่นคือความแตกต่างระหว่างการตรวจสอบที่ช่วย AI ที่ป้องกันได้กับความเสี่ยงการสละสิทธิ์ความลับ