ปัญหาของการแก้ความเสี่ยงการปฏิบัติตามกฎระเบียบหนึ่งโดยสร้างอีกอย่าง
องค์กรที่เข้าใจความเสี่ยงการรั่วไหลข้อมูลของเครื่องมือ AI มักดำเนินการแก้ไขที่ดูมีเหตุผล: ทำให้เนื้อหาที่ละเอียดอ่อนไม่ระบุตัวตนก่อนถึงผู้ให้บริการ AI โดยใช้การทำให้ไม่ระบุตัวตนแบบถาวรหรือแบบทิศทางเดียวที่ไม่สามารถย้อนกลับได้
ตรรกะนั้นถูกต้องในด้านความปลอดภัย การวิเคราะห์ Q4 2025 ของ Cyberhaven พบว่า 34.8% ของเนื้อหาที่ส่งไปยัง ChatGPT มีข้อมูลละเอียดอ่อน การวิจัยปี 2024 ของ Ponemon Institute ระบุว่าต้นทุนเฉลี่ยของการรั่วไหลข้อมูล AI คือ 2.1 ล้านดอลลาร์ การวิจัยจาก eSecurity Planet และ Cyberhaven พบว่า 77% ของพนักงานแชร์ข้อมูลละเอียดอ่อนกับเครื่องมือ AI ทุกสัปดาห์ ความเสี่ยงนั้นแท้จริง บ่อยครั้ง และมีค่าใช้จ่ายสูง
แต่การทำให้ไม่ระบุตัวตนถาวร ซึ่งได้แก่ การ hash แบบทิศทางเดียวที่ไม่สามารถย้อนกลับ การปิดทับที่ทำลาย หรือ pseudonymization โดยไม่เก็บกุญแจ แก้ปัญหาความปลอดภัย AI ขณะสร้างปัญหาอื่นที่แตกต่าง: การทำลายหลักฐาน
สำหรับองค์กรที่อยู่ภายใต้การฟ้องร้อง การสืบสวนด้านกฎระเบียบ หรือข้อผูกพันการค้นพยาน การทำลายความสามารถในการกู้คืนข้อมูลต้นฉบับจากการแสดงที่ไม่ระบุตัวตนอาจถือเป็นการทำลายหลักฐานภายใต้กฎระเบียบการค้นพยานของรัฐบาลกลางและรัฐ เอกสารที่ถูกทำให้ไม่ระบุตัวตนถาวรและไม่สามารถกู้คืนข้อมูลต้นฉบับได้อาจถือเป็นหลักฐานที่ถูกทำลาย
ขนาดการแชร์ข้อมูลที่ทำให้เรื่องนี้เร่งด่วน
อัตราการแชร์รายสัปดาห์ 77% กำหนดขอบเขต พนักงานทั่วทุกอุตสาหกรรม ได้แก่ กฎหมาย การดูแลสุขภาพ บริการทางการเงิน เทคโนโลยี กำลังส่งเนื้อหาที่เกี่ยวข้องกับงานไปยังเครื่องมือ AI เป็นส่วนปกติของ workflow ของตน
เนื้อหานั้นรวมถึง:
- การสื่อสารและจดหมายโต้ตอบลูกค้า
- ร่างสัญญาและเงื่อนไขที่เจรจาแล้ว
- การอภิปรายกลยุทธ์ภายในและเอกสารการวางแผนธุรกิจ
- การคาดการณ์ทางการเงินและข้อมูลการสร้างแบบจำลอง
- บันทึกการวิจัยทางกฎหมายและหมายเหตุกลยุทธ์คดี
- ข้อมูลผู้ป่วยและเอกสารทางคลินิก
- บันทึกพนักงานและการสื่อสาร HR
เมื่อองค์กรดำเนินการทำให้ไม่ระบุตัวตนถาวรเป็นมาตรการควบคุมความปลอดภัย AI ทุกเอกสารที่ผ่านมาตรการควบคุมนั้นในกระบวนการทางธุรกิจปกติอาจถูกแก้ไขในลักษณะที่ทำลายมูลค่าเป็นหลักฐาน หากเอกสารเหล่านั้นกลายเป็นเกี่ยวข้องกับการฟ้องร้องในอนาคต ซึ่งสำหรับองค์กรในอุตสาหกรรมที่มีการกำกับดูแลที่ดำเนินในระดับขนาดใหญ่เป็นความแน่นอนในช่วงหลายปี องค์กรได้ผลิตหลักฐานที่ถูกทำลายแล้ว
ข้อกำหนดการย้อนกลับได้ของ GDPR
กรอบกฎระเบียบของสหภาพยุโรปสำหรับการคุ้มครองข้อมูลกล่าวถึงคำถามการย้อนกลับได้โดยตรงในบริบทของ pseudonymization
GDPR มาตรา 4(5) กำหนด pseudonymization ว่าเป็น "การประมวลผลข้อมูลส่วนบุคคลในลักษณะที่ข้อมูลส่วนบุคคลไม่สามารถระบุตัวตนเจ้าของข้อมูลเฉพาะได้อีกต่อไปโดยไม่ใช้ข้อมูลเพิ่มเติม โดยมีเงื่อนไขว่าข้อมูลเพิ่มเติมดังกล่าวถูกเก็บแยกต่างหากและอยู่ภายใต้มาตรการทางเทคนิคและองค์กรเพื่อให้แน่ใจว่าข้อมูลส่วนบุคคลไม่ถูกระบุตัวตนกับบุคคลธรรมดาที่ระบุหรือสามารถระบุได้"
คำจำกัดความกำหนดให้ "ข้อมูลเพิ่มเติม" ซึ่งก็คือกุญแจที่อนุญาตการระบุตัวตนซ้ำ ต้องถูกรักษาไว้ ข้อมูลที่ถูก pseudonymized ภายใต้ GDPR คือข้อมูลที่สามารถระบุตัวตนซ้ำได้โดยใช้กุญแจที่จัดเก็บแยกต่างหาก ข้อมูลที่ไม่สามารถระบุตัวตนซ้ำได้ไม่ใช่ pseudonymized ภายใต้ GDPR แต่เป็น anonymized
แนวทาง 05/2022 ของคณะกรรมการคุ้มครองข้อมูลยุโรปยืนยันว่าการย้อนกลับได้เป็นข้อกำหนดเชิงนิยามของ pseudonymization ภายใต้กฎระเบียบ องค์กรที่ดำเนินการทำให้ไม่ระบุตัวตนแบบทิศทางเดียวถาวรไม่ได้ดำเนิน pseudonymization ตาม GDPR กำหนด แต่กำลังดำเนิน anonymization
กรอบการทำลายหลักฐานของ Federal Rules
ภายใต้ Federal Rules of Civil Procedure คู่กรณีในการฟ้องร้องมีหน้าที่เก็บรักษาเอกสารและข้อมูลที่จัดเก็บทางอิเล็กทรอนิกส์ที่อาจเกี่ยวข้องกับการฟ้องร้องที่คาดการณ์ได้หรือที่เกิดขึ้นจริง หน้าที่นี้เริ่มต้นเมื่อมีการคาดการณ์การฟ้องร้องอย่างสมเหตุสมผล ไม่ใช่เมื่อมีการยื่นฟ้อง
Rule 37(e) ให้อำนาจศาลในการกำหนดบทลงโทษเมื่อฝ่ายใดล้มเหลวในการเก็บรักษาข้อมูลที่จัดเก็บทางอิเล็กทรอนิกส์ที่ควรถูกเก็บรักษา และความล้มเหลวส่งผลให้เกิดความเสียหายต่ออีกฝ่าย บทลงโทษอาจรวมถึง:
- คำสั่งการอนุมานเชิงลบที่สันนิษฐาน (คณะลูกขุนถูกสั่งให้สันนิษฐานว่าหลักฐานที่ถูกทำลายจะไม่เป็นประโยชน์ต่อฝ่ายที่ทำลาย)
- การห้ามหลักฐาน
- บทลงโทษที่ตัดสินคดีในกรณีที่ร้ายแรง
การวิเคราะห์การทำลายหลักฐานในบริบทของการทำให้ไม่ระบุตัวตนถาวรทำงานดังนี้: หากองค์กรใช้ workflow AI ที่ทำให้เอกสารไม่ระบุตัวตนถาวรในกระบวนการทางธุรกิจปกติ และเอกสารเหล่านั้นต่อมากลายเป็นเกี่ยวข้องกับการฟ้องร้อง องค์กรได้แก้ไขเอกสารเหล่านั้นในลักษณะที่ป้องกันการกู้คืนเนื้อหาต้นฉบับ หากการแก้ไขเกิดขึ้นหลังจากหน้าที่การเก็บรักษาเริ่มต้น หรือหากองค์กรรู้หรือควรรู้ว่าประเภทของเอกสารที่ถูกทำให้ไม่ระบุตัวตนอาจเกี่ยวข้องกับการฟ้องร้องที่คาดการณ์ได้อย่างสมเหตุสมผล องค์กรเผชิญกับการเปิดเผยการทำลายหลักฐาน
ความแตกต่างทางเทคนิค: การย้อนกลับได้ vs การไม่สามารถย้อนกลับ
การทำให้ไม่ระบุตัวตนที่ไม่สามารถย้อนกลับ (การ hash, การแทนที่ถาวร, การปิดทับที่ทำลาย) แปลงข้อมูลในลักษณะที่ไม่สามารถยกเลิกได้ การ hash SHA-256 ของชื่อลูกค้าผลิต hash ที่มีความยาวคงที่ซึ่งไม่สามารถได้ชื่อกลับมา การปิดทับถาวรแทนที่เนื้อหาในลักษณะที่ทำลายข้อความพื้นฐาน
Pseudonymization ที่สามารถย้อนกลับ (การแทนที่ token พร้อมการเก็บกุญแจ, การเข้ารหัส AES-256-GCM) แปลงข้อมูลในลักษณะที่สามารถยกเลิกได้โดยใช้ข้อมูลที่จัดเก็บแยกต่างหาก ชื่อลูกค้าที่แทนที่ด้วย token ที่มีโครงสร้างสามารถเชื่อมโยงกลับกับชื่อต้นฉบับโดยใช้ตารางแมป เนื้อหาที่เข้ารหัสด้วย AES-256-GCM สามารถถอดรหัสได้โดยใช้กุญแจที่สอดคล้อง เนื้อหาต้นฉบับยังคงสามารถกู้คืนได้
สำหรับวัตถุประสงค์ด้านความปลอดภัย AI ซึ่งก็คือการป้องกันไม่ให้ข้อมูลละเอียดอ่อนถึงผู้ให้บริการ AI ในรูปแบบที่ใช้งานได้ ทั้งสองแนวทางบรรลุเป้าหมายเดียวกัน สำหรับการปฏิบัติตามกฎหมาย ซึ่งก็คือการรักษาความสามารถในการกู้คืนเนื้อหาต้นฉบับสำหรับการค้นพยาน การตอบสนองด้านกฎระเบียบ หรือวัตถุประสงค์ทางธุรกิจที่ชอบด้วยกฎหมาย มีเพียง pseudonymization ที่สามารถย้อนกลับเท่านั้นที่สอดคล้อง
สถาปัตยกรรมที่สอดคล้อง
สถาปัตยกรรมที่แก้ไขทั้งความปลอดภัย AI และการปฏิบัติตามการค้นพยานใช้ AES-256-GCM pseudonymization ที่สามารถย้อนกลับ:
- เอกสารถูกประมวลผลก่อนส่งไปยังเครื่องมือ AI
- เอนทิตี้ที่ละเอียดอ่อน ได้แก่ ชื่อ หมายเลขบัญชี ตัวระบุ PHI เนื้อหาที่มีสิทธิ์ ถูกแทนที่ด้วย token ที่มีโครงสร้าง
- การแมป token-ต้นฉบับถูกจัดเก็บแยกต่างหากพร้อมมาตรการควบคุมการเข้าถึงที่เหมาะสมกับความละเอียดอ่อนของข้อมูล
- การประมวลผล AI เกิดขึ้นบนเวอร์ชัน tokenized ซึ่งโมเดล AI ไม่มีวันได้รับเนื้อหาที่ละเอียดอ่อนที่กู้คืนได้
- ผลลัพธ์ถูก de-tokenized โดยใช้การแมปที่จัดเก็บสำหรับการใช้งานธุรกิจที่ชอบด้วยกฎหมาย
- การแมปอยู่ภายใต้ litigation hold เมื่อข้อผูกพันการค้นพยานเริ่มต้น
ภายใต้สถาปัตยกรรมนี้ เนื้อหาต้นฉบับไม่มีวันถูกทำลาย ผู้ให้บริการ AI ไม่มีวันได้รับในรูปแบบที่ใช้งานได้ การแมป token รักษาความสามารถในการกู้คืนเนื้อหาต้นฉบับเมื่อกฎหมายกำหนด ความเสี่ยงการทำลายหลักฐานถูกขจัด เพราะไม่มีหลักฐานที่ถูกทำลาย มีเพียงการ pseudonymize อย่างสามารถย้อนกลับชั่วคราว
ข้อกำหนด pseudonymization ของ GDPR ภายใต้มาตรา 4(5) ได้รับการตอบสนอง: ข้อมูลเพิ่มเติม (การแมป token) ถูกรักษาแยกต่างหากพร้อมมาตรการทางเทคนิคและองค์กรที่เหมาะสม ข้อกำหนดการเก็บรักษาของ Federal Rules ได้รับการตอบสนอง: เนื้อหาต้นฉบับสามารถกู้คืนได้เมื่อ litigation hold ใช้บังคับ
องค์กรที่ดำเนินมาตรการควบคุมความปลอดภัย AI เผชิญกับการเลือกแบบทวิภาค: ทำให้ไม่ระบุตัวตนถาวรและสร้างความเสี่ยงการค้นพยาน หรือ pseudonymize อย่างสามารถย้อนกลับและตอบสนองทั้งข้อกำหนดด้านความปลอดภัยและการปฏิบัติตามกฎระเบียบพร้อมกัน ต้นทุนการรั่วไหล AI เฉลี่ย 2.1 ล้านดอลลาร์ที่ขับเคลื่อนการตัดสินใจมาตรการควบคุมความปลอดภัยควรถูกชั่งน้ำหนักกับต้นทุนที่อาจเกิดขึ้นจากบทลงโทษการทำลายหลักฐาน ซึ่งในคดีที่มีมูลค่าทางการเงินสำคัญ อาจถึงระดับเดียวกันหรือมากกว่า
แหล่งที่มา: