AI & MACHINE LEARNING

Session Risk Memory (SRM): ระบบรักษาความปลอดภัยแบบใหม่สำหรับ AI Agent

arXiv25 Mar 2026

1 min read

Key Takeaways

SRM ช่วยให้ระบบความปลอดภัยของ AI Agent สามารถตรวจจับเจตนาที่ซ่อนอยู่ในการกระทำหลายขั้นตอนได้อย่างแม่นยำ 100% โดยแทบไม่กระทบต่อประสิทธิภาพการทำงาน

ทำไมเรื่องนี้ถึงสำคัญ

การเปลี่ยนจากการตรวจสอบความปลอดภัยแบบรายครั้ง (Spatial) มาเป็นแบบต่อเนื่องตามระยะเวลา (Temporal) ช่วยปิดช่องโหว่สำคัญในการใช้งาน AI Agent ในระดับองค์กร โดยเฉพาะการป้องกันการจารกรรมข้อมูลแบบค่อยเป็นค่อยไปหรือการยกระดับสิทธิ์ที่แนบเนียน

ระบบรักษาความปลอดภัยสำหรับ AI Agent ในปัจจุบันมักใช้วิธีตรวจจับแบบรายคำสั่ง (Stateless) ซึ่งมีจุดอ่อนคือไม่สามารถตรวจจับการโจมตีที่แบ่งขั้นตอนอันตรายออกเป็นส่วนย่อยๆ ได้ งานวิจัยนี้จึงนำเสนอ Session Risk Memory (SRM) ซึ่งเป็นโมดูลน้ำหนักเบาที่ช่วยขยายขีดความสามารถของระบบเดิมให้สามารถวิเคราะห์ความปลอดภัยในระดับวิถีพฤติกรรม (Trajectory-level authorization)

SRM ทำงานโดยการเก็บรักษาค่า 'Semantic Centroid' ที่เป็นตัวแทนโปรไฟล์พฤติกรรมในแต่ละเซสชัน และใช้การคำนวณแบบ Exponential Moving Average เพื่อสะสมสัญญาณความเสี่ยงจากผลลัพธ์ของระบบตรวจจับพื้นฐาน โดยผลการทดสอบพบว่าระบบ SRM สามารถกำจัดอัตราการตรวจจับผิดพลาด (False Positive) ได้เหลือ 0% และมีค่า F1 Score เต็ม 1.0000 ในขณะที่มีภาระการทำงาน (Overhead) ต่ำกว่า 250 ไมโครวินาทีต่อรอบการทำงาน

สรุปประเด็นหลัก

SRM แก้ไขจุดอ่อนของระบบตรวจจับรายครั้งที่มักมองไม่เห็นการโจมตีแบบแบ่งขั้นตอน

ผลการทดสอบให้ค่า F1 Score สูงถึง 1.0000 และมีอัตรา False Positive เป็นศูนย์

ใช้เวลาประมวลผลเพิ่มขึ้นเพียงไม่เกิน 250 ไมโครวินาทีต่อรอบ

นวัตกรรมและเทคโนโลยี

security

Temporal Authorization

การตรวจสอบสิทธิ์และพฤติกรรมโดยพิจารณาจากลำดับเหตุการณ์ต่อเนื่องตลอดทั้งเซสชันแทนการตรวจสอบรายคำสั่ง

infrastructure

Semantic Vector Representation

ใช้การประมวลผลบนเวกเตอร์เดิมของระบบตรวจจับ ทำให้ไม่ต้องเพิ่มโมเดลใหม่หรือทำการเทรนซ้ำ

Developer Impact

ช่วยให้วิศวกรความปลอดภัยและทีมพัฒนา AI Agent มีเฟรมเวิร์กในการสร้างระบบตรวจสอบพฤติกรรมที่มีประสิทธิภาพสูงและมีความหน่วงต่ำมาก

Keywords

#ai safety #agentic systems #session risk memory #temporal authorization

Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

arXiv