งานวิจัยนี้มุ่งแก้ปัญหาข้อจำกัดของวิธีการจำลองสถานการณ์เสี่ยงในปัจจุบันที่มักใช้การเรียนรู้แบบเสริมกำลัง (Reinforcement Learning) ซึ่งสร้างพฤติกรรมฉุกเฉินที่สมจริงได้ยาก คณะผู้วิจัยจึงเสนอวิธีการที่เน้นการนำทางด้วยพฤติกรรม (Behavior Guided Method) โดยเริ่มจากการใช้โมดูลเรียนรู้พฤติกรรมที่พัฒนาจาก Sequence Generative Adversarial Network (GAN) เพื่อเรียนรู้การเปลี่ยนเลนฉุกเฉินจากชุดข้อมูลที่มีอยู่อย่างจำกัด
กระบวนการทำงานจะจำลองยานพาหนะรอบข้างให้เป็นเอเจนท์ที่ทำงานร่วมกับสภาพแวดล้อม และใช้กลยุทธ์ Recursive Proximal Policy Optimization (PPO) เพื่อชี้นำให้เกิดพฤติกรรมที่อันตรายและสมเหตุสมผลตามหลักฟิสิกส์ผ่านการควบคุมด้วย Model Predictive Control (MPC) ผลการทดสอบแสดงให้เห็นว่าวิธีนี้สามารถสร้างสถานการณ์จำลองที่มีความเสี่ยงสูงได้อย่างมีประสิทธิภาพมากกว่าวิธีแบบเดิม เช่น การค้นหาแบบตาราง (Grid Search) หรือการออกแบบด้วยมือ