การติดตามเป้าหมายหลายรายการด้วยหุ่นยนต์เคลื่อนที่ (Active Multi-target Tracking) เป็นโจทย์ที่ท้าทายเนื่องจากหุ่นยนต์ต้องรักษาสมดุลระหว่างการค้นหาเป้าหมายใหม่และการติดตามเป้าหมายเดิมที่มีความไม่แน่นอนสูง งานวิจัยนี้เสนอการใช้ Diffusion Policy ซึ่งเป็นโมเดลที่เรียนรู้จากผู้เชี่ยวชาญ แต่เพิ่มความสามารถในการจัดการความไม่แน่นอนด้วยระบบ Bayesian
หัวใจสำคัญคือการนำโมเดล Variational Bayesian Last Layer (VBLL) มาใช้ในการคาดการณ์ประสิทธิภาพของแต่ละกลยุทธ์ พร้อมทั้งใช้เกณฑ์ Lower Confidence Bound (LCB) เพื่อเลือกกลยุทธ์ที่ดีที่สุดในกรณีที่เลวร้ายที่สุด (Pessimistic approach) ช่วยลดความผิดพลาดจากการเลือกกลยุทธ์ที่โมเดลไม่มั่นใจ ผลการทดสอบในสภาพแวดล้อมจำลองพบว่าวิธีนี้ให้ผลลัพธ์ที่ดีกว่าการใช้ Diffusion Policy แบบมาตรฐานหรือวิธี Mixture-of-Experts ทั่วไป