TECH INDUSTRY / PRODUCT

Bench2Drive-VL: ชุดทดสอบการขับขี่อัตโนมัติแบบวงปิดสำหรับโมเดลภาษาและการมองเห็น

arXiv03 Apr 2026
1 min read
Key Takeaways
  • Bench2Drive-VL เป็นมาตรฐานใหม่ที่เน้นการประเมินความสามารถในการขับขี่จริงของโมเดล VLM ในสถานการณ์ที่ซับซ้อนและอยู่นอกเหนือจากชุดข้อมูลฝึกฝนทั่วไป

ทำไมเรื่องนี้ถึงสำคัญ

ช่วยให้การพัฒนา AI สำหรับรถยนต์ไร้คนขับมีความน่าเชื่อถือมากขึ้น โดยเฉพาะโมเดลที่ต้องสื่อสารและให้เหตุผลด้วยภาษาธรรมชาติควบคู่ไปกับการควบคุมรถ

การประเมินโมเดลขับขี่อัตโนมัติในปัจจุบันมักเน้นที่แบบ Open-loop หรือการตอบคำถามจากภาพนิ่ง ซึ่งไม่สามารถสะท้อนความสามารถในการขับขี่จริงเมื่อเกิดข้อผิดพลาดสะสมได้ Bench2Drive-VL จึงถูกพัฒนาขึ้นเพื่อเป็นส่วนขยายของ Bench2Drive โดยเน้นไปที่โมเดล Vision-Language (VLM) ในรูปแบบวงปิด (Closed-loop)

ระบบนี้มาพร้อมกับ 'DriveCommenter' ซึ่งเป็นเครื่องมือสร้างคู่คำถาม-คำตอบตามพฤติกรรมจริงในสถานการณ์ต่างๆ ของโปรแกรมจำลอง CARLA รวมถึงกรณีการขับออกนอกเส้นทางอย่างรุนแรง นอกจากนี้ยังมีเฟรมเวิร์กที่ยืดหยุ่นรองรับอินพุตภาพหลายรูปแบบและการประมวลผลแบบ Chain-of-thought ช่วยให้การเปรียบเทียบระหว่างโมเดล VLM และระบบขับขี่แบบดั้งเดิมเป็นไปอย่างยุติธรรมและมีประสิทธิภาพ

สรุปประเด็นหลัก

นำระบบ Closed-loop evaluation มาใช้กับโมเดล Vision-Language เป็นครั้งแรก

มาพร้อม DriveCommenter สำหรับสร้างสถานการณ์จำลองที่ท้าทายแบบอัตโนมัติ

รองรับการทำงานบน CARLA simulator และเปิดเป็น Open-source ทั้งหมด

นวัตกรรมและเทคโนโลยี

developer tools

DriveCommenter

ระบบสร้างชุดข้อมูลคำถาม-คำตอบแบบอัตโนมัติจากสถานการณ์ขับขี่จริงในตัวจำลอง

creative ai

VLM4AD Benchmark

มาตรฐานการทดสอบโมเดลภาษาและการมองเห็นสำหรับการใช้งานในการขับขี่อัตโนมัติ

Developer Impact
นักวิจัยและนักพัฒนา AI สามารถใช้เฟรมเวิร์กนี้เพื่อประเมินและปรับปรุงโมเดล VLM ให้มีความทนทานต่อข้อผิดพลาดและการทำงานในสถานการณ์จริงที่ไม่เคยพบมาก่อน
Keywords
#autonomous driving #vision-language models #vlm #closed-loop evaluation #benchmark
Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

arXiv