ROBOTICS & HUMANOID

GE-Sim 2.0: โปรแกรมจำลองโลกแบบวิดีโอเพื่อการฝึกหัดหุ่นยนต์หยิบจับวัตถุ

arXiv28 May 2026
1 min read
Key Takeaways
  • GE-Sim 2
  • 0 เป็นโปรแกรมจำลองโลกขนาด 2B พารามิเตอร์ที่ให้ผลลัพธ์ดีเยี่ยมบนตาราง WorldArena และช่วยให้หุ่นยนต์เรียนรู้ได้ดีกว่าการฝึกในโลกจริงเพียงอย่างเดียว

ทำไมเรื่องนี้ถึงสำคัญ

การมีโปรแกรมจำลองที่แม่นยำและรวดเร็วช่วยลดต้นทุนและเวลาในการฝึกหัดหุ่นยนต์ในโลกจริง ทำให้การพัฒนาหุ่นยนต์อุตสาหกรรมก้าวหน้าได้รวดเร็วขึ้น

GE-Sim 2.0 (Genie Envisioner World Simulator 2.0) เป็นโปรแกรมจำลองโลกแบบ closed-loop ที่พัฒนาขึ้นเพื่อการฝึกหัดหุ่นยนต์หยิบจับวัตถุ (Robotic Manipulation) โดยเฉพาะ โดยได้รับการฝึกฝนจากข้อมูลหุ่นยนต์ในโลกจริงนับพันชั่วโมง ครอบคลุมทั้งการควบคุมจากระยะไกลและการโต้ตอบที่มีการสัมผัสสูง

ระบบนี้มาพร้อมกับโมดูลใหม่ 3 ส่วน ได้แก่ State Expert สำหรับถอดรหัสสถานะหุ่นยนต์จากวิดีโอ, World Judge สำหรับให้คะแนนความสำเร็จของงานอัตโนมัติ และระบบเร่งความเร็วที่สามารถประมวลผลวิดีโอ 25 เฟรมได้ในเวลาเพียง 2.3 วินาทีบนการ์ดจอ H100 ทำให้เป็นแพลตฟอร์มที่มีประสิทธิภาพสูงสำหรับการฝึก VLA Policies ในระดับสเกลใหญ่

สรุปประเด็นหลัก

ฝึกด้วยข้อมูลหุ่นยนต์จริงนับพันชั่วโมงเพื่อให้ได้ความแม่นยำสูงสุด

มีระบบ World Judge ตัดสินผลสำเร็จของภารกิจแทนมนุษย์

ประมวลผลรวดเร็วบน NVIDIA H100 รองรับการประเมินงานระยะยาว

นวัตกรรมและเทคโนโลยี

tools

State Expert

โมดูลถอดรหัสสถานะเชิงกายภาพ (Proprioceptive State) จากข้อมูลวิดีโอเพื่อใช้ในการทำนายขั้นตอนต่อไป

platform

World Judge

ระบบให้คะแนนและสัญญาณความสำเร็จอัตโนมัติโดยใช้โมเดลในการประเมินวิดีโอที่จำลองขึ้น

Developer Impact
ทีมนักพัฒนา VLA Policies และวิศวกรคอมพิวเตอร์วิทัศน์สามารถใช้โปรแกรมนี้ในการทดสอบและประเมินผลนโยบายการทำงานของหุ่นยนต์ในสภาพแวดล้อมเสมือนจริงที่ใกล้เคียงความจริงสูง
Keywords
#world simulator #robotic manipulation #video generation #vla policies #worldarena
Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

arXiv