งานวิจัยนี้นำเสนอผลการทดลองนำนโยบายแบบ Vision-Language-Action (VLA) มาใช้งานในสายการผลิตจริงที่โรงงาน Siemens (GWE) ประเทศเยอรมนี ภารกิจคือการให้หุ่นยนต์หยิบถุงอุปกรณ์ที่มีลักษณะโปร่งใสจากกองของ และบรรจุลงในกล่องกระดาษให้ถูกต้อง
ทีมงานได้สะสมข้อมูลกว่า 2,535 รอบ (ประมาณ 10 ชั่วโมง) เพื่อศึกษาการปรับจูนโมเดล Pi0.5 ให้เข้ากับหน้างาน โดยสรุปบทเรียนสำคัญเกี่ยวกับรูปแบบการล้มเหลว (Failure Modes) และความพยายามที่จำเป็นในการเปลี่ยนจากโมเดลพื้นฐาน (Pretrained Policy) ไปเป็นระบบที่ทำงานได้จริงในระดับโรงงาน ซึ่งต้องอาศัยการเก็บข้อมูลเพื่อแก้ปัญหาเฉพาะจุด (Recovery Data Collection) อย่างต่อเนื่อง