CLAW (Continuous Latent Action World models) นำเสนอแนวทางใหม่ในการฝึกหุ่นยนต์ผ่านการเรียนรู้แบบ Self-supervised โดยระบบจะเรียนรู้การสร้างตัวแทนการกระทำ (Latent Action) จากวิดีโอที่ไม่มีการระบุการกระทำใดๆ มาก่อน ผ่านการใช้เทคนิค Adversarial Latent Regularization และการสร้างวิดีโอด้วยวิธี Diffusion
ความสามารถหลักของ CLAW คือการทำความเข้าใจว่าการกระทำหนึ่งๆ ส่งผลต่อการเปลี่ยนแปลงสภาพแวดล้อมอย่างไรผ่านการสังเกตทางภาพเพียงอย่างเดียว ระบบนี้รองรับทั้งการเลียนแบบพฤติกรรม (Imitation Learning) และการวางแผนงานเพื่อบรรลุเป้าหมาย (Goal-directed planning) ซึ่งผลการทดลองแสดงให้เห็นว่า CLAW สามารถเรียนรู้ความหมายของการกระทำและถ่ายโอนความรู้นั้นไปยังหุ่นยนต์รูปแบบต่างๆ ได้อย่างมีประสิทธิภาพ