ปัจจุบันบริษัทด้านหุ่นยนต์อย่าง Micro1, Tesla และ Figure AI กำลังเผชิญกับความท้าทายในการจัดหาข้อมูลจากโลกจริงเพื่อฝึกฝนหุ่นยนต์ฮิวแมนนอยด์ให้สามารถเคลื่อนไหวและหยิบจับสิ่งของได้อย่างเป็นธรรมชาติ จึงเกิดกระบวนการจ้างงานแรงงานแบบชั่วคราวในกว่า 50 ประเทศ รวมถึงไนจีเรีย อินเดีย และอาร์เจนตินา เพื่อบันทึกวิดีโอการทำงานบ้าน เช่น การพับผ้า การล้างจาน และการทำอาหาร โดยจ่ายค่าตอบแทนตามมาตรฐานท้องถิ่น
กระบวนการเก็บข้อมูลนี้เปลี่ยนจากการใช้เพียงโลกจำลอง (Simulations) มาเป็นการใช้ข้อมูลจริงจำนวนมหาศาล ซึ่งเป็นแนวทางที่ได้รับแรงบันดาลใจจากความสำเร็จของ Large Language Models (LLMs) โดยข้อมูลวิดีโอจะถูกตรวจสอบและติดป้ายกำกับ (Annotation) โดยทั้ง AI และมนุษย์เพื่อสร้างชุดข้อมูลที่หุ่นยนต์สามารถนำไปเรียนรู้การปฏิสัมพันธ์กับโลกทางกายภาพได้อย่างถูกต้อง อย่างไรก็ตาม กระบวนการนี้ยังคงเผชิญกับประเด็นด้านความเป็นส่วนตัวและความยากลำบากในการควบคุมคุณภาพข้อมูลให้มีความหลากหลายเพียงพอ