NVIDIA นำเสนอแนวทางใหม่ในการพัฒนา Vision AI Agent เพื่อใช้ในการวิเคราะห์ข้อมูลวิดีโอจากโลกจริงในโรงงานและเมืองอัจฉริยะ โดยเน้นการใช้ประโยชน์จาก NVIDIA Metropolis และ Omniverse ในการสร้างข้อมูลสังเคราะห์ (Synthetic Data) เพื่อแก้ปัญหาการขาดแคลนข้อมูลสำหรับกรณีที่เกิดขึ้นได้ยาก (Rare Events) เช่น ตำหนิบนผลิตภัณฑ์ที่พบน้อยมากในสายการผลิต
หัวใจสำคัญของเวิร์กโฟลว์นี้ประกอบด้วยการใช้ OpenUSD ในการจำลองสภาพแวดล้อม 3 มิติ และการใช้ทักษะ (Skills) ต่างๆ เช่น Defect Image Generation สำหรับผลิตภาพตำหนิจำลอง และ Video Search and Summarization (VSS) สำหรับการสรุปผลและแจ้งเตือนจากข้อมูลวิดีโอ ซึ่งช่วยให้นักพัฒนาสามารถปรับแต่งโมเดลให้เข้ากับหน้างานจริงได้อย่างรวดเร็วโดยไม่ต้องใช้ทีมผู้เชี่ยวชาญด้าน Machine Learning ขนาดใหญ่