AI & MACHINE LEARNING

NVIDIA เปิดตัว Cosmos 3: โมเดลพื้นฐาน Physical AI แบบ Open Source สำหรับหุ่นยนต์และระบบอัตโนมัติ

NVIDIA Technical Blog01 Jun 2026
1 min read
Key Takeaways
  • NVIDIA Cosmos 3 คือโมเดล Open Source ที่ช่วยให้หุ่นยนต์ 'คิด'
  • 'ตอบสนอง' ต่อกฎฟิสิกส์ได้อย่างเป็นธรรมชาติในเลเยอร์เดียว

ทำไมเรื่องนี้ถึงสำคัญ

นี่คือโมเดลที่จะช่วยแก้ปัญหา 'ช่องว่าง' ระหว่างซอฟต์แวร์ AI และฮาร์ดแวร์หุ่นยนต์ ช่วยให้หุ่นยนต์สามารถคาดเดาสิ่งที่จะเกิดขึ้นต่อไปในสภาพแวดล้อมจริงได้แม่นยำขึ้น และลดภาระในการรวมโมเดลหลายตัวเข้าด้วยกัน

NVIDIA ประกาศความก้าวหน้าครั้งสำคัญในด้าน Physical AI ด้วยการเปิดตัว NVIDIA Cosmos 3 ซึ่งเป็นโมเดลพื้นฐาน (Foundation Model) ที่ออกแบบมาเพื่อให้หุ่นยนต์และระบบอัตโนมัติมีความเข้าใจในโลกทางกายภาพอย่างลึกซึ้ง โดยโมเดลนี้มีความสามารถที่โดดเด่นในการผสมผสานระหว่างการให้เหตุผลทางกายภาพ (Physical Reasoning) การสร้างภาพจำลองโลก (World Generation) และการสร้างชุดคำสั่งการกระทำ (Action Generation) ภายในโมเดลเดียว

Cosmos 3 ใช้สถาปัตยกรรมแบบ Mixture-of-Transformers (MoT) ที่แบ่งออกเป็น 2 ส่วนหลัก คือ 'Reasoner tower' ที่ทำหน้าที่เสมือนสมองในการแปลผลข้อมูลภาพและข้อความเพื่อทำความเข้าใจการเคลื่อนไหว และ 'Generator tower' ที่ทำหน้าที่สร้างวิดีโอหรือชุดการกระทำที่สอดคล้องกับกฎทางฟิสิกส์ การเปิดตัวครั้งนี้มาพร้อมกับโมเดลสองขนาดคือ Cosmos 3 Nano (8B) สำหรับการรันที่เครื่องปลายทาง และ Cosmos 3 Super (32B) สำหรับงานคุณภาพสูงในศูนย์ข้อมูล

นอกจากตัวโมเดลแล้ว NVIDIA ยังได้เปิดซอร์สข้อมูลฝึกสอน (Datasets) 6 ชุด ครอบคลุมด้านการขับขี่อัตโนมัติ การทำงานในคลังสินค้า และพฤติกรรมมนุษย์ เพื่อช่วยให้ชุมชนนักพัฒนาสามารถนำไปพัฒนาต่อยอดได้ทันที ซึ่งถือเป็นก้าวสำคัญที่จะทำให้การพัฒนาหุ่นยนต์และระบบ AI ที่ต้องปฏิสัมพันธ์กับโลกจริงมีความปลอดภัยและแม่นยำยิ่งขึ้น

สรุปประเด็นหลัก

รวมความสามารถด้านการมองเห็น การให้เหตุผล และการสั่งการ (VLA) ไว้ในโมเดลเดียว

เปิดตัวรุ่น Nano (8B) สำหรับใช้งานบนการ์ดจอ RTX และรุ่น Super (32B) สำหรับศูนย์ข้อมูล

แจกฟรีทั้งโมเดล สคริปต์การฝึกสอน และชุดข้อมูลสังเคราะห์ 6 รายการ

นวัตกรรมและเทคโนโลยี

models

Mixture-of-Transformers (MoT)

สถาปัตยกรรมใหม่ที่รวมส่วนการให้เหตุผล (Reasoner) และการสร้างผลลัพธ์ (Generator) เข้าด้วยกัน

research

Action-conditioned World Model

ความสามารถในการสร้างภาพจำลองสิ่งที่อาจเกิดขึ้นเมื่อหุ่นยนต์ลงมือทำพฤติกรรมบางอย่าง

creative ai

Synthetic Data Generation (SDG) Datasets

ชุดข้อมูลสังเคราะห์คุณภาพสูง 6 ชุดสำหรับฝึกหุ่นยนต์ในสถานการณ์ที่หาข้อมูลจริงได้ยาก

Developer Impact
นักพัฒนาสายหุ่นยนต์และยานยนต์ไร้คนขับสามารถใช้ Cosmos NIM microservices เพื่อปรับใช้โมเดลในโปรเจกต์ของตนได้ง่ายขึ้น พร้อมมีชุดข้อมูลมาตรฐานสำหรับทำ Fine-tuning ให้เข้ากับโดเมนเฉพาะ
Keywords
#nvidia cosmos 3 #physical ai #foundation models #robotics #open source ai
Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

NVIDIA Technical Blog