AI & MACHINE LEARNING

Google เปิดตัวฟีเจอร์ Computer Use ใน Gemini 3.5 Flash สำหรับสร้าง AI Agent แบบโต้ตอบข้ามแพลตฟอร์ม

Google DeepMind24 Jun 2026
1 min read
Key Takeaways
  • Gemini 3
  • 5 Flash สามารถทำงานเป็น AI Agent ที่สั่งการคอมพิวเตอร์และเบราว์เซอร์ได้โดยตรงผ่าน API เพียงตัวเดียว

ทำไมเรื่องนี้ถึงสำคัญ

ความสามารถในการสั่งการคอมพิวเตอร์โดยตรงจาก LLM (Agentic Computer Use) เป็นก้าวสำคัญสู่การสร้างระบบอัตโนมัติที่ซับซ้อน ซึ่งช่วยลดช่องว่างระหว่างโมเดลภาษาและการใช้งานซอฟต์แวร์จริงในโลกธุรกิจ

Google DeepMind ประกาศรวมความสามารถ Computer Use เข้าเป็นเครื่องมือมาตรฐานในโมเดล Gemini 3.5 Flash จากเดิมที่เคยเป็นโมเดลแยกเฉพาะทาง (Gemini 2.5 computer use) การอัปเดตนี้ทำให้นักพัฒนาสามารถสร้าง AI Agent ที่มีความสามารถระดับสูงในการโต้ตอบกับระบบคอมพิวเตอร์เหมือนมนุษย์ เช่น การมองเห็นหน้าจอ การให้เหตุผล และการลงมือกระทำข้ามสภาพแวดล้อมต่างๆ ทั้งเบราว์เซอร์ มือถือ และเดสก์ท็อป

ฟีเจอร์นี้ถูกออกแบบมาเพื่อรองรับงานอัตโนมัติในระดับองค์กร (Enterprise Automation) และงานที่ต้องใช้เวลานาน (Long-horizon tasks) เช่น การทดสอบซอฟต์แวร์อย่างต่อเนื่องและการทำงานข้ามแอปพลิเคชันระดับมืออาชีพ นอกจากนี้ Google ยังให้ความสำคัญกับความปลอดภัยโดยการฝึกฝนแบบ Adversarial training และเพิ่มระบบการยืนยันจากผู้ใช้ก่อนการกระทำที่สำคัญหรือย้อนกลับไม่ได้

สรุปประเด็นหลัก

Computer Use ถูกรวมเข้าเป็นฟีเจอร์หลักใน Gemini 3.5 Flash เพื่อการสร้าง Agent

รองรับการทำงานข้ามแพลตฟอร์มทั้ง Browser, Mobile และ Desktop

มาพร้อมระบบความปลอดภัยแบบ Defense-in-depth เพื่อป้องกันการโจมตีประเภท Prompt Injection

นวัตกรรมและเทคโนโลยี

models

Built-in Computer Use

ความสามารถในการมองหน้าจอและสั่งการเมาส์/คีย์บอร์ดโดยตรงผ่านโมเดล Gemini 3.5 Flash

security

Enterprise Safeguard Systems

ระบบควบคุมความปลอดภัยที่กำหนดให้ต้องมีการยืนยันจากผู้ใช้ และหยุดงานอัตโนมัติหากพบสัญญาณอันตราย

Developer Impact
นักพัฒนาสามารถเข้าถึงความสามารถ Computer Use ได้ผ่าน Gemini API และ Gemini Enterprise Agent Platform เพื่อสร้าง Workflow อัตโนมัติที่ซับซ้อนโดยไม่ต้องใช้โมเดลแยก
Keywords
#gemini 3.5 flash #computer use #ai agents #automation #google cloud
Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

Google DeepMind