AI & MACHINE LEARNING

Google เปิดตัว Gemini 3.1 Flash Live โมเดลเสียงยุคใหม่ที่เร็วและเป็นธรรมชาติกว่าเดิม

Google DeepMind Blog26 Mar 2026

1 min read

Key Takeaways

Gemini 3
1 Flash Live คือมาตรฐานใหม่ของ AI ด้านเสียงที่เน้นความเร็ว ความเป็นธรรมชาติ และการรองรับภาษาที่หลากหลายกว่า 200 ประเทศ

ทำไมเรื่องนี้ถึงสำคัญ

การพัฒนา AI ให้คุยโต้ตอบได้เหมือนมนุษย์แบบเรียลไทม์เป็นก้าวสำคัญของอินเทอร์เฟซแบบ Voice-first ซึ่งจะช่วยให้การสั่งงานด้วยเสียงในชีวิตประจำวันหรือการบริการลูกค้าทางโทรศัพท์มีความเป็นธรรมชาติและมีประสิทธิภาพมากขึ้นอย่างก้าวกระโดด

Google ประกาศเปิดตัว Gemini 3.1 Flash Live ซึ่งเป็นโมเดล AI ด้านเสียงที่มีคุณภาพสูงสุดในปัจจุบัน ออกแบบมาเพื่อการโต้ตอบแบบเรียลไทม์ที่ให้จังหวะการพูดเป็นธรรมชาติและมีความแม่นยำสูงขึ้น โมเดลนี้ถูกพัฒนาให้มีความหน่วง (Latency) ต่ำมาก เหมาะสำหรับนักพัฒนาที่ต้องการสร้าง Voice Agents ที่ตอบสนองได้ทันใจ

จุดเด่นของ 3.1 Flash Live คือความสามารถในการเข้าใจน้ำเสียง (Tone) และอารมณ์ของผู้ใช้ เช่น ความสับสนหรือหงุดหงิด และปรับการตอบสนองให้เหมาะสม นอกจากนี้ยังมาพร้อมกับระบบลายน้ำ SynthID เพื่อระบุตัวตนของเสียงที่สร้างโดย AI ป้องกันการแพร่กระจายข้อมูลเท็จ โดยโมเดลนี้เปิดให้นักพัฒนาใช้งานแล้วผ่าน Gemini Live API บน Google AI Studio และ Vertex AI

สรุปประเด็นหลัก

ให้ความหน่วงต่ำและความแม่นยำในการเรียกใช้งานฟังก์ชัน (Function Calling) สูงถึง 90.8%

รองรับการใช้งานมากกว่า 200 ประเทศผ่าน Gemini Live และ Search Live

ฝังลายน้ำ SynthID ในทุกเสียงที่สร้างขึ้นเพื่อความโปร่งใสและความปลอดภัย

นวัตกรรมและเทคโนโลยี

developer tools

Gemini Live API

เปิดให้นักพัฒนาเข้าใช้งานโมเดลเสียงรุ่น 3.1 Flash Live เพื่อสร้าง Voice Agents ที่มีประสิทธิภาพสูง

models

Multilingual Support

รองรับการสนทนาในหลายภาษาและใช้งานได้ครอบคลุมทั่วโลกกว่า 200 ประเทศ

security

SynthID Watermarking

เทคโนโลยีฝังลายน้ำในข้อมูลเสียงเพื่อระบุว่าเป็นเนื้อหาที่สร้างจาก AI

Developer Impact

นักพัฒนาสามารถสร้างระบบสั่งการด้วยเสียงที่มีความซับซ้อนได้ดีขึ้น ด้วยความสามารถในการประมวลผลคำสั่งที่ซ้อนกันและความเข้าใจบริบทเสียงที่ดียิ่งขึ้น ช่วยลดช่องว่างระหว่างการโต้ตอบของมนุษย์และคอมพิวเตอร์

Keywords

#gemini 3.1 flash live #google ai #voice ai #multimodal #synthid

Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

Google DeepMind Blog