AI & MACHINE LEARNING

DeepSeek เปิดตัว V4 โมเดลเรือธงรุ่นใหม่ เน้นประสิทธิภาพสูงและรองรับ Context Window 1 ล้านโทเคน

MIT Technology Review24 Apr 2026

1 min read

Key Takeaways

DeepSeek V4 คือโมเดลโอเพนซอร์สประสิทธิภาพสูงที่เน้นความคุ้มค่าและรองรับข้อมูลมหาศาล ซึ่งถูกออกแบบมาให้ทำงานได้ดีบนโครงสร้างพื้นฐานฮาร์ดแวร์ของจีน

ทำไมเรื่องนี้ถึงสำคัญ

การเปิดตัวครั้งนี้แสดงให้เห็นว่าโมเดลแบบโอเพนซอร์สเริ่มมีประสิทธิภาพทัดเทียมโมเดลแบบปิดในราคาที่ถูกกว่ามาก และยังเป็นตัวบ่งชี้สำคัญว่าอุตสาหกรรม AI ในจีนกำลังพยายามสร้างระบบนิเวศของตนเองเพื่อลดผลกระทบจากการควบคุมการส่งออกชิปจากสหรัฐฯ

บริษัท AI สัญชาติจีน DeepSeek ได้เปิดตัวรุ่นพรีวิวของ V4 ซึ่งเป็นโมเดลเรือธงรุ่นใหม่ที่สืบทอดความสำเร็จจาก R1 โดยเน้นการพัฒนาใน 3 ด้านหลัก ได้แก่ การขยายขีดความสามารถในการประมวลผลข้อความ (Context Window) ให้รองรับได้สูงสุดถึง 1 ล้านโทเคน การปรับเปลี่ยนสถาปัตยกรรมภายในเพื่อเพิ่มประสิทธิภาพการใช้หน่วยความจำ และการลดการพึ่งพาฮาร์ดแวร์จากต่างประเทศโดยการปรับแต่งให้ทำงานได้ดีเยี่ยมบนชิป Ascend ของ Huawei

หัวใจสำคัญของ V4 คือการปรับปรุงกลไก Attention ให้มีความฉลาดมากขึ้น โดยตัวโมเดลจะเลือกให้ความสำคัญกับข้อมูลที่จำเป็นและทำการบีบอัดข้อมูลเก่า แทนที่จะประมวลผลข้อมูลทั้งหมดด้วยน้ำหนักที่เท่ากัน วิธีนี้ช่วยลดการใช้พลังงานประมวลผลลงเหลือเพียง 27% และใช้หน่วยความจำเพียง 10% เมื่อเทียบกับรุ่นก่อนหน้าในขณะที่ประมวลผลข้อมูลปริมาณมหาศาล ทำให้การสร้างผู้ช่วยเขียนโค้ดหรือระบบวิเคราะห์เอกสารจำนวนมากมีต้นทุนที่ถูกลงอย่างมีนัยสำคัญ นอกจากนี้ V4 ยังทำคะแนนการทดสอบได้ใกล้เคียงกับโมเดลชั้นนำแบบปิดอย่าง GPT-5.4 และ Claude 4.6 ในหลายด้าน โดยเฉพาะด้านการเขียนโปรแกรมและคณิตศาสตร์

สรุปประเด็นหลัก

รองรับ Context Window สูงถึง 1 ล้านโทเคน โดยมีประสิทธิภาพการใช้พลังงานและหน่วยความจำที่ดีขึ้นอย่างมาก

มีผลทดสอบด้านการเขียนโค้ดและคณิตศาสตร์ที่โดดเด่นกว่าโมเดลโอเพนซอร์สรายอื่นในตลาด

เป็นโมเดลรุ่นแรกที่ปรับแต่งมาเพื่อใช้งานกับชิป Huawei Ascend ของจีนโดยเฉพาะ

นวัตกรรมและเทคโนโลยี

infrastructure

Long Context Architecture

สถาปัตยกรรมใหม่ที่รองรับ 1 ล้านโทเคน โดยใช้การบีบอัดข้อมูลเก่าเพื่อลดภาระการประมวลผลและหน่วยความจำ

models

V4-Pro & V4-Flash

การออกโมเดลสองเวอร์ชันที่เน้นทั้งความซับซ้อนในงานระดับสูง (Pro) และความเร็วในการประมวลผลในราคาประหยัด (Flash)

infrastructure

Domestic Chip Optimization

การปรับแต่งซอฟต์แวร์ให้รองรับชิป Huawei Ascend 950 series เพื่อสร้างความมั่นคงทางเทคโนโลยีภายในจีน

Developer Impact

นักพัฒนาสามารถเข้าถึงความสามารถระดับ Frontier AI ผ่าน API ในราคาที่ถูกกว่าคู่แข่งหลายเท่า และสามารถรันโมเดลบนโครงสร้างพื้นฐานของตนเองได้เนื่องจากเป็นโอเพนซอร์ส

Keywords

#deepseek #ai model #open source #long context #huawei ascend

Original Source

อ่านข้อมูลเพิ่มเติมจากแหล่งข่าวหลัก

MIT Technology Review