นำเสนอ ADM สถาปัตยกรรมการฝึกสอนโมเดล AI ที่ใช้เลขคณิตแบบ Posit และระบบจัดการหน่วยความจำแบบใหม่ ช่วยลดการใช้หน่วยความจำในการเทรนให้ใกล้เคียงกับตอนใช้งานจริง
CLOUD & INFRA
Adaptive Domain Models
สถาปัตยกรรมการฝึกสอน AI แบบใหม่ที่ประหยัดหน่วยความจำและแม่นยำสูง
สรุปประเด็นหลัก
ใช้ Posit Arithmetic แทน IEEE-754 เพื่อลด Overhead ของหน่วยความจำและเพิ่มความแม่นยำทางเรขาคณิต
ระบบ Warm Rotation ช่วยให้สามารถอัปเดตโมเดลเข้าสู่ระบบ Inference ได้ทันทีโดยไม่ต้องหยุดบริการ
Bayesian Distillation ช่วยแก้ปัญหาการขาดแคลนข้อมูลสำหรับโมเดลเฉพาะทางโดยใช้โครงสร้างจากโมเดลทั่วไป
นวัตกรรมและเทคโนโลยี
infrastructure
Warm Rotation
กลไกการสลับเปลี่ยนโมเดลเวอร์ชันใหม่เข้าสู่ระบบทำงานจริงได้ทันทีโดยไม่มีการหยุดชะงักของบริการ
infrastructure
Posit-based Training
สถาปัตยกรรมการฝึกสอนที่รองรับมาตรฐาน b-posit 2026 เพื่อการคำนวณที่แม่นยำและประหยัดทรัพยากร
Developer Impact
ทำให้นักพัฒนาสามารถฝึกสอนโมเดลขนาดใหญ่บนฮาร์ดแวร์ที่มีข้อจำกัดด้านหน่วยความจำได้ดีขึ้น และช่วยให้การทำ CI/CD สำหรับโมเดล AI (MLOps) ทำได้ราบรื่นขึ้นผ่านระบบ Warm Rotation
Keywords
Original Source
arXiv