Innovation Pulse:The Real-time Tech Landscape
Pulse Insights
ในวันที่ 23 พฤษภาคม 2024 เทคโนโลยีกำลังโฟกัสไปที่ AI & Machine Learning, Cloud & Computing, Robotics & Autonomy และ Cybersecurity & Ethics โดยเฉพาะ Generative AI & LLMs ซึ่งชี้ให้เห็นถึงแนวโน้มการเปลี่ยนผ่านสู่ยุคระบบอัตโนมัติอัจฉริยะที่ผนวกเข้ากับโครงสร้างพื้นฐานที่มีความปลอดภัยสูง
10 ข่าวล่าสุด
Auto-Rubric as Reward: การใช้เกณฑ์ตรวจสอบที่ชัดเจนเพื่อฝึกฝนโมเดล AI มัลติโมดอล
- Auto-Rubric as Reward (ARR) เปลี่ยนความพึงพอใจที่คลุมเครือให้เป็นเกณฑ์ที่ตรวจสอบได้
- RPO ช่วยให้การฝึกฝนโมเดลสร้างภาพมีเสถียรภาพและแม่นยำขึ้น
- ลดปัญหา Reward Hacking และอคติในการประเมินผลของ VLM
Auto-Rubric as Reward (ARR)
Rubric Policy Optimization (RPO)
#rlhf#multimodal learning#reward modeling#rubric-as-reward#text-to-image
การใช้เส้นตาราง (Grid) ช่วยเพิ่มความแม่นยำให้ LLM ในการดึงข้อมูลจากแผนภูมิ
- การวางเส้นตารางทับรูปแผนภูมิช่วยลดความผิดพลาดในการดึงข้อมูลลงอย่างมาก
- เทคนิค Chain-of-Thought ไม่ได้ช่วยให้ AI อ่านกราฟแม่นยำขึ้นเสมอไป
- พิสูจน์แล้วด้วยชุดข้อมูลแผนภูมิสังเคราะห์และโมเดลมัลติโมดอลในปัจจุบัน
Grid-based Spatial Priming
#multimodal llm#chart data extraction#spatial priming#computer vision#prompt engineering
การพัฒนาโมเดล Embedding เพื่อวัดความพึงพอใจแทนการวัดความหมายทางภาษา
- เสนอแนวคิด Preferential Similarity เพื่อวัดความสอดคล้องของจุดยืนแทนความหมายทางภาษา
- ชี้ให้เห็นปัญหาของ Semantic Nuisance ที่ทำให้การคาดการณ์ความพึงพอใจผิดเพี้ยน
- พิสูจน์แล้วว่าช่วยปรับปรุงการทำนายความพึงพอใจในชุดข้อมูลการสนทนาจริง 11 ชุด
Preferential Similarity
#text embeddings#preferential similarity#deliberation#ai alignment#representation learning
การแยกแยะระหว่างการดึงความสามารถเดิมกับการสร้างความสามารถใหม่ในการฝึกฝน AI
- นำเสนอแนวคิดการแยกแยะระหว่างการดึงความสามารถเดิม (Elicitation) และการสร้างความสามารถใหม่ (Creation)
- ใช้นิยาม Accessible Support เพื่อกำหนดขอบเขตพฤติกรรมที่โมเดลทำได้จริง
- อธิบายกระบวนการผ่านมุมมอง Free-energy เพื่อชี้ให้เห็นความแตกต่างของสัญญาณจากการสาธิตและรางวัล
นิยาม Accessible Support
Free-energy Perspective ในการฝึก AI
#large language models#post-training#capability elicitation#free-energy principle#ai research
วิจัยชี้ ความน่าเชื่อถือของโมเดล VLM ซ่อนอยู่ใน Hidden States ไม่ใช่ความคมชัดของ Attention
- Attention map ไม่สามารถใช้ทำนายความถูกต้องของคำตอบ AI ได้ (ความสัมพันธ์ใกล้ศูนย์)
- Hidden state geometry ในเลเยอร์ท้ายๆ เป็นตัวบ่งชี้ความน่าเชื่อถือที่แม่นยำที่สุด
- โมเดลแบบ Early-fusion มีโครงสร้างที่ทนทานต่อการถูกทำลายข้อมูลมากกว่า Late-fusion
VLM Reliability Probe (VRP)
#vision-language models#mechanistic interpretability#attention mechanism#vlm reliability#neural networks
3 ปัจจัยสำคัญในยุคเศรษฐกิจ AI จากมุมมองนักเศรษฐศาสตร์รางวัลโนเบล Daron Acemoglu
- AI Agent ยังมีข้อจำกัดในการสลับและเชื่อมโยงงานย่อยหลายอย่างเข้าด้วยกัน
- บริษัทเทคโนโลยีกำลังพยายามควบคุมทิศทางนโยบายเศรษฐกิจผ่านการจ้างนักเศรษฐศาสตร์ชื่อดัง
- ผลิตภาพจาก AI จะเพิ่มขึ้นอย่างมีนัยสำคัญเมื่อมีเครื่องมือที่ใช้งานง่ายเหมือนซอฟต์แวร์สำนักงานยุคก่อน
#ai economics#daron acemoglu#ai agents#productivity#labor market
Google เปิดตัวโครงการ REPLIQA ผสานเทคโนโลยี Quantum AI เข้ากับวิทยาศาสตร์ชีวภาพ
- Google สนับสนุนงบวิจัย 10 ล้านดอลลาร์ให้แก่ 5 มหาวิทยาลัยชั้นนำ
- เน้นการพัฒนาควอนตัมเซนเซอร์และอัลกอริทึมเพื่อจำลองปฏิสัมพันธ์ระดับโมเลกุล
- เป้าหมายสูงสุดคือการใช้เทคโนโลยีควอนตัมเพื่อเร่งการค้นพบตัวยาใหม่และการรักษาระดับสูง
โปรแกรมวิจัย REPLIQA
เทคโนโลยีควอนตัมจำลองโมเลกุล
#google quantum ai#repliqa#life sciences#molecular simulation#quantum sensors
การเข้ารหัส E2EE บน RCS เริ่มเปิดใช้งานระหว่าง Android และ iPhone แล้ว
- เริ่มเปิดตัว E2EE สำหรับ RCS ข้ามแพลตฟอร์มระหว่าง Android และ iOS
- ระบบจะเปิดใช้งานการเข้ารหัสให้โดยอัตโนมัติ (On by default)
- ผู้ใช้สามารถสังเกตไอคอนแม่กุญแจเพื่อยืนยันสถานะการเข้ารหัสในบทสนทนา
Cross-platform E2EE RCS
#rcs#e2ee#android#iphone#google messages
AWS เปิดตัวระบบจ่ายเงินอัตโนมัติสำหรับ AI Agents และชุดเครื่องมือใหม่สำหรับนักพัฒนา
- Amazon Bedrock AgentCore รองรับการจ่ายเงินผ่าน Coinbase และ Stripe สำหรับ AI Agents
- เปิดตัว Agent Toolkit for AWS เพื่อเพิ่มความแม่นยำและลดต้นทุนให้ Coding Agents
- เปิดตัวอินสแตนซ์ EC2 M8idn/R8idn ประสิทธิภาพสูงขึ้น 43% ต่อ vCPU
AgentCore Payments
Agent Toolkit for AWS
EC2 M8idn/R8idn Instances
#aws#amazon bedrock#agentcore#ec2 m8idn#agent toolkit
ใช้ Gemini เปลี่ยนโน้ตเขียนมือเป็นคู่มือเตรียมสอบอัจฉริยะ
- รองรับการอัปโหลดรูปถ่ายโน้ตเขียนมือเพื่อสร้างคู่มือเตรียมสอบ
- สามารถปรับแต่งระดับความซับซ้อนของเนื้อหาตามความต้องการของผู้เรียน
- เปลี่ยนบันทึกให้เป็นแฟลชการ์ดช่วยจำได้ทันที
Handwritten Note Digitization
#gemini#study guide#handwriting to text#ai education#google