การพัฒนา Prompt สำหรับ AI Agent ในงานสืบค้นข้อมูลมักพบปัญหาว่าเราไม่รู้แน่ชัดว่า Prompt ใดที่ทำงานได้ดีจริงหรืองานล้มเหลวเพราะอะไร งานวิจัยนี้จึงนำเสนอ Contrastive Reflection ซึ่งเป็นลูปการทำงานที่เริ่มจากการนำเคสที่ล้มเหลว (Error) มาวางคู่กับเคสที่ใกล้เคียงกันแต่ทำสำเร็จ (Success) จากนั้นให้ Teacher LLM วิเคราะห์ความต่างและเสนอวิธีแก้ Prompt
จากการทดสอบกับชุดข้อมูล HotpotQA พบว่าวิธีนี้ช่วยเพิ่มความแม่นยำจาก 51.4% เป็น 60.4% ซึ่งสูงกว่าการใช้วิธีสุ่มตัวอย่างหรือการดูเฉพาะข้อผิดพลาดเพียงอย่างเดียว นอกจากนี้ผลลัพธ์ยังดีกว่าเครื่องมือ Prompt Optimizer ยอดนิยมอย่าง MIPROv2 และ GEPA ในบางกรณี
จุดเด่นของเฟรมเวิร์กนี้คือความเป็นเหตุเป็นผล (Interpretability) เนื่องจากขั้นตอนการแก้ไขเกิดจากการวิเคราะห์ร่องรอยการทำงาน (Trace) จริงๆ ของโมเดล ทำให้วิศวกรสามารถตรวจสอบและมั่นใจได้ว่าการแก้ไขจะไม่ทำให้กรณีที่เคยทำงานได้ดีอยู่แล้วกลับมาล้มเหลว (Regression check)