ในปัจจุบันมีการใช้โมเดล Embedding เพื่อจัดกลุ่มความคิดเห็นหรือการตัดสินใจร่วมกันของผู้คนจำนวนมาก อย่างไรก็ตาม Embedding มาตรฐานมักจะวัด 'ความเหมือนกันทางอรรถศาสตร์' (Semantic Similarity) ซึ่งอาจไม่สะท้อนถึงจุดยืนที่แท้จริงของผู้พูดเสมอไป งานวิจัยนี้จึงนำเสนอแนวคิด 'Preferential Similarity' เพื่อให้ระยะห่างในพื้นที่เวกเตอร์สอดคล้องกับระดับความเห็นชอบของผู้ใช้งานต่อข้อความนั้นๆ
ทีมวิจัยชี้ให้เห็นว่าโมเดล Embedding ทั่วไปมักมีปัญหาเรื่องการรบกวนจากสไตล์การเขียนหรือการเลือกใช้คำ (Semantic Nuisance) ซึ่งอาจทำให้ข้อความที่มีจุดยืนต่างกันแต่ใช้คำคล้ายกันถูกจัดให้อยู่ใกล้กันเกินไป ผู้วิจัยจึงได้สร้างชุดข้อมูลสังเคราะห์เพื่อทำลายความสัมพันธ์ที่ผิดเพี้ยนนี้ และพัฒนาวิธีการฝึกฝนที่ช่วยให้โมเดลสามารถแยกแยะจุดยืนและค่านิยม (Stance and Values) ออกมาได้แม่นยำขึ้น โดยผ่านการทดสอบกับชุดข้อมูลการเจรจาออนไลน์กว่า 11 ชุด