ในการพัฒนาระบบสนับสนุนการตัดสินใจ ข้อมูลการทดสอบส่วนใหญ่มักมาจากการจำลอง ซึ่งอาจแตกต่างจากพฤติกรรมมนุษย์จริง นักวิจัยจึงได้เปิดตัว BehaviorBench ซึ่งเป็นเกณฑ์มาตรฐานที่สร้างขึ้นจากประวัติการตัดสินใจจริงในระดับกระเป๋าเงิน (Wallet) จากตลาดพยากรณ์สาธารณะและบันทึกบนบล็อกเชน
ชุดข้อมูลนี้แบ่งออกเป็นสองระดับงานหลัก ได้แก่ 'Belief prediction' เพื่อทำนายจุดยืนและความมั่นใจของผู้ใช้ และ 'Trade prediction' เพื่อทำนายทิศทางและจำนวนเงินในการทำธุรกรรม โดยรวบรวมข้อมูลจาก 2,000 กระเป๋าเงิน ครอบคลุมกว่า 1.4 ล้านรายการ ผลการทดสอบเบื้องต้นพบว่าการใช้ข้อมูลประวัติย้อนหลังช่วยปรับปรุงการทำนายความเชื่อได้ดีกว่าการทำนายการซื้อขาย และแสดงให้เห็นถึงความท้าทายในการใช้หลักฐานพฤติกรรมจริงเพื่อสร้างระบบที่ปรับตามตัวบุคคล