ความสามารถของโมเดลภาษาขนาดใหญ่ (LLM) ในการตรวจจับและรายงานสภาวะภายในของตัวเอง หรือที่เรียกว่า Introspection กำลังถูกตั้งคำถามในงานวิจัยชิ้นนี้ โดยทีมนักวิจัยได้ตรวจสอบซ้ำผ่านการทดลองที่ควบคุมปัจจัยแวดล้อมได้ดีขึ้น และพบว่าหลักฐานพฤติกรรมในอดีตอาจยังไม่เพียงพอที่จะยืนยันว่า LLM มีความสามารถดังกล่าวจริง
จากการทดสอบด้วยการแทรกแซงสภาวะภายใน พบว่าโมเดลไม่สามารถแยกแยะได้ว่าความผิดปกตินั้นเกิดจากการแก้ไขภายในหรือเกิดจากการเปลี่ยนแปลงของอินพุตภายนอก นอกจากนี้ยังพบว่าการที่โมเดลสามารถทำนายผลลัพธ์จากข้อมูล hidden states ของตัวเองได้นั้น ไม่ได้แสดงถึงสิทธิพิเศษในการเข้าถึงข้อมูลภายในแต่อย่างใด เนื่องจากโมเดลที่เห็นเพียงแค่อินพุตก็สามารถทำนายได้ดีพอๆ กัน งานวิจัยนี้จึงสรุปว่าหลักฐานในปัจจุบันยังไม่สามารถยืนยันได้ว่า LLM มีการสังเกตการณ์ในระดับอภิปัญญา (Metacognitive monitoring)