นักวิจัยนำเสนอ WebXSkill ซึ่งเป็นเฟรมเวิร์กใหม่ที่ออกแบบมาเพื่อยกระดับความสามารถของ AI Agent ในการทำงานบนเบราว์เซอร์ โดยมุ่งเน้นที่การแก้ปัญหาของระบบเดิมที่ทักษะมักจะอยู่ในรูปแบบข้อความที่รันไม่ได้ หรือโค้ดที่ Agent ไม่เข้าใจขั้นตอนภายใน WebXSkill เข้ามาแก้ปัญหานี้ด้วยการสร้าง 'ทักษะที่ประมวลผลได้' (Executable Skills) ซึ่งประกอบด้วยโปรแกรมที่ทำงานได้จริงควบคู่ไปกับคำแนะนำภาษาธรรมชาติในแต่ละขั้นตอน
กระบวนการของ WebXSkill แบ่งออกเป็น 3 ขั้นตอนหลัก คือ การสกัดทักษะที่ใช้ซ้ำได้จากข้อมูลการทำงานเดิม การจัดระเบียบทักษะลงในกราฟตาม URL เพื่อการเรียกใช้ที่ตรงบริบท และการปรับใช้ทักษะในสองโหมด คือโหมดอัตโนมัติเต็มรูปแบบและโหมดให้คำแนะนำ ผลการทดสอบบน WebArena และ WebVoyager พบว่าวิธีนี้ช่วยเพิ่มอัตราความสำเร็จของงานขึ้นสูงสุดถึง 12.9 จุด เมื่อเทียบกับระบบพื้นฐานเดิม