การจอดรถอัตโนมัติในพื้นที่ที่มีรถคันอื่นเคลื่อนที่อยู่เป็นงานที่ยาก เพราะต้องรักษาสมดุลระหว่างความแม่นยำเชิงเรขาคณิตและการตอบสนองต่อสิ่งรอบข้างแบบทันที CoPark แก้ปัญหานี้ด้วยการใช้สถาปัตยกรรม Residual-policy ที่รวมเอา 'แผนการเคลื่อนที่ล่วงหน้า' (Fixed action prior) เข้ากับการเรียนรู้แบบ 'ส่วนต่างการตอบสนอง' (Residual head) ผ่านกระบวนการ Self-play Reinforcement Learning
หัวใจสำคัญของ CoPark คือการจัดการช่องทางควบคุมแบบไม่สมมาตร (Channel-asymmetric release) โดยจะยอมให้ระบบการเรียนรู้เข้ามาควบคุมทิศทางตามยาวเพื่อหยุดหรือชะลอรถเมื่อมีภัยคุกคาม แต่ยังคงยึดติดกับแผนเดิมในทางขวางเพื่อรักษาความแม่นยำในการเข้าซอง ผลการทดสอบแสดงให้เห็นถึงพฤติกรรมที่ชาญฉลาด เช่น การหยุดรอในทางแคบ หรือการถอยรถเพื่อหลีกทางให้รถคันอื่น