مقاله یادگیری تقویتی مبتنی بر مدل برای ردیابی بهینه تقریبی افق بینهایت

توضیحات محصول

مقاله یادگیری تقویتی مبتنی بر مدل برای ردیابی بهینه تقریبی افق بینهایت

مقاله یادگیری تقویتی مبتنی بر مدل برای ردیابی بهینه تقریبی افق بینهایت

عنوان مقاله فارسی: یادگیری تقویتی مبتنی بر مدل برای ردیابی بهینه تقریبی افق بینهایت عنوان مقاله لاتین: Model-Based Reinforcement Learning for Infinite-Horizon Approximate Optimal Tracking نویسندگان: Rushikesh Kamalapurkar; Lindsey Andrews; Patrick Walters; Warren E. Dixon تعداد صفحات: 5 سال انتشار: 2017 زبان: لاتین Abstract: This brief paper provides an approximate online adaptive solution to the infinite-horizon optimal tracking problem for control-affine continuous-time nonlinear systems with unknown drift dynamics. To relax the persistence of excitation condition, model-based reinforcement learning is implemented using a concurrent-learning-based system identifier to simulate experience by evaluating the Bellman error over unexplored areas of the state space. Tracking of the desired trajectory and convergence of the developed policy to a neighborhood of the optimal


خرید محصول

محصولات مرتبط در دسته‌بندی "کامپیوتر و IT"

مقاله درباره روانشناسی تبلیغات
مقاله درباره روانشناسی تبلیغات
کامپیوتر و IT
بسته جامع گواهی مهارتی موسسه عروج ( شامل 5 مهارت ) جهت امتیاز در رتبه بندی
بسته جامع گواهی مهارتی موسسه عروج ( شامل 5 مهارت )...
کامپیوتر و IT
جرم یابی سایبری 24 ساعت کد 99507209
جرم یابی سایبری 24 ساعت کد 99507209
کامپیوتر و IT
رویكردهای نوین در شكل گیری شایستگی های فناورانه و دیجیتال 28 ساعت کد 99507206
رویكردهای نوین در شكل گیری شایستگی های فناورانه و...
کامپیوتر و IT
طراحی و اجرای رله های قابل برنامه ریزی و آشنایی با KNX کد99506979 مدت 32 ساعت
طراحی و اجرای رله های قابل برنامه ریزی و آشنایی با...
کامپیوتر و IT
رویكردهای نوین در شكل گیری شایستگی های فناورانه و دیجیتال 28 ساعت کد 99507205
رویكردهای نوین در شكل گیری شایستگی های فناورانه و...
کامپیوتر و IT