مقاله یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید

توضیحات محصول

مقاله یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید

مقاله یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید

عنوان مقاله فارسی: یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید عنوان مقاله لاتین: Discrete-Time Deterministic Q -Learning: A Novel Convergence Analysis نویسندگان: Qinglai Wei; Frank L. Lewis; Qiuye Sun; Pengfei Yan; Ruizhuo Song تعداد صفحات: 13 سال انتشار: 2017 زبان: لاتین Abstract: In this paper, a novel discrete-time deterministic Q-learning algorithm is developed. In each iteration of the developed Q-learning algorithm, the iterative Q function is updated for all the state and control spaces, instead of updating for a single state and a single control in traditional Q-learning algorithm. A new convergence criterion is established to guarantee that the iterative Q function converges to the optimum, where the convergence criterion of


خرید محصول

محصولات مرتبط در دسته‌بندی "کامپیوتر و IT"

مقاله درباره روانشناسی تبلیغات
مقاله درباره روانشناسی تبلیغات
کامپیوتر و IT
بسته جامع گواهی مهارتی موسسه عروج ( شامل 5 مهارت ) جهت امتیاز در رتبه بندی
بسته جامع گواهی مهارتی موسسه عروج ( شامل 5 مهارت )...
کامپیوتر و IT
جرم یابی سایبری 24 ساعت کد 99507209
جرم یابی سایبری 24 ساعت کد 99507209
کامپیوتر و IT
رویكردهای نوین در شكل گیری شایستگی های فناورانه و دیجیتال 28 ساعت کد 99507206
رویكردهای نوین در شكل گیری شایستگی های فناورانه و...
کامپیوتر و IT
طراحی و اجرای رله های قابل برنامه ریزی و آشنایی با KNX کد99506979 مدت 32 ساعت
طراحی و اجرای رله های قابل برنامه ریزی و آشنایی با...
کامپیوتر و IT
رویكردهای نوین در شكل گیری شایستگی های فناورانه و دیجیتال 28 ساعت کد 99507205
رویكردهای نوین در شكل گیری شایستگی های فناورانه و...
کامپیوتر و IT