مقاله یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید
توضیحات محصول
مقاله یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید

عنوان مقاله فارسی: یادگیری Q زمان تعیین گسسته: تجزیه و تحلیل همگرایی جدید عنوان مقاله لاتین: Discrete-Time Deterministic Q -Learning: A Novel Convergence Analysis نویسندگان: Qinglai Wei; Frank L. Lewis; Qiuye Sun; Pengfei Yan; Ruizhuo Song تعداد صفحات: 13 سال انتشار: 2017 زبان: لاتین Abstract: In this paper, a novel discrete-time deterministic Q-learning algorithm is developed. In each iteration of the developed Q-learning algorithm, the iterative Q function is updated for all the state and control spaces, instead of updating for a single state and a single control in traditional Q-learning algorithm. A new convergence criterion is established to guarantee that the iterative Q function converges to the optimum, where the convergence criterion of
محصولات مرتبط در دستهبندی "کامپیوتر و IT"