بهبود یادگیری Q با استفاده از هم زمانی به روزرسانی و رویه تطبیقی بر پایه عمل متضاد


در حال بارگذاری
23 اکتبر 2022
فایل ورد و پاورپوینت
2120
2 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

 بهبود یادگیری Q با استفاده از هم زمانی به روزرسانی و رویه تطبیقی بر پایه عمل متضاد دارای ۱۳ صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

فایل ورد بهبود یادگیری Q با استفاده از هم زمانی به روزرسانی و رویه تطبیقی بر پایه عمل متضاد  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی بهبود یادگیری Q با استفاده از هم زمانی به روزرسانی و رویه تطبیقی بر پایه عمل متضاد،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن بهبود یادگیری Q با استفاده از هم زمانی به روزرسانی و رویه تطبیقی بر پایه عمل متضاد :

نام کنفرانس، همایش یا نشریه : مهندسی برق و مهندسی کامپیوتر ایران – ب مهندسی کامپیوتر

تعداد صفحات :۱۳

روش یادگیری Q یکی از مشهورترین و پرکاربردترین روش های یادگیری تقویتی مستقل از مدل است. از جمله مزایای این روش عدم وابستگی به آگاهی از دانش پیشین و تضمین در رسیدن به پاسخ بهینه است. یکی از محدودیت های این روش کاهش سرعت همگرایی آن با افزایش بعد است. بنابراین افزایش سرعت همگرایی به عنوان یک چالش مطرح است. استفاده از مفاهیم عمل متضاد در یادگیری Q، منجر به بهبود سرعت همگرایی می شود زیرا در هر گام یادگیری، دو مقدار Q به طور هم زمان به روز می شوند. در این مقاله روشی ترکیبی با استفاده از رویه تطبیقی در کنار مفاهیم عمل متضاد برای افزایش سرعت همگرایی مطرح شده است. روش ها برای مساله Grid world شبیه سازی شده است. روش های ارائه شده بهبود در میانگین درصد نرخ موفقیت، میانگین درصد حالت های بهینه، متوسط تعداد گام های عامل برای رسیدن به هدف و میانگین پاداش دریافتی را نشان می دهند.

کلید واژه: رویه تطبیقی، سرعت همگرایی، عمل متضاد، هم زمانی به روزرسانی، یادگیری Q

  راهنمای خرید:
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.