
فرمت فایل : power point (قابل ویرایش در 72 اسلاید) توضیح : ی ادگیری تقویتی از این رو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق دادن پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نمائیم . دو استراتژی اصلی برای اینکار وجود دارد: .1 یکی استفاده از الگوریتم های ژنتیکی. .2 و دیگری استفاده از روشهای آماری و Dynamic Programming . ...