نام پژوهشگر: احمدرضا ناظمی سجزیی
احمدرضا ناظمی سجزیی امیررضا ابطحی
چالش بزرگ مدیریت سفارش دهی در زنجیره تأمین اتخاذ یک راهبرد سفارش دهی مناسب در هر رده از زنجیره تأمین برای کاهش هزینه انبار و در نتیجه کاهش هزینه ها در زنجیره تأمین است. در این پایان نامه عامل های هوشمند نرم افزاری وظیفه تصمیم گیری پویا را برای پیدا کردن یک راهبرد مناسب سفارش دهی بر عهده می گیرند. در گام اول ما به سراغ الگوریتم یادگیری q می رویم و ضمن نشان دادن برتری آن نسبت به الگوریتم هایی که سیاست ثابت سفارش دهی را اتخاذ می کنند به بیان ضعف های آن در مدیریت سفارش دهی با فضای حالت بزرگ همچون سیستم های چند عامله می پردازیم. در گام بعد راهکاری را برای عمومیت بخشیدن به الگوریتم یادگیری q با استفاده از تقریب زدن بیان می کنیم و نشان می دهیم که استفاده از الگوریتم بهینه شده با غلبه بر مشکل فضای حالت وسرعت یادگیری پایین، می تواند به خوبی روش های قبلی راهبرد بهینه را برای مدیریت سفارش دهی پیدا کند. این دست آورد سبب میشود که راه برای استفاده از این الگوریتم در مسایل دنیای واقعی که شامل شبکه ای از زنجیره های تامین با رده های مختلف سفارش دهی هستند هموار شود.