1- دانشگاه صنعتی خواجه نصیرالدین طوسی
2- دانشگاه شهید بهشتی
چکیده: (1124 مشاهده)
امروزه، برای حل بسیاری از مسائل، از سیستمهای چندعاملی مشارکتی استفاده میشود که در آن گروهی از عاملها برای رسیدن به یک هدف مشترک همکاری میکنند. همکاری میان عاملها، فوایدی همچون کاهش هزینههای عملیاتی، مقیاسپذیری بالا و سازگاری قابلتوجه را به ارمغان خواهد آورد. برای آموزش این عاملها در رسیدن به یک سیاست بهینه، از یادگیری تقویتی بهره میجویند. یادگیری در محیطهای چندعاملی مشارکتی پویا، غیرقطعی و با اندازه فضای حالت بزرگ به یک چالش بسیار مهم در برنامههای کاربردی تبدیلشده است. ازجمله این چالشها میتوان به تأثیر اندازه فضای حالت بر مدت زمان یادگیری و همچنین همکاری ناکارآمد میان عاملها و عدم وجود هماهنگی مناسب در تصمیمگیری عاملها اشاره کرد. همچنین هنگام استفاده از الگوریتمهای یادگیری تقویتی نیز با چالشهایی نظیر دشواری تعیین هدف یادگیری مناسب و زمان طولانی همگرایی ناشی از یادگیری مبتنی بر آزمایش و خطا مواجه خواهیم بود. در این مقاله، با معرفی یک چارچوب ارتباطی برای سیستمهای چندعاملی مشارکتی، تلاش شده چالشهای فوق تا حدی برطرف شود. در راستای حل مشکلات مربوط به همگرایی، انتقال دانش به کار برده شده است که میتواند به شکل قابلتوجهی در افزایش کارایی الگوریتمهای یادگیری تقویتی موثر واقع شود. همکاری میان عاملها با استفاده از عامل سرگروه و هماهنگی میان آنان توسط یک عامل هماهنگکننده صورت میپذیرد. چارچوب پیشنهادی برای حل مسأله گلهداری به کار رفته است و نتایج تجربی افزایش کارایی عاملها را نشان میدهند.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
تخصصي دریافت: 1397/10/30 | پذیرش: 1398/10/5 | انتشار الکترونیک پیش از انتشار نهایی: 1399/7/14 | انتشار: 1398/5/24