Skip to main content
SUPERVISOR
Maziar Palhang
مازیار پالهنگ (استاد راهنما)
 
STUDENT
Mohammad ali Mirzaei badizi
محمدعلی میرزائی بادیزی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1392
Intelligent world and systems were a dream in the past,but by growing artificial intelligence field it in becoming a reality. the main factor in a intelligent system is learning and artificial intelligence makes it possible. mutiagent system learning becomes more accurate and faster by combining machine learning methods with them. multi agent learning include Cooperative and Competitive methods. In Competitive learning agents try to increase their utility however other’s utility may be decreased. In cooperative learning agents try to increase utility of all agents simultaneously. In recent years many works have been performed in cooperative learning, Most of these methods used reinforcement learning for learning. While these methods have a main challenge in how to combine the knowledge of agents. In this thesis we have addressed some of those challenges to improve Cooperative learning methods. to achieve this objective , some main points of cooperative learning have been detected, the first point is action selectionin reinforcement learning which we used a new heuristic function to select actions, the second and third points are combining knowledge and task division by two criteria “shortest experienced path” and “Shock”. By using these two criteria combine the knowledge has been improved. Overall experiments showed improve in quality and learning speed. Key Words: Cooperative learning, Multi-agent system,Reinforcement learning
: می‌توان گفت بشراز ساختاولین سیستم کامپیوتری، به دنبالسیستم‌های هوشمند بود. این رویا با فعالیت در شاخه هوش مصنوعی روزبه‌روز به واقعیت نزدیک‌تر شده است. اصلی‌ترین معیار هوشمندی قابلیت یادگیری است که بر همین اساس در هوش مصنوعی زیرشاخه یادگیری ماشین پدید آمد و روزبه‌روز بیشتر موردتوجه قرار گرفت. بعدها با ترکیب یادگیری ماشین با سیستم‌هایتوزیع‌شده، یادگیری در سیستم‌های چند عاملیباهدف افزایش سرعت و کیفیتموردبررسی قرار گرفت.یادگیری در سیستم‌های چندعاملیمی‌تواندبه‌صورت رقابتی و یا مشارکتی باشد.درسیستم‌هایچندعاملی مشارکتی عامل‌ها سعی دارند با همکاری پاداش گروهی خود را افزایش دهند.بر خلاف آن، در سیستم‌های رقابتیعامل‌های خودخواه در تلاش برای افزایش سود فردی خود بوده که این افزایش ممکن است به قیمت کاهش سود دیگران باشد. ترکیب اطلاعات را می‌توانبزرگ‌ترین چالش در روش‌های یادگیری مشارکتی دانست که از یادگیری تقویتی استفاده می‌نمایند.در پژوهش پیش رو باهدف بهبود یادگیری مشارکتی در سیستم‌هایچندعاملیروش‌هایارائه‌شدهموردبررسی قرار گرفت که نتیجه این بررسی شناسایی سه‌نقطه بحرانی بود.اولین نقطه بحرانی که بررسی شد انتخاب عمل در یادگیری مستقل بود که با ارائ? معیاری به نام کوتاه‌ترین فاصل?تجربه‌شدهو بهره‌گیری از این معیار به‌عنوان یک مکاشفه در انتخاب عمل،منجر به بهبود یادگیری تقویتی شد. نقطه بحرانی دوم،بخش ترکیب داده‌هایعامل‌ها است؛ در جهت بهبود این ترکیب داده‌هاابتدا معیار جدیدی به نام شوک ارائه‌شده، سپس با ترکیب این معیار با معیار حداقل فاصله تجربه‌شده، ترکیب مؤثری ایجاد شدهاست. درآخر موضوعی که کمتر موردبررسیقرارگرفتهتقسیم‌کار بین عامل‌هاباهدف کاهش اعمال تکراری و افزایش سرعت است.انجام آزمایش‌ها نشان داد این سه عمل در کنار هم می‌تواندبهبود چشم‌گیری در یادگیری مشارکتی ایجاد نماید. کلمات کلیدی:1. سیستم‌هایچندعاملی 2. یادگیری مشارکتی 3. یادگیری تقویتی

ارتقاء امنیت وب با وف بومی