Skip to main content
SUPERVISOR
Maziar Palhang
مازیار پالهنگ (استاد راهنما)
 
STUDENT
Dariush Hasanpoor
داریوش حسن پورآده

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1393

TITLE

Improvments in speed and quality of learning in multi-agent systems using a novel expertness criteria and fuzzy integral
In the real world, usually, peoples are coming together for sharing their knowledge and talking from their good and bad experiences and more or less everybody has something to say. Although we cannot ignore anybody's knowledge but it's common sense to assign more weight on the most experienced person's knowledge when we are going to decide what we need to do based on consultation from people. The achievements of this research have the same philosophy, that everybody needs to be heard. Fuzzy integrals are one of the most powerful and flexible methods for hearing everybody's knowledge and extract knowledge which is useful for everybody. One of the challenges is that how to fairly answer the "what is the agents' expertise and how to determine the most and least expert agent?" question. To answer this question, in this thesis, we have proposed «the hypothesis of expertness» which defines a framework for "expertness criteria" definitions, and based on this framework we have introduced a new expertness criteria and showed that the defined framework and criteria are much more efficient than the state of the art criteria "Shortest Experienced Path" criteria. Also, the power of using fuzzy integrals for intelligence aggregation and non-additive measuring/knowledge is demonstrated Key words: Multi-agent Systems, Cooperative Learning, Reinforcement Learning, Fuzzy Integral, Non-additive Knowledge
معمولا در دنیایی واقعی هنگامی که افراد برای انتقال دانش گرد هم می‌آیند و از تجربیات خوب و بد گذشته خود سخن می‌گویند هرکسی متناسب با جایگاهی که دارد دارای دانشی می‌باشد و در این انتقال دانش‌ها تجربیات هیچ کسی را نمی‌توان نادیده گرفت ولی گاها پیش می‌آید که تجربیات و دانش فردی دارای بار محتویاتی بیشتری نسبت به اطرافیان خود می‌باشد، مردم معمولا از دانش فرد خبره‌تر بیشتر بهره می‌برند تا افراد دیگر. دستاورد‌های این پژوهش بر مبنای همین فلسفه بنا شده است که سخن و دانش هرکسی باید شنیده شود. انتگرال فازی یکی از قوی‌ترین و منعطف‌ترین ابزارهای ریاضی برای ترکیب اطلاعات می‌باشد، لذا در این پژوهش از انتگرال فازی برای شنیدن بازتاب ندای دانش هر عامل در دانش جمعی و مدل کردن اطلاعات(دانش‌های) غیرافزایشی استفاده شده است. ولی در این راه مشکلاتی نیز وجود داشت و آن این بود که چگونه منصفانه بفهمیم که کدام عامل خبره‌تر از دیگری می‌باشد؟ در گذشته روش‌های متنوعی برای تخمین این معیار ارائه شد است که از شمارش میزان پاداش‌های مثبت و منفی عامل‌ها گرفته تا محاسبات پیچیده‌ای چون معیار‌های شوک و کوتاه‌ترین مسیر تجربه شده. در طی پژوهش که منجر به نگارش این پایان‌نامه گردید احساس شد که تمامی روش‌های قبلی در یک چیز مشترکند: بسیار پیچیده و غیر منعطف! وجود این فصل مشترک ناکارا انگیزه‌ای شد که در صدد ارائه‌ای معیاری برآیم که نه تنها ساده باشد بلکه در زندگی روزمره ما انسان‌ها هم تجلی داشته باشد. در پی این هدف ما به ارائه‌ی تئوری جامعی برای خبرگی پرداختیم که می‌تواند منشع بسیاری از تعاریف خبرگی، در آینده گردد؛ نهایتا با استفاده از تئوری خبرگی معرفی شده تعریفی برای یک معیار خبرگی جدید ارائه دادیم و نشان دادیم که تئوری و تعریف خبرگی جدید نسبت به تعاریف قبلی بسیار کارآمد بوده است. : 1- سیستم های چند عامله 2- یادگیری مشارکتی 3- یادگیری تقویتی 4- دانش غیرافزایشی 5- انتگرال فازی

ارتقاء امنیت وب با وف بومی