Skip to main content
SUPERVISOR
Nader Karimi,Shadrokh Samavi
نادر کریمی (استاد راهنما) شادرخ سماوی (استاد مشاور)
 
STUDENT
Alireza Norouzi
علیرضا نوروزی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1395

TITLE

Image Semantic Segmentation using Differentiable-Memory Augmented Deep Fully Convolutional Neural Networks
Semantic segmentation is one of the major problems in the computer vision domain. Solving this task effectively is a step towards more complex tasks such as scene understanding and object interactions recognition from visual data. Semantic segmentation is applicable in many important real world applications as well. Self-driving vehicles and robot vision, which can have great impact on the living quality, is among those fields that can benefit from semantic segmentation. On the other hand, advances in deep learning have caused noticeable improvements in many AI subfields such as computer vision. Semantic segmentation has also enjoyed the recent advances of deep neural networks, fully convolutional networks, and new methods based on deep learning, which has surpassed their Segmentation, Fully Convolutional Networks, Memory Augmented Neural Network Key Words : Semantic Segmentation, Fully Convolutional Networks, Memory Augmented Neural Networks
بخش‌بندی معنایی تصاویر یکی از مهم‌ترین مسائل مطرح در علم بینایی کامپیوتر است. حل مناسب این مسئله، دروازه‌ای به سوی حل مسائل پیچیده‌تر نظیر فهم ساختار محیط و استخراج روابط اشیا در تصویر است. این مسائل در زمینه‌‌های بسیار مهمی از جمله خودرو‌های خودران و رباتیک کاربرد دارند و می‌توانند تأثیرات شگرفی بر بهبود زندگی انسان در آینده برجای گذارند. از طرف دیگر در دهه اخیر، استفاده از شبکه‌‌های عصبی عمیق، در حل بسیاری از مسائل مطرح در هوش مصنوعی و به ویژه بینایی کامپیوتر، بسیار موثر واقع شده است. در زمینه بخش‌بندی معنایی تصاویر هم، شبکه‌‌های عصبی عمیق و به ویژه شبکه‌‌های کانولوشنی کامل، پیشرفت خوبی را نسبت به روش‌های پیشین ایجاد کرده‌‌اند. با وجود پیشرفت‌های صورت گرفته توسط شبکه‌های عصبی کانولوشنی کامل، این مدل‌ها هنوز دارای نقاط ضعفی در ساختار خود هستند و در موارد بسیاری موفق به بخش‌بندی معنایی موفقی نمی‌شوند. در این پایان‌نامه هدف بهبود عملکرد شبکه‌های عصبی عمیق در زمینه بخش‌بندی معنایی تصاویر به وسیله افزودن اجزای مختلف به یک شبکه عصبی‌ کانولوشنی کامل، با در نظر گرفتن وظایف مشخص برای هر جز است. این اجزا عبارت‌اند از مکانیسم توجه که به شبکه این قابلیت را می‌دهد که تنها روی قسمت‌‌های خاصی از ورودی یا خروجی تمرکز کند و حافظه خارجی که به شبکه اجازه می‌دهد اطلاعات را در گام‌‌های مختلف بدون از دست رفتن ذخیره و بازیابی کند. تمام اجزا نیز توسط یک کنترل‌کننده مرکزی که یک شبکه بازگشتی است کنترل می‌شوند. نتایج به دست آمده در پیاده‌سازی ساختار پیشنهادی نشان می‌دهد با در نظر گرفتن اجزای مختلف به یک شبکه عصبی کانولوشنی کامل پایه، می‌توان دقت نهایی را تا 15 درصد افزایش داد که مبین تأثیرگذار بودن طراحی شبکه‌ها با در نظر گرفتن اجزای مختلف با وظایف مشخص برای این اجزا است. کلمات کلیدی: بخش‌بندی معنایی، شبکه‌های کانولوشنی کامل، شبکه‌های عصبی دارای حافظه

ارتقاء امنیت وب با وف بومی