Skip to main content
SUPERVISOR
Mohammad Reza Ahmadzadeh
محمدرضا احمدزاده (استاد راهنما)
 
STUDENT
Navid Mosayyebzadeh Lahroodi
نوید مسیب زاده لاهرودی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1394

TITLE

Semantic Image Segmentation using SegNet: a convolutional encoder-decoder Network
Object detection and recognition is a subfield of computer vision that is currently heavily based on machine learning. For the past decade, the field of machine learning has been dominated by so-called “deep neural networks”, which takes advantage of the improvements in computing power and data availability. A In the proposed­ method­ a convolutional autoencoder­-­decoder network for the semantic segmentation of the input image into predefined objects is presented. The proposed algorithm in the section of encoder uses the max pooling layer index in encoder part in order to produce a feature map. Then in the next block, the proposed network segments the input image into recognized objects. Finally, in order to evaluate the proposed method, the proposed algorithm is applied to Cam-Vid dataset. Experimental results show that the proposed method obtains mean intersection over union on segmentation area of 62.3%, which shows the superiority of the proposed method in comparison with other similar methods. Keywords: convolutional Neural Network, Deep Learning, semantic sImage egmentation, Object Detection
شناسایی شیء، زیرمجموعه‌ای از حوزه بینایی ماشین است که در حال حاضر به‌شدت مبتنی بر یادگیری ماشین است. در دهه گذشته، زمینه یادگیری ماشین توسط شبکه‌های عصبی عمیق، که ناشی از پیشرفت در توانایی محاسبات و دسترسی به اطلاعات است، تحت تأثیر قرارگرفته است. شبکه عصبی کانولوشن نوعی از شبکه عصبی پرسپترون چند لایه است که برای پردازش بر روی تصاویر مناسب است. این شبکه به این منظور آموزش داده می‌شود که ویژگی‌های مختلفی مانند لبه‌ها، گوشه‌ها، و تفاوت‌های رنگ، در سرتاسر تصویر را استخراج نموده و آن‌ها را به شکل?های پیچیده­تر ترکیب نماید. برای شناسایی شیء در تصویر باید هم مکان احتمالی آن‌ها و هم نوع شیء تخمین زده شود. در این پایان‌نامه ادبیات جاری در مورد شناسایی شیء به‌وسیله شبکه‌های عصبی کانولوشن را موردبحث قرار داده و پیاده‌سازی و بهبود یکی از روش­ها را مدنظر قرار خواهیم داد. علی‌رغم برتری و موفقیت‌های نسبی به‌دست‌آمده در دیگر روش‌ها می­توان به این نتیجه رسید که شناسایی­شیء به­وسیله شبکه عصبی کانولوشن هنوز هم به‌عنوان یک دست?آورد نو در حال تکامل است. شبکه عصبی کانولوشن با کمترین نیاز به پیش‌پردازش داده‌ها مطرح شده است و در معماری آن وزن‌های شبکه به اشتراک گذاشته می‌شوند. بر مبنای آنچه بیان گردید، شبکه عصبی کانولوشن کاربردهای متعددی در حوزه‌ی بینایی ماشین پیدا کرده است. از جمله‌ این کاربردها می‌توان به دسته‌بندی اشیاء و تحلیل داده‌های چندرسانه‌ای اشاره نمود. در این پایان‌نامه یک سیستم شناسایی­شیء در تصویر به روش شبکه عصبی کانولوشن ارائه می‌گردد. در روش پیشنهادی، ابتدا شبکه عصبی خود رمزگذار و خود رمزگشای کانولوشن برای ناحیه­بندی معرفی می‌شود. الگوریتم نمونه افزایی در قسمت رمزگشای آن از اندیس­های ماکزیمم لایه ادغام جهت تولید نقشه ویژگی استفاده می­کند. در بخش بعدی، شبکه‌ عصبی کانولوشن پیشنهادی، شیء­های موجود در تصاویر را ناحیه­بندی می‌کند. در بخش انتهایی به­منظور ارزیابی روش پیشنهادی برمبنای شبکه عصبی SegNet، به عنوان یک شبکه مبنا استفاده شده ­ است این روش بر پایگاه داده‌ Cam Vid­اعمال گردیده و نتایج به­دست­آمده با میانگین دقت صحت ناحیه بندی %3/62 حاکی از کارایی روش پیشنهادی است. کلمات کلیدی: شبکه‌های کانولوشن، یادگیری عمیق، ناحیه بندی تصویر، شناسایی شیء

ارتقاء امنیت وب با وف بومی