Skip to main content
SUPERVISOR
Ali Fanian
علی فانیان (استاد راهنما)
 
STUDENT
Elham Seifossadat
الهام سیف السادات

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1389

TITLE

Indoor Scene Recognition
A scene is a view of a real-world environment that contains multiples surfaces and objects, organized in a meaningful way. The Aim of Scene recognition system is understand Scene type that shown in the image and then assign appropriate semantic tags to it. Creating such a system is one of the most important issues in the field of computer vision and robotics and has many applications in object recognition, semantic image and video retrieval, motion detection, locating and guiding a robot. Scene can be divided into two categories: Indoor and outdoor. Indoor scene includes enviroments such as kitchens, hospitals and even within the vehicle and the outdoor scene, including open spaces, such as streets, beach and mountains. There are some previous works devoted to the task of scene recognition, but they usually only perform well on outdoors. In contrast, recognition indoor images have remained a further challenging task due to the more difficult nature of the problem. The intra- kashida; TEXT-ALIGN: justify; LINE-HEIGHT: 90%; TEXT-KASHIDA: 0%; MARGIN: 12pt 0cm 10pt; unicode-bidi: embed; DIRECTION: ltr" In this thesis, we are designe a system to recognize indoor images. The algorithm contains two basic steps: extract data of images and scene modeling using this data. To extract local features of image are used set of SIFT, HOG and LBP descriptors. Also, to extract information on the spatial relationships in image regions are calculated Co-occurrence matrixs in several angels. Then, we use this information to semantic image segmentation and graph cut energy minimization to image labeling. The proposed method is invariant toward changes of scale, rotation, transformation, contrast, view point and occlusion and clutter in images. Another important feature of the proposed method is the ability to generalize to test images. Keywords: Computer vision, Scene Recognition, Semantic Segmentation, Local Semantic Concepts.
محیط، دیدی از دنیای واقعی شامل چندین شی و سطح است که به صورت معنی داری در کنار هم قرار گرفته اند. هدف سیستم شناسایی محیط، درک نوع محیط نشان داده شده در تصویر و سپس اختصاص برچسب معنایی مناسب به آن است. ایجاد چنین سیستمی یکی از مهم ترین مسائل در حوزه ی بینایی ماشین و رباتیک است و کاربردهای فراوانی در شناسایی اشیا، بازیابی معنایی تصویر و ویدئو، تشخیص حرکت، مکان یابی و هدایت ربات دارد. محیط را می توان به دو دسته ی داخلی و خارجی تقسیم کرد. محیط های داخلی شامل محیط های سرپوشیده مانند آشپزخانه، بیمارستان و یا حتی فضای درون خودرو می باشد و محیط خارجی شامل فضاهای باز مانند خیابان، ساحل، کوه است. تاکنون راه حل های زیادی برای شناسایی محیط ارائه شده است. بسیاری از این راه حل ها بر روی مجموعه تصاویر محیط های خارجی به خوبی کار می کنند، اما برای تصاویر محیط های داخلی، به علت پیچیدگی زیاد، تنوع درون کلاسی و شباهت بین کلاس ها، عملکرد ضعیفی از خود نشان می دهند. بنابراین تلاش برای ایجاد سیستمی که عملکرد رضایت بخشی در شناسایی تصاویر محیط داخلی داشته باشد، ضروری به نظر می رسد. در این پایان نامه، سیستمی برای شناسایی تصاویر محیط داخلی طراحی شده است. مراحل کلی این الگوریتم شامل دو گام اساسی استخراج اطلاعات تصاویر و مدل سازی محیط با استفاده از این اطلاعات است. در این پایان نامه، برای استخراج ویژگی های محلی تصویر از مجموعه ی توصیف گرهای SIFT، HOG و LBP استفاده شده است. برای استخراج روابط واطلاعات فضایی موجود در تصاویر از محاسبه هم رخدادی نواحی مختلف تصویر در چندین جهت استفاده شده است. سپس از این اطلاعات برای بخش بندی معنایی تصویر و برچسب گذاری نواحی محلی توسط الگوریتم کمینه سازی انرژی مبتنی بر برش گراف استفاده می شود. برای بررسی کارایی روش پیشنهادی، از مجموعه داده‌های شامل تصاویر 8 دسته محیط داخلی، 8 دسته محیط خارجی و 15 دسته محیط داخلی و خارجی استفاده شده است. این روش نسبت به تغییرات مقیاس، انتقال، دوران، روشنایی، زاویه‌ی دید و هم پوشانی و درهم ریختگی موجود در تصاویر مقاوم می‌باشد. از دیگر ویژگی های مهم روش پیشنهادی قابلیت تعمیم بالا به تصاویر آزمایشی ست. نتایج به دست آمده از آزمایش‌ها نیز گویای این مطلب است. کلمات کلیدی: 1- بخش بندی معنایی 2-برچسب گذاری 3-شناسایی محیط داخلی 4- مفاهیم معنایی محلی

ارتقاء امنیت وب با وف بومی