Skip to main content
SUPERVISOR
علیرضا معمارمقدم (استاد مشاور) رسول امیر فتاحی ورنوسفادرانی (استاد راهنما)
 
STUDENT
Mohammad Taraghikhah
محمد ترقی خواه

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1391

TITLE

Study and Improvement of Partial Occlusion Invariant Sparsity-based Algorithm of Visual Tracking
: Tracking moving objects is one of the issues in the field of computer vision. Despite the passage of more than three decades, it has attracted the attention of researchers, mainly because of its many applications and challenges. Although the problem of object tracking history goes back to military issues, today it has very broad applications in the areas of industry and commerce in order to motion activity detection, surveillance, human-computer interaction, etc. Tracking can be determined as showing the state of an object and following its variations in successive frames of a video. Tracking in the unrestricted environments is still a challenging problem due to appearance changes of target object caused by intrinsic (such as pose and shape variations of object) or extrinsic (such as environmental illumination changes, camera motion and blurring, clutter, noise disturbance and occlusion) factors. However, in the majority of the video sequences, some parts of target object are not visible in different frames. This phenomenon is called partial occlusion and has been raised during recent years as a key issue in tracking research. The main goal of this study is to find a partial occlusion robust tracking algorithm. In addition, this algorithm should have superior performance against other tracking challenges and should have real time operation. In according to these reasons, we propose a two stage tracker based on coarse and fine sparse representation. At first, target object appearance modeled by a dictionary consisting of PCA basis vectors and trivial templates. We apply APG_L1 solving method for this modeling. We decrease number of trivial templates to decrease computation load such that we consider one trivial template for every a by a pixels. Then, best candidates in previous stage are evaluated by PCA_L1 method in order to determine the last candidate. We evaluate proposed tracker by performance criteria. Results show that, in addition to suitable resistivity to partial occlusion and different challenges, the tracker is significantly shorter in process duration. Also, simulations show that proposed tracker has a better performance in both accuracy and speed in comparison to other algorithms. We compare this tracker with 5 different popular algorithms and 7 new sparse trackers using 12 datasets. We conclude that proposed tracker with 14.2 frame per second, 10.2 pixel center error, 0.7475 average overlapped rate, has a better performance in comparison with nearest competitor with 2.7 frame per second, 12.9 pixel center error, 0.7458 average overlapped rate. Keywords: visual tracking, sparse representation, principal component analysis (pca), partial occlusion, appearance modeling
ردیابی اشیاء متحرک یکی از مسائل مطرح در حوزه بینایی ماشین است که به‌دلیل کاربردها و چالش‌های فراوان، هنوز هم با گذشت بیش از سه دهه، توجه محققان را به خود جلب نموده است. اگر‌چه سابقه طرح موضوع ردیابی به مسائل نظامی بر می‌گردد، ولی امروزه در حوزه‌های صنعتی و تجاری به‌منظور تحلیل حرکت، تشخیص فعالیت، نظارت و مراقبت، تعامل انسان با رایانه و غیره دارای کاربرد بسیار گسترده است. ردیابی را می‌توان نمایش تغییرات حالت یک شیء و دنبال کردن آن تغییرات در قاب‌های متوالی ویدئو تعریف کرد. ردیابی در محیط‌های بدون محدودیت به‌دلیل تغییرات منظر شیء هدف ناشی از فاکتورهای ذاتی ( همچون تغییر موقعیت و شکل شیء) و یا بیرونی ( از قبیل تغییر روشنایی و نورپردازی محیطی، حرکت دوربین و مات‌شدگی صحنه، وجود هدف‌نما، اختلالات نویزی و انسداد) مسئله‌ای چالش‌برانگیز است. از این میان، در اکثر دنباله تصاویر ویدئویی، بخشی از شیء هدف در قاب‌های مختلف قابلمشاهده نیست؛ چنین پدیده‌ای به انسداد جزئی موسوم بوده و به عنوان یکی از موضوعات کلیدی در بسیاری از تلاش‌های تحقیقاتی ردیابی در طی سال‌های اخیر مطرح بوده است. هدف این پژوهش، دستیابی به یک الگوریتم ردیابی است که علاوه بر مقاومبودن در برابر انسداد جزئی، حتی الامکان در برابر سایر چالش‌های ردیابی نیز عملکرد خوبی داشته باشد و همچنین از نظر زمانی، به‌حالت بلادرنگ نزدیک شود. برای این منظور ردیاب مبتنی بر نمایش تنک دومرحله‌ای زبر و نرم را ارائه می‌دهیم که در آن ابتدا منظر شیء هدف با واژه نامه‌ای متشکل از بردارهای پایه PCA و قالب‌های جزئی مدل می‌شود وبرای این مدل‌سازی از روش حل APG_L1بهره می‌بریم. برای افزایش سرعت محاسبات، در مرحله اول به کمک بلوک‌بندی مربعی و درشت روی قالب‌های جزئی، تعداد قالب‌های جزئی واژه‌نامه را کاهش می‌دهیم و آنگاه در مرحله بعد، برای پیدا کردن انسداد در سطح پیکسل، کاندیداهای برتر بدست آمده از مرحله قبل را با روش PCA_L1مورد ارزیابی قرار داده تا کاندیدای نهایی بدست آید. کارایی ردیاب پیشنهادی روی دنباله تصاویر مرجعOcclusion1, Occlusion2, Caviar2, Car4, Singer1, David Indoor, Car11, David Outdoor,Face, Deer, Sylvester2008b, Jumping و با معیارهای ارزیابی مرسوم توسط یک کامپیوتر GHz5 / 2core i5 با حافظه GB4 و تحت نرم افزار MATLAB 2013aمورد بررسی قرار گرفته است.نتایج شبیه‌سازی نشان می‌دهند که ردیاب علاوه برداشتن مقاومت خوب در برابر انسداد جزئی و برخی چالش‌های دیگر، به لحاظ زمانی نیز بهبود قابل ملاحظه‌ای داشته است.براساس این نتایج، می‌توان گفت که ردیاب پیشنهادی در مجموع نسبت به سایر روش‌ها دارای عملکرد بهتری هم در زمینه دقت و هم سرعت می‌باشد؛نتایج کمی مقایسه با پنج الگوریتم ردیابی غیر تنک و نیز هفت الگوریتم کارآمد و مرسوم تنک مبنا بر روی دوازده دنباله تصویر نشان می دهدکه ردیاب پیشنهادی با سرعت اجرای 2 / 14قاب بر ثانیه، منجر به میانگین خطای مرکزیابی 2 / 10 پیکسل و میانگین درصد هم‌پوشانی 7475 / . می‌شود در حالی‌که نزدیکترین الگوریتم رقیب، تنها با سرعتی حدود 7 / 2 قاب بر ثانیه، منجر به میانگین خطای مرکزیابی 9 / 12 پیکسل و میانگین درصد هم‌پوشانی 7458 / . می‌شود که این نتایج گویای برتری روش پیشنهادی هستند. کلماتکلیدی: ردیابیتصویری، بیان تنک، تحلیل مؤلفه اصلی (PCA)، انسداد جزئی،مدل‌سازی منظر

ارتقاء امنیت وب با وف بومی