ارائه‌ی یک توصیفگر جدید برای شناسایی حرکات انسان در دنباله‌ی تصاویر با استفاده از هارمونیک‌های کروی

STUDENT

DEGREE

YEAR

The aim of this thesis is to introduce a new descriptor for the action recognition in video. Action recognition is considered as a combination of human action representation, and subsequent dir=ltr A new invariant action descriptor based upon spherical harmonics, is introduced to describe the STV. The generalizations of Fourier expansion of periodic functions on the line, and polar coordinate representation of function in the plane, to three dimensions lead to the theory of spherical harmonics. Spherical harmonic basis functions are constructed on a unit sphere with two parameters in the spherical coordinate system. To describe surfaces regardless of whether they are stellar or not, spherical harmonics in its parametric form is used. It is shown that the three sets of coefficient ( ) can completely define the shape. In this thesis, it is discussed how spherical harmonics are invariant with respect to transl Keywords: Computer vision, Action Recognition, Space-time volume, Spherical Harmonics

در این پایان نامه، هدف طراحی یک توصیفگر جدید برای شناسایی حرکات انسان در دنباله‌ی تصاویر است. ساخت سیستمی که قادر به شناسایی انسان در دنباله‌ی تصاویر و تشخیص حرکات وی باشد، گام رو به جلو و بزرگی در بکارگیری ماشین در زمینه‌های مختلف محسوب می‌شود. امروزه بینایی ماشین به عنوان یکی از شاخه های رو به رشد و جذاب هوش مصنوعی شناخته شده است که موضوع ردیابی و تشخیص حرکات انسان نیز جزو زمینه های مهم تحقیقاتی آن است. از جمله کاربردهای مهم این زمینه می‌توان به سیستم‌های امنیتی، رابط های کاربر هوشمند، اتاق های گفتگوی اینترنتی، درک زبان های اشاره، اتومبیل‌های خودکار، کمک به بیماران دارای مشکل حرکتی، آموزش ورزش‌های مختلف و طراحی ربات‌های خانگی اشاره کرد. تاکنون راه حل‌های متعددی برای شناسایی حرکات انسان در دنباله‌ی تصاویر ارائه شده است، اما هیچ کدام از این روش‌ها قادر به حل کامل مسئله نبوده‌اند. روش های ارائه شده به طور کلی شامل دو مرحله هستند: 1) نمایش اطلاعات دنباله‌ی تصاویر و توصیف آن 2) رده‌بندی. در این پایان نامه برای نمایش اطلاعات دنباله‌ی تصاویر از حجم مکان-زمان به دلیل در نظر گرفتن تمامی اطلاعات دنباله‌ی تصاویر استفاده شده است. برای توصیف حجم مکان-زمان، توصیفگر جدیدی پیشنهاد شده است که مبتنی بر ضرایب هارمونیک‌های کروی می‌باشد. ضرایب هارمونیک های کروی به دلیل ارائه‌ی توصیف منحصر بفرد برای توابع کروی و مقاوم بودن به چرخش انتخاب مناسبی هستند. برای پیاده سازی توصیفگر پیشنهادی، حجم مکان-زمان باید به گونه ای طراحی شود که بتواند شرایط لازم به عنوان ورودی روش هارمونیک های کروی را دارا باشد. ورودی هارمونیک های کروی، تابعی کروی با عدد دسته ای صفر است که دارای توزیع یکنواخت نقاط ورودی نیز می باشد. توصیفگر پیشنهادی نسبت به انتقال، تغییرات مقیاس، تغییرات زاویه دید و تا حدی نویز مقاوم است. در این پایان نامه روش جدیدی برای حل مسئله‌ی تشخیص حرکات انسان در دنباله‌ی تصاویر مبتنی بر توصیفگر پیشنهادی ارائه شده است. برای بررسی کارایی روش پیشنهادی، از مجموعه داده‌های KTH، Weizmann، Gesture و مقاوم استفاده شده است. روش پیشنهادی به دلیل استفاده از توصیفگر پیشنهادی، نسبت به انتقال، تغییرات مقیاس، تغییرات زاویه‌ی دید و تا حدی نویز مقاوم می‌باشد. نتایج به دست آمده از آزمایش‌ها نیز گویای این مطلب است. برای بررسی عملکرد روش پیشنهادی در برابر چالش متفاوت بودن تعداد دفعات انجام یک حرکت در دنباله‌های تصاویر مختلف، الگوریتمی طراحی گردیده است که این چالش را در نظر بگیرد. سپس این الگوریتم بر روی مجموعه داده‌های مرجع اعمال گشته است. نتایج به دست آمده بیانگر این مطلب است که روش پیشنهادی مقاوم به چالش ذکر شده نیز می‌باشد. کلمات کلیدی: 1- شناسایی حرکات انسان 2-حجم مکان-زمان 3-هارمونیک‌های کروی 4-انحراف زمانی پویا