Skip to main content
SUPERVISOR
Abdolreza Mirzaei
عبدالرضا میرزایی دمابی (استاد راهنما)
 
STUDENT
Amir Hossein Saleki
امیرحسین سالکی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1390

TITLE

Human Action Recognition using Probabilistic Graphical Models
Probabilistic Graphical Models is a powerful framework for representation and inference in probability distributions with many random variables. Sequence labeling is one of the most challenging problems in the field of pattern recognition. In this problem, we want to predict an output vector given a sequence of observations. It has many applications such as part of speech tagging, handwritten text recognition, speech recognition, protein secondary structure prediction and human action recognition. So far, a lot of probabilistic models such as HMMs, MEMMs, CRFs, HCRF and CNFs have been used to solve this problem efficiently and accurately. In models like CRF the distribution over output variables is a log-linear function of observations. In practice, the relation between inputs and outputs is highly non-linear. In this thesis we propose a model to assign a single label to a sequence of observations which capture the non-linearity between inputs and outputs by using a layer of ANFIS networks. We evaluate the proposed model on the task of human action recognition using skeleton data and show that our model achieves better results than models like HCRF and CNF. Key Words Probabilistic Graphical Models, Conditional Random Fields, Hidden Conditional Random Fields, Conditional Neural Fields, Human Action Recognition
مدل های گرافی احتمالی چارچوبی قدرتمند برای بازنمایی توزیع های احتمالاتی با تعداد متغیرهای زیاد را فراهم می کنند. یکی از مسائل چالش برانگیز در حوزه ی بازشناسی الگو، مسئله ی برچسب زنی دنباله ای از مشاهدات است. در این مسئله هدف آن است که با فراهم بودن مشاهدات مربوط به گام های زمانی/فضایی پشت سرهم، برچسب مربوط به کل دنباله یا برچسب مربوط به هر کدام از گام های زمانی/فضایی تخمین زده شود. از جمله کاربردهای این مسئله می توان به تعیین نوع موجودیت یا نقش کلمات در یک متن، تشخیص حروف دست نوشته، بازشناسی گفتار، تخمین ساختار پروتئین و بازشناسی اعمال انسان اشاره کرد. تا کنون مدل های گرافی احتمالی گوناگونی برای این مسئله ها پیشنهاد شده است. مدل نهان مارکوف، میدان تصادفی شرطی و میدان عصبی شرطی نمونه هایی از این مدل ها هستند. در مدل های مبتنی بر میدان تصادفی شرطی، متغیرهای خروجی بر اساس ترکیب خطی از مشاهدات مدل می شوند. با این وجود، معمولا در عمل رابطه ی بین متغیرهای ورودی و خروجی رابطه ای به شدت غیر خطی است. برای رفع این مشکل، در این پایان نامه یک مدل گرافی احتمالی از نوع میدان تصادفی شرطی نهان ارائه شده که در آن رابطه ی بین مشاهدات و متغیرهای نهان/خروجی به واسطه ی یک سیستم استنتاج عصبی-فازی تطبیق پذیر از نوع سوگنو برقرار شده، که قدرت بسیار زیادی در مدل سازی توابع غیرخطی دارد. مدل پیشنهادی در کاربرد بازشناسی اعمال انسان از دنباله ی تصاویر عمق به کار گرفته شده و نتایج قابل توجهی نسبت به مدل های مشابه حاصل شده است.

ارتقاء امنیت وب با وف بومی