ارائه یک مدل استخراج ویژگی مخلوط احتمالاتی مبتنی بر روش تحلیل همبستگی های پایه دو بعدی

STUDENT

DEGREE

YEAR

From the time the first computers built, experts always tried to find out how to improve the performance of computers in processing a large volume of information in a way that acquire more accuracy by spending less time and resources. By the daily growth of data and the noise inside them, experts concluded that data have to be processed, too, before entering the algorithm as input. This is called pre-processing. Nowadays, dimensionality reduction is one of the most important pre-processing techniques used in different sciences. Feature extraction is a dimensionality reduction technique and it is a collection of methods which try to reduce the dimension of data by decreasing the number of effective features in the data. Feature extraction methods are broadly divided into two groups: stochastic features extraction methods and probabilistic feature extraction methods. In stochastic methods, only linear or non-linear transformations are used to derive a new feature space where the dimensionality of data reduces when they mapped to this new space. On the other hand, Probabilistic methods try to derive a new feature space by adding noise to the model and considering a probabilistic distribution for each model parameters. Canonical Correlation Analysis (CCA) is a well-known stochastic feature extraction method. In this study we assessed different aspects of feature extraction; mainly the CCA method and we proposed a new probabilistic model for CCA along with a mixture of probabilistic CCA model. The proposed methods are evaluated in a face recognition application and the results showed that using these techniques, the justify; MARGIN: 30pt 0in; unicode-bidi: embed; DIRECTION: ltr" Keywords : dimensionality reduction, feature extraction, canonical correlation analysis

از زمان ساخت اولین رایانه‌ها، همواره تلاش متخصصان این حوزه بر این موضوع معطوف بوده است که چگونه می‌توان با استفاده از الگوریتم‌های مختلف، کارایی رایانه‌ها را در پردازش حجم وسیع داده‌ها افزایش داد به گونه‌ای که با صرف زمان و منابع کمتر، بتوان داده‌ها را با دقت مناسبی پردازش کرد. با افزایش روزافزون حجم داده‌هاو نیز حجم نویز موجود در آن‌ها، متخصصان به این نتیجه رسیدند که لازم است داده‌ها نیز برای ورود به الگوریتم‌هاپردازش شوند. این مرحله را پیش‌پردازش داده‌ها می‌نامند. یکی از مهم‌ترین پیش‌پردازش‌هایی که امروزه در حوزه‌های مختلف علوم مورد استفاده قرار می‌گیرد، کاهش ابعاد داده‌ها است. استخراج ویژگی یکی از روش‌های کاهش ابعاد داده است و به مجموعه روش‌هایی اطلاق می‌شود که با انتخاب ترکیبی از ویژگی‌های مؤثر در داده‌ها، سعی درکاهش تعداد آن‌ها و در نتیجه کاهش پیچیدگی داده‌ها دارند.به منظور استخراج ویژگی از داده‌ها،روش‌های متنوعی وجود دارد که به دو دسته کلی روش‌های آماری و روش‌های مبتنی بر احتمالات طبقه‌بندیمی‌شوند. در روش‌های آماری تنها از معادلات جبری برای به دست آوردن یک فضای جدید استفاده می‌شود که حجم داده‌ها با نگاشت به این فضای جدید کاهش می‌یابد. روش‌های مبتنی بر احتمال با اضافه کردن نویز به مدل و با در نظر گرفتن توزیع‌های احتمال برای پارامترها، سعی می‌کنند تا فضای جدید را به دست آورند. یکی از روش‌های استخراج ویژگی آماری پرکاربرد روش تحلیل همبستگی‌های پایه است. در این تحقیق به بررسی روش‌های استخراج ویژگی و به خصوص روش تحلیل همبستگی‌های پایه و نسخه‌های مختلف آن شامل تحلیل همبستگی‌های پایه مبتنی بر احتمال و تحلیل همبستگی‌های پایه دو بعدی پرداخته می‌شود و یک نسخه مبتنی بر احتمال به همراه مدل ترکیبی آن برای روش تحلیل همبستگی‌های پایه دو بعدی ارائه می‌شود. با مقایسهروش‌استخراج ویژگی ارائه شده با روش‌های مورد بررسی در این پایان‌نامه در کاربرد شناسایی چهره، دقت کاربرد با استفاده از روش‌ پیشنهادی افزایش یافته است. واژگان کلیدی: کاهش ابعاد داده‌ها، استخراج ویژگی مبتنی بر احتمال، تحلیل همبستگی‌های پایه