Skip to main content
SUPERVISOR
Abdolreza Mirzaei
عبدالرضا میرزایی دمابی (استاد راهنما)
 
STUDENT
Nazanin Asadi
نازنین اسدی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1389
Outputs of real-world processes can be considered as signals. Describing these signals in the form of signal models or times series is a well-known problem nowadays. In these cases by time series, we mean a sequence of data points, measured typically at successive time instants spaced at uniform time intervals. The importance of modeling time series has several reasons. Among them, these models are useful for simulating the source of signals and making a good theoretical basis for signal processing systems. The used model for these systems can be either deterministic model or statistical one. In this thesis, for modeling , training and classifying time series a statistical model named Hidden Markov Model (HMM) is used. Having a strong mathematical basis and its great and varied applications especially in the field of voice recognition were some reasons for selecting HMMs. On the other hand, combining models and classifiers in order to improve the performance and lower the error rate is used widely for a while in hard probelms. In these methods, several weak classifiers are combined with each other to construct a strong good classifier. If the basic classifiers have enough difference and performance of each one is higher than a random model, the obtained combined model expected to have higher performance in comparision to others. Though many researchers investigated classifier combinination in their papers, combining classifiers with the aim of obtaining the final classifier by means of internal structure of all basic classifiers which are particularly used for time series is considered less yet. Pervious methods wich use classifier combination techniques, do their combination in the final, decision level or are not specialized for time series structures. Clustering is also a classification procedure in which the used data don’t have any training labeled data and the purpose is to detect and classify similar data in the same group and the optimum case is when the internal distance among the data of the same clusters are minimum and the extra-distance between different clusters is as much as possible. Due to not having label for data in clustering, this problem is more difficult than classification. In this thesis the first attempt was to obtain a good model for time series by using Hidden Markov Models which can best describe the given data and achieve a good performance and superiority compared to other considered methods. Second, by using this training method and separating the models of different classes from each other, a new technique for time series classification by the means of Hidden Markov Models is proposed. The third problem was clustering. For this problem again by means of Hidden Markov Models and involving measures from pervious researches a new time series clustering method is proposed which take advantage of combining basic models and revealed better performance than other compared methods in the experiments. Keywords: Time series, Hidden Markov Model, classification, training, clustering
خروجی‌ فرآیندهای دنیای واقعی عموما می‌توانند به صورت سیگنال در نظر گرفته شوند. توصیف کردن این سیگنال‌های واقعی در قالب مدل‌های سیگنال یا سری زمانی مسئله‌ای است که اخیرا به صورت گسترده‌ای مورد توجه قرار گرفته است. در این موارد منظور از سری زمانی دنباله‌ای از داده‌ها است که در بازه‌های زمانی یکنواخت به دنبال هم اندازه‌گیری شده باشد. مدل‌سازی سری زمانی به دلایل متعدد از اهمیت ویژه‌ای برخوردار است. از جمله این دلایل می‌توان به شبیه‌سازی منبع تولید سیگنال و ایجاد پایه تئوری برای سیستم پردازش سیگنال اشاره کرد. مدل استفاده شده برای این اعمال می‌تواند از دسته‌ی مدل‌های قطعی یا مدل‌های آماری باشد. در این پایان نامه به منظور مدل‌سازی و طبقه‌بندی سری‌های زمانی از مدل مخفی مارکوف که یک مدل آماری محسوب می‌شود استفاده شده است. وجود ساختار ریاضی قوی که پایه تئوری بسیاری از کاربردها را فراهم می‌کند و استفاده‌ی فراوان آن‌ها در کاربردهای مهم و گوناگون به خصوص تشخیص صدا از دلایل انتخاب این مدل بوده است. از طرفی ترکیب چند طبقه‌بند با یکدگیر به عنوان روشی برای بهبود کارایی در مسائل سخت مدتی است که ابداع شده است. در این روش‌ها چندین طبقه‌بند ضعیف به منظور ساخت یک طبقه‌بند قوی با یکدگیر ترکیب می‌شوند. با وجود اینکه ترکیب طبقه‌بندها با یکدیگر تاکنون بسیار مورد بررسی قرار گرفته است ترکیب طبقه‌بندهای مربوط به سری‌های زمانی به گونه‌ای که ساختار درونی طبقه‌بند نهایی ترکیبی از ساختار درونی طبقه‌بندهای منفرد تشکیل دهنده آن و مختص سری زمانی باشد تا به حال کمتر مورد توجه قرار گرفته است. خوشه‌بندی نیز نوعی طبقه‌بندی محسوب می‌شود که در آن داده‌ها برچسب ندارند و هدف شناسایی و دسته‌بندی داده‌های مشابه با یکدیگر می‌باشد. به دلیل برچسب‌دار نبودن داده‌ها امر خوشه‌بندی از طبقه‌بندی دشوارتر خواهد بود. در این پایان نامه ابتدا هدف ساخت مدلی مطلوب برای سری‌های زمانی با استفاده از مدل مخفی مارکوف بوده است که بتواند داده‌های مورد نظر را به خوبی توصیف کند و با توجه به معیارهای درنظر گرفته شده نسبت به روش‌های قبلی بهبود قابل توجهی داشته باشد. در مرحله بعد این شیوه مدل‌سازی برای طبقه‌بندی سری‌های زمانی مورد استفاده قرار گرفته است و با در نظر گرفتن ماهیت مسئله و جداسازی داده‌های مربوط به دسته‌های مختلف تا حد ممکن، روشی برای طبقه‌بندی سری‌های زمانی با استفاده از مدل مخفی مارکوف ارائه شده است. در مرحله سوم مسئله در نظر گرفته شده خوشه‌بندی سری‌های زمانی بوده است. در این مورد با استفاده از مدل مخفی مارکوف و در نظر گرفتن معیارهایی که در تحقیقات قبل برای خوشه بندی سری‌های زمانی، فارغ از مدل‌سازی آن‌ها با مدل مخفی مارکوف، ارائه شده بود روشی جدید برای خوشه‌بندی سری‌های زمانی ارائه شده است. کلمات کلیدی: 1- سری زمانی، 2- مدل مخفی مارکوف، 3- طبقه‌بندی، 4- آموزش، 5- خوشه‌بندی 1ف

ارتقاء امنیت وب با وف بومی