Skip to main content
SUPERVISOR
عبدالرضا میرزایی دمابی (استاد مشاور) مهران صفایانی (استاد راهنما)
 
STUDENT
Tahereh Mahdipour
طاهره مهدی پور

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1393

TITLE

Extending of Conditional Neural Field based on Mixture of Experts for Labeling of Sequence Data
Sequence labeling is one of the important problems in pattern recognition which involves assignment of labels to each member of various kinds of sequences like sequences of characters , images or speech . One approach for sequence labeling is to model input-output structure as a graphical model . Farther analysis can be performed on the designed graphical model . Graphical models are powerful tools for modeling probability distributions with large number of variables . In some problems like handwriting recognition , the relation between input and output features can be nonlinear and highly complicated . Initially , generative models such as Hidden Markov Model (HMM) were commonly used for sequence labeling . After a while , another model called Conditional random field (CRF) was represented which became popular quickly because of its capabilities in resolving some issues related to previous generative models . CRF is a discriminative probabilistic model . Experiments in recent years show that combining CRF with other models increases the performance . In this thesis , the combination of the Conditional Random Field model and the concept of mixture of experts is investigated . A mixture of experts model increases the learning accuracy through partitioning the input space and having a focused expert network for every partition . It has been shown that utilizing mixture of experts model in learning a model will increase its performance . In this research , by using a number of expert networks , which are some types of neural networks , between the input and output layers of a CRF model , a higher level of features is obtained from the observation sequences and used for training the model . A clustering algorithm is used to assign input strings to experts . To do this , due to the inequality of the length of the observation sequences , clustering is initially performed on the elements of each sequence . After this , there will be two choices for assigning experts to input data : In the first choice , by voting among the clusters of the elements of a string , its cluster is determined and the entire elements of that sequence will be used for learning the related expert and model parameters . In the second choice , according to the cluster related to each element , the training can be performed on all experts assigned to clusters of the input elements . The result of these two choices gives us two models . Experimental results in the application of handwriting recognition demonstrate that the proposed models can considerably improve recognition accuracy in comparison to previous models . In this research , the comparison is performed with models such as neural networks , conditional random field and conditional neural field . The results indicate that the first and second proposed models improve the recognition accuracy up to 7% and 7.5% respectively . Keywords : Sequence Labeling , Log-Linear Model , Discriminative Model , Conditional Random Field , Mixture of Experts
مسئله‌ی برچسب‌زنی رشته یکی از مهم‌ترین مسائل مورد بررسی در حوزه‌ی شناسایی الگو است که در آن سعی در یافتن برچسب‌های عناصر انواع مختلف رشته‌ها مانند رشته‌های از نوع حرف ، تصویر و گفتار می‌شود. در این گونه مسائل می‌توان در ابتدا ساختار ورودی-خروجی را به شکل یک گراف در نظر گرفت و جهت دریافت پاسخ مناسب تحلیل‌های لازم را بر روی مدل گرافی بدست آمده انجام داد. مدل‌های گرافی مدل‌های قدرتمندی جهت نمایش توزیع‌های احتمالاتی با تعداد متغیرهای زیاد هستند. در کاربردهایی مانند تشخیص دست‌خط ، ارتباط میان ویژگی‌های ورودی و خروجی می‌تواند غیرخطی و بسیار پیچیده باشد. در ابتدا استفاده از مدل‌های مولد مانند مدل پنهان مارکوف در این حوزه مرسوم بود. اما پس از مدتی مدلی دیگر با عنوان میدان تصادفی شرطی پا به عرصه گذاشت که بدلیل برطرف کردن مشکلات مدل‌های مولد پیش از خود، به سرعت معروف شد. میدان تصادفی شرطی مدلی احتمالاتی و از نوع افتراقی است. آزمایش‌های انجام گرفته در سال‌های اخیر نشان می‌دهد که ترکیب میدان تصادفی شرطی با مدل‌های دیگر سبب افزایش کارایی می‌شود. در این پایان‌نامه ترکیب مدل میدان تصادفی شرطی با مدل ترکیب خبره‌ها بررسی شده است. مدل ترکیب خبره‌ها با قسمت‌بندی فضای ورودی و تمرکز یادگیری هر شبکه‌ی خبره بر ناحیه‌ی مربوط به خود سبب افزایش دقت می‌شود. تحقیقات انجام شده نشان می‌د هد استفاده از مدل ترکیب خبره‌ها در یادگیری یک مدل می‌تواند باعث افزایش کارایی آن شود. در این تحقیق با قرار دادن تعدادی از شبکه‌های خبره از نوع شبکه‌های عصبی میان دو لایه‌ی ورودی و خروجی در مدل میدان تصادفی شرطی ، با توجه به توزیع و ساختار داده‌ها ، ویژگی‌های سطح بالاتری از رشته‌های مشاهدات بدست آمده‌ و از ‌آن‌ها در یادگیری مدل استفاده شده است. جهت انتساب رشته‌های ورودی به خبره‌ها از یک الگوریتم خوشه‌بندی استفاده می‌شود. برای این کار با توجه به نامساوی بودن طول رشته‌های مشاهدات ، ابتدا خوشه‌بندی روی عناصر مربوط به هر رشته انجام شده است. پس از این کار دو انتخاب برای انتساب خبره‌ها به داده‌های ورودی وجود خواهد داشت. در انتخاب اول با کمک رأی‌گیری میان خوشه‌های مربوط به عناصر یک رشته ، خوشه‌ی مربوط به آن تعیین می‌شود و کل رشته در آموزش خبره‌ی مربوط به خوشه و پارامترهای مدل استفاده می‌شود. در انتخاب دوم با توجه به خوشه‌ی مربوط به هر عنصر ، آموزش می‌تواند بر روی تمام خبره‌‌های منتسب به خوشه‌های عناصر رشته‌ی ورودی انجام گیرد. بر این اساس نتیجه‌ی حاصل از این دو انتخاب می‌تواند دو مدل را به ما بدهد. در ادامه انتخاب اول مدل پیشنهادی اول و انتخاب دوم مدل پیشنهادی دوم نامیده می‌شود. آزمایش‌های انجام گرفته بر روی مدل‌های پیشنهادی در کاربرد تشخیص دست‌خط بهبود قابل توجهی را نسبت به مدل‌های مشابه پیش از خود نشان می‌دهد. در این پژوهش مقایسه با مدل‌هایی همچون شبکه‌های عصبی ، میدان تصادفی شرطی و میدان عصبی شرطی انجام شده است که نتایج حاکی از بهبود عملکرد مدل ارائه شده و افزایش دقت به بیش از 7 درصد در مدل پیشنهادی اول و بیش از 5/7 درصد در مدل پیشنهادی دوم است. کلمات کلیدی : برچسب‌زنی رشته ، مدل Log-Linear ، مدل افتراقی ، میدان تصادفی شرطی ، ترکیب خبرگان

ارتقاء امنیت وب با وف بومی