Skip to main content
SUPERVISOR
عبدالرضا میرزایی دمابی (استاد مشاور) مهران صفایانی (استاد راهنما)
 
STUDENT
Masoud Fatemi
مسعود فاطمی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1393

TITLE

Extension of Restricted Boltzman Machine for Joint Sentiment Topic Modeling in Text Data
Recently by the development of the internet and web, different types of social media such as web blogs become an immense source of text data. Through the processing of these data, it is possible to discover practical information about different topics, individual’s opinions and a thorough understanding of the society. Therefore, applying models which can automatically extract the subjective information from the documents would be efficient and helpful. Topic modeling methods, also sentiment analysis are the most raised topics in the natural language processing and text mining fields. Existed joint sentiment topic models are based on either statistical methods or bayesian networks and there are no solution for this problem using neural networks. In this thesis a new structure for joint sentiment-topic modeling based on Restricted Boltzman Machine (RBM) which is a type of neural networks is proposed. By modifying the structure of RBM as well as appending a layer which is analogous to sentiment of text data to it, we propose a generative structure for joint sentiment topic modeling based on neutral networks. The proposed method is supervised and trained by the Contrastive Divergence algorithm. The new attached layer in proposed model is a layer with multinomial probability distribution which can be used in text data sentiment Key Words: Topic Model, Sentiment Analysis, Neural Networks, Restricted Boltzman Machine, Probabilistic Model, Contrastive Divergence Algorithm
امروزه با گسترش اینترنت و وب، انواع مختلف رسانه‌های اجتماعی نظیر وبلاگ‌ها و شبکه‌های اجتماعی به یک منبع بسیار عظیم از داده‌‌های متنی تبدیل شده‌اند. با پردازش این داده‌ها می‌‌توان اطلاعات سودمند و مفیدی در مورد مباحث مختلف، نظر افراد و احساس کلی‌ جامعه بدست آورد. از این جهت استفاده از مدل‌هایی که کاملا خودکار به تشخیص اطلاعات مفهومی‌ و احساس در اسناد متنی بپردازند بسیار مفید است. روش‌های مدل‌سازی موضوع، استخراج اطلاعات مفهمومی و همچنین تحلیل احساس از مهم‌ترین مباحث مطرح شده در زمینه‌ی پردازش زبان طبیعی و کاوش داده‌های متنی هستند. تمام مدل‌های مشترک موضوع و احساس ارائه شده بر پایه‌ی روش‌های آماری یا شبکه‌های بیزی هستند و تا کنون روشی برای مدل‌سازی این مسئله با استفاده از شبکه‌های عصبی ارائه نگردیده است. در این پایان‌نامه یک ساختار جدید برای مدل‌سازی مشترک احساس-موضوع در داده‌های متنی بر پایه‌ی شبکه‌‌ی عصبی ماشین بلتزمن محدود پیشنهاد می‌‌گردد. با تغییر ساختار این شبکه واضافه کردن یک لایه به آن که متناظر با احساس اسناد متنی است یک ساختار مولد احتمالی برای مدل‌سازی مشترک احساس و موضوع بر پایه‌ی ‌شبکه‌ی عصبی پیشنهاد می‌‌شود. رویکرد پیشنهاد شده یک رویکرد نظارت شده است که برای آموزش آن از الگوریم واگرایی مقابله استفاده می‌‌شود. لایه‌ی جدید اضافه شده در مدل پیشنهادی لایه‌ای با ماهیت توزیع احتمالی‌ چند جمله‌ای است که از آن می‌‌توان در فرآیند طبقه‌بندی اسناد متنی از نظر احساسی‌ یا دیگر کاربرد‌های نظارت شده استفاده کرد. مدل پیشنهادی در آزمایش‌هایی همانند: مدل‌سازی به عنوان یک مدل مولد، طبقه‌بندی احساس و بازیابی اطلاعات با مدل‌های موجود مقایسه گردید و نتایج بدست آمده توصیف ‌کننده‌ی قابلیت‌های مدل ارائه شده است. مشاهده گردید در فرآیند طبقه‌بندی احساس مدل پیشنهادی به طور میانگین ?? درصد دقت بهتری نسبت به مدل پایه دارد. همچنین در فرآیند بازیابی اطلاعات بر روی پایگاه داده‌ی ?? گروه خبری، رویکرد پیشنهادی با در نظر گرفتن احساس به طور متوسط ? درصد عملکرد بهتری نسبت به حالتی که در آن احساس در نظر گرفته نمی‌‌شود را به همراه دارد. کلمات کلیدی: مدل‌سازی موضوع، آنالیز احساس، شبکه‌ها‌ی عصبی، ماشین بلتزمن محدود، مدل احتمالاتی، الگوریتم واگرایی مقابله

ارتقاء امنیت وب با وف بومی