Skip to main content
SUPERVISOR
Mohammad hossein Saraee
محمدحسین سرایی (استاد راهنما)
 
STUDENT
Esmaeil Zahedi
اسماعیل زاهدی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1392

TITLE

Opinion Mining: Toward joint Sentiment and Topic Modeling from Big Time Oriented Data
In recent years people want to express their opinion on every online service or product, and there are now a huge number of opinions on the social media, online stores and blogs. However, most of the opinions are presented in plain text and thus require a powerful method to analyse this volume of unlabeled reviews to obtain information about relevant details in minimum time and with a high accuracy. In this thesis we propose a supervised model to analyze large unlabeled opinion data sets. This model has two phases: preprocessing and a Supervised Sentiment and Aspect Model (SSAM). In the preprocessing phase we input thousands of unlabeled opinions and received a set of (key, value) pairs in which a key holds a word or an opinion and a value holds supervised information such as a sentiment label of this word or opinion. After that we give these pairs to the proposed SSAM algorithm, which incorporates different levels of supervised information such as document and sentence levels or document and term levels of supervised information, to extract and cluster aspects related to a sentiment label and also left; MARGIN: 0in 0in 0pt; unicode-bidi: embed; DIRECTION: ltr" dir=ltr align=left Keywords: Big unlabeled opinion dataset, Supervised Sentiment and Aspect Model, Supervised and Unsupervised methods, Supervised information
در سال‌های اخیر با توجه به گسترش اینترنت، تمایل افراد به استفاده از سرویس‌ها، خدمات و خریدهای برخط بسیار زیاد شده است. معمولاً افراد برای انتخاب بهتر، علاقه‌مندند که نظرات سایر افراد را در مورد این انتخاب خود بدانند و همچنین این علاقه‌مندی در صاحبان کسب‌وکار و سرویس‌دهندگان برخط برای تحلیل بازار ، بهبود کیفیت و بازاریابی محصولات و خدمات خود وجود دارد. در حال حاضر حجم بسیار زیادی از نظرات و دیدگاه‌ها در رسانه‌های اجتماعی، وبلاگ‌ها و فروشگاه‌های اینترنتی وجود دارد که مطالعه، ارزیابی، تحلیل و نتیجه‌گیری از این حجم نظرات بدون برچسب بسیار مشکل و زمان‌بر است. این مستلزم روش و یا مدلی است که بتواند این حجم از نظرات را در مدت زمان بسیار کمتر و دقت بالاتر تجزیه تحلیل و ارزیابی نماید. از طرفی اگر در تحلیل نظرات، ویژگی زمان هم در نظر گرفته شود، می‌توان اطلاعات مفیدتری بدست آورد. در این پایان‌نامه یک چارچوب نظرکاوی بر پایه مدل‌سازی ویژگی و احساس با در نظر گرفتن ویژگی زمان ارائه شده است که توانایی تحلیل حجم بسیار زیادی از نظرات بدون برچسب را دارا می باشد. روش ارائه شده شامل دو زیر بخش، پیش‌پردازش و الگوریتم مدل‌سازی ویژگی و احساس زمانی است، که هر دو زیر بخش این روش بروی چارچوب کلان داده اسپارک پیاده‌سازی و اجرا شده است. نتایج بدست آمده از روش پیشنهادی نشان‌دهنده افزایش دقت نسبت به اغلب روش‌های با نظارت و بدون نظارت، استخراج کلماتِ ویژگی- احساس منسجم‌تر و دقیق‌تر نسبت به دیگر روش‌های مدل‌سازی موضوعی و همچنین افزایش سرعت و کاهش زمان اجرا بروی حجم بسیار زیادی از نظرات است. کلمات کلیدی: 1-نظرکاوی 2-مدل‌سازی ویژگی و احساس زمانی 3-چارچوب کلان داده اسپارک 4- روش بدون نظارت

ارتقاء امنیت وب با وف بومی