Skip to main content
SUPERVISOR
Faramarz Hendessi
فرامرز هندسی (استاد راهنما)
 
STUDENT
Mohammad Bashir Afshar
محمدبشیر افشار

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1391

TITLE

SEMANTIC HASHTAG
Social networks usage increased significantly in recent decades. The range of data in these networks are high because usage of these kinds of networks are common among people, hence, categorizing these data could be really useful. Nowadays, some of these networks use a method for categorizing data which is called Hashtag. Using Hashtag, users can find messages and posts in a specific social network and find their desired subject regardless of the meaning and semantic of the Hashtag. Defining a new approach for categorizing Hashtags is a new and practical approach for categorizing data in social networks. In this thesis we provide a new approach for categorizing Hashtags in the social network of Twitter In our proposed approach, we use hierarchical subject clustering of comprehensive library of congress. We index the text information of our sources, on the other hand, keywords related to messages containing specific desired Hashtags, using semantic and text mining algorithms are extracted and indexed. After diagnosis and isolation of hashtag creator, using the scoring algorithm which is proposed in this thesis, the nearest categories from the inquiry could be extracted, then through another scoring algorithm, shared data between the extracted data from specific Hashtag could be found and then pointed as a best category for the desired Hashtag. Thus, we will be able to provide a service in which user can get the most related categories by entering the Hashtag and the relevant messages. The ability of using upper and downer branches of a certain category will be provided as well. Therefore, semantic Hashtag is standard categories with closest meaning to Hashtags created by ordinary users of social networks which allows access to reliable sources for users Keywords: Hashtag, Semantic algorithms, categorizing, social networks
استفاده از شبکه‌های اجتماعی [1] در دهه‌ی اخیر رشد عظیمی داشته است. با توجه به مردمی بودن این شبکه‌ها، گستردگی اطلاعات در آن‌ها بسیار زیاد است. بنابراین دسته‌بندی کردن داده‌ها به صورت سازمان‌یافته، جهت دسترسی به اطلاعات مرتبط بسیار مفید است. در حال حاضر برخی از این شبکه‌ها، با به کار بردن هشتگ از دسته بندی مردمی سازمان نِیافته بهره می برند. هشتگ، امکان جستجوی پیام های درون شبکه ای شامل آن برچسب را بدون در نظر گرفتن مقاربت موضوعی و معنایی میسر می‌سازد. ارائه راه‌کار مناسب جهت دسته‌بندی موضوعی هشتگ ها و پیام‌های دارای آن هشتگ ، موضوعی نوین و کاربردی جهت بهره‌برداری بهتر از اطلاعات و دسترسی به داده‌های معتبر مربوطه است. در این پژوهش به ارائه روشی مناسب، جهت دسته‌بندی پیام‌های شبکه‌ی اجتماعی توئیتر که با هشتگ [2] برچسب‌گذاری شده‌اند می‌پردازیم. در روش پیشنهادی ما، از دسته‌بندی سلسله‌مراتبی موضوعی جامع کتابخانه‌ی ملّی کنگره استفاده می‌کنیم. بدین‌ترتیب که اطلاعات متنی مربوط به این منبع را نمایه‌سازی کرده و از طرف دیگر، کلمات کلیدی مربوط به پیام‌های شامل هشتگ خاص مورد نظر را، با استفاده از الگوریتم‌های معنایی و متن‌کاوی استخراج می‌کنیم و در منبع نمایه‌سازی‌شده جستجو می‌کنیم. پس از تشخیص و جداسازی کلمات سازنده‌ی هشتگ، با استفاده از الگوریتم امتیازبندی پیشنهادی، نزدیک‌ترین دسته‌های مربوط به یک پیام با تکیه بر هشتگ و کلمات کلیدی به‌کار‌رفته در آن استخراج می‌گردد. سپس از طریق الگوریتم رتبه‌بندی دیگری، اشتراک بین دسته‌های استخراجی برای پیام‌های شامل هشتگ خاص مدّنظر، به‌دست آمده و بالاترین امتیازها به عنوان بهترین دسته‌های مربوط به آن هشتگ معرفی می‌شوند. بدین‌ترتیب قادر به ارائه سرویسی خواهیم بود، که کاربر با وارد کردن هشتگ و یا پیام مربوطه، بهترین دسته‌های مربوط به آن از لحاظ مقاربت معنایی را به دست آورده و ضمن ارائه لینک‌های مربوط به آن دسته، قابلیت دسترسی به شاخه‌های بالا و پائین آن دسته و همچنین منابع معتبر کتابخانه‌ای دسته‌بندی‌شده در آن( از قبیل کتاب‌ها، فیلم‌ها، مقالات، موسیقی‌ها و ...) را به کاربر خواهیم داد. بدین‌ترتیب هشتگ معنایی عبارت است از، دسته‌های استاندارد تخصصی با نزدیکی معنایی بالا، برای هشتگ‌های تولیدی توسط مردم در پیام‌های عمومی شبکه‌های اجتماعی، که امکان دسترسی به منابع معتبر کتابخانه‌ای را به کاربر می دهند. کلمات کلیدی: ?-هشتگ ?-الگوریتم‌های معنایی ?-دسته‌بندی [3] 4-شبکه?های اجتماعی [1] Social Network [2] hashtag [3] Categorising

ارتقاء امنیت وب با وف بومی