Skip to main content
SUPERVISOR
Naser Ghadiri modaress
ناصر قدیری مدرس (استاد راهنما)
 
STUDENT
Seyyed hamid Aboutorabi
سیدحمید ابوترابی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1393
In recent years, massive amount of spatial data described by using texts (labels or sentences) are generated by modern applications. Because of wide use of such data in various applications, many researches focus on how to efficiently retrieve desired data points. Skyline operator that has different types and is based on the concept of dominance, is one of the available responses to this challenge. A data point dominates another one, if it is not worse than another one in all dimensions and better in at least one dimension. Spatio-textual Skyline query uses skyline operator, and retrieves the desired data points (spatially close and textually relevant to the query point) that are not dominated by other data points. The heavy computatios required for this type of queries, as well as big data phenomenon turnes out optimal and efficient answering to these queries to be a serious challenge. Consequently, most of the solutions proposed in this area suffer from lack of scalability. In this research, we proposed two approaches to deal with the scalability challenges. The first solution is an approximate algorithm that offers a compromise between accuracy and efficiency by pruning the search space. The second solution is an efficient distributed approach that uses the map-reduce distributed programming model. Extensive evaluations confirm the high scalability of proposed algorithms. Keywords Spatio-Textual data, Map-Reduce model, Distributed approach, Approximate approach
امروزه حجم زیادی از داده‌های مکانی که با استفاده از متن‌ها (برچسب‌ها یا جملات) توصیف شده‌اند، توسط کاربرد‌های مدرن تولید می‌شوند. باتوجه‌به استفاد? گسترده از چنین داده‌هایی در کاربرد‌های مختلف، تحقیقات بسیاری روی چگونگی بازیابی موثر نقاط مطلوب از بین این داده‌ها متمرکز شده‌‌اند. عملگر اسکای‌لاین که انواع مختلفی دارد و بر اساس مفهوم غلبه عمل می‌کند، یکی از پاسخ‌های موجود به این نیاز است. یک نقط? داده‌ای، نقط? دیگر را مغلوب می‌کند اگر در تمامی ابعاد به‌خوبی آن نقطه بوده و حداقل در یک بُعد، از آن بهتر باشد. پرسمان اسکای‌لاین مکانی-متنی، با استفاده از عملگر اسکای‌لاین، نقاط مطلوب (از نظر مکانی نزدیک و از نظر متنی مرتبط با نقاط پرسمان) را که توسط نقاط دیگر مغلوب نمی‌شوند، بازیابی می‌کند. ماهیت محاسباتی این نوع از پرسمان‌ها در کنار حضور پدید? مه‌داده‌ها در عصر حاضر، ارائ? پاسخ‌های مطلوب و کارآمد به آن‌ها را در مقیاس کلان، تبدیل به یک چالش کرده است. بنابراین اکثر راه‌حل‌های پیشنهاد شده در این حوزه با چالش عدم مقیاس‌پذیری مواجه می‌باشند. در این پایان‌نامه دو روش برای مواجهه با چالش مقیاس‌پذیری ارائه می‌شود. راه‌حل اول یک الگوریتم تقریبی است که با هرس فضای جست‌وجو مصالحه‌ای بین دقت و کارایی پاسخ نهایی پرسمان برقرار می‌کند. راه‌حل دوم نیز یک روش کارآمد و توزیع‌شده است که از الگوی نگاشت-کاهش استفاده می‌کند. نتایج آزمایش‌های گسترده مقیاس‌پذیری بالای الگوریتم‌های پیشنهادی را تایید می‌کند. کلمات کلیدی: 1- داده‌های مکانی-متنی 2-الگوی نگاشت-کاهش 3-روش توزیع‌شده 4-روش تقریبی

ارتقاء امنیت وب با وف بومی