Skip to main content
SUPERVISOR
احمد براآنی دستجردی (استاد راهنما) محمدعلی منتظری (استاد راهنما)
 
STUDENT
Fateme Zahra Heydari Kebriti
فاطمه زهرا حیدری کبریتی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1390
Due to the rapid growth of the World Wide Web in recent years, extensive research on modeling the behavior of users on the Web site was conducted. In this direction, Web usage mining with the aim of obtaining navigational behavior of web users, has been used by many researchers. Generally, Web users may exhibit different behaviours proportional to their information needs and intended tasks when they are visiting a Web site. All the navigational behavior of Web users in the web access log files is traceable. One of the techniques utilized in web usage mining is the clustering of web users. In clustering techniques, users who have similar navigational behavior are in a cluster. Each cluster is led to the creation of user profiles that are used in web applications such as web prefetching and the caching. The conventional web usage mining techniques for clustering web user can discover usage patterns directly, do not generally provide the ability to automatically characterize or quantify the unobservable factors that lead to common navigational patterns. Therefore, it is necessary to develop techniques that can automatically identify the users’ underlying navigational objectives and to discover hidden semantic relationships among users as well as between users and Web objects. In this project, we propose an approach based on probabilistic latent semantic analysis to discover such intrinsic characteristics of Web users’ activities. The proposed method, obtained latent factors for clustering user navigation patterns used to create user profiles. The clustering results will be used to predict and prefetch web requests for grouped users. The usability and superiority of the proposed web user clustering approach through experiments on a real Web log file will be displayed. The clustering and prefetching tasks are evaluated by comparison with previous studies demonstrating better clustering performance and higher prefetching accuracy. Keywords Web usage mining, Web user clustering, Probabilistic latent semantic analysis, Web prefetching
در سالهای اخیر با توجه به رشد سریع وب جهانی، تحقیقات وسیعی پیرامون مدل کردن رفتار پیمایشیِ کاربران در وب سایت ها انجام گرفته است. در این راستا کاربردکاوی وب با هدف به دست آوردن الگوهای رفتار پیمایشی کاربران وب، مورد استفاده بسیاری از محققان قرار گرفته است. به طورکلی کاربران وب رفتارهای متفاوتی متناسب با نیازهای اطلاعاتی و وظایف مورد علاقه خود در بازدید از وب سایت ها از خود نشان می دهند، تمامی رفتارهای پیمایشی کاربران در فایل های ثبت وب قابل ردیابی است. یکی از تکنیک های مورد استفاده در کاربرد کاوی hy; وب خوشه بندی کاربران وب می باشد. در تکنیک خوشه بندی کاربرانی که رفتار پیمایشی مشابهی دارند در یک خوشه قرار می گیرند. هر خوشه منجر به ایجاد پروفایل های کاربری می شود که در برنامه های کاربردی مانند واکشی اولیه و حافظه نهان مورد استفاده قرار می گیرد. تکنیک های متداول و استاندارد کاربرد کاوی وب برای خوشه بندی کاربران وب می تواند الگوهای کاربردی را مستقیماً کشف کند، اما این تکنیک ها به طور خودکار نمی توانند مشخصات یا کیفیت عامل های پنهانی که منجر به کشف الگوهای پیمایشی مشترک می شوند را تعیین کنند. بنابراین نیاز به گسترش تکنیک هایی می باشد تا بتوان بصورت خودکار اهداف اساسی پیمایشی کاربران را شناسایی و رابطه معنایی پنهان میان کاربران وب و همچنین رابطه معنایی پنهان بین کاربران وب و اشیاء وب را استخراج کرد. در این پژوهش، روشی براساس آنالیز معنایی پنهان احتمالاتی پیشنهاد می شود که مشخصات ذاتی رفتار پیمایشی کاربران را مشخص می کند. روش پیشنهادی فاکتورهای پنهان به دست آمده را جهت خوشه بندی الگوهای پیمایشی کاربران مورد استفاده قرار می hy;دهد و پروفایل های کاربری را ایجاد می کند. نتایج خوشه بندی برای پیش بینی و واکشی درخواست های وب گروه های کاربران مورد استفاده و ارزیابی قرار می گیرد. کارایی و برتری روش خوشه بندی کاربران از طریق آزمایش بر روی فایل hy;های ثبت واقعی نشان داده می شود. روش پیشنهادی برای گروه بندی کاربران وب و واکشی اولیه با کارهای قبلی مقایسه شده و نتایج به دست آمده کارایی بهتر و میزان دقت بالای روش پیشنهادی را در مقایسه با روش های دیگر از خود نشان می دهد. کلمات کلیدی : کاربرد کاوی وب ، خوشه بندی کاربران وب ، آنالیز معنایی پنهان احتمالاتی، واکشی اولیه صفحات

ارتقاء امنیت وب با وف بومی