Skip to main content
SUPERVISOR
مهران صفایانی (استاد مشاور) عبدالرضا میرزایی دمابی (استاد راهنما)
 
STUDENT
Rabeh Ravanifard
رابعه روانی فرد

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Doctor of Philosophy (PhD)
YEAR
1392

TITLE

Incorporating Side Information into Recommender Systems based on Probabilistic Graphical Models
Collaborative Filtering (CF) methods make recommendations just by using the rating matrix. However, in practice there is extensive side information about users and items that can solve the coldstart problem. To study the impact of side information on the recommender systems, two novel models based on the probabilistic graphical models are proposed. The first model, called Collaborative Poisson Factorization with Side-information (CPFS), yields an effective way of harnessing not only textual information, but also any kinds of categorical or real-valued side information about users and items. First, CPFS encodes all categorical or real-valued information to binary vectors, and then replaces the shape parameter of all prior distributions with a log-linear combination of the binarised features. We develop a Gi sampler and also a Variational method with closed-form updates for the inference of CPFS. The second model is a Bayesian graphical model, called Content-Aware Listwise Collaborative Filtering (CALCF), which incorporates text information into the listwise CF using Plackett-Luce and topic modeling. We propose a Gi sampler with closed-form samples using data augmentation techniques to infer the latent variables. The results demonstrate that in most cases CPFS and CALCF achieve better Normalized Discounted Cumulative Gain (NDCG) and Recall compared with the previous models.
در دهه‌های اخیر، با ظهورYouTube،Amazon ،Netflix و سایر سرویس‌های وب از این نوع، سامانه‌های توصیه‌گر بیش از پیش در زندگی ما جای گرفته‌اند و استفاده از آن‌ها در تجارت الکترونیک و تبلیغات آنلاین اجتناب‌ناپذیر شده است. سامانه‌های توصیه‌گر تلاش می‌کنند تا با کمک تعامل‌های گذشته میان افراد و آیتم‌ها، امکان پیشنهاد آیتم‌های جدید به افراد را فراهم آورند. این سامانه‌ها، در انبوه اطلاعات، به افراد کمک می‌کنند تا سریع‌تر کالاهایی برای خرید، کتاب‌هایی برای مطالعه یا فیلم‌هایی برای مشاهده پیدا کنند و با آیتم‌های جدید مرتبط با سلیقه‌شان آشنا شوند. گروهی از سامانه‌های توصیه‌گر به نام پالایش مشارکتی، که بسیار پرکاربرد نیز هستند، تنها از تعامل گذشته میان کاربران و آیتم‌ها استفاده می‌کنند تا علایق آینده کاربران را پیش‌بینی کنند. در حالی‌که، در دنیای واقعی اطلاعات جانبی دیگری در مورد افراد و آیتم‌‌ها وجود دارند که می‌توانند به بهبود دقت پیش‌بینی به‌ویژه در حالت شروع-سرد کمک کنند. مشکل شروع-سرد زمانی رخ می‌دهد که آیتم یا کاربر جدید وارد سامانه‌ می‌شود که قبلا تعاملی از وی ثبت نشده است و سامانه اطلاعاتی در مورد آن‌ها ندارد. در چنین شرایطی پالایش مشارکتی قادر به توصیه شخصی به کاربران نیست. در این پژوهش، به منظور بررسی تأثیر اطلاعات جانبی در سامانه‌های توصیه‌گر، دو سامانه‌ مبتنی بر مدل‌های گرافی احتمالی ارائه شده است. این سامانه‌ها در داده‌های بازخورد صریح و ضمنی و در هر دو حالت شروع-سرد و شروع-گرم قابل استفاده‌اند. سامانه پیشنهادی اول، با عنوان تجزیه پواسون مشارکتی با اطلاعات جانبی (CPFS)، روشی کارا برای افزودن اطلاعات متنی، عددی و نامی به سامانه‌های توصیه‌گر می‌باشد. این سامانه یک مدل گرافی احتمالی است که برای مدل‌سازی علایق کاربران به موضوعات مختلف از تجزیه ماتریس احتمالی و برای مدل‌سازی متون از مدل‌سازی موضوع استفاده می‌کند. سامانه CPF ابتدا همه اطلاعات نامی و عددی را به بردارهای دودویی تبدیل می‌کند و سپس ترکیب خطی لگاریتم آن‌ها را به عنوان پارامتر‌های توزیع‌های پیشین در مدل گرافی احتمالی در نظر می‌گیرد. تأثیر انواع اطلاعات جانبی و ترکیب آن‌ها، روی چهار پایگاه‌داده مرتبط با فیلم، کتاب، منابع علمی و هتل‌ها، با اطلاعات جانبی و میزان تنکی مختلف بررسی می‌شود. نتایج آزمایش‌ها نشان می‌دهند که این سامانه کیفیت پیشنهاد‌ها را به‌ویژه در حالت شروع-سرد بهبود می‌دهد. همچنین، بر خلاف سامانه‌های مبتنی بر یادگیری عمیق، سامانه CPFS قابل تفسیر است و تأثیر اطلاعات جانبی در موضوعات مختلف، موضوع‌ مورد علاقه کاربران و موضوع هر فیلم یا کتاب را می‌توان دید. سامانه پیشنهادی دوم، یک مدل احتمالی بیزین است که پالایش مشارکتی لیستی آگاه از محتوا (CALCF) نامیده می‌شود. این سامانه برای اولین بار اطلاعات جانبی متنی را به کمک مدل‌سازی موضوع به سامانه‌های مبتنی بر رتبه‌بندی می‌افزاید. سامانه‌های مبتنی بر رتبه‌بندی، بر خلاف سامانه‌های مبتنی بر امتیاز، سعی می‌کنند بدون پیش‌بینی مقادیر امتیاز‌ها، مستقیما رتبه‌بندی نسبی آیتم‌ها را به‌دست آورند. در این سامانه از مدل پلکت-لوس، تجزیه ماتریس احتمالی و مدل‌سازی موضوع استفاده می‌شود. آزمایش‌ها روی چهار پایگاه‌داده مختلف در دو حالت شروع-گرم و شروع-سرد، حاکی از آن است که افزودن اطلاعات متنی به‌ویژه در حالت شروع-سرد توانسته مقادیر بازیابی و سود تجمعی تخفیف‌یافته را نسبت به سامانه‌های توصیه‌گر مبتنی بر امتیاز و مبتنی بر رتبه‌بندی بهبود دهد.

ارتقاء امنیت وب با وف بومی