Skip to main content
SUPERVISOR
Reyhaneh Rikhtegaran,Zahra Saberi
ریحانه ریخته گران (استاد مشاور) زهرا صابری (استاد راهنما)
 
STUDENT
Aida Taj dini
آیدا تاج دینی

FACULTY - DEPARTMENT

دانشکده ریاضی
DEGREE
Master of Science (MSc)
YEAR
1396

TITLE

Bayesian quantile regression using the skew exponential power distribution
tatistics is one of the tools used in many sciences to analyze data. One of the most commonly used statistical methods, especially in economics, social sciences, etc., is the regression model. Mean regression, expresses the relationship between the conditional mean of a response variable in terms of one or more independent variables. \\\\However, sometimes this method will perform poorly in data analysis. For example, in cases where error distribution is not normal or if variance heterogeneity exists, least-squares estimators are sensitive to outliers and lead to skewed estimates. On the other hand, least squares regression expresses the relationship between covariates and mean response variable, while in many cases, the goal is to find the relationship between independent variables with other segments and dependent variable distribution quantiles.\\\\ In these cases, the quantile regression method can be used. In order to easily implement Bayesian methods to obtain parameter estimation, first a distribution for the response variable is considered, then the Markov Monte Carlo chain methods are used to generate the sample from the later distribution.\\\\ Although the asymmetric Laplace distribution is widely used in the Bayesian quantile regression model, but when the observations include outliers and the distribution of the heavy observations, this distribution will not work properly. Also for each specific quantity such as ${\au _0}$, the skewness of this distribution as a function of ${\au _0}$ it has a constant value, so that it represents a constant value for different quantiles.\\\\In recent years, researchers have attempted to introduce a more flexible skew distribution that is used to estimate the parameters of a Bayesian quantile regression model based on outliers and heavy-tailed observations. In this regard, in this thesis, we propose a Bayesian quantile regression model with skewed exponential power distribution error to solve this problem.\\\\First, by applying the penalized least squares regression methods, we estimate the regression coefficients and the variable selection process using the Lasso and adaptive Lasso fines based on the asymmetric Laplace distribution, as the error variable distribution, which a way to use for dimension reduction by choosing only relevant attributes parameterization. So, Bayesian inference and sample generation from the posterior distribution are made using Gi sampling algorithm. In the following, we introduce the skew exponential power distribution and describe the Bayesian quantile regression model using it as the error distribution. In this distribution family, posterior distribution sampling is performed using the independent Metropolis-Hastings within Gi sampling algorithm, which will also be associated with the variable selection process. Then we use simulation and applied studies to evaluate the performance of the proposed model.
آمار ، یکی از ابزارهایی است که در بسیاری علوم به‌منظور تجزیه و تحلیل داده‌ها از آن استفاده می‌شود. یکی از روش‌های آماری که به جرأت می‌توان گفت دارای بیشترین کاربرد، خصوصاً در اقتصاد ، علوم اجتماعی و … است، مد ل رگرسیونی نام دارد. رگرسیون میانگین، ارتباط بین میانگین شرطی یک متغیر پاسخ بر حسب یک یا چند متغیر مستقل را بیان می‌کند. با این وجود ، گاهی این روش عملکرد ضعیفی در تحلیل داده‌ها خواهد داشت. به‌عنوان مثال ، در حالتی ‌که توزیع خطا غیرنرمال است و یا در صورتی ‌که ناهمسانی واریانس‌ها وجود داشته باشد، براوردگرهای حداقل مربعات نسبت به داده‌های پرت حساس بوده و به براوردهایی اریب منجر می‌شوند. ازطرفی رگرسیون حداقل مربعات ، ارتباط بین متغیرهای کمکی با میانگین متغیر پاسخ را بیان می‌کند، درحالی‌که در بسیاری از موارد، هدف، پیدا کردن ارتباط بین متغیرهای مستقل با سایر بخش‌ها و چندک‌های توزیع متغیر وابسته است. در این‌ موارد می‌توان از روش رگرسیون چندکی استفاده نمود. به‌منظور اجرای آسان روش‌های بیزی برای دست‌یابی به براورد پارامترها، ابتدا یک توزیع برای متغیر پاسخ در نظر گرفته می‌شود ، سپس روش‌های زنجیره‌ی مارکف مونت‌کارلو برای تولید نمونه از توزیع پسین به‌کار برده می‌شود. اگرچه توزیع لاپلاس نامتقارن به‌صورت گسترده در مدل رگرسیون چندکی بیزی مورد استفاده قرار گرفته ‌است، ولی در مواقعی که مشاهدات شامل داده‌های پرت هستند و یا به‌عبارتی توزیع مشاهدات دم‌سنگین است، این توزیع عملکرد مناسبی نخواهد داشت. همچنین به ازای هر چندک خاص مانند ${\au _0}$ ، میزان چولگی این توزیع به‌عنوان تابعی از ${\au _0}$ دارای مقدار ثابتی است ، به‌طوری که برای چندک‌های مختلف مقدار ثابتی را نمایش می‌دهد. در سال‌های اخیر ، پژوهشگران سعی کردند یک توزیع چوله با انعطاف‌پذیری بیشتری معرفی نمایند که از آن برای براورد پارامترهای مدل رگرسیون چندکی بیزی براساس مشاهدات پرت و توزیع دم‌‌سنگین استفاده می‌شود. در این راستا، در این پایان‌نامه بر آنیم مدل رگرسیون چندکی بیزی با خطای توزیع توان نمایی چوله را به‌منظور رفع این مشکل مطرح کنیم. ابتدا با بکارگیری روش‌های توان دوم تاوانیده ، به براورد ضرایب رگرسیونی و فرایند انتخاب متغیر با استفاده از جریمه‌ لاسو و لاسو انطباق‌پذیر براساس توزیع لاپلاس نامتقارن ، به‌عنوان توزیع متغیر خطا ، می‌پردازیم که این فرایند سبب کاهش بعد پارامترها برای رسیدن به مدلی ساده‌تر و تفسیرپذیرتر می‌شود . در این میان استنباط بیزی و تولید نمونه از توزیع پسین با استفاده از الگوریتم نمونه‌گیری گیبز صورت می‌گیرد. در ادامه ، توزیع توان نمایی چوله را معرفی کرده و مدل رگرسیون چندکی بیزی را با استفاده از آن به‌عنوان توزیع متغیر خطا بیان می‌کنیم . در این خانواده توزیع ، نمونه‌گیری از توزیع پسین با استفاده از الگوریتم نمونه‌گیری متروپولیس-هستینگز درون گیبز انجام می‌شود که همراه با فرایند انتخاب متغیر نیز خواهد بود. سپس به‌منظور بررسی عملکرد مدل پیشنهادی ، از مطالعات شبیه‌سازی و کاربردی استفاده می‌کنیم.

ارتقاء امنیت وب با وف بومی