Skip to main content
SUPERVISOR
Reyhaneh Rikhtegaran,Zahra Saberi
ریحانه ریخته گران (استاد راهنما) زهرا صابری (استاد مشاور)
 
STUDENT
Mahsa Malekian
مهسا ملکیان

FACULTY - DEPARTMENT

دانشکده ریاضی
DEGREE
Master of Science (MSc)
YEAR
1392

TITLE

A study on joint modeling of longitudinal and survival data
لاتین: owadays with due regards to the development of medical, economic and industrial studies in the field of survival and longitudinal data analysis, the use of advanced statistical techniques is required more than ever. In survival studies, because of censored data, special modeling techniques are used. The related models can be divided into two categories: the parametric category in which a statistical distribution is considered for the survival time, such as accelerated failure time models and the nonparametric category like Cox proportional hazards models that mainly model the hazard function instead of survival time. Usually in regression survival analysis, the hazard rate for different subjects, due to the effects of unobserved factors related to various subjects is different. In this regard, frailty models are taken into consideration by entering subject effects as random variables in the model. Usually with a collection of survival data, other variables are also registered over time. Such data that are obtained by repeatedly measuring variables over time for different subjects is called longitudinal data. In this type of data, usually serial correlation among observations over time is considered by entering lagged-response variables in the model. In this case, it is necessary that the dependence of initial response variables with the random effects associated with subjects’ effects is also considered. Ignoring this correlation may lead to the serious bias in the estimation of model parameters. Handling this issue is by modeling of initial responses and taking into account the dependence between this model and the original equation through assuming shared random effects. In many studies, the survival time depends on the longitudinal variables that are measured over time. Therefore, we need to the joint modeling of longitudinal and survival data. The dependence between longitudinal data and time to event data could be due to the influence of same subjects for longitudinal variables and the survival time. In such circumstances, the shared-parameter model is one of the most famous models that are used for analysis of data. On the other hand, the dependence of longitudinal and time to event data could be due to the direct influence of longitudinal data on the survival time that should be correctly addressed in the fitted model. In this thesis, while introducing different models of survival analysis and analysis of longitudinal data, common models for joint modeling of survival time and longitudinal data are introduced. Also, a joint model is proposed to cover the serial correlation of longitudinal observations and also their influences on survival times. Moreover, another model is proposed to address the direct influence of longitudinal data on survival times through entering the longitudinal variable as a time-varying covariate in the fitted model for the survival time. Because of the complexity of estimation of parameters in joint models, with the Bayesian approach to the problem, Markov chain Monte Carlo simulation methods are adopted. In this regards, full conditional posterior distributions required for running the Gi sampler are derived for the proposed models when working with the accelerated failure time models.
فارسی: امروزه با توجه به گسترش مطالعات پزشکی، اقتصادی و صنعتی در زمینه تحلیل داده‌های بقا و طولی، نیاز به روش‌های تحلیل آماری پیشرفته‌تر، بیش از پیش احساس می‌شود. در مطالعات بقا، به‌دلیل وجود داده‌های سانسور شده، روش‌های مدل‌سازی خاصی مورد استفاده قرار می‌گیرند . مدل‌های مرتبط را می‌توان به دو دسته پارامتری که در آن برای زمان بقا، توزیع آماری درنظر گرفته می‌شود، مانند مدل‌های زمان شکست شتابیده و دسته ناپارامتری مانند مدل مخاطرات متناسب کاکس که عمدتاً به جای زمان بقا، تابع مخاطره مدل‌سازی می‌شود، تقسیم کرد. معمولاً در مدل‌های رگرسیونی تحلیل بقا، نرخ مخاطره برای واحدهای آزمایشی مختلف، به‌دلیل تأثیرگذاری عوامل مشاهده‌نشده مرتبط با واحدهای آزمایشی مختلف، متفاوت است. مدل‌های شکنندگی با وارد کردن اثر واحدهای آزمایشی، به‌صورت متغیرهای تصادفی در مدل، این مسأله را مورد توجه قرار می‌دهند .\\\\ معمولاً به همراه جمع‌آوری داده‌های بقا، متغیرهای دیگری نیز در طی زمان ثبت می‌شوند. به چنین داده‌هایی که بر اثر اندازه‌گیری‌های مکرر متغیرها در طی زمان برای واحدهای آزمایشی مختلف، به‌دست می‌آیند، داده‌های طولی گویند. مدل متداول جهت تحلیل داده‌های طولی، مدل با اثرات آمیخته است که در آن تغییرپذیری بین و درون واحدهای آزمایشی با وارد کردن اثر تصادفی مرتبط با واحدهای آزمایشی در مدل، لحاظ می‌شود. در داده‌های طولی، معمولاً همبستگی پیاپی مشاهدات در طی زمان، از طریق وارد کردن متغیر پاسخ تأخیری در مدل، درنظر گرفته می‌شود. در این حالت لازم است که وابستگی مشاهدات زمان‌های آغازین با اثرات تصادفی مرتبط با واحدهای آزمایشی نیز درنظر گرفته شوند. این کار از طریق مدل‌سازی مشاهدات زمان‌های آغازین و درنظر گرفتن وابستگی میان این مدل با معادله اصلی، از طریق وارد کردن اثرات تصادفی مشترک لحاظ می‌شود. در بسیاری از مطالعات، زمان بقا به مقادیر متغیرهای طولی اندازه‌گیری شده در طی زمان، وابسته است و لزوم مدل‌سازی توأم داده‌های طولی و بقا را مشخص می‌کند. چنین وابستگی می‌تواند به دلیل تأثیرپذیری متغیرهای طولی و زمان بقا از واحدهای آزمایشی یکسان باشند. مدل پارامتر مشترک، از جمله مدل‌هایی است که جهت تحلیل داده‌ها در چنین شرایطی مورد استفاده قرار می‌گیرد. همچنین وابستگی متغیرهای طولی و بقا می‌تواند از طریق تأثیرگذاری مستقیم مقدار متغیر طولی بر زمان بقای واحد آزمایشی باشد. در این پایان‌نامه، ضمن معرفی مدل‌های مختلف تحلیل بقا و تحلیل داده‌های طولی، مدل‌های متداول جهت مدل‌سازی توأم داده‌های بقا و طولی، معرفی شده و مدل توأمی جهت مدل‌سازی داده‌ها ارائه شده که در آن به همبستگی پیاپی مشاهدات طولی و نیز تأثیرگذاری مستقیم مشاهدات طولی بر زمان بقا توجه شده است. به‌دلیل پیچیده بودن برآورد پارامترها در مدل‌های توأم، با رویکرد بیز به مسأله، از روش‌های شبیه‌سازی مونت کارلوی زنجیر مارکفی استفاده شده است.

ارتقاء امنیت وب با وف بومی