Skip to main content
SUPERVISOR
جعفر قیصری (استاد راهنما) ایمان ایزدی نجف آبادی (استاد راهنما) یوسف قیصری (استاد مشاور)
 
STUDENT
Pooya Borzou
پویا برزواصفهانی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1395

TITLE

Extracting dynamic model of protein interaction network in cells
Interactions among proteins and other elements of cell result in cell activities which disorders in them cause diseases. Consequently, diseases can be analysed by modelling the network of Protein-Protein Interactions (PPI). PPI networks are usually modelled in top-down and bottom-up approaches. In top-down approach, System is modelled in a large scale using high-throughput data from proteins. This approach does not examine dynamics of the system's behavior and usually studies the structures of interactions. However, PPI network dynamics are usually modelled in bottom-up approach using mathematical tools. In this approach, the whole system is analyzed by connecting the results of small models to each other. In this thesis, a systematic modelling approach is proposed which has the advantages of both methods and the dynamics of protein interactions are modelled in a large scale using ordinary differential equations. In the proposed modelling approach, the PPI network is expanded to biochemical reactions network by using information about the details of each protein interaction. After that, based on stoichiometric rules of biochemical reactions between proteins, the network is modelled using ordinary differential equations. %In order to perform the modelling procedure in a large scale for big PPI networks, a software is proposed to do it automatically. Also, a software is implemented to perform the modelling procedure in a large scale for PPI networks, automatically. After giving the list of considered proteins to the software, it extracts the interactions network between them and expands the PPI network to biochemical reactions network. After that, the software extracts ordinary differential equations of the reactions and saves it into a compilable file. The extracted equations have many unknown parameters which should be estimated by fitting model outputs with experimental data. After determining the performance of parameter estimation methods, a new optimization algorithm is proposed which can solve large-scale optimization problems in lower time and computation cost. At each iteration of this method, only one of the model outputs will be fitted to experimental data. The optimum point of parameters will be searched in the space of parameters which affect the considered output directly. In order to test the performance of proposed software with automated modelling, it is used to model two simple PPI networks. After that, one of the common parameter estimation methods is compared with the proposed method by estimating parameters of these two models and comparing the results. After that, the proposed software is used to model the whole PPI network between 757 proteins in the colon cancerous cells. In the first step, the software extracted 5,250 edges between these proteins. After that, it modelled the PPI network by 3,750 state variables and 7,400 unknown parameters. The model parameters are estimated using normalized experimental data from protein concentrations from the colon cancerous cells in five time steps. Parameter estimation is performed by parallel processing techniques using Sheikh-bahayee supercomputer in Isfahan University of Technology. As the result, the proposed model could describe the changes in protein concentrations based on biochemical interactions between proteins in the colon cancerous cells. The proposed model can get a better insight about cancer mechanism and it helps to simulate cell responses to drugs. Systems Biology, Nonlinear dynamic modeling, Protein-Protein Interaction Network, Parameter Estimation, Biologic time-course data, parallel computing
فعالیت حیاتی سلول‌ها، نتیجه‌ی بر‌هم‌کنش میان پروتئین‌های آن با یکدیگر و با سایر اجزای سلول است و اختلالات آن منجر به بیماری می‌شود. به همین دلیل شناخت بر‌هم‌کنش‌های پروتئینی و مدل‌سازی آن، در شناخت مکانیسم سلول و فرآیند بیماری‌ها مؤثر است. بر‌هم‌کنش میان پروتئین‌ها عموما با دو رویکرد بالا به پایین و پایین به بالا مدل‌سازی می‌شوند. در رویکرد اول، کل سیستم در ابعاد وسیع مدل‌سازی شده و با استفاده از داده‌های حجم-انبوه تحلیل می‌گردد.این رویکرد غالبا ساختار برهم‌کنش‌ها را مورد بررسی قرار داده و دینامیک آن را تحلیل نمی‌کنند. تحلیل دینامیک سیستم‌های بیولوژیکی عموما در مقیاس‌های کوچک و با رویکرد دوم انجام می‌گیرد. در این رویکرد مدل‌سازی، ابتدا بخش‌های کوچک سیستم با استفاده از ابزارهای ریاضی توصیف کننده‌ی دینامیک سیستم مدل‌سازی شده و سپس از کنار هم قرار دادن نتایج مدل‌ها‌ی کوچک، رفتار کلی سیستم توصیف می‌شود. در این پژوهش، روشی سیستماتیک جهت مدل‌سازی ارائه شده است که مزیت هر دو رویکرد را داشته باشد. در این روش، دینامیک تعامل پروتئین‌ها با استفاده از معادلات دیفرانسیل معمولی در ابعاد وسیع مدل‌سازی می‌شود. در روش پیشنهادی، با استفاده از اطلاعات بیولوژیکی در مورد هم برهم‌کنش پروتئینی، شبکه‌ی بر‌هم‌کنش‌ها به شبکه‌ی واکنش‌های بیوشیمیایی بسط داده می‌شود. سپس بر مبنای قوانین استوکیومتری واکنش‌های بیوشیمیایی، این شبکه با معادلات دیفرانسیل معمولی مدل‌سازی می‌شود. جهت پیاده‌سازی این روش در ابعاد وسیع، نرم‌افزاری ارائه شده است که می‌تواند مستقل از ابعاد مسأله، مدل‌سازی را بصورت خودکار انجام دهد. نرم‌افزار مذکور، پس از دریافت لیست پروتئین‌های مورد نظر شبکه‌ی ارتباطات بین پروتئینی آن‌هارا مشخص کرده و شبکه‌ی واکنش‌های بیوشیمیایی را استخراج می‌کند. سپس معادلات دیفرانسیل حاکم بر سرعت واکنش‌های شیمیایی در حال وقوع مابین پروتئین‌های سلول را بصورت خودکار استخراج می‌کند. معادلات حالت استخراج شده توسط نرم‌افزار، دارای پارامترهایی با مقادیر نامشخص است که با تطبیق خروجی‌های مدل بر داده‌های آزمایشگاهی تخمین زده می‌شوند. پس از بررسی روش‌های متداول تخمین پارامتر، یک روش جدید متناسب با شرایط مدل مذکور و داده‌های آزمایشگاهی در دسترس ارائه شد. با وجود اینکه در روش‌های متداول، جهت یافتن مفادیر مناسب پارامتر‌ها غالبا مجموع کل مربعات خطا بهینه‌سازی می‌شود، در روش پیشنهادی، در هر مرحله تنها یکی از خروجی‌های مدل بر داده‌های تجربی تطبیق داده شده و جهت انجام این کار فضای جستجو به فضای پارامترهای تأثیرگذار بر خروجی مورد نظر محدود می‌شود. در مراحل بعدی، سایر خروجی‌های مدل بصورت گردشی بر داده‌های تجربی تطبیق داده می‌شوند. جهت بررسی عملکرد الگوریتم پیشنهاد شده، دو نمونه از شبکه‌‌ی بر‌هم‌کنش‌ پروتئینی در ابعاد کوچک به وسیله‌ی آن مدل‌سازی شده‌اند. با تخمین پارامترهای مدل‌های شبکه‌های نمونه بااستفاده از روش پیشنهادی تخمین پارامتر و روش‌های متداول، دقت عملکرد آن‌ها مورد ارزیابی قرار گرفت. در ادامه، با استفاده از الگوریتم پیشنهادی، شبکه‌ی کامل برهم‌کنش پروتئینی در سلول سرطانی روده با 5250 برهم‌کنش مابین 757 پروتئین بصورت اتوماتیک مدل‌سازی شده است. مدل استخراح شده، معادلات حالتی با 3750 متغیر حالت و 7400 پارامتر با مقدار نامشخص است. این مدل همچنین دارای 757 خروجی است که مقدار آن‌ها برابر غلظت پروتئین‌های داخل سلول است. در گام بعدی، پارامترهای مدل، با تطبیق داده‌های آزمایشگاهی از غلظت هر پروتئین در سیر 5 گام زمانی با خروجی‌های مدل تخمین زده شده‌اند. با توجه به ابعاد بزرگ مسأله و حجم محاسبات، این کار با استفاده از تکنیک پردازش موازی بر روی ابر کامپیوتر مرکز ابررایانش شیخ‌بهایی انجام شده است. در نهایت، بر پایه‌ی روابط بیوشیمیایی در شبکه‌ی برهم‌کنش پروتئینی در بدن انسان و با استفاده از الگوریتم پیشنهاد شده، مدلی از سلول‌های سرطانی روده ساخته شد که قادر است سیر تغییرات داده‌های آزمایشگاهی از غلظت پروتئین‌ها را با گذشت زمان توصیف کند. رویکرد مدل‌سازی دینامیکی در ابعاد وسیع، ضمن شناخت مکانیزم بیماری، می‌تواند در طراحی دارو‌های جدید ضد سرطان کمک کننده باشد و همچنین به عنوان ابزاری برای شناخت اهداف دارویی مورد استفاده قرار بگیرد. 1- بیولوژی سیستم‌ها، 2- مدل‌سازی دینامیکی غیرخطی، 3- شبکه‌ی بر‌هم‌کنش پروتئینی، 4-تخمین پارامتر، 5-داده‌های بیولوژیک سیر زمانی. 6-پردازش موازی

ارتقاء امنیت وب با وف بومی