SUPERVISOR
جعفر قیصری (استاد راهنما) ایمان ایزدی نجف آبادی (استاد راهنما) یوسف قیصری (استاد مشاور)
STUDENT
Pooya Borzou
پویا برزواصفهانی
FACULTY - DEPARTMENT
دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1395
TITLE
Extracting dynamic model of protein interaction network in cells
Interactions among proteins and other elements of cell result in cell activities which disorders in them cause diseases. Consequently, diseases can be analysed by modelling the network of Protein-Protein Interactions (PPI). PPI networks are usually modelled in top-down and bottom-up approaches. In top-down approach, System is modelled in a large scale using high-throughput data from proteins. This approach does not examine dynamics of the system's behavior and usually studies the structures of interactions. However, PPI network dynamics are usually modelled in bottom-up approach using mathematical tools. In this approach, the whole system is analyzed by connecting the results of small models to each other. In this thesis, a systematic modelling approach is proposed which has the advantages of both methods and the dynamics of protein interactions are modelled in a large scale using ordinary differential equations. In the proposed modelling approach, the PPI network is expanded to biochemical reactions network by using information about the details of each protein interaction. After that, based on stoichiometric rules of biochemical reactions between proteins, the network is modelled using ordinary differential equations. %In order to perform the modelling procedure in a large scale for big PPI networks, a software is proposed to do it automatically. Also, a software is implemented to perform the modelling procedure in a large scale for PPI networks, automatically. After giving the list of considered proteins to the software, it extracts the interactions network between them and expands the PPI network to biochemical reactions network. After that, the software extracts ordinary differential equations of the reactions and saves it into a compilable file. The extracted equations have many unknown parameters which should be estimated by fitting model outputs with experimental data. After determining the performance of parameter estimation methods, a new optimization algorithm is proposed which can solve large-scale optimization problems in lower time and computation cost. At each iteration of this method, only one of the model outputs will be fitted to experimental data. The optimum point of parameters will be searched in the space of parameters which affect the considered output directly. In order to test the performance of proposed software with automated modelling, it is used to model two simple PPI networks. After that, one of the common parameter estimation methods is compared with the proposed method by estimating parameters of these two models and comparing the results. After that, the proposed software is used to model the whole PPI network between 757 proteins in the colon cancerous cells. In the first step, the software extracted 5,250 edges between these proteins. After that, it modelled the PPI network by 3,750 state variables and 7,400 unknown parameters. The model parameters are estimated using normalized experimental data from protein concentrations from the colon cancerous cells in five time steps. Parameter estimation is performed by parallel processing techniques using Sheikh-bahayee supercomputer in Isfahan University of Technology. As the result, the proposed model could describe the changes in protein concentrations based on biochemical interactions between proteins in the colon cancerous cells. The proposed model can get a better insight about cancer mechanism and it helps to simulate cell responses to drugs. Systems Biology, Nonlinear dynamic modeling, Protein-Protein Interaction Network, Parameter Estimation, Biologic time-course data, parallel computing
فعالیت حیاتی سلولها، نتیجهی برهمکنش میان پروتئینهای آن با یکدیگر و با سایر اجزای سلول است و اختلالات آن منجر به بیماری میشود. به همین دلیل شناخت برهمکنشهای پروتئینی و مدلسازی آن، در شناخت مکانیسم سلول و فرآیند بیماریها مؤثر است. برهمکنش میان پروتئینها عموما با دو رویکرد بالا به پایین و پایین به بالا مدلسازی میشوند. در رویکرد اول، کل سیستم در ابعاد وسیع مدلسازی شده و با استفاده از دادههای حجم-انبوه تحلیل میگردد.این رویکرد غالبا ساختار برهمکنشها را مورد بررسی قرار داده و دینامیک آن را تحلیل نمیکنند. تحلیل دینامیک سیستمهای بیولوژیکی عموما در مقیاسهای کوچک و با رویکرد دوم انجام میگیرد. در این رویکرد مدلسازی، ابتدا بخشهای کوچک سیستم با استفاده از ابزارهای ریاضی توصیف کنندهی دینامیک سیستم مدلسازی شده و سپس از کنار هم قرار دادن نتایج مدلهای کوچک، رفتار کلی سیستم توصیف میشود. در این پژوهش، روشی سیستماتیک جهت مدلسازی ارائه شده است که مزیت هر دو رویکرد را داشته باشد. در این روش، دینامیک تعامل پروتئینها با استفاده از معادلات دیفرانسیل معمولی در ابعاد وسیع مدلسازی میشود. در روش پیشنهادی، با استفاده از اطلاعات بیولوژیکی در مورد هم برهمکنش پروتئینی، شبکهی برهمکنشها به شبکهی واکنشهای بیوشیمیایی بسط داده میشود. سپس بر مبنای قوانین استوکیومتری واکنشهای بیوشیمیایی، این شبکه با معادلات دیفرانسیل معمولی مدلسازی میشود. جهت پیادهسازی این روش در ابعاد وسیع، نرمافزاری ارائه شده است که میتواند مستقل از ابعاد مسأله، مدلسازی را بصورت خودکار انجام دهد. نرمافزار مذکور، پس از دریافت لیست پروتئینهای مورد نظر شبکهی ارتباطات بین پروتئینی آنهارا مشخص کرده و شبکهی واکنشهای بیوشیمیایی را استخراج میکند. سپس معادلات دیفرانسیل حاکم بر سرعت واکنشهای شیمیایی در حال وقوع مابین پروتئینهای سلول را بصورت خودکار استخراج میکند. معادلات حالت استخراج شده توسط نرمافزار، دارای پارامترهایی با مقادیر نامشخص است که با تطبیق خروجیهای مدل بر دادههای آزمایشگاهی تخمین زده میشوند. پس از بررسی روشهای متداول تخمین پارامتر، یک روش جدید متناسب با شرایط مدل مذکور و دادههای آزمایشگاهی در دسترس ارائه شد. با وجود اینکه در روشهای متداول، جهت یافتن مفادیر مناسب پارامترها غالبا مجموع کل مربعات خطا بهینهسازی میشود، در روش پیشنهادی، در هر مرحله تنها یکی از خروجیهای مدل بر دادههای تجربی تطبیق داده شده و جهت انجام این کار فضای جستجو به فضای پارامترهای تأثیرگذار بر خروجی مورد نظر محدود میشود. در مراحل بعدی، سایر خروجیهای مدل بصورت گردشی بر دادههای تجربی تطبیق داده میشوند. جهت بررسی عملکرد الگوریتم پیشنهاد شده، دو نمونه از شبکهی برهمکنش پروتئینی در ابعاد کوچک به وسیلهی آن مدلسازی شدهاند. با تخمین پارامترهای مدلهای شبکههای نمونه بااستفاده از روش پیشنهادی تخمین پارامتر و روشهای متداول، دقت عملکرد آنها مورد ارزیابی قرار گرفت. در ادامه، با استفاده از الگوریتم پیشنهادی، شبکهی کامل برهمکنش پروتئینی در سلول سرطانی روده با 5250 برهمکنش مابین 757 پروتئین بصورت اتوماتیک مدلسازی شده است. مدل استخراح شده، معادلات حالتی با 3750 متغیر حالت و 7400 پارامتر با مقدار نامشخص است. این مدل همچنین دارای 757 خروجی است که مقدار آنها برابر غلظت پروتئینهای داخل سلول است. در گام بعدی، پارامترهای مدل، با تطبیق دادههای آزمایشگاهی از غلظت هر پروتئین در سیر 5 گام زمانی با خروجیهای مدل تخمین زده شدهاند. با توجه به ابعاد بزرگ مسأله و حجم محاسبات، این کار با استفاده از تکنیک پردازش موازی بر روی ابر کامپیوتر مرکز ابررایانش شیخبهایی انجام شده است. در نهایت، بر پایهی روابط بیوشیمیایی در شبکهی برهمکنش پروتئینی در بدن انسان و با استفاده از الگوریتم پیشنهاد شده، مدلی از سلولهای سرطانی روده ساخته شد که قادر است سیر تغییرات دادههای آزمایشگاهی از غلظت پروتئینها را با گذشت زمان توصیف کند. رویکرد مدلسازی دینامیکی در ابعاد وسیع، ضمن شناخت مکانیزم بیماری، میتواند در طراحی داروهای جدید ضد سرطان کمک کننده باشد و همچنین به عنوان ابزاری برای شناخت اهداف دارویی مورد استفاده قرار بگیرد. 1- بیولوژی سیستمها، 2- مدلسازی دینامیکی غیرخطی، 3- شبکهی برهمکنش پروتئینی، 4-تخمین پارامتر، 5-دادههای بیولوژیک سیر زمانی. 6-پردازش موازی