Skip to main content
SUPERVISOR
Zeinab Maleki,Naser Ghadiri modaress
زینب مالکی (استاد مشاور) ناصر قدیری مدرس (استاد راهنما)
 
STUDENT
Mehdi Joodaki
مهدی جودکی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1395

TITLE

Building a reliable network with fuzzy inference and prediction of disease-causing genes on Apache Spark platform
Diagnosis of disease-related genes is one of the most important goals in biomedical researchers. The topic is the arespredic-tion of disease genes which the genes associated with them still remain unknown. Most network-based method together.gbased on the principle that genes associated with diseases that are similar in phenotypes, are usually interactin enegThe main goal is to find these interactions or modules more accurate. Some of these approaches are based on gene esnetworks to discover new genes associated with the disease. Other methods integrate gene-gene networks with disea the,similarity network to improve the accuracy of discovering new genes. Despite the different integration approaches suproblem of accurately recognizing disease causing genes is still a challenge. Given the definition of heterogeneo egrationtnetworks made up of nodes with different kinds of connections, it is possible to consider a network made up of in inding afof different biological networks as a heterogeneous network. On the other hand, there are various algorithms for gmodule or cluster on heterogeneous networks such as RWRHN. Therefore, due to the existence of effective clusterin llyaalgorithms on heterogeneous networks, the problem of discovering the genes associated with the disease, which usu . form a cluster, can be examined from the perspective of cluster detection on the heterogeneous network. The method introduced in this research is called RWRHN-FF. First, four gene-similarity networks based on different ase,hgenomic resources were constructed. Then the type II fuzzy voter was used to combine the networks. In the second p ademthe gene-gene network used a two-part disease-gene network, was connected to a disease-disease similarity network Nup of a combination of four different sources, and a reliable heterogeneous network was created. Finally, the RWRH ultssalgorithm was implemented on a network constructed to prioritize the candidate gene for inherited diseases. The re show that the performance of RWRHN-FF is better than RWRHN-RE and RWRH. In addition, RWRHN-FF was used to mpredict new genes for prostate, breast, stomach and intestine cancers. Also, in order to reduce the RWRHN algorith runtime on heterogeneous networks, Apache Spark has been used, which converges in less time compared to other . implementations on different volumes of heterogeneous networks. Key Words :Clustering, Heterogeneous networks, Gene-Gene network, Genes associated with the disease, Prioritization, Type II Fuzzy Voter, RWRHN
تشخیص ژ‌ن‌های مرتبط با بیماری یکی از مهم‌ترین اهداف در تحقیقات زیست پزشکی است. موضوع مورد بحث در این زمینه بررسی بیماری‌هایی است که هنوز بخشی از ژن‌های مرتبط با آن‌ها به صورت ناشناخته باقی مانده‌ است. اکثر روش‌های مبتنی بر شبکه بر این اصل استوارند که ژن‌های مرتبط با بیماری‌هایی که از نظر فنوتایپ با یکدیگر شباهت دارند، اغلب با هم در تعامل هستند. هدف اصلی این روش‌ها، پیدا کردن این تعاملات یا ماژول‌ها با دقت بیشتر است؛ در میان این روش‌ها، رویکرد‌هایی وجود دارد که تنها براساس شبکه‌های ژن-ژن به کشف ژن‌های جدید مرتبط با بیماری می‌پردازند. دیگر رویکردها به منظور بهبود دقت در کشف ژن‌های جدید، شبکه‌ی ‌ژن-ژن را با شبکه‌ی شباهت بیماری‌ها تلفیق می‌کنند. با وجود روش‌های مختلف بر روی ترکیبات این نوع شبکه‌ها، مسئله‌ی دقت تشخیص ژن‌های عامل بیماری به عنوان یک چالش پا برجاست. با توجه به تعریف شبکه‌های ناهمگن که از گره‌ها یا ارتباط‌هایی با نوع متفاوت ساخته می‌شوند، می‌توان شبکه‌ی ساخته‌شده از ترکیب شبکه‌های متفاوت زیستی را به عنوان یک شبکه‌ی ناهمگن درنظر گرفت. از طرفی الگوریتم‌های مختلفی برای پیدا کردن ماژول یا خوشه بر روی شبکه‌های ناهمگن مانند RWRHN وجود دارد. لذا با توجه به وجود الگوریتم‌های خوشه‌بندی موثر بر روی شبکه‌های ناهمگن، مسئله‌ی کشف ژن‌های مرتبط با بیماری که اغلب با هم یک خوشه تشکیل می‌دهند را می‌توان از منظر تشخیص خوشه بر روی شبکه‌ی ناهمگن مورد بررسی قرار داد. روش معرفی شده در این پژوهش RWRHN-FF نامیده می‌شود. ابتدا چهار شبکه‌ی شباهت ژن-ژن بر اساس منابع مختلف ژنومیک ساخته‌شد. سپس برای ترکیب شبکه‌ها از متد رای‌گیر فازی نوع دو ستفاده شد. در مرحله‌ی دوم شبکه‌ی ژن-ژن را با استفاده از شبکه‌ی دو بخشی بیماری-ژن به شبکه‌ی شباهت بیماری-بیماری ساخته شده از ترکیب چهار منبع مختلف، متصل کرده و یک شبکه‌ی ناهمگن قابل اعتماد ایجاد شد. درنهایت الگوریتم RWRHN روی شبکه‌ی ساخته شده برای اولویت‌بندی ژن‌های کاندید بیماری‌های ارثی اجرا شد. نتایج به‌دست‌ آمده نشان می‌دهد که متد RWRHN-FF نسبت به دو روش RWRHN-RE و RWRHN عملکرد بهتری دارد. علاوه بر این، RWRHN-FF برای پیش‌بینی ژن‌های جدید سرطان‌های پروستات، سینه، معده و روده مورد استفاده قرار گرفت. همچنین در این پژوهش برای کاهش زمان اجرای الگوریتم RWRH روی شبکه‌های ناهمگن از بستر آپاچی اسپارک استفاده شد که در مقایسه با دیگر پیاده‌سازی‌ روی حجم‌های مختلف شبکه‌ی ناهمگن در زمان کمتری به همگرایی رسید. کلمات کلیدی : خوشه بندی،شبکه‌های ناهمگن، شبکه‌ی ژن-ژن، ژن‌های مرتبط با بیماری، اولویت‌بندی، رای‌گیر فازی نوع دو، RWRHN

ارتقاء امنیت وب با وف بومی