Skip to main content
SUPERVISOR
Maziar Palhang,Seyed Rasul Moosavi
مازیار پالهنگ (استاد مشاور) سید رسول موسوی (استاد راهنما)
 
STUDENT
Maryam Babaie
مریم بابائی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1386
Computational biology and bioinformatics are two important interdisciplinary fields which connect biology and information technology. An important goal of these fields is to interpret genome and protein data, which has led to such problems as genome rearrangement, sequence alignment, and sequences consensus problem, most of which are known to be NP-hard. Sequences consensus problems include closest string problem and farthest string problem and far from most string problem, Which have applications in drug design and coding theory. The closest string problem seeks for a string whose distance from all the strings in a given set of strings is minimum. Consequently, the solution to the problem is a sequence with maximum 'similarity' to the input strings. The farthest string problem, on the other hand, is the reverse of the closest string problem in the sense that it seeks for a string whose distance from the given strings is maximum. The third problem is to find a string which has distance more than a predefined threshold from all the strings of the input strings. These problems are especially important in the context of studying molecular evolution, protein structures, and drug target design. For example, one of their applications in drug target design is to find a genetic sequence that kills all pathogenic bacteria without any impact on human being genes. The closest string problem also has applications in the coding theory, data compression, error decoding, and speech coding. Several algorithms have been proposed to solve these problems. Since the problems are NP-hard, none of these algorithms is a polynomial time exact algorithm. That is, the existing algorithms which can solve the problem to optimality are all exponential. However, because of their exponential complexity, these algorithms are not of much use in practice. Consequently, many non-exact algorithms have been proposed which try to obtain 'good' solutions in acceptable time. There are in general two justify; LINE-HEIGHT: 12pt; TEXT-INDENT: 11.35pt; MARGIN: 0in 0in 0pt; unicode-bidi: embed; DIRECTION: ltr; mso-line-height-rule: exactly; tab-stops: 28.35pt" dir=ltr Key Words Bioinformatic, Closest string problem, farthest string problem, far from most string problem, memetic algorithm, GRASP
در این پایان نامه، سه مسئله ی نزدیک ترین رشته، دورترین رشته، و دور از بیشترین رشته مورد بررسی قرار می گیرند. این مسائل، در گروه مسائل رشته ی مورد توافق در حوزه ی بیوانفورماتیک دسته بندی می شوند. کاربرد اصلی این مسائل در بیوانفورماتیک در تولید دارو، به ویژه داروهای آنتی بیوتیک و ضد حساسیت، یافتن نقطه اثر داروها، و یافتن کاوشگر برای طراحی داروهای جدید می باشد. مسئله ی نزدیک ترین رشته دارای کاربردهایی در نظریه کدینگ نیز می باشد. الگوریتم های مختلفی برای این مسائل ارائه شده اند. از آنجا که این مسائل به گروه مسائل NP-سخت تعلق دارند و الگوریتم های ارائه شده برای این مسائل دارای پیچیدگی زمانی بالایی هستند، الگوریتمی که قادر به دستیابی به پاسخ دقیق آنها در زمان چندجمله ای باشد ارائه نشده است. الگوریتم های حل دقیق این مسائل همگی دارای زمان نمایی هستند. بنابراین، محققین برای ارائه الگوریتم هایی که قادر به دستیابی به پاسخ های نزدیک به بهینه در زمان قابل قبول باشند تلاش کرده اند. دو روش عمده برای یافتن راه حل های تقریبی برای مسائل پیچیده وجود دارد: تخمین و روش های مکاشفه ای. الگوریتم های تخمین، تضمینی از حد بالای خطای ممکن در پاسخ حاصل، ارائه می دهند و الگوریتم های مکاشفه ای، فاقد چنین تضمینی هستند. در عمل نشان داده شده است که الگوریتم های مکاشفه ای، علیرغم عدم ارائه حد بالای خطا در پاسخ، بهتر از الگوریتم های تخمین عمل می کنند. در این تحقیق، دو الگوریتم مکاشفه ای ممتیک و گرسپ، برای حل هر یک از مسائل ذکر شده، ارائه می شود. الگوریتم ممتیک، الگوریتمی است که با افزودن جستجوی محلی به الگوریتم های تکاملی سعی در بهبود عملکرد این الگوریتم ها دارد. الگوریتم های تکاملی نظیر ژنتیک به علت دانش محلی اندکی که دارند، ممکن است قادر به دستیابی به برخی پاسخ های خوب در نزدیکی پاسخ های موجود نباشند. افزودن جستجوی محلی، قابلیت دستیابی به این پاسخ ها را در الگوریتم ایجاد می کند. دومین روش مکاشفه ای ارائه شده، الگوریتم گرسپ می باشد که با استفاده از تولید اعداد تصادفی طی روند تولید پاسخ به روش حریصانه، با ایجاد تنوع در پاسخ های حاصل، احتمال دستیابی به پاسخ بهینه را افزایش می دهد. نتایج به دست آمده از اجرای این دو الگوریتم روی مسائل نزدیک ترین رشته و مسئله ی دور از بیشترین رشته های ممکن با آخرین الگوریتم های مکاشفه ای ارائه شده برای حل این دو مسئله مقایسه شده و نشان داده شده است که الگوریتم های پیشنهادی برتری قابل توجهی نسبت به آنها دارند. برای حل مسئله ی دورترین رشته تا کنون الگوریتم مکاشفه ای مستقلی ارائه نشده است و دو الگوریتم ارائه شده در این پایان نامه اولین روش های مکاشفه ای پیشنهاد شده برای حل این مسئله می باشند. الگوریتم های ممتیک و گرسپ با یکدیگر مقایسه شده و نشان داده شده است که برای مسئله ی نزدیک ترین رشته و مسئله دورترین رشته الگوریتم گرسپ و برای مسئله دور از بیشترین رشته، الگوریتم ممتیک به پاسخ های بهتری دست پیدا می کند. در هر سه مسئله، الگوریتم گرسپ زمان اجرای کمتری دارد.

ارتقاء امنیت وب با وف بومی