SUPERVISOR
سعید انصاری مهیاری (استاد راهنما) مهدی سرگلزائی (استاد راهنما)
STUDENT
Mehrnush Forutan
مهرنوش فروتن
FACULTY - DEPARTMENT
دانشکده کشاورزی
DEGREE
Doctor of Philosophy (PhD)
YEAR
1391
TITLE
Use of Haplotype Data to Construct the Genomic Relationship Matrix and Calculate Inbreeding Coefficient In Dairy Cattle
The success of genomic selection programs in dairy cattle populations has resulted in a growing demand for new methods to increase the accuracies of genomic estimated breeding values ( GEBV ) and to calculate more precisely inbreeding coefficient. The main objectives of this thesis were 1) to investigate the accuracy and bias of GEBV using genomic best linear unbiased prediction ( GBLUP ) with alternate genomic relationship matrices ( G ) based on single nucleotide polymorphism () and haplotypes information in simulated and real data (first study), and 2) to determine the optimal method for estimating true inbreeding based on simulated data, and to characterize the distribution of runs of homozygosity ( ROH ) across the genome of real and simulated populations (second study). In the first study, alternate G matrices were constructed for simulated populations for two traits with heritability of 0.3 and 0.1. In addition, genomic relationship matrices were built using actual 50k chip genotypes and fat yield, milk yield, somatic cell score, conformation, and days open were analyzed in the North American Holstein cattle. In the second study, a gene dropping simulation was performed and inbreeding estimates based on ROH, pedigree, and the genomic relationship matrix were compared to true inbreeding. Furthermore, inbreeding coefficients were estimated in a sample of genotyped North American Holstein animals born from 1990 to 2016 using 50k chip data and ROH patterns were assessed before and after genomic selection. Based on the results of the first study, the use of haplotype relationship matrixes ( G HAP ) yielded slightly higher prediction accuracy than other matrices, in simulation. Using LD-haploblocks based relationship matrix ( G HAP-LD ) compare to use of G HAP did not result in more accurate estimates. Constructing haplotype-based relationship matrices based on giving credit to long haplotype ( G HAP2 ) did not result in more accurate GEBVs. Results of the second study revealed that using ROH with a minimum window size of 20 to 50 (1 to 2.5Mb) using 1101 software provides the closest estimates to true inbreeding in simulation study. Pedigree inbreeding tended to underestimate true inbreeding, and results for genomic inbreeding varied depending on assumptions about base allele frequencies. The longest individual ROH and the largest average length of ROH were observed when selection was based on best linear unbiased prediction ( BLUP ), whereas genomic selection showed the largest number of small ROH compared to BLUP estimated breeding values ( BLUP-EBV ). In North American Holsteins, the average number of ROH segments of 1 Mb or more per individual increased from 57 in 1990 to 82 in 2016. Based on current results, G HAP might be an alternative approach to reduce bias of genomic predictions in routine genomic evaluations. Genomic selection based on G HAP instead of G improved genomic predictions slightly especially for low heritable traits under recent selection, such as days open. Furthermore, this study shows that ROH based approach can accurately identify autozygosity across the genome, provided appropriate threshold parameters are used. Our results show how different selection strategies affect the distribution of ROH, and how the distribution of ROH has changed in the North American dairy cattle population over the last 25 years. Key words: Accuracy, Bias of prediction, Genomic relationship matrix, Haplotype, Inbreeding, Real data, ROH, Simulation
پیشرفت های حاصل شده در برنامه های به نژادی در گاوهای شیری موجب افزایش تقاضا جهت طراحی و ارائه روش های جدید جهت افزایش صحت برآورد ارزش اصلاحی ژنومی ( GEBV ) و دقت محاسبه ضریب هم خونی شده است. لذا این مطالعه با اهداف کلی زیر صورت گرفت: ارزیابی صحت و اریبی GEBV با استفاده از روش بهترین برآورد نا اریب خطی ژنومی ( GBLUP ) با استفاده از ماتریس های روابط ژنومی بر پایه اطلاعات ها و هاپلوتایپ ها در داده های شبیه سازی و واقعی(مطالعه ی اول)، تعیین بهترین روش برآورد هم خونی واقعی بر اساس داده های شبیه سازی شده و تعیین توزیع قطعات هموزیگوت ( ROH ) در ژنوم جمعیت واقعی و شبیه سازی (مطالعه ی دوم). در مطالعه ی اول، ماتریس های ژنومی متفاوت برای جمعیت شبیه سازی شده برای دو صفت با وراثت پذیری 3/0 و 1/0 تشکیل داده شد. افزون بر این، ماتریس های روابط خویشاوندی با استفاده از تراشه k 50 و برای صفات تولید چربی، تولید شیر، نمره سلول های بدنی، تیپ و روزهای باز در جمعیت گاوهای هلشتاین آمریکای شمالی تشکیل گردید. در مطالعه ی دوم، شبیه سازی gene dropping انجام شد و میزان هم خونی محاسبه شده بر اساس اطلاعات ROH ، شجره و ماتریس روابط ژنومی با میزان هم خونی واقعی در جمعیت های مختلف مقایسه گردید. افزون بر این ضریب هم خونی در جمعیت گاوهای هلشتاین آمریکای شمالی متولد شده در بین سال های 1990 تا 2016 بر اساس تراشه k 50 محاسبه گردید و الگوی ROH قبل و بعد از اجرای انتخاب ژنومی بررسی شد. بر اساس نتایج مطالعه ی اول، استفاده از ماتریس روابط ژنومی بر پایه اطلاعات هاپلوتایپ ها ( G HAP ) منجر به بالاترین صحت برآورد نسبت به سایر ماتریس ها در جمعیت شبیه سازی گردید. استفاده از G HAP-LD در مقایسه با ماتریس روابط ژنومی G HAP منجر به افزایش صحت برآوردها نگردید. تشکیل ماتریس بر پایه اطلاعات هاپلوتایپ ها با اعمال وزن بیشتر روی هاپلوتایپ های طویل تر( G HAP2 ) موجب افزایش صحت برآوردها نشد. با توجه به نتایج مطالعه ی دوم، استفاده از ROH با حداقل طول 20 تا 50 با استفاده از الگوریتم موجود در نرم افزار 1101 نزدیکترین برآورد از هم خونی را نسبت به میزان هم خونی واقعی در جمعیت شبیه سازی فراهم کرد. میزان هم خونی بر پایه اطلاعات شجره تمایل به برآورد رو به پایین میزان هم خونی داشت و نتایج حاصل از ضریب هم خونی با استفاده از اجزای قطری ماتریس روابط ژنومی بر پایه تحت تأثیر میزان فراوانی آللی مورد استفاده برای جمعیت پایه بود. بزرگترین طول ROH و بزرگترین میانگین طول ROH در جمعیت تحت انتخاب BLUP بدست آمد، در حالی که در جمعیت تحت انتخاب ژنومی بیشترین تعداد ROH کوتاه در مقایسه با جمعیت تحت انتخاب BLUP مشاهده شد. در جمعیت گاوهای هلشتاین آمریکای شمالی متوسط تعداد ROH با اندازه حداقل یک Mb در سال 2016 نسبت به 1990 در حدود 43درصد افزایش یافته است. بر اساس نتایج این رساله،استفاده از ماتریس G HAP روشی جایگزین جهت کاهش اریبی برآوردهای ژنومی خصوصاً برای صفاتی با وراثت پذیری پایین و تحت انتخاب جدید همچون روزهای باز است. افزون بر این، نتایج این مطالعه نشان داد که روش های بر پایه ROH می تواند با دقت بالایی میزان واقعی هم خونی را به شرط تعیین مؤلفه های اولیه مناسب نشان دهد. نتایج این مطالعه تاثیر معیارهای مختلف انتخاب بر توزیع ROH و تغییرات توزیع ROH در جمعیت گاوهای هلشتاین آمریکای شمالی در طول 25 سال اخیر را نشان داد. واژه های کلیدی: صحت برآورد، اریبی برآورد، ماتریس روابط ژنومی، هاپلوتایپ، ضریب هم خونی، ROH، گاوهای شیری