Skip to main content
Rasoul AmirFattahi,MasoudReza Hashemi,Keyarash Bazargan
رسول امیر فتاحی ورنوسفادرانی (استاد مشاور) مسعودرضا هاشمی (استاد راهنما) کیارش بازرگان (استاد راهنما)
Soroosh Nasseri Shabankareh
سروش ناصری شبانکاره


دانشکده مهندسی برق و کامپیوتر
Master of Science (MSc)
The popularity of information and communication technology increases the demand for more powerful processing and communication systems. Microprocessors, as one of the main parts of information systems, play important role in determining the performance of these systems. As a result, improving the performance and functionality of the processors will have a great effect on the performance of information processing systems. In this thesis, several basic changes to the structure of a general purpose superscalar microprocessor are investigated in order to improve its performance and computational power. The most important changes are: improving the system behavior by employing the reconfigurability and working in single, dual, thriple and quadruple threaded modes based on the number of tasks needed to be executed by the system, change in the management strategy of branch instructions using instruction fetch from both directions of execution, improving the number of executable instructions, removing upper levels of caches and reducing the performance gap between the memory and processor. In this thesis, all of the design and implementation steps and the way of applying the above changes in the processor structure are investigated. In order to quantify the efficiency of the above changes, performance of the proposed processor in performing a set of benchmarks is compared to the performance of some selected processors that represent different families of general purpose processors. Based on the performance results of executing benchmark set, performance of the proposed processor in executing integer benchmarks is better than the selected processors in almost all cases due to the removal of prediction in management of branch instructions and thus reducing of their performance overhead, increasing the number of executable instructions and the ability to extract more parallelism in instruction level and also decreasing the performance gap between processor and main memory. As a result of loop based nature of floating point applications and more locality in their data accesses, the impact of applying the above changes is decreased. The more advanced structure of floating point functional units in selected processors results in their relative superiority to the proposed processor in performing floating point benchmarks. Performance of the proposed processor in performing floating point benchmarks can be improved using newer and more powerfull functional units. Finally, the proposed processor shows acceptable performance in performing benchmark applications and this highlights the impact of applied changes in its structure. Key words: Microprocessor, Superscalar Processors, Reconfigurability, Multi-Thread Processing, Cache Memory.
گسترش فناوری‌های اطلاعاتی و ارتباطی، نیاز بشر به سیستم های قدرتمند پردازش و انتقال اطلاعات را بیش از پیش آشکار می‌سازد. ریز پردازنده‌، به عنوان یکی از اساسی‌ترین بخش های سیستم های اطلاعاتی، نقش اساسی در تعیین عملکرد این سیستم ها بر عهده دارد. از این رو، بهبود عملکرد و توانایی اجرایی پردازنده‌ها، تأثیر بسزایی در ارتقای عملکرد سیستم های پردازش اطلاعات، خواهد داشت. در این پایان نامه، اعمال چندین تغییر اساسی در ساختار یک پردازنده ابر مقیاسی عام منظوره جهت ارتقای عملکرد و توان محاسباتی آن، مورد بررسی قرار گرفته است. افزودن قابلیت پیکربندی و کار در حالت های پردازشی یک، دو، سه و یا چهار رشته‌ای براساس تعداد فعالیت- های اجرایی مورد نیاز در سیستم، تغییر نحوه مدیریت دستورات انشعاب با استفاده از روش فراخوانی دستورها از هر دو مقصد احتمالی انشعاب، افزایش تعداد دستورهای قابل اجرا، حذف سطوح بالاتر حافظه های نهان و نیز کاهش شکاف عملکردی میان حافظه و پردازنده، از جمله مهمترین این تغییرات می‌باشند. در این پایان نامه، مراحل کامل طراحی و پیاده‌سازی پردازنده پیشنهادی و نحوه اعمال تغییرات فوق در ساختار آن، به تفصیل مورد بررسی قرار می گیرد. به منظور ارزیابی کمی بازدهی تغییرات فوق، عملکرد پردازنده پیشنهادی در اجرای مجموعه‌ای ازکاربردهای آزمون با عملکرد تعدادی پردازنده منتخب، به نمایندگی از خانواده‌های مختلف پردازنده‌های عام منظوره، مقایسه شده است. بر اساس نتایج عملکردی حاصل از اجرای مجموعه کاربردهای آزمون، عملکرد پردازنده پیشنهادی در اجرای کاربردهای آزمون صحیح، به دلیل حذف پیش‌بینی در مدیریت دستورات انشعاب و در نتیجه کاهش سربار عملکردی این دستورات، افزایش تعداد دستورهای قابل اجرا و قابلیت بهره‌برداری بیشتر از توازی در سطح دستورات و نیز کاهش شکاف عملکردی میان پردازنده و حافظه اصلی، تقریباً در تمامی موراد، بهتر از عملکرد پردازنده‌های منتخب مورد بررسی می‌باشد. به دلیل ماهیت عموماً حلقه‌ای کاربردهای ممیز شناور و نیز محلیت بیشتر در دست‌یابی به داده‌ها، تأثیر اعمال تغییرات فوق در اجرای کاربردهای آزمون ممیز شناور، کمتر مشاهده می‌شود. علاوه بر این، ساختار پیشرفته‌تر واحدهای عملیاتی ممیز شناور در پردازنده‌های منتخب نیز، موجب برتری نسبی آنها در اجرای کاربردهای آزمون ممیز شناور نسبت به پردازنده‌ پیشنهادی می‌شود. با استفاده از واحدهای عملیاتی جدیدتر و با توان محاسباتی بیشتر، می‌توان عملکرد پردازنده پیشنهادی در اجرای کاربردهای ممیز شناور را نیز تا حد زیادی افزایش داد. در کل، پردازنده پیشنهادی عملکرد قابل قبولی را در اجرای مجموعه کاربردهای آزمون از خود نشان می‌دهد و این امر تأثیر مثبت تغییرات اعمال شده در ساختار آن را، آشکار می‌نماید. پس از انجام آزمایشهای فراوان و بررسی و رفع معایب احتمالی موجود در ساختار پردازنده پیشنهادی، در صورت فراهم بودن پشتیبانی مالی، می‌توان آنرا تولید و به عنوان جای گزینی بر پردازنده‌های قدیمی‌تر موجود در سیستم های اطلاعاتی، مورد استفاده قرار داد. واژه های کلیدی: 1-ریز پردازنده، 2-پردازنده های ابر مقیاسی، 3-قابلیت پیکربندی، 4-پردازش چند رشته ای، 5-حافظه نهان.

ارتقاء امنیت وب با وف بومی