Skip to main content
SUPERVISOR
Nader Karimi,Shadrokh Samavi
نادر کریمی (استاد مشاور) شادرخ سماوی (استاد راهنما)
 
STUDENT
Mansour Nejati
منصور نجاتی اصفهانی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Doctor of Philosophy (PhD)
YEAR
1390

TITLE

Performance Improvement of Sparse Representation Model for Image Restoration and Reconstruction
Data models are a cornerstone of contemporary methodology in the field of signal and image processing which have evolved over the years. In that respect, the past decade has been certainly the era of sparse and redundant representations, a popular and highly effective data model. The main objective of this dissertation is the performance improvement of this model in image restoration and reconstruction. To this end, we first consider the performance improvement of sparse coding for noisy images for which low-rank and nonlocal sparse representation models are proposed. These models leads to superior image denoising performance compared to the state-of-the-art methods. Second, we concentrate on the dictionary as the core component of sparse representation model. To improve the performance of learned dictionaries for sparse representation, a coherence regularized dictionary learning model is presented and two novel dictionary optimization algorithms are proposed. Furthermore, we propose a boosted dictionary learning approach to train a dictionary ensemble which results in more efficient sparse representations. Lastly, a joint sparse model is presented to train multiple dictionaries from different datasets taking into account their relationships. Key Words Sparse representation, dictionary learning, sparse coding, image restoration, optimization.
بسیاری از پیشرفت‌های به دست آمده در حوزه پردازش تصویر در دهه‌های گذشته را می توان نتیجه مدلسازی بهتر محتوای تصویر و بکارگیری صحیح این مدل‌ها در کاربردهای مربوطه دانست. در سال های اخیر، پردازش و تحلیل سیگنال‌ها به کمک مدل‌های بازنمایی تُنُک به شدت مورد توجه محققان قرار گرفته و در طیف وسیعی از کاربردها موفق بوده است. ارائه‌ی توصیفی ساده و فشرده از سیگنال برحسب ترکیب خطی تعداد کمی از المان های مجموعه‌ای به نام دیکشنری متشکل از سیگنال های پایه، ایده‌ی اساسی مدل‌های بازنمایی تُنُک می باشد. یکی از مسائل اساسی در این مدل‌ها، انتخاب دیکشنری مناسب برای بازنمایی تُنُک سیگنال‌های مورد بررسی است. در واقع، دیکشنری به عنوان جزء اصلی در مدل‌ بازنمایی تُنُک، نقشی کلیدی در موفقیت کل مدل را ایفا می‌نماید. مسأله دیگری که در پردازش تُنُک سیگنال‌ها حائز اهمیت بسیاری است، کدگذاری تُنُک برای به دست آوردن بازنمایی تُنُک سیگنال با استفاده از دیکشنری می باشد. این مسأله به ویژه در کاربردهای بازگردانی که نیاز به تخمین بازنمایی تُنُک سیگنال از روی نسخه تخریب شده‌ی آن است، بسیار چالش برانگیز می‌شود. هدف این تحقیق، پیشبرد حوزه مدلسازی مبتنی بر بازنمایی تُنُک در جهت بهبود کارایی مدل در مسائل بازگردانی و بازسازی تصویر است. در راستای این هدف، بهبود مدل‌ بازنمایی تُنُک را از جنبه‌های کارایی بازگردانی، دقت بازنمایی و وفق پذیری مدنظر قرار داده و راه حل‌هایی را بدین منظور ارائه می‌نماییم. در این راستا، برای افزایش کارایی کدگذاری تُنُک در شرایط نویزی، مدل‌های رتبه-کم و تُنُک غیرمحلی را ارائه کرده و کارایی آن را در نویززدایی تصاویر نشان می‌دهیم. سپس، به مسأله‌ی یادگیری دیکشنری پرداخته و مدل جدیدی مجهز به تنظیم همدوسی را برای بهبود کارایی دیکشنری‌های یادگیری شده برای بازنمایی تُنُک مطرح می کنیم. برمبنای این مدل، دو الگوریتم کارا و مؤثر برای بهینه‌سازی دیکشنری پیشنهاد می‌شوند. این الگوریتم‌ها با جلوگیری از بیش برازشِ دیکشنری به داده آموزشی، منجر به بهبود کارایی تعمیم دیکشنری شده و افزایش دقت بازنمایی‌های تُنُک را به همراه دارند. در ادامه، با ارائه چارچوب نوینی برای یادگیری تقویتی دیکشنری، ساختار مجموعه‌ای را برای دیکشنری پیشنهاد می‌دهیم که کاهش خطای بازنمایی‌های تُنُک، از نتایج اساسی آن است. سرانجام، با ارتقاء مدل مرسوم بازنمایی تُنُک به مدل بازنمایی توأم، امکان یادگیری همزمان چند دیکشنری از روی چند مجموعه‌ آموزشی با در نظر گرفتن رابطه‌ی بین داده‌های متناظر در مجموعه‌های مختلف را فراهم می آوریم. کلمات کلیدی: بازنمایی تُنُک، یادگیری دیکشنری، کدگذاری تُنُک، بازگردانی تصویر، بهینه سازی.

ارتقاء امنیت وب با وف بومی