Skip to main content
SUPERVISOR
Nader Karimi,Shadrokh Samavi
نادر کریمی (استاد مشاور) شادرخ سماوی (استاد راهنما)
 
STUDENT
Maryam Karimi
مریم کریمی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Doctor of Philosophy (PhD)
YEAR
1391

TITLE

Improvement of Perceptual Objective Image Quality Assessment Methods
Perceptual quality assessment is important for testing, optimizing and iecting relevant multimedia systems, services and algorithms. Current objective scores are not close enough to subjective ones. The purpose of this research is to use models based on the human visual system to promote objective quality assessment systems. In this regard, first, a binocular combination model for combining stereo pair images is proposed. Then, two no-reference and general-purpose objective quality assessment models are presented based on the feature extraction from these combined images. The first model uses the spatial domain features of combined images to train a stacked generalizer. The second model is based on sparse representation of combined images using pristine image dictionaries. These methods have increased the best correlations with subjective scores by up to 1% and 5% respectively. In the next step, two full-reference methods for quality evaluation of retargeted images are provided. The first method provides three groups of features to cover different types of retargeting distortions. The second method introduces a pyramidal integration model for different types of features, unlike most of the existing methods that just use global pooling. The proposed quality assessment methods provide rank correlation of up to 5% higher than the other methods. Despite the same efficiency, the second method is much faster than the first one and is fully applicable for real applications. Key words subjective quality assessment, Objective quality assessment, Perceptual quality, Stereo images, Retargeted images, Binocular combination, Spatial natural scene statistics, Sparse representation.
با پیشرفت سریع تکنولوژی‌های کامپیوتر، موبایل و شبکه، سیگنال‌های دیداری مختلفی تولید، ارسال و استفاده می‌شود. بنابراین کیفیت تجربی نقش مهمی در سرویس‌ها و کاربردهای چندرسانه‌ای دارد. ارزیابی کیفیت ادراکی برای تست، بهینه‌سازی و بازرسی سیستم‌ها، سرویس‌ها و الگوریتم‌های مربوطه و همچنین شکل‌دهی و تصمیم‌گیری اکثر الگوریتم‌های پردازش سیگنال چندرسانه‌ای و مخابراتی از اهمیت ویژه‌ای برخوردار است. در طول دو دهه گذشته، زمینه تحقیقاتی ارزیابی کیفیت ادراکی رشد چشمگیری داشته است. با وجود اینکه دقیق‌ترین روش کیفیت ادراکی، ارزیابی چشمی توسط کاربران است اما چنین روشی در کاربردهای واقعی غیرعملی است. اگر چه برای حل این مشکل، تحقیقات بسیاری برای ارائه روش‌های ارزیابی کیفیت محاسباتی صورت گرفته است، امتیازات بدست آمده از این طریق همچنان با امتیازات چشمی فاصله دارند. همچنین با ظهور تکنولوژی‌های جدید در زمینه ابزارهای ثبت و نمایش تصاویر، فرمت‌های جدیدی از تصاویر و ویدئو بوجود آمده است که زمینه‌های جدیدی برای تحقیقات در ارزیابی کیفیت محاسباتی ایجاد کرده است. هدف این تحقیق، استفاده از مدل‌های مبتنی بر ساختار بینایی انسان برای ارتقاء سیستم‌های ارزیابی کیفیت محاسباتی است. در این راستا، ابتدا با بسط دادن یک مدل ترکیب دوچشمی تجربی برای امواج ساده سینوسی، مدلی برای ترکیب زوج تصاویر استریو ارائه می‌شود. سپس دو مدل ارزیابی کیفیت بدون مرجع و عام ‌منظوره بر اساس استخراج ویژگی از این تصاویر ترکیبی ارائه می‌شود. مدل اول، ویژگی‌های مبتنی بر آمارگان حوزه مکان تصاویر ترکیبی را برای آموزش یک تعمیم‌گر پشته‌ای استفاده می‌نماید. نتایج بدست آمده توسط این روش از بهترین نتایج همبستگی با معیارهای چشمی 1% بالاتر است. دومین مدل پیشنهادی، مبتنی بر استفاده از بازنمایی تُنُک تصاویر ترکیبی برای ارزیابی کیفیت عام‌منظوره و بدون مرجع تصاویر استریو است. تصاویر ترکیبی تخریب شده با استفاده از دیکشنری‌های تصاویر سالم، بازنمایی شده و از ضرایب تُنُک بدست آمده بعنوان توصیف‌گرهای محلی تصویر استفاده می‌شود. تلفیق هرمی این ضرایب در این روش، توصیف‌گرهای سراسری از تصویر برای آموزش یک مدل رگرسیون ارزیابی کیفیت در اختیار قرار می‌دهد. این روش توانسته است بهترین نتایج همبستگی با معیارهای چشمی را تا 5% افزایش دهد. درگام بعدی، دو روش برای ارزیابی کیفیت با مرجع تصاویر بازنگار ارائه می‌شود. روش اول از یک الگوریتم شار نوری برای یافتن تناظر بین مناطق مختلف تصویر مقیاس شده و بازنگار استفاده می‌کند. این روش پیشنهادی، برای پوشش انواع تخریب حاصل از بازنگاری، سه دسته ویژگی ارائه می‌نماید. ویژگی‌های مرتبط با مساحت برای تشخیص میزان حفظ محتوای برجسته و میزان همگنی آن ارائه می‌شود. در کنار آن، ویژگی‌هایی برای اندازه‌گیری میزان حفظ نسبت ابعاد و توزیع آن در سطح تصویر معرفی می‌شود. ویژگی‌های مرتبط با تغییر شکل نیز به بررسی اعوجاجات محلی می‌پردازند. روش دوم، به معرفی یک مدل تلفیق هرمی برای انواع مختلف ویژگی بصورت سراسری به محلی می‌پردازد. برخلاف اکثر روش‌ها که صرفاً از تلفیق سراسری استفاده می‌کنند، این روش قادر است با محاسبه فاصله بردارهای حاوی مجموع‌های محلی بین تصویر بازنگار و تصویر اصلی، در هر مرتبه محلی یک ویژگی جداگانه تولید نماید. این ویژگی‌ها برای آموزش یک مدل یادگیری ماشین مورد استفاده قرار می‌گیرند. نتایج تجربی حاکی از آن است که دو روش ارزیابی کیفیت پیشنهادی، روی مجموعه داده‌های موجود همبستگی رتبه‌بندی تا 5% بالاتر از دیگر روش‌ها فراهم می‌نمایند. باوجود کارآیی مشابه، روش دوم به لحاظ زمانی بسیار سریع‌تر از روش اول بوده و برای کاربردهای واقعی کاملاً قابل استفاده است.

ارتقاء امنیت وب با وف بومی