Skip to main content
SUPERVISOR
عبدالرسول قاسمی (استاد راهنما) محمدرضا احمدزاده (استاد راهنما)
 
STUDENT
Saeedeh Fooladgar
سعیده فولادگر

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1390

TITLE

Design and Evaluation of an Objective Criterion for Video
The advent of Internet and mobile technology and increasing the interest in multimedia services on wired and wireless networks lead to extensive use of encrypted and compressed images and videos. Since the final receptors of these Medias are humans, viewers’ comments about the video quality are very important. So the image and video quality assessment has become a big challenge. Video quality assessment is the key issues to improve the monitoring and control systems, improve methods for image and video processing, error concealment and many other applications. Subjective video quality assessment is a challenging problem since it is costly and time consuming. That is why in the recent years the development of the objective video quality assessment method is more considered. In this thesis a new method of video quality assessment is proposed in reduced reference scope which utilizes spatial and temporal entropic differences and comparison of statistical parameters of natural scenes. In this method a combination of statistical models and perceptual characteristics is used for designing the video quality assessment algorithm. Gaussian Scale Mixture (GSM) and Generalized Gaussian Distribution (GGD) are used to model wavelet coefficients of each frame and frame differences in order to measure different spatial and temporal information between original and distorted videos. Then the difference between spatial and temporal information is sent into a multi-layer neural network. This network receives spatial and temporal information difference as an input vector. Target vector includes subjective scores which is available from live (Laboratory for Image Video Engineering) video quality assessment dataset. Then the network weights are adjusted and trained. There are various methods to evaluate the efficiency of image and video quality assessment algorithms, including the correlation between subjective and objective data. The Spearman Rank Order Correlation Coefficient (SROCC) of predicted scores by the neural network and subjective score is equal to 0.8276 that in comparison with the STRRED and MOVIE algorithms improved considerably. In addition, feature vector is sent to a RBF network to cluster videos according to their quality using k -means algorithm. For justify; LINE-HEIGHT: normal; MARGIN: 0cm 2.45pt 0pt 0cm; unicode-bidi: embed; DIRECTION: ltr" Keywords: objective video quality assessment, Reduce Reference methods, Entropy, Gaussian Scale Mixture (GSM), natural scenes statistic, Generalized Gaussian Distribution (GGD), Neural Network.
ظهور تکنولوژی اینترنت و موبایل، افزایش علاقه به سرویس‌های چند رسانه‌ای در شبکه‌های سیمی و بی سیم و نیز در دسترس قرار گرفتن حجم وسیعی از تصاویر و ویدئوهای کدشده و فشرده شده، ارزیابی کیفیت تصویر و ویدئو را به یک چالش تبدیل کرده است. با توجه به اینکه گیرنده نهایی در کاربردهای مختلف تصاویر و ویدئوها انسان‌ها هستند، نظرات بینندگان در مورد کیفیت ویدئو بسیار حائز اهمیت است. ارزیابی کیفیت ویدئو از مسائل اساسی در بهبود نظارت و کنترل، بهبود روش‌های پردازش تصویر و ویدئو، پنهان سازی خطا و بسیاری از کاربردهای دیگر است. ارزیابی کیفیت ویدئو به صورت ذهنی با مشکلات زیادی از جمله زمانبر بودن و پر هزینه بودن و در برخی مواقع ناممکن بودن همراه است. به همین دلیل در سالهای اخیر توسعه روش‌های ارزیابی عینی کیفیت ویدئو بیش از پیش مورد توجه قرار گرفته است. محققان، ارزیابی کیفیت تصویر و ویدئو را در سه حوزه‌ی مرجع کامل، مرجع کاهش‌یافته و بدون مرجع انجام می‌دهند. در این پایان نامه یک روش جدید ارزیابی کیفیت ویدئو در حوزه مرجع کاهش‌یافته ارائه شده است، که از اختلاف آنتروپی‌های زمانی و مکانی و نیز مقایسه پارامترهای آماری صحنه‌های طبیعی استفاده می‌کند. در این روش ترکیبی از مدل‌های آماری و اصول ادراکی، برای طراحی الگوریتم‌های ارزیابی کیفیت ویدئو استفاده شده است. مدل ترکیب مقیاس گوسی و مدل توزیع گوسی تعمیم‌یافته، برای ضرایب موجک قابها و تفاوت‌های قاب به ترتیب برای اندازه‌گیری اطلاعات متفاوت مکانی و زمانی بین قابها مورد استفاده قرار گرفته است. سپس تفاوت اطلاعات زمانی و مکانی به یک شبکه عصبی سه لایه با یک لایه میانی برای آموزش ارسال می‌شود. این شبکه تفاوت اطلاعات زمانی و مکانی را به عنوان ورودی دریافت می‌کند و با توجه به تابع هدف که شامل نمرات ذهنی موجود در پایگاه داده‌ی ارزیابی کیفیت ویدئو است، وزن‌های شبکه را تنظیم می‌کند. برای ارزیابی بهینه بودن الگوریتم‌های ارزیابی کیفیت تصویر و ویدئو روش‌های مختلفی از جمله همبستگی بین داده‌های ذهنی و عینی وجود دارد. مقدار ضریب همبستگی اسپیرمن(SROCC) نمرات پیش‌بینی شده توسط شبکه عصبی برابر 8276/0 است که در مقایسه با الگوریتم STRRED از دسته روش‌های مرجع کاهش‌یافته کهSROCC برابر8007/0 و MOVIE از دسته روش‌های مرجع کامل که SROCC برابر 8059/0 دارد، بهبود قابل توجهی داشته است. همچنین اطلاعات مکانی و زمانی استخراج شده از ویدئوها به یک شبکه RBF داده شده است تا با روش رده‌بندی k-means با 36 گره میانی، ویدئوها بر اساس کیفیت، دسته بندی شوند. برای تست رده‌بندی، میانگین نمرات انسانی داده‌های اطراف یک گره میانی، به عنوان نمره کیفیت آن دسته معرفی شده است و سپس SROCC و ضریب همبستگی پیرسون (PCC) بین نمرات پایگاه داده و داده‌های تست رده‌بندی شده، محاسبه می‌شود که به ترتیب برابر8103/0 و 8199/0 است و نشان دهنده دسته بندی مناسب ویدئوها بر اساس کیفیت آن‌ها است. الگوریتم مورد ارزیابی در این پایان نامه همبستگی بالایی با نمرات انسانی داشته است که نشان دهنده بهبود الگوریتم است. کلمات کلیدی: ارزیابی عینی کیفیت ویدئو، روش‌های مرجع کاهش‌یافته، ضریب همبستگی اسپیرمن، آنتروپی، مدل ترکیب مقیاس گوسی، ویژگی‌های آماری صحنه‌های طبیعی، توزیع گوسی تعمیم‌یافته، شبکه عصبی

ارتقاء امنیت وب با وف بومی