Skip to main content
SUPERVISOR
Behzad Nazari
بهزاد نظری (استاد راهنما)
 
STUDENT
Amir Ziaeddini
امیر ضیاء الدینی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1388

TITLE

Investigation and Design of a Music Searcher System Based on Dynamic Time Warping
Today, due to development of information technology and extraordinary growth of data, it is necessary to develop new methods to query this information. ''Music Information Retrieval'' or ''music query'' is one of these challenges. Music query based on information such as title, composer or genre is possible using general search engines today, if this information is available. But if not, searching by direct musical content would be a solution in that case. In this thesis, Query By Humming (QBH) systems and the previous researches in this area have been studied. In these systems the users can search for their favorite song by just whistling or singing part of the song. Since there would be some possible errors due to false whistling, the algorithm should be robust to work in these cases. An efficient QBH system must have pitch detector, melody extractor, time-series aligner and sequence matcher. In this study, relative pitch frequencies of the notes have been used to represent the melodies instead of absolute pitch frequencies. In this manner the system is not sensitive to the beginning note, because people may whistle the song on different clefs or octaves. In addition, the Rhythm of the melodies has been taken in to account by introducing a new criterion named IoIRatio. This criterion is robust to Tempo i.e. in order to obtain an efficient music retrieval, the IoIRatio assists the system to tolerate the errors originated from different tempos between the whistled query and the original song in the database. Moreover, Dynamic Time Warping (DTW) algorithm that is based on Dynamic Programming has been employed to match the query and database songs and also to measure the similarity between them. Global constraints such as Saoko-Chiba, Itakura and SDTW algorithm have also been applied to enhance retrieval efficiency. By introducing the SDTW algorithm that behaves statistically with the sequences and considers each frequency sample as a Gaussian distribution around that sample, the retrieval efficiency has been enhanced. Moreover, dimensionality reduction approaches like FTW, PDTW and IDDTW have been applied to reduce time and computational complexity. By applying these approaches, there will be a trade-off between retrieval efficiency and time performance of the system. These approaches usually utilize PAA coefficients in accompany to DTW algorithm for representation of reduced-dimension query and melodies. Furthermore, a criterion named Mean Reciprocal Rank (MRR) has been utilized to determine accuracy level of the retrieval. These are the issues that have been evaluated and studied in this thesis. Keywords QBH system, Melody matching, Time-series alignment, Dynamic Time Warping algorithm, Saoko-Chiba and Itakura constraints, Dimensionality Reduction
امروزه توسعه ی فن آوری اطلاعات و حجم روزافزون داده ها، منجربه بروز نیازهای جدیدی در زمینه ی جستجوی داده شده است. در این راستا تحقیقات بسیاری در زمینه ی جستجوی داده های صوتی نیز صورت گرفته که از این میان، بازیابی اطلاعات موسیقی، موضوعی است که کاربرد آن در آینده بیشتر و بیشتر خواهد شد. در حالی که بازیابی قطعات موسیقی بر اساس اطلاعاتی از قبیل عنوان، آهنگساز و ژانر در بسیاری از سیستم های موجود انجام می گیرد، ظهور موسیقی دیجیتال در اینترنت، موجبات نیاز به روش های جدید جستجوی این گونه داده ها را بر اساس محتوای موسیقاییشان فراهم آورده است. در این پژوهش، مجموعه روش ها و سیستم هایی با عنوان " جستجو توسط زمزمه کردن " (QBH) و تحقیقات گذشته در این راستا که می‌توانند بر پایه ی زمزمه کردن یا سوت زدن مدت زمان کوتاهی از یک قطعه ی خاص، آن را در یک پایگاه داده ی موسیقی بیابند، معرفی شده اند. ازآنجا که ملودی زمزمه شده ممکن است به علت عدم درست خوانده شدن، خطاهای بسیاری داشته باشد، این سیستم باید توانایی تحمل خطا را نیز داشته باشد. بعلاوه، استخراج ملودی و نمایش آن، یافتن قرکانس گام، هم ترازی سری های زمانی حاصل از پردازش ملودی ها، اجرای الگوریتم های تطبیق دهی دنباله ها و کاهش زمان اجرا برای یک سیستم QBH قوی وکارآمد، الزامی می باشند. در این پژوهش با بررسی قطعات موسیقی و بررسی نحوه ی یادآوری قطعات موسیقی در ذهن افراد مختلف، برخلاف برخی از روش های موجود از فرکانس مطلق نت ها برای نمایش ملودی ها استفاده نمی شود، بلکه از آنجایی که این افراد ممکن است قطعات موسیقی را در کلیدها یا اکتاوهای متنوع موسیقایی بخوانند، از فرکانس نسبی نت های خوانده شده توسط آنها برای نمایش ملودی ها استفاده می شود. عنصر ریتم نیز از طریق معیاری به نام IOIRatio در نظر گرفته می شود. این معیار در برابر سرعت مقاوم می باشد تا کاربر بتواند حتی با سرعتی بیشتر یا کمتر از سرعت واقعی قطعه ی مورد نظرش، آن را زمزمه کند و مشکل خاصی در بازیابی قطعه ی مورد نظر پیش نیاید. همچنین در این پژوهش روش انحراف پویای زمان (DTW) که بر پایه ی برنامه ریزی پویا (Dynamic Programming) استوار می باشد، برای تطبیق دهی جستار و قطعات موسیقی پایگاه داده و سنجیدن میزان شباهت آنها مورد استفاده قرار گرفته است و در ادامه با اعمال محدودیت های سراسری ایتاکورا و سائوکو-چیبا سعی در بهبود میزان دقت بازیابی و سرعت اجرای آن شده است. سپس با معرفی الگوریتم SDTW که به صورت آماری با دنباله های فرکانسی فوق رفتار می کند و هر نمونه ی فرکانسی را به فرم توزیعی گوسی حول آن نمونه در نظر می گیرد، میزان دقت بازیابی بهبود داده شده است. اطلاعات بدنه ای 3، 5 و 7 سطحی و همچنین استفاده از فواصل دیگری مانند LB_Keogh، LB_DR و LB_PAA نیز بدین منظور مورد بررسی قرار گرفته اند. همچنین به منظور کاهش هزینه ی محاسباتی و زمانی، از روش های کاهش بعد نظیر FTW، PDTW و IDDTW استفاده شده است. با اعمال این روش ها یک مصالحه میان دقت بازیابی سیستم و زمان اجرای آن به وجود می آید و در این بین IDDTW عملکرد بهتری دارد. در این روش ها عمدتا از ضرایب تقریب تجمعی تکه ای برای نمایش کاهش بعد یافته ی جستار و قطعات پایگاه داده به همراه الگوریتم DTW استفاده می شود. از یک معیار به نام MRR نیز برای تعیین میزان دقت بازیابی جستارها استفاده می شود. کلمات کلیدی: سیستم QBH ، منطبق سازی ملودی ، هم ترازی سری های زمانی، الگوریتم انحراف پویای زمان ، محدودیت های سراسری ایتاکورا و سائوکو- چیبا، کاهش بعد

ارتقاء امنیت وب با وف بومی