Skip to main content
SUPERVISOR
حمید سلطانیان زاده (استاد مشاور) محمد مهدی نقش (استاد مشاور) رسول امیر فتاحی ورنوسفادرانی (استاد راهنما)
 
STUDENT
Habib Alah Hajimolahoseini
حبیب الله حاجی ملاحسینی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Doctor of Philosophy (PhD)
YEAR
1390

TITLE

Estimation and Tracking of Audio Signals in Non-Linear and Non-Gaussian Conditions
In this thesis , we introduce an algorithm for estimating and tracking the pitch period of audio signals using Bayesian filters . For this purpose , we propose Bayesian model , which is robust to the non-stationary variations of the amplitude and frequency of the input signal . We also employ a state space model , which uses the delayed versions of the input signal to model the periodicity of non-stationary audio signals . This simple model allows a significant reduction of the required number of particles for the estimation of the pitch period compared to the state-of-the-art particle filtering methods . Moreover , we propose to estimate the logarithm of the period instead of the period itself . We show that the resulting algorithm does not require prior knowledge about the initial state and is robust to the octave error phenomenon , which is a common problem in pitch period estimation methods . Our method often results in a higher time-domain resolution with no perceptible compromise on the frequency-domain resolution especially for high-pitched audio signals such as music . Experimental results reveal that the proposed algorithm outperforms the state-of-the-art pitch period detection algorithms at low signal to noise ratios assuming no prior knowledge about the initial conditions . Key Words Pitch Period Estimation , Bayesian Filtering , Audio Signals , State-Space Model , Real-Time estimation
تخمین دوره تناوب، گام یا فرکانس پایه سیگنال‌های صوتی همواره یکی از زمینه‌های پرکاربرد در پردازش سیگنال صوت و گفتار بوده است. اگرچه تاکنون تحقیقات فراوانی در این زمینه صورت گرفته است، اما اکثر روش‌های ارائه شده فقط در شرایط خاص، مثلا در نسبت‌های سیگنال به نویز بالا، و برای دسته محدودی از سیگنال‌ها با ویژگی‌های مشخص، مثلا سیگنال‌های دارای ساختار هارمونیک پایدار، نتیجه مطلوبی را ارائه می‌دهند. در کاربردهایی که این شرایط برقرار نباشند، بسیاری از روش‌های موجود از دقت کافی برخوردار نیستند. در این رساله، یک الگوریتم مبتنی بر مدل بیزی برای تخمین و ردیابی گام یا دوره تناوب سیگنال‌های صوتی در شرایط غیرخطی و غیر گوسی ارائه شده است. برای این منظور، یک فیلتر ذره‌ای با حداقل تعداد پارامتر ممکن پیشنهاد شده که به تغییرات غیرایستان دامنه سیگنال ورودی حساس نیست. این الگوریتم، از یک مدل فضای حالت با تنها یک متغیر برای مدل‌سازی تناوب سیگنال غیرایستان و تخمین دوره تناوب آن استفاده می‌کند. در مقایسه با دیگر روش‌های مبتنی بر فیلتر ذره‌ای، این مدل ساده موجب کاهش شدید تعداد ذره‌های مورد نیاز برای تخمین دقیق گام سیگنال می‌شود. علاوه براین، نشان داده می‌شود که اگر بجای استفاده از خود دوره تناوب به عنوان متغیر حالت، از لگاریتم آن استفاده نماییم، الگوریتم پیشنهادی نسبت به خطای اکتاو که یک خطای بسیار رایج در الگوریتم‌های تخمین گام است مصون‌تر شده و حتی بدون نیاز به داشتن دانش پیشین در مورد حالت اولیه سیستم می‌تواند به جواب صحیح همگرا شود. از طرفی، در اکثر روش‌های موجود در این حوزه لازم است که طول پنجره پردازش سیگنال از بزرگترین دوره تناوب موجود در سیگنال بزرگتر باشد اما روش پیشنهادی چنین محدودیتی را اعمال نمی‌کند. الگوریتم پیشنهادی، به خصوص برای سیگنال‌های با گام بلند مانند سیگنال موسیقی، حتی به ارائه دقت زمانی بهتری نیز منجر می‌شود بدون اینکه دقت فرکانسی را تحت تاثیر قرار دهد. نتایج شبیه‌سازی‌ها به روشنی نشان می‌دهد که الگوریتم پیشنهادی می‌تواند حتی در شرایطی که نسبت سیگنال به نویز بسیار پایین باشد به آسانی و بدون دسترسی به دانش پیشین در مورد حالت اولیه سیستم، گام سیگنال‌های صوتی را تخمین زده و ردیابی کند. کلمات کلیدی: تخمین گام - فیلتر بیزی - سیگنال صوت - مدل فضای حالت

ارتقاء امنیت وب با وف بومی