Skip to main content
SUPERVISOR
Zeinab Maleki,Farzaneh Shayegh boroujeni
زینب مالکی (استاد راهنما) فرزانه شایق بروجنی (استاد مشاور)
 
STUDENT
Arezoo Haratian
آرزو هراتیان

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1396
easy to use these databases and we must use and develop advanced methods to extract useful information from them. Among all clinical database, using clinical laboratory data is important because it is inexpensive and accessible, and can also easily represent the general condition of the patient. Therefore, using machine learning tools for analyzing laboratory data can provide a good basis for research and knowledge discovery. During last decades, many researchers investigate different type of laboratory data, specially blood test. They use various machine learning methods aiming reducing the laboratory costs, increasing the accuracy of prognosis and diagnosis, and finding correlations among variables. In this thesis, we consider blood tests data from a clinical laboratory in Isfahan to find correlations among variables. One of main challenge for analyzing such a real data is large amount of missing data. In this regard, we use existing imputation methods and propose a new imputation method based on Bayesian network which fill each of variables with a specific Bayesian network defined for that variable. Finally, we will consider several کلید واژه های انگلیسی : 1-Machine learning 2-Data mining 3- Laboratory data 4- Test result prediction
امروزه با وجود حجم زیاد داده‌های پزشکی و سلامت به نظر می‌رسد منبع بسیار خوبی برای بهبود فرایندهای پزشکی در دسترس داریم. هرچند به دلیل حجم بالای این داده‌ها، استخراج اطلاعات ارزشمند از آن‌ها بدون استفاده از روش‌های پیشرفته مانند روش‌های یادگیری ماشین قابل انجام نیست. دراین‌بین به نظر می‌رسد که داده‌های آزمایشگاهی از اهمیت ویژه‌ای برخوردارند زیرا ارزان و در دسترس بوده، همچنین به‌راحتی می‌توانند وضعیت کلی بدن بیمار را نمایش دهند. بنابراین استفاده از توانایی ابزارهای یادگیری ماشین برای تحلیل داده‌های آزمایشگاهی، می‌تواند زمینه‌ی خوبی برای تحقیق و کشف دانش ایجاد کند . تحقیقات انجام‌شده برای تحلیل داده‌های آزمایشگاهی با اهدافی مانند کاهش هزینه‌های آزمایشگاهی، افزایش دقت تشخیص و کشف ارتباطات میان متغیرها، از روش‌های یادگیری ماشین استفاده می‌کنند. در این پروژه ما از داده‌های آزمایش خون یک آزمایشگاه در اصفهان برای کشف ارتباطات میان متغیرهای آزمایشگاهی استفاده کرده‌ایم. چالش اصلی تحلیل داده‌های آزمایشگاهی حجم زیاد مقادیر گمشده‌ی موجود در این داده‌ها است. ما برای برخورد با این چالش علاوه‌بر استفاده از روش‌های موجود از یک روش جدید برای پر کردن مقادیر گمشده‌ی متغیرهای آزمایش خون استفاده کرده‌ایم. در این روش که بر پایه‌ی شبکه‌ی بیزین ایجادشده ‌است برای جانهی هرکدام از متغیرها از شبکه‌ی بیزین مجزا با ساختار متفاوت استفاده می‌شود. نهایتاً ما در این پروژه از روش‌های مختلف رده‌بندی برای پیش‌بینی مقدار متغیر ها استفاده کردیم. نتایج نشان می‌دهد که بهترین دقت رده‌بندی برای مجموعه‌داده‌ی پرشده با استفاده از روش جانهی ارائه‌شده به‌دست آمده است. معیار سطح زیر نمودار منحنی ROC برای مدل‌های رده‌بندی ایجادشده برای متغیرهای گلبول قرمز و کراتینین به ترتیب به 0/97 و 0/90 رسیده است . کلیدواژه های فارسی : 1-یادگیری ماشین 2-داده‌کاوی3-داده‌های آزمایشگاهی4-پیش‌بینی تست‌های آزمایشگاهی

ارتقاء امنیت وب با وف بومی