Skip to main content
SUPERVISOR
Naser Ghadiri modaress
ناصر قدیری مدرس (استاد راهنما)
 
STUDENT
Sahar Khalafi zengir
سحر خلفی زنگیر

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1397
Today, medical centers record treatment and clinical care for patients in the form of electronic health records. Most of the necessary clinical care is stored in clinical notes consisting of natural language. The analysis and search of the clinical notes are essential for in electronic health records creates potentially negative consequences for patient care and computational modeling. The growing number of clinical notes clinical processes, including errors due to the omission of important endangering patient's health. information, delays in providing appropriate treatment, and generally Different data mining methods have been proposed to summarize clinical notes, including statistical methods using knowledge bases, the use of cue expressions, and deep learning models. Among the existing challenges is the need for domain specialists to annotate and define comprehensive concepts and relationships between them, create semantic representations of sentences, and enrich the knowledge base. Identifying the phenotypes in clinical notes plays a vital role in resolving this issue and also leads to the identification of the patient group, which is a crucial task in the secondary use of methods proposed so far to solve the problem of identifying disease phenotypes electronic health records for the management of clinical information. The learning approaches require knowledge bases and field experts' intervention to have not been accurate enough to extract related features. Conventional machine not usually able to extract semantic information and grammatical features do feature engineering in clinical notes. On the other hand, deep learning approaches also learn features automatically by deep neural models, which are effectively. In this study, a model consisting of two units is presented, which includes a unit for identifying disease phenotypes based on deep learning to identify the most phenotype using a combination of two knowledge bases, including the output of relevant terms to cardiac and pulmonary phenotypes. A summary unit based on sentences to cardiopulmonary phenotypic abnormalities. the previous unit, as a base of internal knowledge and, the human phenotype ontology, as a base of external knowledge, identifies the most relevant The proposed model extracts more features than the existing methods and provides a better F1score. Also, the phenotype-based summarizing unit, using the phenotypes identified by the deep neural model, without the need for experts in the field and can use content-based embedding automatically extracts topics related to cardiac and pulmonary phenotypes to record the semantic display of sentences without the need for providing challenges of previous methods when using knowledge bases. existing concepts with related terms in knowledge bases for sentence-level analysis of sentences. The phenotype-based summary system could tackle the
امروزه مراکز درمانی، درمان و مراقبت‌های بالینی مربوط به بیماران را در قالب پرونده‌های الکترونیک سلامت ثبت می‌کنند. بخش عمده‌ای از مراقبت‌های لازم در قالب یادداشت‌های بالینی متشکل از زبان طبیعی ذخیره شده‌اند که تحلیل و جستجوی اطلاعات آنها برای مراقبت‌های درمانی بیمار و مدل‌سازی محاسباتی ضروری است. رشد روزافزون یادداشت‌های بالینی موجود در پرونده الکترونیک سلامت باعث ایجاد پیامدهای منفی بالقوه در فرایند‌‌های بالینی از جمله خطاهای ناشی از نادیده گرفته شدن اطلاعات مهم، تاخیر در ارائه روش درمانی مناسب و به طور کلی به خطر افتادن سلامت بیماران می‌شود. تاکنون روش‌های مختلفی در حوزه متن‌کاوی برای خلاصه‌سازی یادداشت‌های بالینی ارائه شده است که از روش‌های آماری با استفاده از پایگاه‌های دانش، استفاده از عبارات نشانه و مدل‌های یادگیری عمیق می‌توان نام برد. از جمله چالش‌های موجود نیاز به متخصصین دامنه برای حاشیه ‌نویسی دستی و تعریف مفاهیم جامع و روابط بین آن‌ها و ایجاد نمایش معنایی از جملات و غنی‌سازی پایگاه دانش است. شناسایی فنوتایپ‌های موجود در یادداشت‌های بالینی در حل این مسئله نقش مهمی دارند و منجر به مشخص شدن گروه بیمار نیز می‌شوند که یک کار اساسی در استفاده ثانویه از پرونده الکترونیک سلامت برای مدیریت اطلاعات بالینی بشمار می‌رود. روش‌هایی که تاکنون برای حل مسئله شناسایی فنوتایپ‌های بیماری ارائه شده‌اند، دارای دقت کافی در استخراج ویژگی‌های مرتبط نبوده‌اند. رویکردهای رایج یادگیری ماشین نیازمند پایگاه‌های دانش و دخالت‌های متخصصین حوزه برای مهندسی ویژگی‌های موجود در یادداشت‌های بالینی هستند واز طرف دیگر رویکردهای یادگیری عمیق نیز ویژگی‌ها را به طور خودکار توسط مدل‌های عصبی عمیق می‌آموزند که معمولاً قادر به استخراج اطلاعات معنایی و ویژگی‌های دستور زبان به طور موثر نیستند. در این پژوهش یک مدل متشکل از دو واحد ارائه می‌شود که شامل واحد شناسایی فنوتایپ‌های بیماری مبتنی بر یادگیری عمیق با هدف شناسایی مرتبط‌ترین عبارات به فنوتایپ‌های قلبی و ریوی، و واحد خلاصه‌ساز مبتنی بر فنوتایپ با استفاده از ترکیب دو پایگاه دانش از جمله خروجی واحد قبلی به عنوان پایگاه دانش داخلی و هستی‌شناسی فنوتایپ انسان به عنوان پایگاه دانش خارجی، مرتبط‌ترین جملات به ناهنجاری‌های فنوتایپی قلبی و ریوی را شناسایی می‌کند. مدل ارائه شده تعداد ویژگی بیشتری را نسبت به روش‌های موجوداستخراج کرده و شاخصF1 بهتری فراهم می‌سازد. همچنین واحد خلاصه‌ساز مبتنی بر فنوتایپ با استفاده از فنوتایپ‌های شناسایی شده توسط مدل عمیق، موضوعات مرتبط با فنوتایپ‌های قلبی و ریوی را بصورت خودکار و بدون نیاز به متخصصین حوزه استخراج می‌کند و با استفاده از جاسازی مبتنی بر محتوا می‌تواند ضبط نمایش معنایی جملات را بدون نیاز به نگاشت مفاهیم موجود به اصطلاحات متناظر در پایگاه‌های دانش برای تحلیل جملات در سطح مفهوم فراهم سازد. سیستم خلاصه‌ساز مبتنی بر فنوتایپ قادر به حل چالش‌های موجود در روش‌های قبلی هنگام استفاده از پایگاه‌های دانش بوده است و همچنین روش‌های نوین انتخاب جملات مرتبط در این پژوهش باعث بهبود شاخص‌های ROUGE سیستم خلاصه‌ساز در مقایسه با خلاصه‌سازهای مبتنی بر محتوا نظیر BERT و مبتنی بر روش‌های آماری نظیر SUMMA شده است.

ارتقاء امنیت وب با وف بومی