Skip to main content
SUPERVISOR
Shadrokh Samavi,Nader Karimi
شادرخ سماوی (استاد راهنما) نادر کریمی (استاد راهنما)
 
STUDENT
Nasrin Tavakoli
نسرین توکلی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1392

TITLE

Detection of breast cancer in mammographic images
reast cancer is a fatal disease that originates in breast tissue. The disease could affect the majority of women, although men may also be affected. According to the American Cancer Society, almost one in nine women is estimated to develop breast cancer. Hence, mammograms have been introduced as one of the best tools to diagnose the disease at an early stage. The mortality rate of breast cancer can be reduced by early diagnosis and treatment. The computer-aided diagnostic systems help expert physicians to identify the early-stage of breast cancer by mammograms. The function of these computer diagnostic systems generally consists of four main stages including preprocessing, extraction of a region of interest (ROI), features extraction and classification. Although many diagnosis methods are introduced so far, the problem of diagnosing breast cancer automatically by using computers has remained as a challenge due to the complexity of the breast tissue that makes the mass difficult to separate from other dense regions of the breast tissue. Moreover, sometimes, the size of the disorder is too small to be seen by experts. Therefore, considering the great importance of the existence of an automatic diagnostic system for breast cancer, we represent two methods for detecting breast cancer in this study. The first method is based on discriminative dictionary learning on DSIFT descriptors and the second method is based on deep convolutional neural network (CNN). The pre-processing stage consists of extracting breast tissue, removing muscle from the breast and improving the contrast of the mammograms. Then DSIFT feature is represented as a sparse coding in a dictionary-based method. The sparse representations of DSIFT Descriptors are given to the dictionary and linear classifier to learn simultaneously according to the LC-KSVD algorithm. After training the dictionary and the linear classifier, they would be used in order to classify test images. In the second proposed method, which is based on the CNN, after the preprocessing phase, a number of normal and abnormal blocks of the mammography images are extracted and inputted to the network. After training CNN, the obtained weights and biases, in the network, would be used at the test stage. In the end, with the aim of improving the accuracy Keywords: Diagnosis system, breast cancer, mammography, dictionary, sparse coding, deep learning.
سرطان پستان یک بیماری کشنده است که در بافت پستان ایجاد می‌شود. این بیماری عمدتاً قشر زنان را تحت تأثیر قرار می‌دهد؛ اگرچه ممکن است مردها هم به این بیماری مبتلا شوند. به گفته انجمن سرطان آمریکا در سال 2011 تقریباً از هر 9 زن، 1 زن به این بیماری مبتلا بوده است و تصاویر ماموگرافی به‌عنوان یکی از بهترین ابزارها برای تشخیص این بیماری در مراحل اولیه معرفی شده است. نرخ مرگ و میر سرطان پستان را می‌توان با تشخیص و درمان زودهنگام کاهش داد. سیستم های تصمیم گیری و تشخیص به کمک کامپیوتر از روی تصاویر ماموگرافی در تشخیص مراحل اولیه ی سرطان پستان به پزشکان متخصص کمک می‌کنند. عملکرد این سیستم‌های تشخیص کامپیوتری عموماً شامل چهار مرحله‌ی اصلی پیش پردازش، استخراج نواحی مطلوب از بافت پستان، استخراج ویژگی و کلاس بندی می‌شود. اگر چه تا کنون روش‌های زیادی برای تشخیص سرطان، ارائه شده است اما هنوز مسئله‌ی آشکار سازی سرطان پستان به کمک کامپیوتر به‌عنوان یک چالش باقی مانده است؛ چرا که با توجه به بافت نسبتاً پیچیده‌ی پستان، تفکیک توده‌ها از سایر نواحی متراکم در بافت پستان مشکل است. از طرفی گاهی اوقات اندازه‌ی اختلالات در حدی کوچک است که از دید متخصصین پنهان می‌ماند. لذا با توجه به اهمیت زیاد وجود یک سیستم تشخیص خودکار، در این تحقیق دو روش آشکارسازی سرطان که یکی مبتنی بر یادگیری دیکشنری روی نمایش تُنُک ویژگی و دیگری مبتنی بر شبکه‌ی عصبی کانوولوشن (CNN) است ارائه می‌شود. در این روش ها مرحله ی پیش پردازش شامل حذف نواحی نامربوط از تصویر ماموگرافی، استخراج ناحیه‌ی بافت پستان، حذف عضله‌ی سینه و بهبود کنتراست تصاویر ماموگرافی می‌شود. سپس در روش مبتنی بر دیکشنری، ویژگی DSIFT پنجره ی اطراف هر پیکسل در بافت پستان، استخراج می‌شود و به‌صورت نمایش تُنُک ارائه می‌شود. این داده‌های تُنُک به دیکشنری و کلاس بند خطی داده می‌شوند تا مطابق با الگوریتم LC-KSVD به‌طور هم‌زمان یادگیری شوند. در انتها از دیکشنری و کلاس بند خطی یادگیری شده برای کلاس بندی تصاویر آزمون استفاده می‌شود. در روش پیشنهادی دوم که مبتنی بر شبکه‌ی CNN است پس از مرحله‌ی پیش پردازش، تعدادی بلوک نرمال و غیر نرمال از تصاویر ماموگرافی استخراج شده و به‌عنوان ورودی به شبکه داده می‌شود و پس از یادگیری، از وزن‌ها و بایاس‌های به دست آمده در شبکه در مرحله‌ی آزمون استفاده می‌شود و در انتها به‌منظور افزایش دقت سیستم، یک مرحله‌ی پس پردازش روی تصاویر خروجی شبکه، انجام می‌گیرد. در مرحله ی ارزیابی روش های پیشنهادی، معیار sensitivity در روش مبتنی بر دیکشنری به مقدار 93.33% و در روش مبتنی بر شبکه ی CNN به مقدار 96.67%رسیده است. از طرفی برای معیار AUC، در روش مبتنی بر دیکشنری مقدار 0.94 و در روش مبتنی بر CNN، مقدار 0.97 به دست آمده است که مقایسه‌ی نتایج روش‌های پیشنهادی با دیگر روش‌های موجود در این زمینه، نشان از عملکرد خوب این روش ها دارد. کلمات کلیدی: 1- سیستم تشخیص 2- سرطان پستان 3- ماموگرافی 4- دیکشنری 5- نمایش تُنُک 6- یادگیری عمیق.

ارتقاء امنیت وب با وف بومی