Skip to main content
SUPERVISOR
محمد تقی صادقی (استاد مشاور) رسول امیر فتاحی ورنوسفادرانی (استاد راهنما)
 
STUDENT
Sanaz Nasiri
ساناز نصیری دهج

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1393

TITLE

Separation and Recognition of English Handwritten Digits in Noisy Conditions
Today , handwritten digits recognition plays a pivotal role in industrial applications . Despite lots of researches have been conducted in this field , it is still a state of the art research line . In general , a handwritten digit recognition system consists of binarization , discrimination , feature extraction , and ltr" In this thesis , various algorithms of handwritten digit recognition is analyzed in order to propose a suitable method for automatic handwritten digit recognition of slabs in Isfahan Steel Co . These images have noisy non-uniform background and digits are destructed by sagging of the color . Therefore , by analyzing various binarization methods , a K-means cluster based algorithm which has higher accuracy than Otsu , Niblack , Sauvola , and multi-scale grid-based Sauvola was utilized in our method . In addition , by using preprocessing methods , shadow removal , sagging elimination and post processing , the quality of digits and their complex background improves which leads to more convenient digit segmentation . For classification of data , a sparse representation based classifier is proposed . The accuracy of proposed algorithm is 98.95% for MNIST standard database and 81.17 % for Isfahan Steel Co . database . Keywords: handwritten digit recognition, slab,binarization, segmentation, feature vector, classification.
امروزه تشخیص ارقام دست‌نوشته نقش مهمی در کاربردهای گسترده‌ی عملی در صنعت دارد، بنابراین برخلاف پژوهش‌های مختلف انجام شده در این زمینه، همچنان یک زمینه‌ی علمی زنده و به روز به شمار می‌آید. از دیدگاه کلی، سیستم تشخیص ارقام دست‌نوشته شامل بخش‌های باینری‌سازی، جداسازی، استخراج ویژگی و درنهایت دسته‌بندی کننده است. اولین مرحله در راستای تشخیص ارقام، حذف پس‌زمینه و نگه داشتن پیکسل‌های متعلق به ارقام است. پژوهش‌های پیشین در این زمینه، در دو دسته‌ی کلی روش‌های مبتنی بر خوشه‌بندی و روش‌های مبتنی بر آستانه‌گذاری بیان شده‌اند. سیستم‌های بازشناسی، به قسمت‌های تفکیک شده‌ی تصویر نیازمند هستند که در دو شاخه‌ی جداسازی بیرونی و درونی مورد بررسی قرار گرفته است. در مرحله‌ی استخراج ویژگی به‌منظور کاهش بعد داده‌ها و اغلب توصیف آن‌ها در فضای ویژگی‌، از روش‌های مختلفی با استفاده از ویژگی‌های آماری، ساختاری و حوزه‌ی تبدیل استفاده کرده‌اند. آخرین مرحله در سیستم بازشناسی ارقام دست‌نوشته، طبقه‌بندی رقم مورد بررسی است. الگوریتم‌های معروف نزدیک‌ترین همسایه، شبکه عصبی و ماشین بردار پشتیبان به‌منظور طبقه‌بندی و تشخیص برچسب داده‌ی آزمون به‌کارگیری شده است. در سال‌های اخیر نیز به‌منظور طبقه‌بندی کاراکترها و ارقام، روش‌های طبقه‌بندی مبتنی بر نمایش تنک نیز پیشنهاد گردیده است. در این پایان‌نامه به بررسی روش‌های مختلف تشخیص ارقام دست‌نوشته، به‌منظور ارائه‌ی روشی مناسب برای تشخیص ارقام دسته‌نوشته‌ی موجود در تصاویر تختال‌های شرکت فولاد اصفهان پرداخته‌ایم. این تصاویر دارای پس‌زمینه‌ی پیچیده، غیر یکنواخت و نویزی بوده و ارقام موجود در این تصاویر دچار مشکل ریزش و شره زدگی رنگ نیز هستند. بدین منظور با بررسی روش‌های مختلف باینری‌سازی، از الگوریتم باینری‌سازی مبتنی بر خوشه‌بندی که دارای دقت مطلوب‌تری در مقایسه با روش‌های باینری‌سازی اتسو، نایبلک، ساولا و ساولای چند‌مقیاسه‌ی شبکه‌بندی شده است، استفاده نموده‌ایم. علاوه بر آن، با به‌کارگیری روش‌های پیش‌پردازش، حذف سایه، حذف شره و پس‌پردازش موجب بهبود ارقام ریخته‌شده یا شره زده و بهبود زمینه‌ی پیچیده‌ی تصویر شده‌ایم که باعث جداسازی راحت‌تر ارقام نیز شده است. به‌منظور طبقه‌بندی داده‌ها، طبقه‌بند خطی مبتنی بر نمایش تنک را پیشنهاد نموده‌ایم. روش پیشنهادی دارای درصد تشخیص 98/95 درصدی بر روی پایگاه داده‌ی استاندارد MNIST و 81/17 درصدی بر روی پایگاه داده‌ی فولاد است. کلمات کلیدی: تشخیص ارقام دست‌نوشته، تختال، باینری‌سازی، جداسازی، بردار ویژگی، طبقه‌بندی

ارتقاء امنیت وب با وف بومی