Skip to main content
SUPERVISOR
عبدالرضا میرزایی دمابی (استاد راهنما) مهران صفایانی (استاد مشاور)
 
STUDENT
SeyyedVahid Moravvej
سیدوحید مروج

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1396

TITLE

Using Conditional Generative Adversarial Networks(CGAN) in Text Summarization
Today, with the growing number of textual information sources, we have a lot of textual data.Researchers are faced with the problem of redundancy in accessing useful information and have to search through large databases that lead to long time and loss of useful information.Text summarization is a solution to produce an of information. Summarization has been studied for many years as a word processing tool. The purpose of a summary is to produce a text shorter than the original text so that the summary contains important information and no redundancy. So far, different algorithms have been proposed using statistical concepts and machine learning and other methods. In the last few years, deep learning has attracted a great deal of attention in many areas, including the processing of natural languages, and has achieved great success in these fields. In this research, a method based on Conditional Generative Adversarial Networks (CGAN) is presented for extractive summarization which has a Generator and a Discriminator that compete with each other in a process. The purpose of the generator is to select important sentences from the text for summarization and the discriminator's goal is to identify the generator's efficiency. In this research, after identifying the important characteristics of the text sentences, we provide it as an input to the generative adversarial network and finally, after training, the important sentences are determined by the generator. We evaluated our proposed model on two types of datasets, CNN/DailyMail and Medicine. Summaries produced in this study performed 5\\% better than competing algorithms. Text Summarization, Redundancy, Deep Learning, Generative Adversarial Networks, Extractive Summarization
امروزه با رشد روزافزون منابع اطلاعات با حجم زیادی از داده‌های متنی روبه‌رو هستیم. پژوهشگران برای دستیابی به اطلاعات مفید با مشکل افزونگی اطلاعات روبه‌رو هستند و باید در پایگاه‌داده‌های بزرگ به جستجو بپردازند که منجر به ‌صرف زمان طولانی و از دست دادن اطلاعات مفید می‌شود. خلاصه‌سازی متن یک‌ راه‌حلی برای تولید ای از اطلاعات است. خلاصه سازی به عنوان یک ابزار پردازش متن از سال‌ها پیش مورد بررسی و تحقیق قرار گرفته است. هدف از خلاصه‌سازی متن تولید یک متن کوتاه‌تر از متن اصلی است به صورتی که خلاصه تولید شده شامل اطلاعات مهم و فاقد افزونگی باشد. تاکنون الگوریتم‌های مختلفی با استفاده از مفاهیم آماری و یادگیری ماشین و روش‌های دیگر مطرح‌ شده است. یادگیری عمیق در چند سال اخیر توجه زیادی را در بسیاری از زمینه‌ها از جمله پردازش زبان‌های طبیعی به خود جلب کرده است و موفقیت‌های زیادی را در این زمینه‌ها به دست آورده است. در این پژوهش یک روش مبتنی بر شبکه‌های مولد تخاصمی شرطی برای خلاصه‌سازی استخراجی ارائه شده است که دارای یک مولد و یک متمایزگر است که طی یک فرایند با هم رقابت می‌کنند. هدف مولد انتخاب جملات مهم از متن برای خلاصه است و هدف متمایزگر تشخیص کارایی مولد است. در این پژوهش پس از تعیین ویژگی‌های مهم جملات متن، آن را به عنوان ورودی به شبکه مولد تخاصمی می دهیم و درنهایت پس از آموزش، جملات مهم توسط مولد تعیین می‌شود. مدل پیشنهادی خود را بر روی دو نوع مجموعه داده CNN/ِDailyMail و پزشکی ارزیابی کردیم. خلاصه‌های تولید شده در این پژوهش 5 درصد بهتر از الگوریتم‌های رقیب عمل کرده است. خلاصه‌سازی متن، افزونگی، یادگیری عمیق، شبکه‌های مولد تخاصمی شرطی، خلاصه‌سازی استخراجی

ارتقاء امنیت وب با وف بومی