Skip to main content
SUPERVISOR
Mohammad hossein Saraee
محمدحسین سرایی (استاد راهنما)
 
STUDENT
Nasrin Kalanat
نسرین کلنات

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1388
Data mining is the process of discovering valid, novel and understandable patterns from data while the discovered patterns can be usable and actionable for business decisions. most of machine learning and data mining techniques only focus on finding frequent patterns and usually do not pay any attention to actionably and usability of mined patterns. Thus data mining is converted to a data-driven trial-and-error process that faces users with many patterns and they will be confused about how and what to do with them. It is because the discovered knowledge by data mining methods is not actionable to satisfy the real world requirements. In order to solve this problem, data mining must be developed towards real world business. For this developing it needs to consider domain factors and constraints in data mining process. Actionable Knowledge Discovery is a paradigm shift from data-driven data mining toward domain-driven data mining that is aimed at discovering actionable knowledge to satisfy real world requirements. Up to now many researches have been done on AKD that have considered some of real world factors and constraints such as changeable or not changeable attributes, cost of change of value's attributes, distributed data, incomplete data. All of these researchesassume that the data is precise, while in most of real world scenarios we never face with quite precise values and always face with a degree of uncertainty. Therefore, accuracy or precision in real world situations is simplifying and idealizing that cause high rate of error in AKD methods. Consequently some useful actionable knowledge strategies can be missed during the search process of these methods and even some non-actionable knowledge strategies may be produced. In this thesis these drawbacks will be overcome by fuzzy set theory. Wepropose the idea of combining fuzzy set theory with actionable knowledge. In this regard and in order to improve the only existent methodon discovering actions (Leaf Node Search Method) one type of fuzzy actionable knowledge named fuzzy action will be introduced and the idea of considering cost of change of attribute values as a function will be proposed. Also a profit function will be presented for predicting the net profit of each fuzzy action. In this thesis, we present an algorithm that suggests fuzzy action in order to decrease the degree to which a certain object (for example a customer) belongs to an undesired status and increase the degree to which it belongs to a desired one while maximizing objective function, namely the expected net profit. The contribution of this thesis is in taking the output from fuzzy decision trees, for producing actionable knowledge through automatic post processing. The effectiveness of our proposed method will be verified on four public data set of UCI in comparison with the leaf-node search method. It will be shown that our method is more efficient than Leaf-Node Search method in a number of suggested actions, total profit and average profit. Keywords: Actionable knowledge, Fuzzy action, Fuzzy decision tree, Post process
داده کاوی فرایند کشف کردن الگوهای معتبر، جدید و قابل فهم از داده می باشد به طوریکه این الگوها قابل کاربرد و قابل استفاده در تصمیم گیری های تجاری باشند. از آنجایی که اغلب تکنیک های داده کاوی بر استخراج کردن الگوها و توالی های مکرر از داده تمرکز می کنند و به قابل کاربرد بودن این الگوها در تصمیم گیری های تجاری توجه نمی کنند، شکافی بین الگوهای کشف شده توسط آنها و انتظارات تجاری کاربران ایجاد شده است.به منظور پر کردن این شکاف و در جهت گسترش داده کاوی به کاربردهای جهان واقع، متدهای کشف کردن دانش قابل کاربرد بوجود آمده اند.تاکنون کارهای محدودی در زمینهکشف کردن دانش قابل کاربرد انجام شده است که تمامی آن ها فرض را بر قطعی بودن داده نهاده اند. از آنجاکه در اغلب و شاید تمام سناریوهای جهان واقع، هیچ گاه مقادیر کاملاً قطعی وجود ندارد، این روش ها، منجر به ارائه دانش ناکامل و نادقیق می شوند. در این پروژه به منظور رفع مشکلات ذکر شده از تئوری فازی استفاده می شود و ایده ی ترکیب کردن آن با دانش قابل کاربرد معرفیمی شود. بدین منظور و در جهت بهبود تنها روش موجود برای استخراج کنش(متد جستجو برگ-گره)،کنش فازیمعرفیمی شود. همچنین تابعی برای برآورد سود خالص حاصل از هر کنش فازی ارائه می شود ومتدیبرای کاوشکنش فازی مقرون به صرفه به منظور کاهش میزان تعلقیک موجودیت مشخص به موقعیت نامطلوب و افزایش میزان تعلق آن به موقعیت مطلوب تر در حالیکه سود خالص بیشینه شود، پیشنهاد می شود.این متد در فرآیند پس پردازش خودکار، کنش های فازی مقرون به صرفه را از درخت تصمیم گیری فازی استخراج می کند. در انتها کارایی متد ارائه شده با بکارگیری آن و بکارگیری متد جستجو برگ-گره، روی چهار پایگاه داده ی عمومیUCI نشان داده می شود. در این مرحله یکبار خصوصیات عددی هر پایگاه داده و بار دیگر همه خصوصیات آن در نظر گرفته می شود. با ارزیابی های انجام شده نشان داده می شودکه روش پیشنهادی از نظر تعداد کنش های پیشنهادی، سود کل خالص آن ها و متوسط سود هر کنش به مقدار قابل توجهی کاراترمی باشد. کلمات کلیدی:کنش فازی، درخت تصمیم گیری فازی، پس پردازش،دانش قابل کاربرد.

ارتقاء امنیت وب با وف بومی