Skip to main content
SUPERVISOR
SeyedReza Hejazi taghanaki,Mohammad hossein Saraee
سیدرضا حجازی طاقانکی (استاد مشاور) محمدحسین سرایی (استاد راهنما)
 
STUDENT
Zohreh Ahmadi Dastjerdi
زهره احمدی دستجردی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1387

TITLE

Fuzzy Extension of Apriori algorithm for Mining Association Rules
In the current world, information is one of the most important producing factors. So, trying to extract information from data is one of the challenges in the information industry and the related area. Volume of data is growing rapidly in all environments and in different ways. It shows the complexity of changing data to information. Data mining is one of the recent progresses in the field of data management. In the data mining, database theories, artificial intelligence, machine learning and statistics are combined to prepare an applied area. Data mining is composed of different methods, which one of the most important of them is association rules mining. The most currently used technique in association rules mining is Apriori algorithm. Various studies have been done already to develop association rules mining, which the Apriori algorithm has been a base for them. The focus of this research is on a new sight to the association rules mining according to the fuzzy logic. After proposing fuzzy logic, it is used in the intelligence systems, because of its similarity to the human reasoning and then it is entered to the data mining rapidly. In the compare with left; MARGIN: 0cm 0cm 0pt; unicode-bidi: embed; DIRECTION: ltr" align=left Keywords: Fuzzy association rules, minimum support, fuzzy taxonomy, itemset
در دنیای کنونی، اطلاعات به‌عنوان یکی از فاکتورهای تولیدی مهم مطرح است. در نتیجه، تلاش برای استخراج اطلاعات از داده‌ها از جمله چالش‌های اساسی در صنعت اطلاعات و حوزه‌های وابسته به آن است. حجم داده‌ها دائماً در حال رشد است و در همه‌ی محیط ها و به صورت متنوع در قالب‌های مختلف وجود دارد، که این نمایانگر پیچیدگی کار تبدیل داده‌ها به اطلاعات است. داده کاوی یکی از پیشرفت‌های اخیر در زمینه فناوری‌ مدیریت داده‌هاست. در داده‌کاوی ?تئوری‌های پایگاه‌داده‌ها، هوش مصنوعی، یادگیری ماشین و علم آمار را در هم می‌آمیزند تا زمینه‌ای کاربردی فراهم شود. داده کاوی روش‌های مختلفی دارد که از جمله مهمترین آنها قوانین وابستگی است. یکی از الگوریتم‌های رایج برای کشف قوانین وابستگی الگوریتم Apriori است. تاکنون مطالعات متعددی جهت توسعه کاوش قوانین وابستگی صورت گرفته است که پایه بسیاری از آنها، الگوریتم Apriori بوده است. آنچه دراین تحقیق بر آن تأکید می شود نگاهی جدید بر مبنای منطق فازی جهت کشف قوانین وابستگی است. پس از مطرح شدن منطق فازی، استفاده از آن در سیستم‌های هوشمند به دلیل شباهت با نحوه استدلال انسان به سرعت وارد داده‌کاوی شد. در مقایسه با منطق کلاسیک، منطق فازی جهان بینی نوینی است که با نیازهای دنیای پیچیده امروز سازگارتر است. در این نظریه درستی گزاره‌ها عددی بین صفر و یک است در صورتی که در منطق کلاسیک گزاره‌ها یا درست و یا غلط هستند. لذا نتایج حاصل از منطق فازی در مسائل متعدد، کاربردی‌تر و واقعی‌تر خواهد بود. در این تحقیق ضمن مطالعه کارهای انجام شده تاکنون و بررسی نقاط ضعف و قوت آنها، همچنین بررسی مسائل کاربردی و مطرح کنونی، الگوریتمی جدید با نام FTARM برای کشف قوانین وابستگی فازی از روی مجموعه داده‌های عددی مختلف، با در نظر گرفتن یک طبقه‌بندی چندسطحی فازی روی داده‌ها و همچنین قابلیت متفاوت در نظر گرفتن کمترین پشتیبان به ازای اقلام مختلف پیشنهاد شده است. یکی از ایده‌های مهم به کار رفته در این الگوریتم توانایی آن در استفاده روی مجموعه‌داده‌های مختلف با انواع متنوعی از مشخصه‌ها اعم از مشخصه‌های گسسته و پیوسته است. قابلیت الگوریتم ارائه شده در لحاظ نمودن طبقه‌بندی فازی و کشف قوانین وابستگی در تمام سطوح آن با در نظر گرفتن فرض‌های فوق یکی از نقاط قوت پرکاربرد آن است. همچنین در این تحقیق یک روش برای به دست آوردن طبقه‌بندی فازی بر مبنای روش چند متغیره آماری تحلیل عاملی ارائه شده است. استفاده از این روش به منظور استخراج طبقه‌بندی فازی در مواردی توصیه می‌گردد که طبقه‌بندی در دسترس نبوده و یا تولید آن مشکل باشد. از این رو با کمک تحلیل عاملی می‌توان به استخراج طبقه‌بندی فازی پرداخت. این روش با تقسیم‌بندی شاخص‌های سطح پایین‌تر، عوامل پنهان را در سطح بالاتر طبقه‌بندی تولید می‌نماید. روش‌های فوق بر روی دو مثال کاربردی به منظور نشان دادن کارکرد الگوریتم پیاده‌سازی شده است. مثال اول در زمینه هواشناسی و شامل داده‌های میانگین دمای هوای ماهیانه 26 شهر کشور ایران در بین سال‌های 1990 تا 2000 میلادی است. مثال دوم برگرفته از حمل و نقل جاده‌ای کشور بوده و در آن 14 شاخص مهم در زمینه ایمنی حمل و نقل جاده‌ای کشور در سال 1387 مورد استفاده قرار گرفته است. کلمات کلیدی: 1- قوانین وابستگی فازی 2- کمترین پشتیبان 3- طبقه‌بندی فازی 4- مجموعه اقلام

ارتقاء امنیت وب با وف بومی