Skip to main content
SUPERVISOR
Mohammad hossein Saraee,Maziar Palhang
محمدحسین سرایی (استاد راهنما) مازیار پالهنگ (استاد مشاور)
 
STUDENT
Ahmad Mehrbod
احمد مهربد

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1383
With the recent developments in computer storage and information technology, massive amounts of data have been stored and it is very difficult to process them without automatic data analysis methods. Large amount of knowledge exist within these datasets but hidden from the users. Data mining is the process of extraction of unknown knowledge from large amounts of data. Knowledge is a concept beyond data and information. Knowledge is finding patterns and hidden trends among data and information. Different types of rules can be discovered by the process of data mining, including association rules, dir=ltr It has been discovered recently that time dependent information is important in data mining. So temporal patterns or rules should be discovered from temporal data, since it can provide accurate information about an evolving business domain, rather than a static one that conventional data mining is dealing with. Time is considered in discussed mining methods in this thesis. There are many time aspects where can associate with rules. One of these aspects is time interval. A time interval associate with each association rule showing when that rule is valid. Thus, knowing time interval of a pattern, usefulness of extracted knowledge is increased. Another time aspect where can associate with rules is time period. A series of repeated occurrences of a certain type of event at regular intervals is described as a periodic event. In this thesis both time interval and time period factors is discussed in mining temporal association rules. We extend one of existing teqniques in order to create a flexible schema for expressing
با پیشرفت‌های اخیر در فناوری اطلاعات و ذخیره‌سازی در کامپیوتر، مقدار داده ذخیره شده در پایگاه‌های داده فراتر از آن است که بتوان داده‌ها را بدون استفاده از شیوه‌‌های تحلیلی خودکار تحلیل کرد. علیرغم این‌که اطلاعات زیادی در این مجموعه‌ داده ها نهفته است، این اطلاعات مستقیماً در اختیار کاربرها قرار ندارد. داده‌کاوی فرایندی است که در آن دانش نهفته در میان انبوهی از داده‌ها استخراج می‌گردد. دانش مفهومی فراتر از داده و اطلاعات است. دانش استنتاج کردن و شناخت الگوها و روندهای پنهان میان داده‌ها و اطلاعات است. داده‌کاوی انواع مختلفی دارد. در این پایان‌نامه کاوش قوانین وابستگی به عنوان یکی از مورد توجه‌ترین انواع داده‌کاوی دنبال می‌شود. قوانین وابستگی تلاش در کشف الگوهای رخداد همزمان صفت‌های خاصه در پایگاه‌داده را دارند. در این نمونه از کاربرد داده‌کاوی رابطه‌ها و وابستگی‌های جالب بالقوه میان داده‌ها تشخیص داده می‌شود. در سال‌های اخیر کشف شده که اطلاعات وابسته به زمان در داده‌کاوی مهم است و در کشف قانون ها و الگوها، زمان نیز باید در نظر گرفته شود. در این پایان‌نامه بعد زمان در روش‌های بحث شده برای کاوش مورد توجه قرار گرفته است. جنبه های زمانی زیادی وجود دارند که می توانند برای تشریح جنبه های زمانی دانش با الگوهای به دست آمده مرتبط شوند. از جمله این جنبه ها می توان فاصله اعتبار برای یک الگو را نام برد. یعنی به همراه قانون وابستگی، فاصله ای از زمان آورده می‌شود که نشان می دهد قانون مذکور در چه موقعی از زمان معتبر است. بنابراین با معلوم شدن فاصله زمانی یک الگو، سودمندی دانش به دست آمده افزایش می یابد. یکی دیگر از ویژگی های زمانی مورد توجه در داده کاوی زمانی که می تواند برای تشریح جنبه های زمانی دانش با الگوی های به دست آمده مرتبط شود، دوره یک رویداد است. یک سری از رخ دادهای تکرار شونده از یک نوع رویداد معین در فاصله های منظم به عنوان یک رویداد دوره ای بیان می شود. هنگامی‌که زمان در کاوش قوانین وابستگی منظور شود، کاوش قوانین وابستگی زمانی مطرح شده است. در این پایان‌نامه هر دو عامل فاصله زمانی و دوره زمانی در کاوش قوانین وابستگی زمانی مورد توجه قرار گرفته است. مذکور اعمال کرده‌ایم که باعث افزایش بیشتر دقت زمان برقراری قانون‌ها می‌شود. بنابراین تغییرات صورت گرفته در سیستم زمان قانون‌های وابستگی باعث دقیق‌تر شدن زمان مرتبط با هر قانون می‌شود که به سودمندی بیستر قانون‌ها منجر می‌شود. علاوه بر این نتایج پیاده‌سازی نشان می‌دهد که این تغییرات باعث کشف قانون‌های بیشتری نسبت به قبل از داده‌های یکسان می‌شود.

تحت نظارت وف ایرانی