Skip to main content
SUPERVISOR
Mohammad hossein Saraee,Mohammad Ali Montazeri
محمدحسین سرایی (استاد راهنما) محمدعلی منتظری (استاد مشاور)
 
STUDENT
Leila Hafezi
لیلا حافظی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1387

TITLE

Warehousing and Mining on Massive RFID Data Sets
Radio Frequency Identification (RFID) has been proposed as an efficient, effective and useful technology in the recent years. RFID technology is widely used across many application domains with promising results such as supply chain management, retail, access control, airline luggage management, medical identification, electronic paort and pet identidication. It uses radio frequency waves to read a unique identifier that is attached to an unexpensive tag by RFID reader from a far distance and without a line of sight. Reader receives radio waves from tags and convertes them into transformable data and then save data in computer servers. This technology facilitates and accelerates many applications, but it has proposed a challenge. RFID systems generates enormous amount of data where traditional methods are not capable of handling them and therefore new, novel and efficient techniques for processing are needed. The volume is so enormous that disusing the system comes into consideration. Data mining techniques are used for modeling of relationship and discovering hidden pattern in massive data consider being useful. RFID data is stored in multidimensional format by RFID warehousing which is more suitable for analysis and mining. Before using data mining algorithm, we use warehousing techniques to load and store the data in data warehouse. In this project, we have focused on preprocessing techniques and try to improve these techniques for improving data mining. In this project a new warehousing model is presented. In this new model, we add a new step into old model of warehousing, which is compression step (old model contains data gathering, data cleaning and data transformation and then data warehouse construction). This data structure is compressed to the highest degree possible without missing any data and therefore data warehouse is compressed as well. In this method, we consider a definite and deterministic sequence among different phases in the production line of car engines. Then we combine these phases at different levels. Therefore, low level data have been converted to higher and more meaningful levels. In this model, we save the combination of different levels of stages in the table in database and thus we can decompose the data at every level and return to level 0 again that is a main advantage of our method; that is to say, Key words Radio Frequency Identification, Data Mining, Data warehousing, and Data warehouse. ده
تکنولوژی شناسایی از طریق امواج رادیویی یا به صورت خلاصه‌تر تکنولوژی رادیو شناسه چندین سال است که به عنوان یکی از تکنولوژی‌های کارآمد و مفید مطرح شده است. این تکنولوژی در کاربردهای زیادی به کار گرفته شده و نتایج مطلوبی نیز داشته است از جمله در مدیریت زنجیره تأمین، مدیریت چمدان‌های فرودگاه‌ها، خرده فروشی‌ها، کنترل دسترسی، شناسایی حیوانات خانگی و بیماران آلزایمری. در ساده‌ترین سطح این تکنولوژی اجازه می‌دهد یک بارکد از راه دور و در خطی غیر مستقیم با استفاده از امواج رادیویی خوانده شود. بارکد‌ها در سیستم‌های رادیو شناسه معمولاً کدهای یونیکی هستند که به هر شیء اختصاص می‌یابند. این کد روی تراشه‌ای متصل به یک آنتن ذخیره می‌شود. به مجموعه این تراشه و آنتن تگ گفته می‌شود. از آنتن برای انتقال اطلاعات تراشه به تگ‌خوان استفاده می‌شود. تگ‌خوان امواج رادیویی را از تگ‌ها دریافت و آن‌ها را به اطلاعات قابل انتقال به کامپیوتر تبدیل می‌کند. این اطلاعات یا داده‌ها در کامپیوتر ذخیره و پردازش می‌شوند. داده‌هایی که به وسیله‌ی سیستم‌های رادیو شناسه تولید می‌شوند بسیار بزرگ و حجیم هستند. متدهای قدیمی در این مورد کارساز نیست و واضح است که بایست تکنیک‌های جدید و کارآمدی برای پردازش این داده‌های حجیم به کار گرفته شود. استفاده از تکنیک‌های داده‌کاوی برای مدل کردن ارتباطات و کشف الگوهای مخفی در داده‌های بزرگ مفید به نظر می‌رسد. یکپارچه سازی داده‌های تکنولوژی رادیو شناسه آن‌ها را به صورت ابعادی، در فرمت مشخصی مرتب می‌کند و در نتیجه کار تحلیل و آنالیز راحت‌تر می‌شود. لذا قبل از به کارگیری الگوریتم‌های داده کاوی ابتدا با استفاده از قوانین یکپارچه سازی، داده‌ها را به انباره داده تبدیل خواهیم کرد. در این پروژه هدف و تمرکز را بر روی مراحل پیش پردازش قرار داده و سعی شده با بهبود این مراحل گامی مؤثر در جهت بهبود داده کاوی برداشته شود. در این پروژه با ارائه مدل جدیدی از یکپارچه سازی داده‌ها که در آن علاوه بر فازهای موجود در مدل قدیمی یعنی فاز جمع‌آوری داده، فاز پاک سازی و فاز تبدیل داده، فاز دیگری به این مدل اضافه شد که آن فاز فشرده سازی است و برای فشرده سازی داده‌های کاربرد مورد نظر در این پروژه ساختار جدیدی ارائه شد که البته این ساختار برای تمامی کاربردهایی از RFID که یک سری عملیات ثابت و تکراری بر روی داده‌ها انجام می‌شوند نیز قابل اعمال است. با به کارگیری این ساختار، داده‌هایی که از یک خط تولید موتور خودرو به دست آمده بودند و تعداد آن‌ها 75,127,352 بود را تا 50 / 1 مقدار اولیه فشرده کردیم، که باعث بهبود انباره داده در هنگام اعمال الگوریتم‌های داده کاوی شد. علاوه بر فشرده سازی بسیار زیاد داده‌ها مزیت دیگر این ساختار این است که می‌توان با ذخیره روند فشرده سازی در یک جدول در دیتابیس، داده‌ها را به داده‌های اولیه قبل از فشرده سازی بازگرداند. هم چنین کار دیگری که بر روی انباره داده انجام شد این بود که از نرمال بودن جداول در انباره داده به منظور کاهش تعداد جداول صرف نظر شد، که آن چنان که نشان داده خواهد شد این کار نیز موجب بهبود زمان اجرای الگوریتم داده کاوی شد. واژه‌های کلیدی: تکنولوژی شناسایی از طریق امواج رادیویی، تکنیک‌های داده‌کاوی، یکپارچه سازی، انباره داده.

ارتقاء امنیت وب با وف بومی