Skip to main content
SUPERVISOR
مهران صفایانی (استاد مشاور) عبدالرضا میرزایی دمابی (استاد راهنما)
 
STUDENT
Elham Hatefi ghahfarokhi
الهام هاتفی قهفرخی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1391

TITLE

Privacy Preserving Fuzzy Association Rule Mining
Privacy preserving data mining (PPDM) has been a new research area in the past two decades. In fact, the aim of PPDM algorithms is to modify data in the dataset so that sensitive data and confidential knowledge, even after data mining operation be kept confidential. Association rule hiding is one of the main techniques of PPDM aiming to avoid extracting some rules that are recognized as sensitive rules. Most of the work which has been done in the area of association rule hiding are limited to binary data, however many real world datasets include quantitative data too. In this work a new methods is proposed to hide sensitive quantitative association rules which is based on convex optimization technique. In most of the previous methods, there were uniform changes in the values of all items and also in all of them the correlation between related items were not considered. By considering these two issues, fewer changes are made in the real and fuzzy dataset. In our proposed method, we make suitable changes in the value of each item and the relations between related items are defined as constraints in the optimization problem. In all existing methods at this field, association rules were extracted from 2-large itemsets. However our method can be extended for any kind of association rules. The performance of the proposed algorithm is measured in the term of percentage of hiding of sensitive rules, side effects and changes occurred in the fuzzy and real datasets. The results showed, most sensitive rules were made hidden with the proposed method and the number of lost and ghost rules and changes in the fuzzy and real datasets have been significantly reduced. Keyword : Data Mining, Association Rule Hiding, Convex Optimization
داده‌کاوی با حفظ محرمانگی داده‌ها زمینه تحقیقاتی جدیدی در دو دهه اخیر می‌باشد. در حقیقت هدف اصلی الگوریتم‌های داده‌کاوی با حفظ محرمانگی تغییر داده‌های پایگاه‌داده ورودی به گونه‌ای است که داده‌های خصوصی و همچنین دانش‌های محرمانه، حتی پس از عملیات داده‌کاوی محرمانه بمانند. کاوش قوانین وابستگی با حفظ محرمانگی یکی از تکنیک‌های اصلی داده‌کاوی با حفظ محرمانگی به شمار می‌آید و هدف آن جلوگیری از استخراج برخی از قوانینی می‌باشد که به عنوان قوانین حساس شناخته می‌شوند. اکثر روش‌های مربوط به پنهان‌سازی قوانین وابستگی محدود به پایگاه‌داده‌های باینری می‌باشند در صورتی‌که پایگاه‌داده‌ها محدود به داده‌های باینری نبوده و دامنه این پایگاه‌داده‌ها اعداد حقیقی را نیز شامل می‌شود. در این پایان‌نامه یک روش جدید به منظور پنهان‌سازی قوانین وابستگی فازی از طریق فرموله کردن آن به صورت یک مساله بهینه‌سازی محدب، ارائه شده است. در محدود روش‌های انجام شده در این حوزه تغییراتی که در مقادیر آیتم‌ها صورت می‌پذیرد به صورت ثابت بوده و همچنین وابستگی بین آیتم‌های وابسته در نظر گرفته نمی‌شود. در صورتی‌که با در نظر گرفتن این دو موضوع، تغییرات کمتری در پایگاه‌داده فازی و حقیقی ایجاد می‌گردد. در روش پیشنهادی با استفاده از تکنیک بهینه‌سازی محدب تغییرات مناسب در مقادیر آیتم‌ها صورت می‌پذیرد و وابستگی بین آیتم‌های وابسته به صورت یک محدودیت مسئله بهینه‌سازی در نظر گرفته می‌شود. در تمامی روش‌های موجود در این حوزه پنهان‌سازی قوانین وابستگی برای قوانینی که از مجموعه آیتم با طول دو استخراج شده‌اند، ارائه شده است. در حالی‌که روش ارائه شده در این پایان‌نامه برای تمامی قوانین وابستگی فازی قابل تعمیم خواهد بود. کارایی روش پیشنهادی بر اساس درصد پنهان‌سازی قوانین حساس، تاثیرات جانبی آن و میزان تغییرات ایجاد شده در پایگاه‌داده فازی و حقیقی ارزیابی شده است. نتایج به دست آمده از آزمایشات صورت پذیرفته حاکی از آن می‌باشد که اکثر قوانین حساس در این روش پنهان شده‌اند و تعداد قوانین از دست‌رفته و خیالی و تغییرات به وجود آمده در پایگاه‌داده حقیقی و فازی کاهش قابل توجهی داشته است. واژگان کلیدی: داده‌کاوی، پنهان‌سازی قوانین وابستگی، بهینه‌سازی محدب

ارتقاء امنیت وب با وف بومی