Skip to main content
SUPERVISOR
Eman Ezadi,Naser Ghadiri modaress
ایمان ایزدی نجف آبادی (استاد راهنما) ناصر قدیری مدرس (استاد مشاور)
 
STUDENT
Zahra Mannani
زهرا منانی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1395

TITLE

Preprocessing and Pattern Mining of Industrial Alarm Data
Today , alarm system is an important part of the industry and processes . By using advanced technologies , defining alarms in each section of the process is both easy and cost-effective . Thus , the increased number of alarms in any process may cause confusion for the operator and deviate his/her judgement to identify the root cause of the problem . So improving alarm management systems is very crucial in today's industrial processes . Analysing historical alarm data can identify problems in alarm systems . Data mining algorithms and techniques are utilized to analyze alarm data . Data mining is the science of finding patterns in large data . Various frameworks are available for data mining . One of the most important steps in data mining is the preprocessing of data . Therefore , by considering both data approaches (point-based and interval-based) , a structure is proposed for preprocessing of alarm data . Removing chattering and fleeting alarms and imputing missing alarm messages are the most important parts of preprocessing of alarm data . Several algorithms are introduced to remove chattering alarms and the effects of process variable types are investigated . Then , we have described the concept of missing messages in the interval-based alarms and two methods for imputation are presented . ON-OFF RLD median index and temporal patterns are used to reconstruct missing alarms and then place them into the dataset . The first one is based on the information of the same unique alarms in the dataset , and the latter , on the information of the other unique alarms for estimating missing message time . The goal of the modeling step is to find the related alarms and their relationship as temporal patterns . By using the developed TPMiner algorithm , a new method to find suffix sequences and alarm domain concepts , the ATPMiner algorithm is introduced . The occurrence and duration probability of temporal patterns , provide more information to the analyst about the existing alarms in the pattern . By adopting the developed P-TPMiner algorithm , for calculating the probability of occurrence and the duration of a specific pattern , a new algorithm , AP-TPMiner is introduced . Finally , a graphical user interface is designed based on this algorithm to display the association of the existing alarms in the temporal pattern and related probabilities . This user interface is provided as an analytical tool for the expert analyst . A case study demonstrates the effectiveness of the proposed preprocessing and modeling methods on real industrial alarm data .
امروزه سیستم آلارم یکی از قسمت‌های مهم در صنایع و فرآیندها است. با استفاده از سیستم‌های کنترل پیشرفته‌‌، تعریف آلارم در هر قسمت از فرآیند به راحتی و با کمترین هزینه صورت می‌گیرد. در نتیجه اپراتورها با انبوهی از آلارم‌ها مواجه‌اند که باعث می‌شود نتوانند در زمان مناسب علت اصلی را پیدا کرده و آن را برطرف سازند. لذا بهبود سیستم‌های مدیریت آلارم یکی از نیازهای روز فرآیندهای صنعتی است. تحلیل تاریخچه‌ی داده‌ها‌ی آلارم یکی از راه‌های یافتن مشکلات سیستم آلارم است. از الگوریتم‌ها و تکنیک‌های داده‌کاوی برای تحلیل داده‌های آلارم استفاده می‌شود. داده‌کاوی علم یافتن الگوها در داده‌های بزرگ است و چهارچوب‌های مختلفی برای آن معرفی شده است. پیش‌پردازش داده‌ها یکی از مهم‌ترین مراحل داده‌کاوی است، لذا در این پژوهش با در نظر گرفتن مفاهیم هر دو رویکرد داده‌ها (نقطه‌ای و بازه‌ای) ساختاری برای پیش پردازش داده‌های آلارم ارائه شده است. حذف آلارم‌‌های نوسانی و زودگذر و جای‌گذاری پیام‌های آلارم گم‌شده را می‌توان از مهم‌ترین قسمت‌های پیش‌پردازش داده‌های آلارم نام برد. برای حذف آلارم‌های نوسانی چند الگوریتم معرفی شده و تأثیر نوع متغیر فرآیندی در حذف این آلارم‌ها بررسی شده است. سپس مفهوم پیام‌های گم‌شده در داده‌های آلارم بازه‌ای مطرح و دو روش شاخص میانه‌ی ON-OFF RLD و استفاده از الگوهای زمانی برای ساختن دوباره‌ و جای‌گذاری آن‌ها در مجموعه‌ی داده ارائه شده است. در اولی بر اساس اطلاعات همان آلارم منحصر به فرد در داده و در دومی با استفاده از اطلاعات دیگر آلارم‌های منحصر به فرد، زمان پیام گم‌‌شده تخمین زده می‌شود. هدف گام مدل‌سازی یافتن آلارم‌های مرتبط و ارتباط بین آن‌ها به صورت الگوهای زمانی است. در این گام با استفاده از الگوریتم TPMiner توسعه یافته، معرفی روش جدید یافتن دنباله‌های پسوند و مفاهیم حوزه‌ی آلارم، الگوریتم ATPMiner برای یافتن الگوهای زمانی ارائه شده است. الگوهای زمانی وقوع و مدت احتمالی اطلاعات بیشتری در مورد آلارم‌های موجود در یک الگو در اختیار تحلیل‌گر می‌گذارند. با اقتباس از الگوریتم P-TPMiner ، الگوریتم AP-TPMiner برای محاسبه‌ی احتمال وقوع و مدت یک الگوی مشخص معرفی شده است. در نهایت یک رابط کاربری گرافیکی بر اساس این الگوریتم به منظور نمایش ارتباط آلارم‌های موجود در الگوی زمانی و احتمال‌های مربوط به آن طراحی شده است. این رابط کاربری به صورت یک ابزار تحلیل جانبی در اختیار تحلیل‌گر متخصص قرار می‌گیرد. مطالعه‌ی موردی، کارایی پیش‌پردازش و مدل‌سازی انجام شده بر روی داده‌های آلارم را نشان می‌دهد.

ارتقاء امنیت وب با وف بومی