Skip to main content
SUPERVISOR
Ali Fanian
علی فانیان (استاد راهنما)
 
STUDENT
Homa Hasannezhad
هما حسن نژاد

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1391

TITLE

Identification and Classification of Encrypted Network Applications Using their Statistical Features
Internet traffic classification plays an important role in many aspects of network management such as exploit data detection, malicious user intention identification and applying traffic restriction on some applications. In the past, some features such as port numbers and protocol numbers were used to classify traffic, but nowadays ease of changing these features makes traffic classification inefficient. Consequently traffic classification based on machine learning methods is more common recently . In general, the machine learning based approached are categorized to the supervised learning with completely labeled training data, and the unsupervised learning without any labeled training data. Since, in the network traffic classification, obtaining the true label of instances is expensive, the supervised learning methods may not be practical. Therefore, semi-supervised learning methods should be applied to classify the encrypted traffic. In this thesis, a new semi-supervised classification method is presented that exploits clustering and the proposed labeling mechanism. The clustering step is performed using graph theory and the minimum spanning tree concepts. Next, some instances are selected to ask their true labels from expert system these labels are applied to label all the unlabeled instances. Finally, the decision tree algorithm is employed to build the classification model using the fully labeled dataset. Experimental results show that the proposed method has high precision in the identification and classification of the network applications based on the encrypted traffics. Moreover, this method for the unencryptedtraffic flow and unbalancedtraffic flow gives good results. Keywords Internet traffic classification, Encrypted traffic, Graph theory
دسته‌بندی ترافیک اینترنت نقش مهمی در بسیاری از جنبه های مدیریت شبکه مانند بهره برداری تشخیص داده، شناسایی هدف کاربر مخرب و استفاده از محدودیت ترافیک در برخی از برنامه ها‌ی کاربردی، ایفا می‌کند. در گذشته، برخی از ویژگی‌های ترافیک، مانند شماره درگاه و شماره پروتکل برای دسته‌بندی ترافیک مورد استفاده قرار می‌گرفته‌است. اما امروزه تغییر این ویژگی‌ها، دسته‌بندی ترافیک را ناکارآمد می‌سازد. بنابراین دسته‌بندی ترافیک با روش یادگیری ماشین مورد توجه قرار گرفت. بطور کلی روش های یادگیری ماشین در دو دسته ی یادگیری با نظارت که در آن نیاز به یک مجموعه داده کاملا برچسب خورده و یادگیری بدون نظارت که در آن نیازی به وجود برچسب به همراه مجموعه داده نیست، قرار می گیرند. با توجه با این که وجود یک مجموعه داده کاملا برچسب خورده هزینه بسیار زیادی را متحمل می‌شود و روش‌های یادگیری با نظارت عملی نیستند. بنابراین روش های یادگیری نمیه نظارتی برای دسته‌بندی ترافکی رمز‌شده به کار برده شده‌است. در این پایان نامه، یک روش یادگیری نمیه نظارتی جدید پیشنهاد شده‌است که از خوشه‌بندی و مکانیزم پخش برچسب داده‌هااستفاده می‌کند. مرحله ی خوشه بندی براساس تئوری گراف و درخت پوشای کمینه انجام می گیرد. سپس بعضی از داده ها برای پرسش از سیستم خبره انتخاب می‌شوند تا برچسب صحیح آن‌ها مشخص شود و برچسب آن‌ها برای تمام نمونه‌های بدون برچسب مورد استفاده قرار می‌گیرد. در نهایت الگوریتم درخت تصمیم، برای ساخت مدل دسته‌بندی از داده‌های برچسب‌دار مورد استفاده قرار می‌گیرد. نتایج بدست آمده نشان دهنده آن است که روش پیشنهادی، عملکرد دقیق و صحیحی در شناسایی و دسته‌بندی کاربردهای شبکه‌ای، که مبتنی بر رمز نگاری می‌باشند، دارد. همچنین این روش در مورد داده های ترافیک رمز نشده، بخصوص در مورد ترافیک هایی با جریان های نامتعادل نیز نتایج مطلوبی ارائه می کند. کلمات کلیدی: 1- دسته‌بندی ترافیک اینترنت 2-ترافیک رمزشده 3-نظریه گراف

ارتقاء امنیت وب با وف بومی