Skip to main content
SUPERVISOR
Mehdi Mahdavi
مهدی مهدوی (استاد راهنما)
 
STUDENT
Farzad Forughi
فرزاد فروغی

FACULTY - DEPARTMENT

دانشکده مهندسی برق و کامپیوتر
DEGREE
Master of Science (MSc)
YEAR
1396
Quick expansion of network services diversity made network resource planning harder than ever. Different requirements of each service on the network, knowing network users' usage pattern and differentiated service to each traffic or preventing its propagation are fundamental reasons for traffic classification. On other hand extensive use of encryption and tunneling protocols on the networks made current methods unfunctional. Thus the network's quality of service management is affected by improper network traffic classification. Diversity of traffic and available encryptions for it requires a more complex modeling method which is capable of hidden pattern extraction. This research took advantage of Deep Learning methods to classify network traffic due to this level of uncertainty. The proposed method is trying to classify encrypted or tunneld network traffic by deploying Recurrent, Convulotional and Fully Connected Neural Networks with supervised training. Also to make the model as simple as possible, this research examined a range of preprocessing parameters which is involved in the training process like flow sample size, packet sample size, removal of source and destination address and ports and etc to make sure the optimal point for each one. Furthermore independence of classification from tunneling or encryption protocols is preserved by providing different encryption or tunneling on the same network service traffic with the same label in the training process. The results show that effects of preprocessing were previously unknown on network traffic classification accuracy. These preprocessing pipelines dramatically decreased required model parameters. Also this process helped the model’s input data to balance statistical features of packet header, packet payload and packets flow. After encryption of packet most of the statistical features in packets flow or packet headers preserve. So balancing these features to train Deep Neural Network improves final classification accuracy. This method unlike any other proposed methods can classify same traffic under different tunnels with the same label with an average up to 95% accuracy as well as having 30% less parameters to train than latest research. This accuracy and simplicity could lead to an effective role in today’s networks full of encryption and tunneling. Encrypted IP Traffic,Classificatio,Deep Learning Methods
گسترش سریع و افزایش تنوع سرویس‌های تحت شبکه، برنامه ریزی برای منابع شبکه را از همیشه دشوارتر کرده است. نیازمندی‌های متفاوت هر سرویس در شبکه، دانستن الگوی مصرف کاربران و همچنین سرویس‌دهی ویژه به انتشار ترافیک سرویس خاص یا جلوگیری از آن، مهم‌ترین دلایل دسته‌بندی ترافیک یک شبکه برای مدیران آن است. از سوی دیگر، استفاده‌ی گسترده از رمزنگاری و پروتکل‌های تونل زدن در شبکه باعث شده است تا روش‌های معمول کارایی لازم در این زمینه را نداشته باشند. در نتیجه مدیریت کیفیت سرویس شبکه به کلی تحت تاثیر عدم شناسایی درست جریان‌های ترافیکی قرار می‌گیرد. این تنوع در ترافیک و رمزنگاری‌های قابل استفاده، نیاز به روش‌های مدل‌سازی پیچیده‌تری دارد که توانایی استخراج الگوهای پنهان را داشته باشند. در این پژوهش به واسطه‌ی وجود این سطح از ابهام، از روش‌های یادگیری عمیق برای تشخیص جریان‌های ترافیکی استفاده شده است. با به‌کارگیری شبکه‌های عصبی حافظه‌ی طولانی کوتاه مدت، پیچشی و تماماً متصل، مدلی ارائه شده است که با یادگیری تحت نظارت سعی در دسته‌بندی ترافیک‌های رمزنگاری شده یا تحت یک تونل دارد. همچنین برای حداکثر کوچک‌سازی مدل عصبی عمیق مورد نیاز، تاثیر پیش‌پردازش‌های متفاوتی مانند طول جریان نمونه‌گرفته شده، طول بسته‌های موجود در جریان و حذف آدرس‌ها و درگاه‌های مبدا و مقصد بررسی شده و مقدار بهینه‌ی هرکدام، مشخص شده است. علاوه‌ بر این، استقلال دسته‌بندی از پروتکل‌های تونل زدن با در نظر گرفتن این حالات در داده‌های آموزشی و در نظر گرفتن یک برچسب برای همه‌ی آن‌ها حفظ شده است. نتایج این پژوهش نشان می‌دهد نقش پیش‌پردازش در افزایش دقت شبکه‌ی عصبی تا به‌حال پنهان بوده است. پیش‌پردازش‌ها باعث شدند تا تعداد پارامترهای مورد نیاز برای مدل عصبی عمیق کاهش چشمگیری پیدا کند. از سوی دیگر پیش‌پردازش‌ها باعث شدند که ویژگی‌های آماری مربوط به محتوای بسته‌ها و سرآیند بسته‌ها و جریان بسته‌ها به صورت مساوی وارد شبکه‌ی عصبی شوند. با رمزنگاری محتوای بسته، بسیاری ویژگی‌های آماری دیگر در جریان بسته‌ها و سرآیندشان حفظ می‌شود. در نتیجه متناسب بودن حضور این سه دسته ویژگی‌ آماری در ورودی شبکه‌ی عصبی عمیق، تشخیص ترافیک‌هایی با رمزنگاری‌های متفاوت را بهبود می‌دهد. روش ارائه شده با استفاده از جزییات ذکر شده توانسته است برخلاف پژوهش‌های پیشین ترافیک یکسانی که در تونل‌های مختلف شبکه ارسال می‌شود را تحت یک برچسب با دقت بالای 95% دسته‌بندی کند. همچنین شبکه‌ی استفاده شده حدود 30 درصد تعداد پارامتر کمتری نسبت به آخرین یافته‌‌ها دارد. این دو مسئله باعث حفظ دقت این روش‌ها در ترافیک‌های شبکه‌های مملو از تونل‌ و رمزنگاری‌ امروزی شود. یادگیری عمیق، یادگیری تحت نظارت، دسته‌بندی ترافیک رمزشده، شبکه‌هایIP، شبکه‌های عصبی بازگشتی، شبکه‌های عصبی پیچشی

ارتقاء امنیت وب با وف بومی