Skip to main content
SUPERVISOR
Keivan Aghababaei samani,Farhad Shahbazi
کیوان آقابابائی سامانی (استاد راهنما) فرهاد شهبازی دستجرده (استاد مشاور)
 
STUDENT
Dena Izadi
دنا ایزدی

FACULTY - DEPARTMENT

دانشکده فیزیک
DEGREE
Master of Science (MSc)
YEAR
1386

TITLE

Detecting Overlapping Community Structures in Complex Networks Using NMF Method
Networks are known to be suitable representations of many complex systems. The first idea of networking was taken from graph theory. Many real-world networks have nonhomogeneous structures and contain sets of densely interconnected substructures called communities which play functional role in the original system. Community is a qualitative concept. Therefore it has no deterministic definition. Detecting community structure is important because it will give knowledge of the structural topology of networks. A lot of algorithms have been introduced to identify communities. The new algorithm which is presented in the thesis, is based on Non-negative Matrix Factorization method. In fact, one of the non-negative graph matrices of network will be chosen as the feature matrix, V, of the NMF method and will be factorized into multiplication of two non-negative matrices W, H. This factorization is a representation of the dataset in a new reduced dimension space. Matrices W and H are being initially selected randomly. Iterative assignment of these matrices will be done on the basis of two update rules which finally leads to the convergence of WH to V. For a network, each column of W corresponds to one community and the components of the weight vector indicate the degree of dependence of each node to every community. We applied our algorithm to a variety of real-world and computer-generated networks whose community structure have been already known or investigated by others before. Our method leads to detection of overlapping community structure of networks. We introduced a new feature matrix called Vertex-Vertex correlation Matrix . Using this matrix makes our algorithm less sensitive to different initializations than previous existing matrices which have been used in NMF based algorithms and gives more accurate results in various data bases. In addition, this feature matrix gives a new definition of community which is reasonable in many cases. Key Words Network, Community, NMF method, Vertex-Vertex Correlation Matrix.
شبکه‌ها، به عنوان نمایشی مناسب از سیستم ‌های پیچیده شناخته شده‌اند که ایده‌ی اولیه‌ی آن‌ها از نظریه‌ی گراف گرفته شده است. بسیاری از شبکه‌های موجود در جهان واقعی، دارای ساختار‌هایی ناهمگن هستند و شامل مجموعه‌ای از زیرساختار‌های با اتصالات داخلی بسیار به نام همایه می‌باشند که نقش عملیاتی را در سیستم اولیه بازی می‌کنند. همایه، یک مفهوم کیفی است و تاکنون هیچ تعریف همه‌پسندی برای آن ارائه نشده است. شناخت ساختار همایه از این جهت مهم است که منجر به شناخت ساختار توپولوژی شبکه‌ها می‌شود. روش‌های بسیاری تاکنون برای شناسایی همایه‌ها معرفی شده‌اند. روش جدیدی که در این پایان‌نامه به آن اشاره شده است، بر پایه‌ی فاکتوریزه‌سازی ماتریس نامنفی (NMF) بنا شده است. در واقع، یکی از ماتریس‌های نامنفی شبکه به‌عنوان ماتریس مشخصه، V، در این الگوریتم به کار می‌رود و به حاصل‌ضرب دو ماتریس نامنفی، W و H، فاکتوریزه می‌شود. این فاکتوریزه‌سازی، نمایشی از مجموعه داده‌ها در یک فضای با ابعاد کاهش یافته است. ماتریس‌های W و H در مرحله‌ی نخست به صورت تصادفی انتخاب می‌شوند. گزینش متوالی این ماتریس‌ها براساس دو قانون به‌روز‌رسانی صورت می‌گیرد که در نهایت، منجر به همگرایی حاصل‌ضرب WH به ماتریس اولیه می‌شود. در یک شبکه، هر ستون W معادل با یک همایه است و مؤلفه‌های بردار وزن، میزان تعلق هر رأس را به تمامی همایه‌ها نشان می‌دهند. این الگوریتم را برای مجموعه‌ای از شبکه‌های موجود در جهان واقعی و شبکه‌های دست‌ساز به‌کار بردیم که ساختار همایه‌های آن‌ها برای ما از قبل شناخته شده بود یا قبلاً توسط دیگران بررسی شده بود. روش ما منجر به شناسایی ساختار همایه‌های با هم‌پوشانی در شبکه‌ها می‌شود. ماتریس مشخصه‌ی جدیدی را به نام ماتریس همبستگی میان رئوس معرفی کردیم. با کاربرد این ماتریس در روش ما، حساسیت‌های موجود در الگوریتم نسبت به مقادیر اولیه‌ی متفاوت که تاکنون در روش NMF به کار می‌رفت، بسیار کاهش می‌یابد و منجر به نتایج دقیق‌تری در مجموعه داده‌ای متفاوت می‌شود. به‌علاوه، این ماتریس مشخصه، منجر به پیدایش تعریف جدیدی برای همایه می‌شود که در بسیاری موارد معقول به نظر می‌رسد.‌

ارتقاء امنیت وب با وف بومی