Internet作为信息传播的主要载体,在政治、经济、教育乃至日常生活等方面发挥着重要作用.近年来,Internet的安全性、鲁棒性、可控性和可管性等问题正逐渐受到人们的关注.而以上问题的解决,都离不开对其拓扑结构的研究.
当前,在Internet拓扑分析方面已经取得了一些成果[1-3],这些工作主要集中在网络拓扑的全局层面上.面对规模呈指数型增长的Internet,单纯从全局角度进行研究往往是事倍功半的.为了迎合大规模拓扑环境下的新需求,寻找新的研究角度成为当务之急.而将分形理论应用到Internet拓扑研究,成为一种新的尝试[4].
分形简单来说是“组成部分以某种方式与整体相似的图形”,图 1就是一个分形.在图 1中,不同观测尺度(矩形框)下观测到的部分子集,其结构都与整体保持一致,这种部分与整体的一致性被称作自相似性.
如式(1)所示,在分形理论中,若覆盖研究对象所需最小盒子数NB和盒子的尺度lB具有幂律关系,则说明其具有分形特征.其中dB为分形维数,dB越大,研究对象越复杂,其内部规律性越不明显.
(1) |
分形理论打破了整体与部分之间的隔膜,找到了由部分过渡到整体的媒介--自相似性,可以有效降低研究对象的复杂性.2005年,Song等[5]提出了广义盒子计数法,第一次将分形理论应用到网络对象拓扑分析中.随后,Song等[6]又提出了燃烧算法,Schneider等[7]提升了算法的效率,Kim等[8]提出了随机序列算法,Gao等[9]提出了球覆盖算法.
以上算法均为普适性方法,研究过程中所有节点的地位都是一致的,并不适宜研究Internet这种核心层和边缘层节点存在较大差异的网络.为此本文采用k-核分解算法[4]对Internet的分形特征进行了研究,该方法可以更准确地反映Internet内部的结构特征,并有助于研究其结构的规律性.在研究过程中,本文提出Internet具有层次分形特征的猜想,并在验证猜想的同时,从统计角度观察了Internet部分与整体、部分与部分之间的关系.
1 基于k-核分解的分形研究方法 1.1 k-核分解算法k-核分解算法[4]源于求解k-核,网络的k-核是指反复去掉度值小于k的节点后,所余的最大子图.k-核分解算法选择节点核数ks作为度量尺度lB,选择ks-核的节点数Ns(ks)作为NB,如式(2)所示,若ks与Ns(ks)服从幂律,则认为研究对象具有分形特征.
(2) |
其中ds为分形维数,由式(2)等价有
(3) |
即可以通过统计不同核数下的节点数,并在双对数坐标系下进行直线拟合,通过计算拟合直线斜率绝对值的方式获得分形维数,如图 2和图 3所示.
k-核分解过程逐步删除了网络中小度值节点,换个角度来看,可以认为所有度值小的节点都被与其连通的大度值节点所吸收,求解k-核的过程实际上是研究Internet更深层结构的过程.
1.2 问题分析图 2和图 3分别统计了k2至k15和k15至k26两个区间上的数据,并对统计结果在双对数坐标系下进行了线性拟合.实验数据采用CAIDA Archipelago项目2014年12月第5个探测周期的探测结果,实验数据包含84.5万个节点、219.5万条边.
观察拟合直线的斜率可以发现,在k-核分解过程中,随着核数的升高,其前后两个子集对应节点数的下降速率有着显著不同.对应的分形维数分别为1.43和3.27,后者是前者的2.28倍,即整个k-核分解过程并不具有一致性.针对这一现象,有学者认为:“任意一个实际存在的复杂系统,都仅存在有限层次的分形特征,当研究层次深入到一定程度时,研究对象将不再表现出分形特征.”以上解释为针对网络对象的普适性结论,结合Internet自身结构特征,以下解释更为合理.
图 4给出了Internet结构示意图[10],由图可知,Internet具有三级层次结构,分别是核心骨干网(简记为核心层)、边缘ISP (简记为边缘层)和用户终端.Internet的边缘层和核心层各自具有统一网络结构,核心层结构类似于全局耦合网络,节点度值较大;边缘层呈类树形结构,节点度值相对较小.在图 2对应的k-核分解过程中,由于核数较低,核心层节点所占比例较小,因此主要反映Internet的边缘层特征.随着核数的升高,整个过程逐渐逼近网络核心,因而图 3反映的是Internet核心层特征.而图 2和图 3的差异恰恰说明了Internet核心层和边缘层之间的差异.
经过以上实验和分析,本文猜测,Internet可能具有层次分形特征,其核心层和边缘层具有完全不同的结构,具有不同的分形维数.
2 面向分形特征的拓扑分割为了验证1.2节猜想,需要区分Internet的核心层和边缘层,再分别进行研究.鉴于k-核分解过程恰好是从Internet边缘层向核心层逼近的过程,因此可以从该过程入手,寻找合适的ks作为分割边界.
2.1 基于“核心-边缘”的Internet拓扑分割k-核分解通过删边,由边缘层逼近核心层,因此不妨观察k-核分解过程中的删边情况.图 5中纵坐标为删边数N,实验数据同前.
如图 5所示,随着层次的深入,删边数呈下降趋势.当ks较小时,边缘层节点在网络中占主体地位,该层主要为类树形结构,存在大量小度值节点,因而在图像前半部分有大量的边被删除.在图像后半部分,从ks=11开始,删边数开始呈现出不规则趋势.本文认为这种不规律性恰好是对Internet核心层结构性质的反映,其原因在于Internet核心层除了平均度较高外,并不具有其他性质.由此猜测,核心层和边缘层的边界可能在ks=11左右出现.
图 6给出了k-核分解过程中删边数占当前总体的比例,实验数据同前文.图 6可以在ks=11处分为特征鲜明的两个部分.在前半部分,随着ks上升,对应比例呈下降趋势.即随着层次的深入,需要删除的节点逐渐减少;在后半部分,随着ks升高,对应比例呈现出不规律性,即每次需删除的节点数不具有规律性.由此可知,k-核分解在前半部分主要是对边缘层进行研究,而后半部分则是观测核心层性质,以上结论都与图 5的观测结果保持一致.
图 7为网络总体去掉k-核分解生成的ks-核后,生成的子网数.图中横坐标为核数ks,纵坐标为子网个数,实验数据同前文.由图 4可知,Internet核心层节点相互连接,而边缘层往往仅同其上层和下层节点相连,因此在去掉网络核心后,会生成大量相互独立的边缘子网,子网数与去掉的ks-核直接相关.在图 7中,当ks取较大值时(ks∈[15,26]),子网数相对稳定.这说明有一部分核心层节点没有被删除,正是这部分核心层节点保证了剩余部分的连通性,使得子网数稳定在一个较低值.由此可知,分割边界在ks=15前出现.图中ks=2似乎是一个异常点,结合k-核定义可以发现,Internet的2-核涵盖了网络中的大部分节点,因此在该点子网数很少.
由以上分析可知,Internet核心层和边缘层的分割边界在ks=11左右,即ks∈[10,12],并在ks=15之前出现.为了简化计算,本文选择ks=11作为分割边界,进行后续实验.
2.2 分割合理性验证2.1节根据观察结果用Internet的11-核表征Internet核心层,用余下边缘子网表征Internet边缘层.下面研究分割合理性.
在研究过程中,本文借用了Kim等[11]有关骨架树的相关研究成果.Kim等将网络的介数作为对应边的权值,将原网络转化为一个加权无向图,并计算其权值和最小的生成树,求得的生成树即为该网络的骨架树.研究发现,一些分形网络的分形维数与其骨架树的分形维数相同,而另一些分形网络则不具备该性质,该现象同分形网络结构的差异性有关.
图 8和图 9分别对Internet核心层、边缘层最大子网和对应骨架树的分形维数进行了计算.在计算过程中,由于骨架树结构的特殊性,本文选择另一种常见算法--随机序列算法[8]计算分形维数,本次实验中采用的实验数据同前文.
由图 8和图 9可知,Internet核心层和边缘层都具有分形特征,且两者的分形维数具有较大差异,这说明两者的复杂程度和规律性并不相同.此外,Internet核心层与其骨架树的分形维数不具有一致性,Internet边缘层子网与其骨架树的分形维数具有一致性,Internet的核心层和边缘层为两种完全不同的结构.
由以上分析可知,猜想成立,Internet的核心层和边缘层各自具有分形特征,但两者的复杂程度、内部的规律性和组织结构均存在较大差异,即Internet具有层次分形特征.
3 基于“核心-边缘”分割的分形研究从度分布指数、同配系数和结构熵三个统计角度对Internet的层次分形特征进行了观察.实验采用CAIDA Archipelago项目2010年至2014年每年6月和12月第5次探测的探测数据.
图 10为Internet整体、核心、最大边缘子网(子网A)和随机子网(子网B)在10个时间点上的度分布指数.其中子网B在规模最大的100个边缘子网中随机选择.观察发现,在度分布指数方面,Internet核心和边缘子网均可表征整体性质.此外,Internet核心和边缘子网可以相互表征.
图 11展示了Internet整体、核心、子网A和子网B的同配系数波动情况.在同配系数方面,边缘子网可以表征整体性质,而核心则与整体存在较大差异.同时,边缘子网可以相互表征.
图 12分别展示了Internet整体、核心、子网A和子网B的结构熵.与图 11类似,在结构熵方面,Internet边缘子网可以表征整体性质,而核心则不能表征.此外,边缘子网可以相互表征.
研究发现因特网具有层次分形特征.Internet的核心层与边缘层具有完全不同的组织结构、复杂程度和规律性,对应的分形维数也存在较大差异.值得注意的是,Internet虽然并非具有单一分形特征,在度分布指数、同配系数和结构熵等方面,其边缘子网仍可表征整体性质.与之对应,网络核心在度分布指数方面与整体具有一致性,在其他统计角度则不具备该性质.此外,在以上三个统计角度,Internet的边缘子网均可以相互表征.
[1] | Jun A, Hai Z, Carley K M, et al. Evolution of IPv6 Internet topology with unusual sudden changes[J]. Chinese Physics B , 2013, 22 (7) : 078902. DOI:10.1088/1674-1056/22/7/078902 |
[2] | Wang X, Loguinov D. Understanding and modeling the Internet topology:economics and evolution perspective[J]. IEEE/ACM Transactions on Networking , 2010, 18 (1) : 257–270. DOI:10.1109/TNET.2009.2024145 |
[3] | Siganos V, Faloutsos M, Faloutsos P, et al. Power laws and the AS-level Internet topology[J]. IEEE/ACM Transactions on Networking , 2003, 11 (4) : 514–524. DOI:10.1109/TNET.2003.815300 |
[4] |
关世杰, 赵海.
互联网中路由级和IP级拓扑分形特征分析[J]. 通信学报 , 2013, 34 (11) : 162–170.
( Guan Shi-jie, Zhao Hai. Analysis of fractal characterisitic of internet router-level and IP-level topology[J]. Journal of Communications , 2013, 34 (11) : 162–170. ) |
[5] | Song C, Havlin S, Makes H A. Self-similarity of complex networks[J]. Nature , 2005, 433 (7023) : 392–395. |
[6] | Song C, Lazaros K G, Havlin H A. How to calculate the fractal dimension of a complex network:the box covering algorithm[J]. Journal of Statistical Mechanics:Theory and Experiment , 2007, 3 (3) : 1742–5468. |
[7] | Schneider C M, Kesselring T A, Andrade Jr J S, et al. Box-covering algorithm for fractal dimension of complex networks[J]. Physical Review E , 2012, 86 (1) : 016707. DOI:10.1103/PhysRevE.86.016707 |
[8] | Kim J S, Goh K I, Kahng B, et al. Fractality and self-similarity in scale-free networks[J]. New Journal of Physics , 2007, 9 (6) : 177. DOI:10.1088/1367-2630/9/6/177 |
[9] | Gao L, Hu Y, Di Z. Accuracy of the boll-covering approach for fractal dimensions of complex networks and a rank-driven algorithm[J]. Physical Review E , 2008, 78 (4) : 046109. DOI:10.1103/PhysRevE.78.046109 |
[10] | Newman M E J. Networks:an introduction[M]. New York: Oxford University Press, 2010 : 23 -25. |
[11] | Kim D H, Noh J D, Jeong H. Scale-free trees:the skeletons of complex networks[J]. Physical Review E , 2004, 70 (4) : 046126. DOI:10.1103/PhysRevE.70.046126 |