2. 天津市智能机器人重点实验室,天津 300350
2. Key Laboratory of Intelligent Robotics of Tianjin, Tianjin 300350, China
现代社会中的信息呈爆炸式增长,使得社会系统极具复杂性。研究表明,各种系统之间的交互信息可以通过对应的复杂网络表示,其中,网络中的节点代表系统中的个体,连边代表个体之间的关系[1]。网络科学是专门用于研究各种复杂网络系统的定性和定量规律的一门交叉学科[2]。然而,由于隐私政策和个体设置等原因,实际获取的网络连边信息往往是不完整的,加大了网络科学研究的难度。链路预测能够对缺失信息进行还原和预测,是网络科学研究的有力辅助工具,具有重要的理论研究和实际应用价值。一方面,链路预测可以帮助人们理解各种复杂网络的演化机制[3-4],为不同演化模型的优劣比较提供统一平台;另一方面,链路预测的结果可以指导生物网络中的实验,降低实验成本并提高准确率,还可以建立网络中的推荐系统[5]。
网络中的链路预测,是指如何根据网络中已知的节点和结构信息,预测网络中尚未产生连边的两个节点之间产生连接的可能性[6],包括未来链接和未知链接的预测,常用的方法可分为两大类:基于相似性的方法和智能方法。
基于相似性方法的一个基本假设是:两个节点越相似,在未来连接的可能性越大,而节点的相似程度可通过相似性指标量化,即根据相似性指标计算相似性得分,得分越高,两个节点越相似。已有相似性指标可分为三大类:基于节点局部信息的方法,如共同邻居(CN)[7]、Adamic-Adar(AA)[8]和资源分配(RA)[9]指标等;基于全局路径的方法,如Katz[7]和局部路径(LP)[9]等;基于随机游走的方法[10]。
上述方法中,基于节点局部信息的方法运算复杂度最低,且预测准确度较高,因此常被用作基准指标。吕琳媛等[11]对几种基准指标的研究发现,无论是否加权,RA均表现最好,且无权指标的性能均优于加权指标。由此得出:复杂网络中的弱连接不容忽视,强调弱连接的贡献可以极大提高预测准确度。此外,作者意识到这些指标存在共同缺点,即认为所有共同邻居对于节点对的贡献相同。为此,Liu等[12]假设每个共同邻居的贡献不同,有些促进链接的产生,有些则抑制,因此共同邻居数量相同的节点对产生链接的概率可能不同。然后将朴素贝叶斯理论应用到链路预测中,提出了局部朴素贝叶斯(LNB)模型。最近,Valverde-Rebaza等[13]认为每个用户可能同时属于多个社团,且扮演角色不同,预测时应充分考虑用户所属的所有社团信息。基于此思想,Valverde-Rebaza在文献[14]中提出了基于重叠组的朴素贝叶斯(GNB)链路预测模型。此外,考虑到共同邻居之间并非完全相互独立,文献[15]使用互信息量化共同邻居的相关性,对LNB进行推广,提出了广义的树增广朴素贝叶斯(TAN)概率模型,并扩展到了CN、AA和RA指标,在运行效率和有效性等方面均优于基准方法。然而,上述方法仅考虑了共同邻居的作用,忽略了节点自身的影响。闫玲玲等[16]提出了一种基于度和聚类系数的新指标,对中国航空网络中的节点重要性进行分析。Pujari等[17]认为节点对的每个属性代表不同信息,可以将所有属性对应特征进行加权整合以提高预测性能。Li等[18]以新浪微博为研究对象,根据其自身特点提出了包含用户临近特征、属性特征和拓扑特征的特征集用于预测。但这些方法仅考虑了节点自身作用,忽略了共同邻居的影响。
为解决上述问题,本文基于局部朴素贝叶斯(LNB)模型提出了融合朴素贝叶斯(syncretic naive Bayes,SNB)模型。本文的主要贡献如下。1)认为链接的产生受到内部和外部两方面因素的影响。其中,节点对自身特点属于内部影响,可以通过节点度量化;共同邻居的作用属于外部影响,可以通过LNB模型量化,将两者结合提出一个新模型。2)模型的优劣不仅体现在其自身的预测精确度上,还体现在它与其他思想的融合效果上,后者可以通过其在基准指标推广后的预测精确度定性描述。因此,文中将SNB推广到CN、AA和RA形式,说明其具有普适性。
近些年,智能方法受到广泛关注。已有研究包括支持向量机[19]、BP神经网络[20-21]、3层隐含的贝叶斯(3-HBP)链路预测模型[22]、最大熵模型[23]以及可变贝叶斯概率矩阵分解模型[24]等。与直接给节点对分配相似性得分不同,这些方法都是通过学习已知知识建立模型进行预测,是将来的研究重点。
1 预备知识本部分首先给出了链路预测的概念,然后介绍了本文的理论基础——朴素贝叶斯理论,接着阐述了一些常用的基准指标,最后简要介绍了局部朴素贝叶斯(LNB)链路预测模型。
1.1 问题描述一个无权无向的网络图可表示为
通常,按照某种比例
朴素贝叶斯分类器简单易懂,受到了众多学者的青睐。假设
$\begin{array}{c} P(C|{{X}}) = P(C|{X_1},{X_2}, \cdots ,{X_n}) = \\ \displaystyle\frac{{P(C) \cdot P({X_1},{X_2}, \cdots ,{X_n}|C)}}{{P({X_1},{X_2}, \cdots ,{X_n})}} \end{array}$ | (1) |
朴素贝叶斯的基本假设是:当类变量
$P({X_1},{X_2}, \cdots ,{X_n}|C) = \prod\limits_{i = 1}^n {P({X_i}|C)} {\rm{ }}$ | (2) |
将式(2)代入式(1)可得
$P(C|{{X}}) = \frac{{P(C) \cdot \prod\limits_{i = 1}^n {P({X_i}|C)} }}{{P({X_1},{X_2}, \cdots ,{X_n})}}$ |
1) 共同邻居指标(CN)
通常认为,共同邻居越多,节点对越相似。CN指标通过直接计算共同邻居数目来量化节点对的相似性[7],定义如下:
$s_{xy}^{\rm{CN}} = |N(x) \cap N(y)| = |N(x,y)|$ |
2) Adamic-Adar指标(AA)
AA指标[8]以CN指标为基础,认为度越大的共同邻居对于节点对的贡献越小。因此,可以通过惩罚度大的邻居节点提高预测准确度,其定义为
$s_{xy}^{\rm{AA}} = \sum\limits_{{\textit{z}} \in N(x,y)} {\frac{1}{{\log {k_{\textit{z}}}}}} $ |
式中
3) 资源分配指标(RA)
受到资源分配动力学的启发,RA指标[9]根据资源在节点间的传递情况,结合惩罚大度节点的思想,定义了节点对的相似性:
$s_{xy}^{\rm{RA}} = \sum\limits_{{\textit{z}} \in N(x,y)} {\frac{1}{{{k_{\textit{z}}}}}} {\rm{ }}$ |
LNB模型[11]假设节点
$P({e_{xy}}|N(x,y)) = \frac{{P({e_{xy}}) \cdot P(N(x,y)|{e_{xy}})}}{{P(N(x,y))}}$ | (3) |
$P(\overline {{e_{xy}}} |N(x,y)) = \frac{{P(\overline {{e_{xy}}} ) \cdot P(N(x,y)|\overline {{e_{xy}}} )}}{{P(N(x,y))}}$ | (4) |
其中,
$P(N(x,y)|{e_{xy}}) = \prod\limits_{{\textit{z}} \in N(x,y)} {P({\textit{z}}|{e_{xy}})} {\rm{ }}$ | (5) |
$P(N(x,y)|\overline {{e_{xy}}} ) = \prod\limits_{{\textit{z}} \in N(x,y)} {P({\textit{z}}|\overline {{e_{xy}}} )} $ | (6) |
将式(5)和式(6)分别代入式(3)和式(4),然后两式相除,得:
$r_{xy}^{\rm{LNBCN}} = \underbrace {\frac{{P({e_{xy}})}}{{P(\overline {{e_{xy}}} )}} \cdot \prod\limits_{{\textit{z}} \in N(x,y)} {\frac{{P(\overline {{e_{xy}}} )}}{{P({e_{xy}})}}} }_{{\rm{constant \; value }}}{\rm{ }} \cdot \underbrace {\prod\limits_{{\textit{z}} \in N(x,y)} {\frac{{P({e_{xy}}|{\textit{z}})}}{{P(\overline {{e_{xy}}} |{\textit{z}})}}} {\rm{ }}}_{{\rm{role \; of \; }} {\rm{node \; {\textit{z}}}}}$ | (7) |
式中
$P({e_{xy}}) = \frac{{|{E^T}|}}{{|A|}}$ |
$P(\overline {{e_{xy}}} ) = \frac{{|A| - |{E^T}|}}{{|A|}}$ |
显然,
$P({e_{xy}}|{\textit{z}}) = {c_{\textit{z}}} = \frac{{2T({\textit{z}})}}{{{k_{\textit{z}}} \cdot ({k_{\textit{z}}} - 1)}}$ | (8) |
$P(\overline {{e_{xy}}} |{\textit{z}}) = 1 - {c_{\textit{z}}}$ | (9) |
式中
$s_{xy}^{{\rm{LNBCN}}} = \sum\limits_{{\textit{z}} \in N(x,y)} {(\log s + \log {R_{\textit{z}}})} $ |
将其推广可得:
$s_{xy}^{{\rm{LNBAA}}} = \sum\limits_{{\textit{z}} \in N(x,y)} {\frac{1}{{\log {k_{\textit{z}}}}}} (\log s + \log {R_{\textit{z}}})$ |
$s_{xy}^{{\rm{LNBRA}}} = \sum\limits_{{\textit{z}} \in N(x,y)} {\frac{1}{{{k_{\textit{z}}}}}} (\log s + \log {R_{\textit{z}}})$ |
在介绍SNB模型之前,首先考虑一个问题,节点之间链接的产生到底与什么因素有关?图1给出了3种不同的思路。
Download:
|
|
最简单的一种思路是:两节点的共同邻居数目越多,它们的兴趣属性等越接近,未来越有可能产生链接,这便是图1(a)中CNs指标的主要思想。因此,图中节点
在CNs的基础上,有学者指出,每个共同邻居扮演角色不同,对于节点对产生链接的贡献不同,因此不能通过简单计算共同邻居的数目得到相似性,而应该累加共同邻居的贡献以得到最终的相似性分数。按照此思想,图1(b)中节点
实际生活中,节点间链接的产生不仅受到共同邻居的影响,与其自身的活跃程度也是密不可分的。在共同邻居数目相等的条件下,节点倾向于和更活跃的个体产生链接;当共同邻居数目不等时,如图1(c)中,节点
本文认为,节点
在SNB模型下,节点
$\begin{array}{c} P({e_{xy}}|N(x,y),{k_x},{k_y}) = \\ \displaystyle\frac{{P({e_{xy}}) \cdot P(N(x,y),{k_x},{k_y}|{e_{xy}})}}{{P(N(x,y),{k_x},{k_y})}} \end{array}$ | (10) |
$\begin{array}{c} P(\overline {{e_{xy}}} |N(x,y),{k_x},{k_y}) = \\ \displaystyle\frac{{P(\overline {{e_{xy}}} ) \cdot P(N(x,y),{k_x},{k_y}|\overline {{e_{xy}}} )}}{{P(N(x,y),{k_x},{k_y})}} \end{array}$ | (11) |
由概率论相关知识,可得:
$\begin{array}{c} P(N(x,y),{k_x},{k_y}|{e_{xy}}) = \\ P(N(x,y)|{e_{xy}}) \cdot P({k_x}|{e_{xy}},N(x,y)) \cdot \\ P({k_y}|{e_{xy}},N(x,y),{k_x}) \end{array}$ | (12) |
$\begin{array}{c} P(N(x,y),{k_x},{k_y}|\overline {{e_{xy}}} ) = \\ P(N(x,y)|\overline {{e_{xy}}} ) \cdot P({k_x}|\overline {{e_{xy}}} ,N(x,y)) \cdot \\ P({k_y}|\overline {{e_{xy}}} ,N(x,y),{k_x}) \end{array}$ | (13) |
将式(12)和式(13)分别代入式(10)和式(11),可得:
$\begin{array}{c} r_{x,y}^{{\rm{SNBCN}}} = \displaystyle\frac{{P({e_{xy}}|N(x,y),{k_x},{k_y})}}{{P(\overline {{e_{xy}}} |N(x,y),{k_x},{k_y})}}{\rm{ = }}\\ \underbrace {\frac{{P({e_{xy}})}}{{P(\overline {{e_{xy}}} )}} \cdot \frac{{P(N(x,y)|{e_{xy}})}}{{P(N(x,y)|\overline {{e_{xy}}} )}}}_{{\rm{LNBCN}}} \cdot \underbrace {\frac{{P({k_x}|{e_{xy}},N(x,y))}}{{P({k_x}|\overline {{e_{xy}}} ,N(x,y))}}}_{{\rm{influence}}\;{\rm{of}}\;{\rm{node}}\;x} \cdot \\ \underbrace {\frac{{P({k_y}|{e_{xy}},N(x,y),{k_x})}}{{P({k_y}|\overline {{e_{xy}}} ,N(x,y),{k_x})}}}_{{\rm{influence}}\;{\rm{of}}\;{\rm{node}}\;y}{\rm{ }} \end{array}$ | (14) |
由式(14)可知,
Download:
|
|
首先考虑式(14)中的第2项,即节点
$P({k_x}|{e_{xy}},N(x,y)) = C_{m - n - 2}^{{k_x} - n - 1} $ | (15) |
同理可得:
$P({k_x}|\overline {{e_{xy}}} ,N(x,y)) = C_{m - n - 2}^{{k_x} - n}$ | (16) |
然后考虑式(14)的第3项,即节点
$P({k_y}|{e_{xy}},N(x,y),{k_x}) = C_{m - {k_x} - 1}^{{k_y} - n - 1}$ | (17) |
同理,当节点
$P({k_y}|\overline {{e_{xy}}} ,N(x,y),{k_x}) = C_{m - {k_x} - 2}^{{k_y} - n}$ | (18) |
将式(7),式(15)~(18)代入式(14),可得:
$\begin{array}{c} r_{xy}^{{\rm{SNBCN}}} = \underbrace {\frac{{P({e_{xy}})}}{{P(\overline {{e_{xy}}} )}} \cdot \prod\limits_{{\textit{z}} \in N(x,y)} {\frac{{P(\overline {{e_{xy}}} )}}{{P({e_{xy}})}}} }_{{\rm{constant}}\;{\rm{value}}} \cdot \\ \underbrace {\prod\limits_{{\textit{z}} \in N(x,y)} {\frac{{P({e_{xy}}|{\textit{z}})}}{{P(\overline {{e_{xy}}} |{\textit{z}})}}} }_{R{\textit{z}}} \cdot \underbrace {\frac{{C_{m - n - 2}^{{k_x} - n - 1}}}{{C_{m - n - 2}^{{k_x} - n}}}}_{Rx} \cdot \underbrace {\frac{{C_{m - {k_x} - 1}^{{k_y} - n - 1}}}{{C_{m - {k_x} - 2}^{{k_y} - n}}}}_{Ry} \end{array}$ | (19) |
忽略常数
$s_{xy}^{{\rm{SNBCN}}} = \sum\limits_{{\textit{z}} \in N(x,y)} {(\log s + \log {R_{\textit{z}}})} + \log {R_x} + \log {R_y}$ |
受LNB模型的启发,本文将SNBCN推广到了AA和RA形式,以证明所提SNB模型的有效性。可以得到:
$\begin{array}{c} s_{xy}^{{\rm{SNBAA}}} = \displaystyle\sum\limits_{{\textit{z}} \in N(x,y)} {\displaystyle\frac{1}{{\log {k_{\textit{z}}}}}(\log s + \log {R_{\textit{z}}})} + \\ \displaystyle\frac{{\log {R_x}}}{{\log {k_x}}} + \frac{{\log {R_y}}}{{\log {k_y}}} \end{array}$ |
$\begin{array}{c} s_{xy}^{{\rm{SNBRA}}} = \displaystyle\sum\limits_{{\textit{z}} \in N(x,y)} {\displaystyle\frac{1}{{{k_{\textit{z}}}}}(\log s + \log {R_{\textit{z}}})} + \\ \displaystyle\frac{{\log {R_x}}}{{{k_x}}} + \frac{{\log {R_y}}}{{{k_y}}} \end{array}$ |
显然,当节点
所提SNB模型的有效性需要实验的验证,为此,本文将从以下几个方面做详细介绍。
3.1 数据集本文采用的数据集为美国航空网络(USAir),包含332个机场和2 126条航线。网络的聚类系数
1) 基准方法
为方便评判SNB模型的性能优劣,本文采用CN、AA和RA(记为CNs)与LNBCN、LNBAA和LNBRA(记为LNBs)等作为基准指标。由于CNs和LNBs指标在前文已作介绍,此处不再赘述。
2) 评价指标
链路预测算法多种多样,需要统一的评价指标对其进行性能优劣比较,本文选用AUC和精确度量化算法的准确度。
AUC (area under the receiver operating characteristic curve)表示随机从测试集
$AUC = \frac{{{n'} + 0.5{n{''}}}}{n}$ |
精确度(precision)表示前
${\rm{Precision}} = \frac{m}{L}$ |
本实验中设置
本实验中训练集与测试集的划分比例为9∶1。由于网络中存在数据类别不平衡问题,即已知连边与不存在连边的数目相差很大,直接采取随机采样方式会严重影响预测效果。为此,本实验采用了分层采样,在保证训练集与测试集中存在边和不存在边的比例与原网络相同的条件下,随机划分数据集。另外,为消除随机误差的影响,实验中采用了10折交叉验证方法,且重复10次后取平均值作为最终结果。
3.4 实验结果与分析本部分通过两方面内容评估SNB模型的性能:与基准指标的预测结果比较;当训练集大小发生变化时,预测结果的变化情况。
3.4.1 不同方法性能比较当按照9∶1的比例划分训练集与测试集时,在USAir网络得到的预测结果如表1所示。可以看出:
1) SNBs的AUC值最高,LNBs和CNs次之。说明SNBs模型整体的预测准确度最高。
2) SNBs比LNBs的AUC值高,说明与单独考虑共同邻居相比,将共同邻居与节点自身综合考虑效果更好。
3) SNBs系列指标中,SNBRA的AUC值最高,SNBAA次之,之后是SNBCN,LNBs系列指标也有类似规律,这与之前的认识相符,即RA指标预测效果优于AA指标,AA指标预测效果优于CN指标,说明惩罚大度节点确实可以提高预测准确度,证实了文献[11]中的结论。
4) SNBCN相对于LNBCN和CN的AUC的提高幅度最大,SNBAA次之,接着是SNBRA。究其原因,一方面是因为预测效果越差的指标越容易提高,另一方面是因为直接计算共同邻居的贡献时,节点自身的影响是最大的,不容忽视。且节点的度越大,越倾向于形成链接,符合优先连接原则,因此考虑节点度的影响可以极大地提高准确度。而SNBAA和SNBRA认为,度越大的节点贡献越小,这与优先连接思想相悖,相当于将节点度对其自身的影响中和掉了一部分,导致AUC提高的幅度变小。
5) 对于精确度值,SNBs整体上与LNBs和CNs相差不大,甚至有所下降,可能是因为在预测的前100条边中,节点受其自身度的影响不大。
综上,可以得到如下结论:
1) SNBs的AUC值较LNBs和CNs明显提高,说明SNB模型倾向于赋予预测集中的链接更高的分数,即整体上SNBs能够更好地将测试集中的边与不存在的边区分开。
2) 3种方法的精确度变化不明显,说明三者对测试集中边的排序位置相差不大。
3) SNBs能够在基本保证前100条边中预测准确率一定的条件下,将更多地测试链接识别出来,证明了其有效性。
3.4.2 预测效果随训练集大小的变化情况本实验中,训练集比例从0.6开始,步长为0.1,直到比例达到0.9,得到的CNs, LNBs, SNBs的AUC和精确度随训练集大小变化情况如图3和4所示。
Download:
|
|
Download:
|
|
图3(a)中,SNBCN的AUC值始终高于LNBCN和CN,证明了SNB模型的高效性;图3(b)和(c)的变化趋势相似,当训练集比例较小时,SNBRA和SNBAA的AUC值均最低,随着训练集的增大,SNBs与其他指标的差距逐渐减小,并在训练集比例为0.9时超过其他指标,说明SNB模型在训练集比例为0.9时的总体预测准确度最高。
图4(a)和图4(b)具有一致的变化趋势,即SNBs的精确度略低于LNBs和CNs指标,而图4(c)中SNBRA的精确度值一直处于或接近最高值,可能是因为:节点自身影响不能简单地用度进行量化,将节点度与资源分配思想结合可以取得更好的预测性能。
1) 随着训练集比例增大,几种指标的AUC值均呈增长趋势,而精确度值均呈递减趋势,这可能是由于AUC和精确度本身的侧重点不同造成的。其中,AUC侧重于总体的预测准确率,当训练集比较大(已知信息丰富)时,预测缺失边越容易,AUC值越高;精确度侧重于前
2) 当SNB模型的AUC值较低时,精确度值一般最高或接近最高;同理,当其精确度值较低时,AUC值一般最高或接近最高,说明SNB模型的AUC和精确度一定有一个最高值,进一步从侧面印证了SNB模型的有效性。
4 总结与展望近来,有文献指出:社交网络中链接的产生受内部和外部因素的影响。受此思想的启发,本文在局部朴素贝叶斯(LNB)的基础上,结合节点度的自身影响,提出了融合朴素贝叶斯(SNB)模型。该模型易于推广到其他的基于共同邻居的指标形式,如AA和RA具有良好的可扩展性。在美国航空网(USAir)上的实验结果表明:与基准方法相比,提高了链路预测性能,证实了该方法的有效性。由此得出结论:链接的产生不仅受到共同邻居的影响,也受到其自身度的影响,将二者综合考虑更加合理。
未来,将尝试将该思想推广到智能方法做链路预测,如支持向量机、相关向量机等。另外,考虑到本文研究的是无权无向网络,以后可以先在更多不同领域的网络上实现,然后再着眼于加权网络的研究。
[1] | LIU Yangyang, ZHAO Chengli, WANG Xiaojie, et al. The degree-related clustering coefficient and its application to link prediction[J]. Physica A: statistical mechanics and its applications, 2016, 454: 24-33. DOI:10.1016/j.physa.2016.02.014 (0) |
[2] | 何大韧, 刘宗华, 汪秉宏. 复杂系统与复杂网络[M]. 北京: 高等教育出版社, 2009. (0) |
[3] |
刘宏鲲, 吕琳媛, 周涛. 利用链路预测推断网络演化机制[J]. 中国科学, 2011, 41(7): 816-823. LIU Hongkun, LÜ Linyuan, ZHOU Tao. Infer network evolution mechanism by using link prediction[J]. Chinese science, 2011, 41(7): 816-823. (0) |
[4] |
张学龙, 王军进. 链路预测下能源供应链网络合作演化机制研究[J]. 智能系统学报, 2017, 12(2): 221-228. ZHANG Xuelong, WANG Junjin. On the evolution cooperation mechanism of energy supply chain networks under link prediction[J]. CAAI transactions on Intelligent Systems, 2017, 12(2): 221-228. (0) |
[5] | ZHOU Tao, REN Jie, MEDO M, et al. Bipartite network projection and personal recommendation[J]. Physical review e, 2007, 76(4): 046115. DOI:10.1103/PhysRevE.76.046115 (0) |
[6] | LÜ Linyuan, ZHOU Tao. Link prediction in complex networks: a survey[J]. Physica A: statistical mechanics and its applications, 2011, 390(6): 1150-1170. DOI:10.1016/j.physa.2010.11.027 (0) |
[7] | LIBEN-NOWELL D, KLEINBERG J. The link-prediction problem for social networks[J]. Journal of the American society for information science and technology, 2007, 58(7): 1019-1031. DOI:10.1002/(ISSN)1532-2890 (0) |
[8] | ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social networks, 2003, 25(3): 211-230. DOI:10.1016/S0378-8733(03)00009-1 (0) |
[9] | ZHOU Tao, LÜ Linyuan, ZHANG Yicheng. Predicting missing links via local information[J]. The European physical journal B, 2009, 71(4): 623-630. DOI:10.1140/epjb/e2009-00335-8 (0) |
[10] | LIU Weiping, LÜ Linyuan. Link prediction based on local random walk[J]. EPL (europhysics letters), 2010, 89(5): 58007. DOI:10.1209/0295-5075/89/58007 (0) |
[11] | LÜ Linyuan, ZHOU Tao. Link prediction in weighted networks: the role of weak ties[J]. EPL (europhysics letters), 2010, 89(1): 18001. DOI:10.1209/0295-5075/89/18001 (0) |
[12] | LIU Zhen, ZHANG Qianming, LÜ Linyuan, et al. Link prediction in complex networks: a local naïve Bayes model[J]. EPL (europhysics letters), 2011, 96(4): 48007. DOI:10.1209/0295-5075/96/48007 (0) |
[13] | VALVERDE-REBAZA J C, DE ANDRADE LOPES A. Link prediction in online social networks using group information[C]//Proceedings of the 14th International Conference on Computational Science and Its Applications. Guimarães, Portugal, 2014: 31–45. (0) |
[14] | VALVERDE-REBAZA J, VALEJO A, BERTON L, et al. A naïve Bayes model based on overlapping groups for link prediction in online social networks[C]//Proceedings of the 30th Annual ACM Symposium on Applied Computing. Salamanca, Spain, 2015: 1136–1141. (0) |
[15] | WU Jiehua. A generalized tree augmented naive Bayes link prediction model[J]. Journal of computational science, 2018, 27: 206-217. DOI:10.1016/j.jocs.2018.04.006 (0) |
[16] |
闫玲玲, 陈增强, 张青. 基于度和聚类系数的中国航空网络重要性节点分析[J]. 智能系统学报, 2016, 11(5): 586-593. YAN Lingling, CHEN Zengqiang, ZHANG Qing. Analysis of key nodes in China's aviation network based on the degree centrality indicator and clustering coefficient[J]. CAAI transactions on intelligent systems, 2016, 11(5): 586-593. (0) |
[17] | PUJARI M, KANAWATI R. Link prediction in complex networks by supervised rank aggregation[C]//Proceedings of the 2012 IEEE 24th International Conference on Tools with Artificial Intelligence. Athens, Greece, 2012: 782–789. (0) |
[18] | LI Yun, NIU Kai, TIAN Baoyu. Link prediction in Sina Microblog using comprehensive features and improved SVM algorithm[C]//Proceedings of the 2014 IEEE 3rd International Conference on Cloud Computing and Intelligence Systems. Shenzhen, China, 2014: 18–22. (0) |
[19] | YUAN Weiwei, HE Kangya, GUAN Donghai, et al. Graph kernel based link prediction for signed social networks[J]. Information fusion, 2019, 46: 1-10. DOI:10.1016/j.inffus.2018.04.004 (0) |
[20] |
孙诚, 王志海. 社会网络中基于神经网络的链路预测方法[J]. 数学建模及其应用, 2017, 6(4): 10-17. SUN Cheng, WANG Zhihai. The link prediction algorithms based on neural networks in social networks[J]. Mathematical modeling and its applications, 2017, 6(4): 10-17. DOI:10.3969/j.issn.2095-3070.2017.04.002 (0) |
[21] | LI Jichao, ZHAO Danling, GE Bingfeng, et al. A link prediction method for heterogeneous networks based on BP neural network[J]. Physica A: statistical mechanics and its applications, 2018, 495: 1-17. DOI:10.1016/j.physa.2017.12.018 (0) |
[22] | XIAO Yunpeng, LI Xixi, WANG Haohan, et al. 3-HBP: a three-level hidden Bayesian link prediction model in social networks[J]. IEEE transactions on computational social systems, 2018, 5(2): 430-443. DOI:10.1109/TCSS.2018.2812721 (0) |
[23] |
李勇军, 尹超, 于会, 等. 基于最大熵模型的微博传播网络中的链路预测[J]. 物理学报, 2016, 65(2): 31-41. LI Yongjun, YIN Chao, YU Hui, et al. Link prediction in microblog retweet network based on maximum entropy model[J]. Acta physica sinica, 2016, 65(2): 31-41. (0) |
[24] | WANG Yisen, LIU Fangbing, XIA Shutao, et al. Link sign prediction by variational Bayesian probabilistic matrix factorization with student-t prior[J]. Information sciences, 2017, 405: 175-189. DOI:10.1016/j.ins.2017.04.014 (0) |