2. 河北工业大学 河北省大数据计算重点实验室,天津 300401;
3. 天津商业大学 信息工程学院,天津 300134
2. Hebei Province Key Laboratory of Big Data Computing, Tianjin 300401, China;
3. School of Information Engineering, Tianjin University of Commerce, Tianjin 300134, China
近年来随着互联网科技的发展,大数据在促进社会进步的同时,也带来了“信息过载”问题。如何快速从海量数据中获取有价值的信息成为当前大数据发展的关键性问题[1]。为满足人们在大数据中快速获取有价值信息的需求,推荐系统应运而生。推荐系统的目标是根据用户的个性化需求将最符合用户喜好的信息挑选出来并推荐给用户,以减轻用户的选择负担。协同过滤推荐算法是一种目前应用最广泛的推荐算法[2],可以在用户没有明确提出自己需求的情况下,根据用户的行为对用户进行推荐。但由于大数据环境下用户和项目的数量不断增长,协同过滤推荐算法面临着严重的数据稀疏性和可扩展性问题[3]。
针对稀疏性问题,许多学者从不同角度进行了相关研究。SUN等[4]采用聚类和时间影响因子矩阵来监测用户兴趣漂移程度,更准确的预测项目的评分。彭宏伟等[5]提出一种基于矩阵分解的上下文感知POI推荐模型,有效地缓解稀疏性问题。WU等[6]将异构信息网络建模为张量,并提出两种随机梯度下降方法同时进行分解。MA等[7]提出了一种局部概率矩阵分解的方法,降低稀疏性的同时有效地缓解了每个局部模型的过拟合问题。以上的方法均通过缓解数据稀疏性问题来提高推荐的准确度。
针对协同过滤推荐算法在处理大规模数据所遇到的可扩展性问题,许多学者在并行方法上进行了相关研究。杨志文[8]、LU F[9]、KUPISZ[10]等将协同过滤推荐算法部署在Hadoop和Spark并行平台上,取得了良好的执行效率。
本文针对协同过滤推荐算法的数据稀疏性问题和可扩展性问题进行研究。针对稀疏性问题,在皮尔逊相关相似度的基础上引入交占比系数来计算用户的直接相似度,提出了一种基于图游走的协同过滤推荐算法(GW_CF),使用图游走的方法计算用户的间接相似度,然后根据直接相似度和间接相似度重建用户的相似度矩阵,最后进行推荐。在Movielens-100k数据集和IPTV数据集上实验,验证GW_CF在提高推荐准确度上的有效性。针对可扩展性问题,在Spark平台上实现GW_CF算法,并使用Movielens-1M和Movielens-100k数据集进行实验,验证GW_CF算法的可扩展性。
1 相关工作 1.1 问题定义基于近邻的协同过滤问题可以描述为[11]:已知用户集合表示为
用户相似度指用户与用户之间行为中表现出的相似程度,皮尔逊相关相似度是一种常用的计算相似度的方法,反映了两个用户的偏好信息的线性相关程度。用户
${\rm{sim}}(a,b) = \frac{{\sum\limits_{{s_i} \in {s_{ab}}} {\left( {{r_{ai}} - {{\bar{r}_a}} } \right)\left( {{r_{bi}} - {{\bar{r}_b}} } \right)} }}{{\sqrt {\sum\limits_{{s_i} \in {s_{ab}}} {\left( {{r_{ai}} - {{\bar{r}_a}} } \right)} } \sqrt {\sum\limits_{{s_i} \in {s_{ab}}} {\left( {{r_{bi}} - {{\bar{r}_b}} } \right)} } }}$ | (1) |
式中:
近邻用户表示与目标用户偏好信息最相似的一组用户,可以通过式(1)计算用户的相似度,然后计算目标用户的近邻用户。目标用户的多个近邻用户组成目标用户的近邻用户集合,常用的计算近邻用户集合的方法分为两类:基于数量的近邻用户集合和基于阈值的近邻用户集合。
基于阈值的近邻用户集合包含以目标用户为中心,与目标用户的相似度大于Value的用户。基于数量的近邻用户集合包含与目标相似度最大的Top-K个近邻用户。
1.4 个性化推荐首先计算目标用户的近邻用户集合,然后对目标用户进行推荐。目标用户
${r_{ai}} = {{\bar{r}_a}} + \frac{{\sum\limits_{{u_b} \in {N_{{u_a}}}} {{\rm{sim}}\left( {a,b} \right) \times \left( {{r_{bi}} - {{\bar{r}_b}} } \right)} }}{{\sum\limits_{{u_b} \in {N_{{u_a}}}} {{\rm{sim}}\left( {a,b} \right)} }}$ | (2) |
式中:
皮尔逊相关相似度计算方法如式(1),仅仅考虑了用户的共同评分项,而忽视了共同评分项目与每个用户所有评分项的比例关系。这会导致如果两个用户仅有极少数共同评分项目,并且两个用户对共同评分项目的评分极度相似,使用皮尔逊相关相似度计算得到的用户的相似度,远远大于用户的真实相似度,降低了推荐的准确度。例如,用户
${\rm{sim}}(a,b) = \frac{{2 \times \left| {{s_{ab}}} \right|}}{{\left| {{s_a}} \right| + \left| {{s_b}} \right|}} \times \frac{{\sum\limits_{{s_i} \in {s_{ab}}} {\left( {{r_{ai}} - {{\bar{r}_a}} } \right)\left( {{r_{bi}} - {{\bar{r}_b}} } \right)} }}{{\sqrt {\sum\limits_{{s_i} \in {s_{ab}}} {\left( {{r_{ai}} - {{\bar{r}_a}} } \right)} } \sqrt {\sum\limits_{{s_i} \in {s_{ab}}} {\left( {{r_{bi}} - {{\bar{r}_b}} } \right)} } }}$ | (3) |
式中:
表1为用户评分示例,
相似度计算是协同过滤推荐算法的关键部分,得到用户相似度之后可以确定用户的近邻用户集合。但以往计算用户的相似度时只考虑用户的直接相似相似度,这样将会遗失目标用户的间接近邻用户[15-16]。例如图1所示,
Download:
|
|
使用用户网络图来说明用户间的相似关系,从目标用户开始游走后停留在某个用户的概率越高意味着它与目标用户更相似。为了建立用户网络图,首先使用式(3)计算用户间的直接相似度,然后根据直接相似度建立用户近邻矩阵。为每个用户选择T个直接近邻用户,其他非T用户的相似度置0,得到的近邻矩阵如式(4)所示:
${\bf{SU}} = \left[ {\begin{array}{*{20}{c}} {{\rm{s{u}}_{11}}}&{{\rm{s{u}}_{12}}}& \cdots &{{\rm{s{u}}}_{1n}} \\ {{\rm{s{u}}_{21}}}&{{\rm{s{u}}_{22}}}& \cdots &{{\rm{s{u}}}_{2n}} \\ \vdots & \vdots & & \vdots \\ {{\rm{s{u}}}_{n1}}&{{\rm{s{u}}}_{n2}}& \cdots &{{\rm{s{u}}}_{nn}} \end{array}} \right]$ | (4) |
式中:对每个用户
然后对矩阵
用向量
${\left( {{{{r}}^{k + 1}}} \right)^{\rm{T}}}={\bf{S{U}}^*} \times {\left( {{{{r}}^k}} \right)^{\rm{T}}}$ | (5) |
式中:
在用户网络图中存在着与其他用户的相似度都很低甚至可以忽略不计的特殊用户节点。在用户网络图中此类节点只有入度,没有出度,如图2中节点D,此时由于图中D节点只有入度,没有出度,用户网络图演变为非强连通图,以式(5)的方法游走到图中节点D时将无法跳转到其他节点。整个用户网络图的游走最终停留在类似节点D的死节点,无法求得用户的间接相似度,因此对式(5)进行变形如下:
${\left( {{{{r}}^{k + 1}}} \right)^{\rm{T}}} = p \times {\bf{S{U}}^*} \times {\left( {{{{r}}^k}} \right)^{\rm{T}}} + \left( {1 - p} \right) \times {{{t}}^{\rm{T}}}$ | (6) |
式中:
当式(6)经过有限次迭代后,向量
${{{r}}^{\rm{T}}} = (1 - p) \times {({{I}} - p \times {{{S}}^*})^{ - 1}} \times {{{t}}^{\rm{T}}}$ | (7) |
式中:向量
Download:
|
|
向量
集合
${\rm{sim}}(a,b) = \left\{ \begin{gathered} \frac{{\sum\limits_{{u_{_b}} \in {{N'\!}_{{u_a}}}} {\displaystyle\frac{{{\rm{s{u}}_{ak}}}}{{{r_k}}}} }}{{\left| {{{N'\!}_{{u_a}}}} \right|}} \times {r_a} \hfill \\ {\rm{s{u}}}_{ab}\;\; {{u_b} \in {{N'}_{{u_a}}}} \hfill \\ \end{gathered}, \right.\;\; {{u_b} \notin {{N'\!}_{{u_a}}}} $ | (8) |
式中:
以每个用户顶点为起点进行游走查找其间接相似用户,得到重建的用户相似度矩阵,进一步得到目标用户的近邻用户集合。然后利用式(2)对目标用户的未评分项目进行评分预测,并将评分最高的Top-K个项目推荐给目标用户。
4 基于图游走的并行协同过滤推荐算法 4.1 Spark介绍Spark是基于内存的分布式并行计算平台[19],它拥有Hadoop平台和MapReduce框架的全部优点,并且Spark运算的中间结果能存储在内存中,提高了并行计算的速度,因此Spark更适合进行数据挖掘与机器学习等需要迭代处理算法的实现[19-21]。Spark集群启动时包括一个Master节点和若干个Worker节点,其中Master节点主要负责集群资源的管理,Worker节点主要负责数据的计算。当在Master节点使用spark-submit命令提交作业时,首先在本地客户端启动一个Driver进程;Driver进程会根据设置的参数向Master节点申请相应的集群资源,主要有Worker节点个数、每个Worker节点上Executor的内存和CPU数量;Master节点与Worker节点进行通信,通知Worker节点启动Executor并向Driver进程注册;Driver进程与Worker节点连接起来,将需要执行的任务分配给集群中的各个Worker节点,Worker节点按照任务分配从HDFS上读取数据并缓存到内存中,Driver进程对各个Worker节点处理完的结果进行收集和汇总。在Spark平台实现基于图游走的协同过滤算法能够有效地提高算法的时间效率。
4.2 相似性计算的并行化由于皮尔逊相关相似度计算公式较为复杂,全局搜索较多,因此在实现本文方法并行化时引入中间变量
${Q_{ai}} = \frac{{\left( {{r_{ai}} - {{\bar r_{a}}} } \right)}}{{\sqrt {\sum\limits_a {({r_{ai}} - {{\bar r_{a}}} )} } }}$ | (9) |
式中:
${\rm{sim}}\left( {a,b} \right) = \frac{{2 \times \left| {{s_{ab}}} \right|}}{{\left| {{s_a}} \right|{\rm{ + }}\left| {{s_b}} \right|}} \times \sum\limits_{{s_i} \in {s_{ab}}} {{Q_{ai}} \times {Q_{bi}}} $ | (10) |
因此,求用户
基于图游走的协同过滤推荐算法在Spark平台上的并行化包括3部分,分别是读入数据创建RDD、计算用户的相似度以及生成推荐列表,该算法的并行化主要体现在计算用户相似度和生成推荐列表。基于图游走的并行协同过滤推荐算法示意图如图3所示。
Download:
|
|
具体过程如下:
1) 读入用户行为数据,构建RDD1;
2) 将RDD1转换成
3) 根据RDD4计算用户
4) 将3)的RDD5使用ReduceByKey算子统计其共同评分项,计算结合交占比系数的相似度,得到形如
5) 利用4)的相似度RDD6,构造用户相似度矩阵userMatrixRDD,使用Spark中的线性代数库Breeze,调用其库函数inv()计算userMatrixRDD的逆矩阵invMatrixRDD,进一步通过式(7)和(8)求得得间接相似度,重建相似度矩阵得到RDD7;
6) 根据RDD7按用户划分得到RDD8,并进一步得到目标用户的近邻用户集合RDD9,最后进行推荐。
5 实验与评价实验使用Movielens数据集和IPTV数据集[20]进行实验。Movielens是一个基于Web的研究型推荐系统,用于接收用户对电影的评分并提供电影的推荐列表,Movielens数据集在协同过滤研究领域得到了广泛研究,也是使用最多的数据集之一。IPTV数据集来源于天津市IPTV电视用户的收视日志数据,经过对日志数据进行预处理和隐式评分处理,形成IPTV数据集。相比于Movielens数据集,IPTV数据集应用性更高。Movielens-100k数据集包含943用户,1 682项目,共10万条评分记录;Movielens-1M数据集包含6 040个用户和3 952个项目,共计100万条评分记录。IPTV数据集选取193用户,8 200项目,共计43 175条评分记录。
使用平均绝对误差
${\rm{MAE}} = \frac{{\sum\limits_{i = 1}^N {\left| {{r_i} - r_i^{'}} \right|} }}{N}$ | (11) |
式中:
准确率
${\rm{precision}} = \frac{{\sum\limits_{u \in U} {\left| {R\left( u \right) \cap T\left( u \right)} \right|} }}{{\left| {R\left( u \right)} \right|}}$ | (12) |
式中:
以加速比作为可扩展性的实验指标,加速比为
$S_{\!\!p} = \frac{{{T_1}}}{{{T_p}}}$ | (13) |
式中:
在原始的皮尔逊相关相似度的基础上,为了比较加入交占比(YPCC)和未加入交占比(PCC)对预测评分误差的影响进行本次实验。此次实验使用Movielens-100k数据集,共943用户,1 682个项目,共10万条评分记录,稀疏度为94.12%,训练集和测试集按8:2分割。实验结果如图4。
图4中,Top-K表示近邻用户选取的个数,
Download:
|
|
从图4中可以看出,协同过滤推荐算法的预测评分误差受到近邻用户个数Top-K的影响。随着近邻用户个数Top-K的增加,PCC和YPCC曲线均呈现下降趋势并最终趋于稳定,但是YPCC曲线明显低于PCC曲线,尤其Top-K在[40, 60]时差距最明显。实验结果表明,无论近邻用户个数如何选取,在皮尔逊相关相似度上加入交占比系数均可以有效地减小评分预测误差。
5.2 基于图游走方法的有效性验证实验 5.2.1 Movielens数据集实验为了验证基于图游走方法在降低评分预测误差和提高推荐准确率上的有效性,本次实验使用Movielens-100k数据集,训练集和测试集按8:2分割。先通过实验确定用户直接近邻个数T的最优取值,然后比较在不同的推荐近邻个数Top-K下,本文方法和基于用户的协同过滤推荐算法(BSCF)与基于聚类的协同过滤推荐算法(k-means_CF)的
图5为选取不同直接近邻个数时的评分预测误差曲线,T表示直接近邻用户选取的个数。图5表明,当T>60时,
Download:
|
|
图6的实验中T=60。推荐时近邻用户个数Top-K作为单一变量,对基于图游走的协同过滤推荐算法(GW_CF)、基于用户的协同过滤推荐算法(BSCF)、基于聚类的协同过滤推荐算法(k-means_CF)进行对比实验。图6Top-K表示推荐时近邻用户选取的个数,
图7中虚线反映了使用GW_CF推荐的准确度,实线反映了使用BSCF推荐的准确度。生成推荐列表时推荐项目数为10,从图中可以看出,随着近邻用户个数Top-K的增加,两条曲线呈上升趋势,GW_CF准确率曲线高于BSCF曲线。实验结果表明,基于图游走的协同过滤推荐算法GW_CF可以有效地提高推荐准确率。
Download:
|
|
Download:
|
|
为了验证基于图游走方法在降低评分预测误差和提高推荐准确率上的有效性,本次实验使用IPTV数据集,训练集和测试集按8:2分割。先通过实验确定用户直接近邻个数T的最优取值,然后比较在不同的推荐近邻个数Top-K下,基于图游走的协同过滤推荐算法(GW_CF)和基于用户的协同过滤推荐算法(BSCF)的
图8为选取不同直接近邻个数时的评分预测误差曲线。图8表明,当T>20时,
Download:
|
|
图9的实验中T=20,推荐近邻用户Top-K作为单一变量,对基于图游走的协同过滤推荐算法(GW_CF)和基于用户的协同过滤推荐算法(BSCF)进行对比实验。从图9 中可以看出,随着近邻用户个数Top-K的增加,两条曲线均呈下降趋势,GW_CF曲线明显低于BSCF曲线。实验结果表明:GW_CF算法在降低评分预测误差方面是有效的。
Download:
|
|
图10中生成推荐列表时推荐项目数为10,随着近邻用户个数Top-K的增加,两条曲线呈上升趋势,GW_CF准确率曲线趋势更明显并且高于BSCF曲线。实验结果表明,在一般情况下,GW_CF比BSCF拥有更高的推荐准确率。
Download:
|
|
为了验证基于图游走的并行协同过滤推荐算法的可扩展性,使用Movielens-1M和Movielens-100k数据集在Spark平台进行实验。其中1M数据集包含6 040个用户和3 952个项目,共计100万条评分记录;100k数据集包含943用户,1 682项目,共10万条评分记录。实验在Spark集群上实现,集群环境包括6个节点,一个Master节点,5个worker节点,每个节点的配置相同,且处在同一个局域网内,操作系统为CentOs6.5,CPU为E5-2620 v4,核心频率2.10 GHz,节点内存32 GB。加速比结果如图11。
Download:
|
|
从图11中可以看出,随着节点个数的增加,加速比呈现上升趋势,100万数据集更逼近线性加速比。实验结果表明,并行协同过滤推荐算法在大规模数据集的情况下有较好的可扩展性。
6 结束语本文针对协同过滤推荐算法中的数据稀疏性问题和可扩展性问题进行研究。针对稀疏性问题,在基于用户的协同过滤推荐算法的基础上,首先为传统的皮尔逊相关相似度引入交占比系数来计算用户的直接相似度,其次提出一种基于图游走方法来计算用户间接相似度,并重建相似度矩阵和进行推荐。针对可扩展性问题,在Spark平台上实现本文方法的并行化。通过在Movielens数据集和IPTV数据集上进行实验,先后验证了加入交占比系数和基于图游走的方法在提高推荐准确度上的有效性,以及本文方法的可扩展性。实验结果表明,本文的方法在提高推荐准确度上是有效的,并且在大规模数据上拥有较好的可扩展性。
[1] |
黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述[J].计算机学报,2018,41(7):1619-1647. HUANG Liwei, LIU Yanbo, LI Deyi. Deep learning based recommender systems[J].Chinese journal of computers. 2018,41(07):1619-1647. (0) |
[2] |
孙光福, 吴乐, 刘淇, 等. 基于时序行为的协同过滤推荐算法[J]. 软件学报, 2013, 24(11): 2721-2733. SUN Guangfu, WU Le, LIU Qi, et al. Recommendations based on collaborative filtering by exploiting sequential behaviors[J]. Journal of software, 2013, 24(11): 2721-2733. (0) |
[3] |
许智宏, 蒋新宇, 董永峰, 等. 一种基于Spark的改进协同过滤算法研究[J]. 计算机应用与软件, 2017, 34(5): 247-254, 278. XU Zhihong, JIANG Xinyu, DONG Yongfeng, et al. An improved collaborative filtering algorithm based on Spark[J]. Computer applications and software, 2017, 34(5): 247-254, 278. DOI:10.3969/j.issn.1000-386x.2017.05.043 (0) |
[4] | SUN Baoshan, DONG Lingyu. Dynamic model adaptive to user interest drift based on cluster and nearest neighbors[J]. IEEE access, 2017, 5: 1682-1691. DOI:10.1109/ACCESS.2017.2669243 (0) |
[5] |
彭宏伟, 靳远远, 吕晓强, 等. 一种基于矩阵分解的上下文感知POI推荐算法[J/OL]. 计算机学报: (2018-05-14)[2018-05-30]. http://kns.cnki.net/kcms/detail/11.1826.TP.20180512.2150.008.html. PENG Hongwei, JIN Yuanyuan, LÜ Xiaoqiang, et al. Context-aware POI recommendation based on matrix factorization[J]. Chinese Journal of Computers: (2018-05-14)[2018-05-30]. http://kns.cnki.net/kcms/detail/11.1826.TP.20180512.2150.008.html. (0) |
[6] | WU Jibing, YU Lianfei, ZHANG Qun, et al. Multityped community discovery in time-evolving heterogeneous information networks based on tensor decomposition[J]. Complexity, 2018, 2018: 9653404. (0) |
[7] | MA Wenping, WU Yue, GONG Maoguo, et al. Local probabilistic matrix factorization for personal recommendation[C]//Proceedings of the 13th International Conference on Computational Intelligence and Security. Hong Kong, China, 2017: 97–101. (0) |
[8] |
杨志文, 刘波. 基于Hadoop平台协同过滤推荐算法[J]. 计算机系统应用, 2013, 22(7): 108-112. YANG Zhiwen, LIU Bo. Hadoop-based collaborative filtering recommendation algorithm[J]. Computer systems and applications, 2013, 22(7): 108-112. DOI:10.3969/j.issn.1003-3254.2013.07.024 (0) |
[9] | LU F, HONG L, CHANGFENG L. The improvement and implementation of distributed item-based collaborative filtering algorithm on Hadoop[C]//Proceedings of the 34th Chinese Control Conference. Hangzhou, China, 2015: 9078–9083. (0) |
[10] | KUPISZ B, UNOLD O. Collaborative filtering recommendation algorithm based on Hadoop and Spark[C]//Proceedings of 2015 IEEE International Conference on Industrial Technology. Seville, Spain, 2015: 1510–1514. (0) |
[11] |
冷亚军, 陆青, 梁昌勇. 协同过滤推荐技术综述[J]. 模式识别与人工智能, 2014, 27(8): 720-734. LENG Yajun, LU Qing, LIANG Changyong. Survey of recommendation based on collaborative filtering[J]. Pattern recognition and artificial intelligence, 2014, 27(8): 720-734. DOI:10.3969/j.issn.1003-6059.2014.08.007 (0) |
[12] |
范波, 程久军. 用户间多相似度协同过滤推荐算法[J]. 计算机科学, 2012, 39(1): 23-26. FAN Bo, CHENG Jiujun. Collaborative filtering recommendation algorithm based on user’s multi-similarity[J]. Computer Science, 2012, 39(1): 23-26. DOI:10.3969/j.issn.1002-137X.2012.01.005 (0) |
[13] |
徐堃, 朱小柯, 荆晓远. 基于改进协同过滤的个性化web服务推荐方法研究[J]. 计算机技术与发展, 2018, 28(1): 64-68. XU Kun, ZHU Xiaoke, JING Xiaoyuan. Research on personalized web service recommendation based on improved collaborative filtering[J]. Computer technology and development, 2018, 28(1): 64-68. DOI:10.3969/j.issn.1673-629X.2018.01.014 (0) |
[14] | WU Xiaokun, CHENG Bo, CHEN Junliang. Collaborative filtering service recommendation based on a novel similarity computation method[J]. IEEE transactions on services computing, 2017, 10(3): 352-365. DOI:10.1109/TSC.2015.2479228 (0) |
[15] |
肖春景, 夏克文, 乔永卫. 基于时序逆影响的随机游走推荐算法[J]. 计算机应用研究, 2018, 35(8): 2304-2307. XIAO Chunjing, XIA Kewen, QIAO Yongwei. Temporal inverse influence based recommendation method by using random walk[J]. Application research of computers, 2018, 35(8): 2304-2307. DOI:10.3969/j.issn.1001-3695.2018.08.016 (0) |
[16] |
王鹤, 邬春学. 基于图结构和项目类型的协同过滤推荐算法[J]. 数据通信, 2016(5): 44-47. WANG He, WU Chunxue. Collaborative filtering recommenddation algorithm based on graph structure and item type[J]. Data communications, 2016(5): 44-47. DOI:10.3969/j.issn.1002-5057.2016.05.012 (0) |
[17] |
宫秀文, 张佩云. 基于PageRank的社交网络影响最大化传播模型与算法研究[J]. 计算机科学, 2013, 40(S1): 136-140. GONG Xiuwen, ZHANG Peiyun. Research on propagation model and algorithm for influence maximization in social network based on pageRank[J]. Computer science, 2013, 40(S1): 136-140. (0) |
[18] | HU Yan, PENG Qimin, HU Xiaohui, et al. Time aware and data sparsity tolerant web service recommendation based on improved collaborative filtering[J]. IEEE transactions on services computing, 2015, 8(5): 782-794. DOI:10.1109/TSC.2014.2381611 (0) |
[19] |
黄筱云, 董国海, 常佳夫, 等. Level set函数快速步进重构并行算法的改进[J]. 哈尔滨工程大学学报, 2017, 38(6): 836-842. HUANG Xiaoyun, DONG Guohuai, CHANG Jiafu, et al. Improvement of parallel fast marching method for reconstruction of level set function[J]. Journal of Harbin Engineering University, 2017, 38(6): 836-842. (0) |
[20] | LIU Tiantian, FANG Zhiyi, ZHAO Chen, et al. Parallelization of a series of extreme learning machine algorithms based on spark[C]//Proceedings of the IEEE/ACIS 15th International Conference on Computer and Information Science. Okayama, Japan, 2016. (0) |
[21] |
顾军华, 官磊, 张建, 等. 基于Hadoop的IPTV隐式评分模型[J]. 计算机应用, 2017, 37(11): 3188-3193. GU Junhua, GUAN Lei, ZHANG Jian, et al. IPTV implicit scoring model based on Hadoop[J]. Journal of computer applications, 2017, 37(11): 3188-3193. (0) |