反馈信息不能反映评价人的个人偏好,且其评价的重要程度随时间增加逐渐消减.为此,在充分考虑评价人的个人偏好基础上提出了一个基于信誉的信任管理框架.该框架主要包括基于决策树的信任计算模型和时间衰减计算模型.最终使得云服务的信誉值不再仅仅局限于反映云服务质量的一个客观数值,而是更能体现出不同云服务评价人的主观性.在该模型的基础上,进行了实验对比分析.实验分析结果表明,与现有的信誉评价模型相比,采用决策树和时间衰减模型信誉评价更为精确.
Currently, most of cloud service requesters select cloud services (cloud storage, cloud platforms, etc. according to the evaluation by the evaluators. This evaluation is based an objective criterion which is neglected with the difference of preferences between the requester and the evaluators. However, the issues of the evaluation with individual's preferences, which is the value of evaluation with the requester's subjective sense and the value of evaluations wearing off with time going, are in normal sense. Taking the subjectivity and time-varying of evaluations into consideration, a decision tree and time decay to assess trust model was proposed. In detail, the reputation value of cloud services no longer regards the quality of service as an objective value, but the difference of the cloud services users' subjective consciousness. Experiments was conducted based on the proposed model. It is shown that this model can provide more accurate reputation values based on the cloud customers' feedbacks than the existing reputation evaluation model.
在过去的几年中, 云计算得到了迅猛发展, 它按需供应计算资源与软件即服务的优点备受人们的追捧.云计算使用虚拟化技术以服务的方式对计算资源进行重新分配和管理, 广泛应用于私有云与公共云中, 实现商业逻辑的自动化.然而, 随着软件规模的不断扩大, 各种云服务如雨后春笋般崛起, 其功能及性能鱼龙混杂.由于缺乏高效统一的信任管理, 给用户选择合适的服务带来极大的不便[1].
目前, 解决信任问题的传统方法是计算云服务的信誉值.信誉是一个跨多学科研究的课题, Dellarocas [2]将信誉的概念定义为“收集整理关于一个实体之前的行为信息, 并作为其他人的经验参考”的行为.目前, 信誉值的计算是基于对使用过此服务的用户给出反馈信息, 即信誉评估系统.信誉评估系统通常使用在电子商务中, 如eBay的反馈机制和Epinions[3]中.在云计算领域, 现有的信誉值评估方法是通过不同方式计算所有评价人的反馈信息作为云服务的信誉值.通常是由一个权威的第三方为云服务计算一个客观的信誉值.
然而, 一个客观的信誉值并不能准确反映出请求者各式各样的个性化需求.假设这样的一个场景:有2个云服务请求者Alice(记作CA), 和Bob(记作CB)同时请求一个存储类型的云服务.其中, CA是IT领域的专家, 对数据的保密性提出非常具体的要求;CB是一位IT领域的工作者, 更加看重云服务的性价比.现在有一个价格低廉的云存储服务, 其客观信誉值是4. CB因其性价比较高, 对该服务相当满意, 因此反馈了一个5分的评价;然而, CA可能体验到该服务并未达到他的高要求, 因此给该服务的评分会相对较低, 比如3分.
在这个情景中, 2个请求者都从自己的角度给出了各自评价, 不存在欺骗行为, 然而给出的评价却很悬殊.为此, 我们认为, 云服务的信誉值应基于不同云服务请求者计算得到, 从而体现出信誉值的主观性.
另外, 现有的计算云服务信誉值的方法中鲜有考虑时间衰减因素, 然而云服务的信誉值具有时变性.
采用决策树模型确保信誉值的主观性, 达到对于同一个云服务, 基于不同的请求者, 计算得到满足请求者个性化需求的信誉值.为了实现这一目标, 使用算法, 依据评价者与请求者的背景属性相似度, 将评价者进行分类.通常认为, 用户的背景属性对其认知程度有着巨大的影响, 直接关系到其个人偏好, 换句话说, 背景属性相似度较大的两个人, 对同一类型的云服务有着类似的需求.也就是说, 与请求者背景属性相似的评价人的反馈信息更有参考价值.同时使用时间衰减函数调整反馈信息对云服务信誉值的影响程度, 体现信誉值的时变性.
综上, 面向主观性和时变性的云服务信任管理方法主要有以下两个贡献点:
1) 建立决策树模型, 使用C4.5算法基于用户的背景属性, 为云服务请求者与评价者计算相似性.
2) 使用时间衰减函数及时更新云服务的主观信誉值, 保证求得的信誉值能够及时反映出云服务的最新性能.
1 相关工作云计算中的信任管理问题引起了云计算产业界和学术界的广泛重视.针对这一问题, 研究者提出了许多解决方案[1].
目前, 基于信誉的信任管理模型是最流行的一种方式.为了解决推荐准确度低、数据分散等问题, Andhale等[4]提出了一种基于用户信任网络管理的推荐方法. Wang等[5]提出了一个线性马尔科夫(RLM, Robust linear Markov)信任模型, 它采用线性隐马尔可夫过程预测信誉值.此外, Noor等[6]介绍了一种把信任作为服务的信任框架, 在此框架中, 反馈信息的权重由与多数意见偏差和该评价者自身的经验决定.类似地, Noor等[7]提出了一种信任框架, 认为多数共识和时间一致性是影响信任的主要因素. Malik等[8]基于累积和控制图方法, 提出恶意反馈信息检测, 旨在减少反馈信息的主观效应. Wang等[9]认为, 信任和信誉都是有空间和时间维度的, 因此, 作者将时空因素作为影响云服务信誉的主要因素.
Bishr等[10]从云服务提供商的视角来处理信任问题, 而刘迎春等[11]使用模糊技术评估来计算反馈信息.与此同时, 周超等[12]提供了一种基于信任的应用.
以上基于信誉的信任管理研究中没有充分考虑用户提供反馈信息时用户的主观因素以及反馈信息的可信度随时间衰减对于云服务信誉的影响.
2 信誉值的主观性与时变性建模 2.1 信誉值的主观性建模本章在计算云服务信誉值时, 考虑了云服务请求者与评价者的主观偏好相似度, 并将其视为信誉值的主观性因子.
定义1 体现云服务的主观性信誉值的定义为
${F_i}\left( r \right) = \alpha f\left( {i,{\rm{ }}s} \right) + \left( {1 - \alpha } \right){C_r}^i$ | (1) |
其中:Fi(r)是根据云服务请求者r与评价者i的相似度得到的反馈信息, 即体现云服务信誉值的主观性;f(i, s)是评价者i评价云服务S的反馈信息;Cri是请求者r与评价者i的背景属性相似度(基于C4.5算法计算得到), 其取值范围在整数区间[0, 5], 视为反馈信息f(i, s)的主观性因子;参数α决定相似度Cri影响反馈信息f(i, s)的程度.由式(1) 可以得出, 当请求者r与评价者i的相似度越高, 得到的Fi(r)值越大, 可以说请求者r更加信任评价者i提供的反馈信息.
2.2 信誉值的时变性建模假设用户ui和用户uj分别在tik与tjk时刻调用了云服务Sk并给出了评价信息, 其中Δtx是调用服务距现在的一个时间跨度, 如果Δtj < Δti, 暂且忽略用户uj和用户ui其他因素的不同, 那么用户uj给出的反馈信息相对于用户ui对云服务Sk的信誉值影响更大一些.
定义2 云服务信誉值的时变性定义为
$F{\prime _i}\left( {\Delta t} \right) = \beta f\left( {i,{\rm{ }}s} \right) - \left( {1 - \beta } \right)\frac{1}{{{{\rm{e}}^{ - k\Delta t}}}}$ | (2) |
其中:F′i(Δt)是评论者i提供的衰减后的反馈信息;f(i, s)代表评价者i反馈给云服务S的反馈信息;Δt是反馈信息提供的时刻与信誉值计算的时刻差;k是衰变常数, 决定时间衰减的速率,
将云服务请求者与用户的主观偏好相似度问题转化为请求者与用户背景属性相似度问题, 进而采用决策树模型预测云服务请求者与评价者的相似度.与此同时, 建立时间衰减模型, 提出反馈信息对信誉值的影响衰减的计算方法, 并给出了基于信任管理解决方案.
3.1 基于决策树算法的相似性计算传统的用户对云服务的评价建模中, 目前广泛采用的是基于协同过滤算法的建模方法.但在协同过滤算法中, 用户的相似度根据用户—项目评分矩阵获得, 该算法的不足在于如果很少量的用户为一个项目评价, 会产生一个稀疏矩阵, 得到计算结果精度相对较低.然而, 对于云环境的高度动态性, 协同过滤算法没能发挥其特点.因此, 提出基于用户背景属性(住址信息、工作性质、受教育程度、年龄和性别)计算其相似度.
根据决策树模型的特点, 将用户的背景属性用五元组表示:U=(L, J, E, A, G), 其中L表示用户的住址信息;J表示用户的工作性质;E表示用户的受教育程度;A代表用户的年龄信息;G代表用户的性别.将用户的反馈信息表示为:F=(Sid, Uid, R, T), 在该四元组中Sid表示反馈信息的接收者, 即云服务提供商;Uid是评价者即已消费云服务Sid的用户;R是用户Uid给服务Sid的评分, 其取值在整数区间[0, 5];T是一个时间戳, 记录反馈信息给出的时间.
此外, 在决策树模型中, 还有以下两个定义.
定义3 决策树内部节点为用户的背景属性即元组U=(L, J, E, A, G), 将其类比为C4.5算法中的测试属性, 根节点所代表的背景属性对用户的个人主观偏好影响最大.
定义4 决策树叶子节点为用户给出的反馈信息中的评分即四元组F=(Sid, Uid, R, T)中评分R, 其最能直接反映出该用户的主观偏好, 因此将其作为叶子节点进行分类.
决策树算法是机器学习中一个重要的分类算法, 该算法分为两个阶段:训练阶段和预测阶段. 图 1所示为决策树模型工作流程.
1) 决策树模型C4.5算法的训练阶段
在训练阶段, 训练样本选取过程如下:首先, 从信任管理模型的数据存储中心中, 随机选取云服务S以及云服务S的评价者集合Vs, 同时从信任管理模型的数据中心提取评价者的背景属性U=(L, J, E, A, G)及评价者的反馈信息F=(Sid, Uid, R, T).最终将训练集中的每个样本表示为一个六元组, 记作:M=(L′, J′, E′ A′, G′; ΔR), 其中, 元组M中前五个元素为决策树的测试属性即内部节点, 与评价者的背景属性相对应, ΔR是反馈信息F中的评分绝对差, ΔR表示为决策树的叶节点.
样本元组M的预处理步骤如下:步骤1, 从云服务评价者集合Vs中随机选取一个评价者Cr及其背景属性UCr作为参照样本, 记作:UCr=(L, J, E, A, G), 以及Cr对云服务S的反馈信息:FCr=(S, UCr, R, T);步骤2, 将参照样本Cr的背景属性与云服务S的评价者集合Vs中其他评价者的背景知识一一比较, 生成训练样本集M′s.当任意两个评价者的某一个属性相同时, 样本元组M的相应元素值为1, 否则为0.
同样地, ΔR的取值是参照样本Cr与评价者集合Vs中的其他评价者评分差值的绝对值. ΔR=|RC-Ro|, 其中Ro是评价者集合Vs中其他评价者的评分, RC是参照样本Cr的评分, 由于评分R的取值范围是整数区间[0, 5], ΔR是反馈信息F中的评分绝对差, 因此其取值范围也是整数区间[0, 5]. ΔR作为决策树模型的叶子节点有六种不同的取值, 意味着用户个人偏好的相似度同样分为六类, 分别为{0, 1, 2, 3, 4, 5}.由此可见ΔR取值越小表明2个评价者对云服务S的评价越相似, 也就是说两个用户的个人偏好也越相近.
2) 决策树模型的预测阶段
决策树模型建立之后, 将用于预测云服务请求者R与其请求云服务的评价者之间个人偏好的相似度, 作为该反馈信息的主观性因子并为请求者r计算符合其个性化需求的主观信誉值.
预测数据集P处理如下:与训练样本类似, 预测样本P是一个五元组P=(L′, J′, E′, A′, G′), 其中元素的取值是云服务请求者r与评价者的背景属性比较结果, 如果相等则取值为1, 否则为0, 作为决策树模型的输入.根据请求者r的背景属性将评价者分类, 并转化为主观偏好的相似度.基于C4.5算法建立决策树模型的算法如算法1所示.
算法1 决策树模型
Input: VS:随机选取存储类型云服务S的用户集合, U:用户的背景知识集合, F反馈信息, UCr:随机选取用户的背景知识, FCr:Cr的反馈信息作为参照组Output: a decision tree model
1 Attributelist←U
2 While VS Do
3 U′i←|UCr-Ui|
4 F′i←|FCr-Fi|
5 Smp←U′i∪F′i
6 |Vs |--, i++
7 END WHILE
8 C4.5(Attributelist, M′s)
9 RETURN a decision tree model
在算法1中, 步骤1~5的主要任务是对数据预处理, 得到M′s样本集合.接着使用C4.5(Attributelist, M′s)算法, 返回一个决策树模型.
3.2 面向主观性和时变性信誉值的计算方法定义5 将面向主观性和时变性信誉值定义为
${L_r}^S = \frac{{\sum\limits_{i = 1}^{\left| {V\left( C \right)} \right|} {} (\gamma {F_i}\left( r \right) + \left( {1 - \gamma } \right)F{\prime _i}\left( {\Delta t} \right))}}{{\left| {V\left( C \right)} \right|}}$ | (3) |
其中:LrS代表请求者r请求云服务S的信誉值, V(C)代表云服务S评价者集合, |V(C)|代表评价者集合的大小, 变量Fi(r)包含了请求者r主观偏好, F′i(Δt)包含了反馈信息的时间衰减程度, 参数γ决定了用户主观偏好与反馈信息时间衰减程度对云服务信誉值的影响程度.由式(3) 得出, 在提出的计算方法中, 云服务的信誉值与请求者的主观偏好以及反馈信息随时间衰减程度密切相关.
总结前文, 整理得到
$\left. \begin{array}{l} {L_r}^S = \frac{{\sum\limits_{i = 1}^{\left| {V\left( C \right)} \right|} {} (\gamma {F_i}\left( r \right) + \left( {1 - \gamma } \right)F{\prime _i}\left( {\Delta t} \right))}}{{\left| {V\left( C \right)} \right|}}\\ {F_i}\left( r \right) = \alpha f\left( {i,{\rm{ }}s} \right) + \left( {1 - \alpha } \right){C_r}^i\\ F{\prime _i}\left( {\Delta t} \right) = \beta f\left( {i,{\rm{ }}s} \right) - \left( {1 - \beta } \right)\frac{1}{{{{\rm{e}}^{ - k\Delta t}}}} \end{array} \right\}$ | (4) |
最终信誉值的计算方法如算法2所示.
算法2 主观信誉值计算方法
Input: a decision tree model, Vs:服务评价者集合, U:用户背景知识, F:反馈信息集合, Ur:请求者背景知识
Output: LrS
1 While Vs Do:
2 Tree_input←|Ur-Ui|
3 Cri=Decision_tree(Tree_input)
4 Fi(f, r)=αf(i, s)+(1-α)Cri
5 ti←Fi, F′i(f, t)=βf(i, s)-(1-β)
6 |Vs|--, i++
7 END WHILE
8
9 RETURN LrS
在算法2中, 首先使用算法1的决策树模型结果, 将云服务请求者Ur与评价者Ui背景属性的比较值作为决策树模型的输入Tree_input, 决策树模型的输出结果Cri即为云服务请求者与评价者的主观偏好相似度.接着, 从反馈信息中提取反馈信息的提交时间ti, 采用时间衰减模型得到反馈信息对信誉值影响的衰减程度, 并视为信誉值的时变性.最后, 使用前两步骤的结果得到具有主观性和时变性的信誉值.
4 实验分析使用的数据集来源为国内知名数据集网站(数据堂)中的微博用户数据集①, 结合Epinions服务评价数据集②中的存储类云服务数据集.在此基础上, 针对具体问题, 对上述数据集进行扩充和完善展开仿真实验.
① http://www.datatang.com/data/46324
② http://www.trustlet.org/wiki/Downloaded Epinions dataset
首先构造相应的决策树模型和时间衰减函数, 并模拟云环境, 通过5个实例开展仿真实验验证提出方法的可行性.
在实验中, 以5个请求者的背景属性作为信任管理方法的输入[13], 最终得到云服务的主观信誉值如图 2所示.图中纵轴表示云服务的信誉值, 横轴表示给出该云服务反馈信息的数量, 其中信誉值的体现, 即云服务请求者的主观偏好, 主要表现在:不同的云服务请求者从相同的反馈信息集合中得到了不一样的云服务信誉值.如果两个请求者得到的云服务的信誉值是相似的, 根据提到的信誉值计算方法可以推断出, 这两个请求者的背景属性是相似的.
对实验结果进行解析.请求者C1与请求者C3得到的云服务信誉值的结果最接近.请求者C1与请求者C3除了“性别”和“年龄”属性以外, 其余的背景属性信息都是相同的.笔者分析出“性别”和“年龄”属性在存储类型的服务中, 对用户的个人偏好相似性影响相对较小, 因此请求者C1与请求者C3的个人偏好相似度最高, 两人得到的云服务信誉值相近;而请求者C2与请求者C4虽然只有“性别”与“工作性质”属性不同, 得到的云服务主观信誉值的结果相差较大.从请求者C3和请求者C5的结果可以看出, 请求者的“住址”属性对主观偏好也有一定的影响.这一结果表明, 提出的信任管理方法确实可以通过用户的背景属性信息满足其个性化需求.
5 结束语提出了一种面向信誉主观性和时变性的云服务信任管理方法.在该方法中, 基于决策树模型预测每一个请求者的偏好, 并根据其偏好信息计算主观信誉值, 体现出信誉值的主观性特征.此外, 还考虑了时间衰减因素, 同样在很大程度上影响了反馈信息的可靠性, 保证了信誉值的时效性.实验结果表明, 在提出的方法中, 不同的请求者可以获得与他们期望一致的云服务信誉值.
今后的工作将加强主观信誉系统的健壮性以及提高提出的方法的效率.
[1] | Noor T H, Sheng Q Z, Zeadally S, et al. Trust management of services in cloud environments:obstacles and solutions[J]. ACM Computing Surveys (CSUR), 2013, 46(1): 1–30. |
[2] | Dellarocas C. Reputation mechanisms [C]//Handbook on Economics and Information Systems. Amsterdam:Elsevier, 2006:629-660. |
[3] | Schlosser A, Voss M, Brückner L. On the simulation of global reputation systems[J]. Journal of Artificial Societies & Social Simulation, 2006, 9(1): 11. |
[4] | Andhale P, Rege M, Yu Q. Discovering heterogeneous evolving web service communities using semi-supervised non negative matrix factorization[J]. International Journal of Machine Learning and Computing, 2013, 3(2): 201–205. |
[5] | Wang Xiaofeng, Su Jinshu, Hu Xiaofeng, et al. Trust model for cloud systems with self variance evaluation[C]//Security, Privacy and Trust in Cloud Systems. Berlin Heidelberg:Springer, 2014:283-309. |
[6] | Noor T H, Sheng Q Z. Trust as a service:a framework for trust management in cloud environments [C]//International Conference on Web Information System Engineering. Sydney:Springer, 2011:314-321. |
[7] | Noor T H, Sheng Q Z, Yao L, et al. CloudArmor:supporting reputation-based trust management for cloud services[J]. IEEE transactions on parallel and distributed systems, 2016, 27(2): 367–380. doi: 10.1109/TPDS.2015.2408613 |
[8] | Malik Z, Bouguettaya A. Rateweb:Reputation assessment for trust establishment among web services[J]. The VLDB Journal-The International Journal on Very Large Data Bases, 2009, 18(4): 885–911. doi: 10.1007/s00778-009-0138-1 |
[9] | Wang Shangguang, Zheng Zibin, Wu Zhengping, et al. Reputation measurement and malicious feedback rating prevention in web service recommendation systems[J]. IEEE Transactions on Services Computing, 2015, 8(5): 755–767. doi: 10.1109/TSC.2014.2320262 |
[10] | Bishr M, Kuhn W. Trust and reputation models for quality assessment of human sensor observations [C]//International Conference on Spatial Information Theory. Scarborough:Springer, 2013:53-73. |
[11] |
刘迎春, 郑小林, 陈德人. 信任网络中基于角色信誉的信任预测[J]. 北京邮电大学学报, 2013, 36(1): 72–76.
Liu Yingchun, Zheng Xiaolin, Chen Deren. Trust predicting using roles-based reputation in trust network[J]. Journal of Beijing University of Posts and Telecommunications, 2013, 36(1): 72–76. |
[12] |
周超, 李博. 一种基于用户信任网络的推荐方法[J]. 北京邮电大学学报, 2014, 37(4): 98–102.
Zhou Chao, Li Bo. A recommendation method based on user trust network[J]. Journal of Beijing University of Posts and Telecommunications, 2014, 37(4): 98–102. |
[13] | Xu Jiuyun, Jiang Dan, Wang Bin, et al. Local reputation management in cloud computing [C]//2015 IEEE World Congress on Services (SERVICES). New York:IEEE, 2015:261-267. |