2. 中国民航信息网络股份有限公司, 北京 100105
民航附加服务是民航业提升民航旅客旅行体验并获取增值收入的新兴服务领域.区别于传统的民航服务, 民航附加服务可以更好地满足旅客的个性化需求.为有效地开展个性化的民航附加服务, 需要建立相应的旅客兴趣模型.基于民航附加服务特征, 提出了一种基于扩展三维矩阵的民航附加服务旅客兴趣模型表示方法, 对兴趣数据的采集方法进行分析, 并提出了兴趣模型的进化算法, 最后通过应用数据对上述兴趣模型进行验证.
2. Travel Sky Technology Limited, Beijing 100105, China
Ancillary service is a new service field for civil aviation to improve the travel experience for customers and obtain value-added income. Compared with traditional airlines services, the ancillary services could satisfy the personalized requirements. In order to effectively and smoothly provide personalized value-added services, it is necessary to establish a passenger interest model. Based on characteristics of ancillary services, a new representation method for passenger interest model of airlines ancillary services was proposed. The collection method for interest data was analyzed and the evolving algorithm for the interest model was proposed as well. At last, the interest model and its effectiveness verification were implemented by means of application and experiment.
民航附加服务特指航空公司向消费者提供的除旅客运输之外的其他服务.民航附加服务一方面可以为消费者带来更好的旅行体验.另一方面也为航空公司获取增值收入带来更多的机会.
民航附加服务旅客兴趣建模是获取和维护与民航旅客兴趣、需求、习惯相关知识的过程,结果是产生能表示民航旅客特有背景知识或兴趣的旅客兴趣模型.随着个性化服务的兴起,当前已经有很多研究关注于个性化服务特别是用户兴趣建模[1-4].
以民航附加服务特征为基础,提出了一种基于分级向量思想的民航附加服务旅客兴趣模型.
主要工作包括:
1) 提出了民航附加服务旅客兴趣模型的表示方法,并分析了兴趣数据的采集方法;
2) 提出了兴趣模型的进化算法;
3) 实现了上述兴趣模型和算法并通过民航附加服务平台对兴趣模型进行了应用和验证.
1 民航附加服务旅客兴趣模型表示1.1 旅客个体的兴趣模型民航附加服务旅客兴趣模型涉及的个体包括旅客、旅客出行场景、民航附加服务类别以及附加服务提供商等.为了细粒度地刻画旅客兴趣度与上述各个体间的关系,基于层次向量空间的方法描述民航附加服务旅客兴趣模型.
建立的兴趣模型为2个树形结构.第一个树形结构描述旅客、出行场景、服务类别间的关系,如图 1(a)所示.其第一层表示旅客;第二层表示旅客出行场景及其取值的组合,如出游模式、出发地天气、目的地天气、出发地活动情景、目的地活动情景等;第三层表示旅客可能选择的附加服务类别及相应的兴趣度,如座位选择服务、酒店服务等,其中,兴趣度是一个二元组,描述为 < 短期兴趣,长期兴趣 > ;短期兴趣和长期兴趣是一个大于0的数字.每个旅客的兴趣度可以表示为如下的1个向量:
{ < 出游模式、取值 > 、< 出发地天气情景、取值 > 、< 目的地天气情景、取值 > 、< 出发地活动情景、取值 > 、< 目的地活动情景、取值 > 、< 服务种类A、兴趣度取值 > 、< 服务种类X、兴趣度取值 > …}
为了表达旅客、服务类别及相应服务提供商间的关系,设计了第二个树形结构,如图 1(b)所示.其第一层表示旅客;第二层表示旅客可能选择的附加服务类别,如座位选择服务、酒店服务等;第三层表示相应的附加服务提供商及相应的兴趣概率,兴趣概率是一个≥0并≤1的数值,对于任一 < 旅客,附加服务>对,其全部兴趣概率之和为1.
每个旅客的兴趣概率可表示为如下的一个向量:
{ < 服务类型、取值 > 、< 服务提供商A、兴趣概率取值 > 、< 服务提供商X、兴趣概率取值 > …}.
旅客兴趣度存储模型和兴趣概率存储模型实例分别见表 1和表 2所列.
综合上述2方面的旅客个体兴趣模型可以表示为一个扩展的三维兴趣矩阵,如图 2所示.其中第一个维度描述出行场景和附加服务类型,第二个维度描述不同的旅客,第三个维度则描述提供民航附加服务的不同服务提供商.
基于旅客个体兴趣模型可通过数据挖掘进一步形成旅客聚类兴趣模型[6],从而帮助服务平台对特定类型的旅客推荐服务.聚类的设置分为2种:人工设定聚类和自动生成聚类.前者为人工根据专家意见设定而成.后者周期性地由系统根据用户之间兴趣度向量以及兴趣概率向量的差异大小(“距离”),自动汇聚成聚类.
对于定义的旅客聚类,仍然可以采用类似于旅客个体的兴趣模型描述其兴趣度和兴趣概率.
2 兴趣模型进化民航附加服务旅客兴趣建模的关键是通过科学地分析旅客选择附加服务时的信息行为,找出其中的规律,从而提高民航附加服务质量.旅客的信息行为是在认知思维支配下对外部条件做出的反应,是建立在信息需求和思想动机的基础上,经历信息查询、选择、搜集各过程,并为旅客吸收、纳入思想库的连续、动态、逐步深入的过程[5].
心理学家吕恩运用力场理论[5],描述人类行为与主体和环境的关系,即B=F(PE).人类行为(B)是主体(P)及环境(E)的函数,是作为主体的人和作为客体的环境之间综合作用的效应.心理学家希尔加提出了内驱力理论[5].如果用ER表示用户的反应潜力或行为,HR表示用户反应的习惯强度,D表示内驱力,V表示信息刺激,K表示诱因动机,则:ER=HRDVK,即用户的信息反应和行为除取决于刺激强度和诱因外,主要取决于习惯强度和内驱力.
基于以上理论,主要基于行为因素和习惯因素对旅客选择民航附加服务的兴趣进行量化.
2.1 兴趣度和兴趣概率的计算方法1) 兴趣度计算方法
基于旅客选择民航附加服务的信息行为对兴趣度进行计算.将兴趣度定义为>0的整数.兴趣度的计算基于旅客使用附加服务平台时的行为,并根据对这些行为间的关系进行挖掘确定不同行为对应的兴趣度的分值.例如,购买1次服务,通常旅客需要浏览10次,查询5次,则设定浏览服务分值为1,查询分值为2,而购买分值为10,该分值可随系统历史数据动态调整.
2) 兴趣概率计算方法
将旅客选择民航附加服务的习惯因素体现为兴趣概率计算中的兴趣衰减因素.定义兴趣概率取值为0到1的浮点数.对于旅客个体的兴趣概率,计算方式如下:
① 首先计算除了本次之外的提供商的兴趣概率,最后本次选择的提供商的兴趣概率为(1-其他兴趣概率之和);
② 定义兴趣概率的半衰期为2次,对于本次累计一次未被选中的提供商,其兴趣概率为
③ 对于某个兴趣概率不为0的提供商,如果两次未被选择,则其概率降为一半;如果连续20次未被选择,则其兴趣概率降为0,将被彻底遗忘.
对于旅客聚类的兴趣概率,计算时以 < 聚类,服务,提供商 > 为基准,进行兴趣概率求和;求和完成之后,在以 < 聚类,服务 > 为标识,将全部提供商的兴趣概率进行归一化处理.
2.2 兴趣模型的更新算法为了使旅客兴趣特征信息能够自动地调整.并随着旅客兴趣变化而产生自适应的动态变化,需要自适应地调整旅客兴趣度和兴趣概率.研究的兴趣度和兴趣概率更新算法分别如下.
1) 兴趣度更新算法
步骤1 根据旅客出行历史记录组合生成旅客兴趣矩阵行标识 < 出游模式,出发地天气情景,目的地天气情景,出发地活动情景,目的地活动情景 > ;
步骤2 根据旅客活动判断矩阵中是否存在该行;
步骤3 如果存在则找到已存在的行;
步骤4 如果不存在新插入行;
步骤5 根据兴趣度分值更新当前行各服务类型的兴趣度.
2) 兴趣概率更新算法
步骤1 根据旅客出行历史记录组合生成旅客兴趣概率矩阵行标识 < 旅客,服务类型 > ;
步骤2 根据旅客活动判断矩阵中是否存在该行;
步骤3 如果存在则找到已存在的行;
步骤4 如果不存在新插入行;
步骤5 根据兴趣概率的衰减规律计算其他提供商的概率值,更新本次提供商的概率值.
3 模型的应用和验证基于所提出的民航附加服务旅客兴趣模型,设计并实现了民航附加服务平台原型系统.原型系统的功能结构如图 3所示.其中,附加服务提供商负责附加服务的创建、注册、更新、删除和策略维护.附加服务集成商负责对附加服务提供商注册的服务加以集成并通过手机APP、电脑终端的途径销售给旅客.旅客或代理通过附加服务集成商提供的途径浏览、查询、订购服务,并最终对服务使用进行支付.
该平台实现了提出的兴趣模型并基于兴趣模型设计实现了相应的服务推荐算法.将基于兴趣模型的服务推荐产生的结果与最终旅客选择的结果进行对比.
以经过数据漂白后的2011年、2012年以及2013年上半年国内3个特大型城市的旅客出行数据(共计1 130万人次,536万人)作为基础,其中清除不规范的数据后,存入验证数据库.其中,2011年和2012年的数据作为初始计算数据,2013的数据作为验证数据.前者共计902万(人次),人数为378万;后者共计228万条(人次),人数为158万.提炼和统计的附加服务见表 3所列.
定义推荐命中率作为验证指标.其计算方法为:1) 系统向旅客推荐的附加服务集合为A,旅客实际购买的附加集合为B;2) 如果A和B有交集,则此记录此用户的命中率为1,否则为0.3) 组内整体推荐命中率定义为式(1):
(1) |
式(1) 中分子表示统计分组内所有旅客的累计命中率,分母为统计分组内所有旅客数,precision即为统计分组的整体推荐命中率.其中personal precision为统计分组内针对每个旅客的命中率,定义如式(2):
(2) |
由于乘机次数20次以上的旅客,选择附加服务的行为会呈现出一定的规律性和习惯性,通过将乘机次数达到20次以上的旅客自然划分5个数据组进行分析,其服务推荐的平均准确率见表 4所示,其中,最低准确率55%,最高准确率达65%,证明了提出的兴趣模型的合理性.
区别于传统的民航服务,民航附加服务可以更好地满足旅客的个性化需求.为顺畅、有效地开展个性化的民航附加服务,需要主动感知旅客个性化服务需要,满足其差异化服务需求,而旅客兴趣模型是实现主动个性化附加服务的核心.基于民航附加服务特征,提出了一种基于分级向量的民航附加服务旅客兴趣模型的表示方法,分析了兴趣数据的采集方法;并基于行为因素和习惯因素提出了兴趣模型中兴趣度和兴趣概率的进化算法;最后通过应用和实验对上述兴趣模型进行了验证.
[1] | Zheng L, Cui S, Yue D, et al. User interest modeling based on browsing behavior[C]//Advanced Computer Theory and Engineering (ICACTE), 2010 3rd International Conference on. [S.l.]: IEEE, 2010, 5: 455-458. |
[2] | Li X, Du J, Zi L, et al. Study and implementation of personalized searching system based on user's interest model[C]//Cloud Computing and Intelligent Systems (CCIS), 2012 IEEE 2nd International Conference on. [S.l.]: IEEE, 2012, 1: 1-5. |
[3] | Zhang Y, Wang X, OuYang H. Design and implementation of personalized search model on user's interest[C]//E-Business and E-Government (ICEE), 2011 International Conference on. [S.l.]: IEEE, 2011: 1-5. |
[4] | Changhong F, Fan Y, Shunzhi Z. Research of personalized recommendation system based on client interest model in the smart mobile phone[C]//Computer Science and Education (ICCSE), 2010 5th International Conference on. [S.l.]: IEEE, 2010: 371-374. |
[5] | Chen Shuran. Personlization-based user interest modeling and its applying study [D]. Chongqing: Chongqing University, 2007. |
[6] | L Yongli, OY Yuanxin, W Jia, et al. Approach to modeling user interests using conceptual clustering[J].Journal of Beijing University of Aeronautics and Astronautics, 2010, 36(2): 188–192. |