广东工业大学学报  2020, Vol. 37Issue (6): 32-40.  DOI: 10.12052/gdutxb.200029.
0

引用本文 

何锐超, 刘洪伟, 高鸿铭, 范梦婷, 詹明君. 基于点击流与PROMETHEE多属性决策法的电子商务消费者购买意愿预测[J]. 广东工业大学学报, 2020, 37(6): 32-40. DOI: 10.12052/gdutxb.200029.
He Rui-chao, Liu Hong-wei, Gao Hong-ming, Fan Meng-ting, Zhan Ming-jun. E-commerce Consumer Purchase Intention Prediction Based on Clickstream and PROMETHEE[J]. JOURNAL OF GUANGDONG UNIVERSITY OF TECHNOLOGY, 2020, 37(6): 32-40. DOI: 10.12052/gdutxb.200029.

基金项目:

国家自然科学基金资助项目(71671048)

作者简介:

何锐超(1994–),男,硕士研究生,主要研究方向为信息系统与商务智能。

通信作者

詹明君(1994–),男,博士研究生,主要研究方向为信息系统与商务智能,E-mail:zhanmj_gdut@163.com

文章历史

收稿日期:2020-02-21
基于点击流与PROMETHEE多属性决策法的电子商务消费者购买意愿预测
何锐超, 刘洪伟, 高鸿铭, 范梦婷, 詹明君    
广东工业大学 管理学院,广东 广州 510520
摘要: 在电子商务环境下, 充分了解消费者的兴趣变化过程并预测其购买意愿是个性化推荐系统需要解决的问题,因此具有巨大潜在信息的点击流数据因其易获性及预测的准确性得到了广泛的研究与应用。为了挖掘用户点击行为所反映消费者的兴趣变化过程并预测消费者的购买意愿, 通过点击流数据, 基于兴趣漂移理论, 采用偏好顺序结构评估法(Preference Ranking Organization Methods for Enrichment Evaluations,PROMETHEE)的多属性决策方法建立有效的模型进行测量与预测。结果建立了包括3个一级指标和8个二级指标构成的多会话消费者购买意愿评价体系, 为消费者购买意愿预测提供了一种实用的评价方法。
关键词: PROMETHEE    消费者兴趣漂移    购买意愿    点击流数据    会话    
E-commerce Consumer Purchase Intention Prediction Based on Clickstream and PROMETHEE
He Rui-chao, Liu Hong-wei, Gao Hong-ming, Fan Meng-ting, Zhan Ming-jun    
School of Management, Guangdong University of Technology, Guangzhou 510520, China
Abstract: Under the environment of e-commerce, fully understanding the consumer’s interest change process and predicting their purchase intention are the problems that personalized recommendation systems need to solve. To solve this problem, clickstream data with huge potential information has been widely studied and applied due to its availability and accuracy of prediction. Therefore, in order to mine the consumer’s interest change process reflected by the user’s click behavior and predict the consumer’s purchase intention, click stream data is used, based on interest drift theory, to establish an effective model for measurement and prediction on multi-attribute decision-making method (MADM) of preference ranking organization methods for enrichment evaluations (PROMETHEE). As a result, a multi-session consumer purchase intention evaluation system consisting of three primary indicators and eight secondary indicators is established, providing a practical evaluation method for consumer purchase intention prediction.
Key words: preference ranking organization methods for enrichment evaluations (PROMETHEE)    consumer interest drift    purchase intention    clickstream data    session    

在线购物是众多消费者网络行为的出发点与归宿,而了解用户的兴趣并预测消费者的购买意愿是网站实现个性化的基础[1]。电子商务的发展使得消费者可以轻易接触到丰富的商品,同时也导致企业之间的竞争越来越激烈。因此,实时了解消费者的兴趣度变化,有利于提高个性化推荐结果的准确性,避免重复推荐,提高消费者的购买体验。

传统的消费者购买意愿研究主要基于问卷调查的方式[2-3]。然而,其数据在真实性与客观性上都存在缺陷,而且没有考虑消费者的兴趣会随着时间的推移而逐渐改变。互联网上存在着大量隐式反映消费者兴趣的数据。而点击流数据因为兼顾了消费者的异质性、消费者需求的完整性以及动态性[4],因此利用点击流技术对用户行为进行有效的建模受到越来越多学者的关注。

为此,本文结合电子商务消费者的实际点击情况,基于消费者兴趣漂移理论,构建适合网络消费者点击行为的购买意愿预测模型并分析各影响因素的重要程度。在测量方法上,本文选择Brans教授提出的PROMETHEE(Preference Ranking Organization Methods for Enrichment Evaluation)偏好顺序结构排序评估方法,该方法是建立在级别优先关系(Outranking Relation)上的排序方法。该方法以方案各个属性的两两比较为基础,并根据偏好临界值确定方案之间的偏好性,并认为方案之间可以存在偏好的不可比性和弱偏好关系[5],解释消费者在商品选择过程中的犹豫心理。

PROMETHEE方法是一种建立在级别不劣关系下的多属性决策方法[6]。级别不劣关系认为,方案与方案之间存在偏好的不可比性和弱偏好性。其中,不可比性认为:按照不同的排序标准对方案进行优劣比较,则会出现某些方案不能绝对排序的情况。另外,该方法设置了6种典型的属性偏好函数。在对消费者的偏好建模时,允许消费者针对两个不同的商品或者商品属性有严格偏好、弱偏好与无差异等多种偏好关系。通过两两比较,根据优势度概念,并从两个侧面对方案进行比较。一个侧面为某方案优于其他方案的程度,以流出量 $ \varPhi^+ $ 表示;另一个侧面为其他方案优于该方案的程度,用流入量 $ \varPhi^- $ 表示。最后,PROMETHEE方法在方案排序上存在3种方法,并对排序存在矛盾的部分解释为严格偏好、弱偏好与无差异,这一点与消费者的犹豫心理相似。该排序方法易于理解,思路清晰,有利于决策者进行分析。

因此,本文提出一种基于点击流和PROMETHEE多属性决策法的电子商务消费者兴趣与购买意向的测度方法。该方法首先针对点击流数据构建一个完整的指标体系,并采用真实的京东购物网站上消费者的点击流数据,最后利用PROMETHEE偏好顺序排序方法进行计算与排序,预测消费者的购买意愿。

1 文献综述 1.1 消费者购买意愿

购买意愿指的是消费者愿意采取特定购买行为的概率[7]。消费者通过信息搜索累积其购买兴趣并在方案评估中产生偏好,最终在购买决策阶段明确其购买意愿。因此,购买意愿是衡量消费者是否会产生进一步购买行为的重要指标。

传统测量消费者购买意愿的方法主要为显式反馈,如:问卷调查等方法。但是,因为由于消费者购买意愿无法观测,较难使用统一的量表准确地测量每个消费者在不同商品上的购买意愿,从而导致消费者购买意愿的相关研究在指标设置与理论选择上存在较大的差异[8]。随着数据挖掘技术的提升,隐式反馈方法受到越来越多的学者的关注,较多学者从基于社交网络[9]、商品评论[10-11]等角度,动态地预测消费者的购买意愿。然而,以上研究方法较多地从他人对消费者的影响的角度对消费者的购买意愿进行研究,较少考虑消费者自身兴趣度的变化[12]。点击流数据包含着每一个消费者在购物网站中的浏览痕迹,利用点击流技术对用户行为进行有效的建模,有利于兼顾每个消费者自身的特性,更好地挖掘消费者实时的购买意愿[13]

1.2 点击流研究

点击流指的是消费者在网站上点击行为的序列[4]。消费者注意力有限,袁兴福等[14]提出,会话划分是消费者序列行为建模的重要工作之一。以会话为基础,当前关于点击流的研究可以分为单一会话研究与多会话研究[13]。其中,单会话研究主要专注于会话类别的分类[12, 14-15],而多会话研究主要研究消费者的行为规律与购买意愿。Montgomery等[16]通过消费者访问的页面类型,重复访问次数以及人口统计学特征,发现消费者累计的访问次数越多,则越有可能购买,而且模型中的记忆成分是预测消费者浏览与购买行为重要因素。刘洪莲等[17]通过停留时间等指标,发现消费者在信息浏览与决策会话中行为规律的差别。OsnatMokryn等[18]利用产品的流行趋势以及消费者访问时间的变化,预测匿名消费者的购买意愿。Jenkins等[19]开发了一个ClickGraph算法,通过将消费者的商品点击序列绘制为一个有向图网络,并通过循环神经网络技术预测匿名消费者下一次点击的商品。

以上研究关注消费者点击流指标比较单一,较多仅关注消费者的网站访问频率与停留时间。然而,不同消费者的不同的点击流行为类别,也会从不同侧面反映消费者的兴趣程度,如点击、浏览、收藏以及加入购物车等[20-21]。当前关注到该问题的研究如Houda Zaim等[22]通过模糊多属性方法探究消费者在网页上的浏览行为规律。但是,该研究尚未细化到消费者的行为类别,因此,本文将通过建立一个针对点击流的指标体系,并利用PROMETHEE多属性决策方法探究消费者在每一个会话中的购买意愿,动态识别消费者的兴趣变化过程。

另外,以上关于多会话的研究较少解释消费者会话与会话之间的依赖关系,忽略了消费者兴趣的动态性。消费者兴趣漂移理论认为,消费者会受到长期兴趣与短期兴趣的影响[23]。其中,消费者受到短期兴趣的影响最大,而长期兴趣对消费者的影响会随着时间的推移而逐渐减弱[24]。因此,本文借鉴兴趣漂移理论的研究范式,引入遗忘函数以解释消费者点击会话之间的依赖关系[25]

综上所述,本文将根据以往点击流的研究,构建指标体系,并利用PROMETHEE方法评估消费者在会话内的购买意愿。最后,利用遗忘函数探究会话间的依赖关系,改进现有的点击流多会话研究。

2 消费者购买意愿预测模型构建 2.1 点击流会话构建

本文划分会话的方法为若消费者 $ i$ 在某购物网站中第 $ t$ 次浏览的持续时间(View Time,单位:s) ${{T}}_{it}$ 大于时间阈值 $T _{\rm max}$ ,则认为该浏览行为结束并形成了一个会话(Session),如式(1)所示。

${ {{T}}_{it} = {\rm{time}}_{i(t+1)} -{\rm{time}}_{it} } $ (1)

其中, $ {\rm{time}}_{it} $ 代表的是消费者 $ i$ $ t$ 次浏览的开始时间点, $ {\rm{time}}_{i(t+1)} $ 代表的是第 $ t$ 次浏览的结束时间点,也是第 $ t+1$ 次浏览的开始时间点。若 ${{T}}_{it} \geqslant T_{\rm max}$ ,则代表该会话结束,新会话产生。

2.2 消费者购买意愿评价指标体系构建

点击流数据可以从不同侧面反映消费者当前的兴趣状态,周翔[26]将消费者点击行为划分为浏览广度、浏览深度以及浏览复杂度3个维度。因此,本文在深入研究京东消费者的点击流行为的基础上,结合消费者点击行为类别,构建了包含3个一级指标和8个二级指标的消费者购买兴趣度评价指标体系,如表1所示。

表 1 点击流购买意愿评价的指标体系 Table 1 Index system for evaluating purchase intention of clickstream
2.2.1 行为复杂度

选取行为复杂度为一级指标(B1)。复杂度的主要度量手段为频率,如浏览详细页面的频率(店铺、商品等)。在点击流数据库中,消费者的点击行为可以分为点击、浏览(浏览详细页面)、收藏、加入购物车等。以上行为都在不同程度地反映着消费者针对每一个商品不同的兴趣度,而且随着消费者行为复杂度的不断累积,消费者对商品的不同信息的收集量越来越多,则消费者购买意愿越明确。因此,选取点击频数、浏览频数、收藏频数以及购物车频数作为二级指标,解释行为复杂度,表达式如式(2)所示。

$ { B^{ps}_{1c} = \sum\limits_{t=1}^{T_s} I( {\rm{click}}_t = c \cap {\rm{product}}_t = p ) } $ (2)

其中, $B_1$ 表示的是一级指标行为复杂度。注意到一级指标中包含3个指标,本文用 $ m \in \{1,2,3\} $ 表示; $ c$ 表示的是消费者的行为类型,若 $ c=1 $ ,则表示点击;若 $ c=2 $ ,则表示浏览;若 $ c=3 $ ,则表示加入收藏夹;若 $ c=4 $ ,则表示加入购物车。另外, $ s$ 表示会话数(Session)且 $ s\in \{ 1,2,\cdots,S \} $ $ S$ 表示消费者浏览的会话总数。在同一会话 $ s$ 内, $ p\in \{ 1,2,\cdots,P_s \} $ $ t\in \{ 1,2,\cdots,T_s \} $ ,即在会话 $ s$ 内,消费者浏览的商品用 $ p$ 表示,浏览的商品总数为 $ P_s $ ;消费者浏览次数用 $ t$ 表示,浏览的总次数为 $ T_s $ 。函数 $I({{ \cdot }})$ 为指示函数。若函数 $I({{ \cdot }})$ 内条件成立,则输出1;反之为0。其中, $ {\rm{click}}_t $ 表示在会话 $ s$ 内,消费者第 $ t$ 次的点击类型。同理, $ {\rm{product}}_t $ 表示在会话 $ s$ 内,消费者第 $ t$ 次点击的商品。因此, $B_{1c}^{ps}$ 表示的是消费者在会话 $ s$ 内针对商品 $ p$ 的点击类型 $ c$ 的累积频率。

2.2.2 行为广度

选取行为广度作为一级指标。消费者会根据一定的维度在一个会话中浏览商品信息。在该维度内,浏览的商品越多,则说明消费者在对该维度内的信息了解越透彻,越有利于消费者做出决策,同时反映了消费者对该维度的忠诚度。因为本文利用的数据为京东商城的点击流数据,京东商城中商品较多根据品牌分类,较少利用店铺进行分类。因此,本文以商品品牌为分类维度,并以品牌浏览次数与浏览频数为二级指标,对消费者在同一会话中所浏览的品牌进行对比,计算方式见式(3)、式(4)。

$ { B^{ps}_{21} = \sum\limits_{t=1}^{T_s} I( {\rm{brand}}_t = b ) } $ (3)
$ { B^{ps}_{22} = \sum\limits_{t=1}^{T_s} I( {\rm{brand}}_t = b ) T_t } $ (4)

其中,行为广度以品牌为基础,因此 $ {\rm{brand}}_t $ 表示在会话 $ s$ 内消费者第 $ t$ 次点击的品牌。

2.2.3 行为深度

选取行为深度为一级指标(B3)。消费者在需求触发阶段,信息浏览往往比较随意,其浏览频率比较高,收集的信息量比较多;但是,在商品选择与评价阶段,消费者的浏览频率下降,而浏览时长增加。因为消费者在商品选择与评价阶段能更有效地分配其信息搜索的时间,消费者需要更详细的信息辅助其进行最终的购物决策[24]。因此,消费者在购物网站上停留的时长是评估消费者行为深度的有效指标。在点击流行为类别中,消费者通过点击商业陈列页面以及浏览商品详细页面才可以了解更多商品信息,因此,本文以点击时长以及浏览时长作为二级指标解释行为深度:

$ { B^{ps}_{3c} = \sum\limits_{t=1}^{T_s} I( {\rm{click}}_t =c \cap {\rm{product}}_t = p ) T_t } $ (5)

其中, $ c\in\{1,2\} $ ,分别代表点击与浏览行为。综上,点击流购买意愿评价的指标体系如表1所示。

2.3 多会话指标累积兴趣度计算

本文将兴趣漂移理论引入到点击流研究领域。兴趣漂移理论主要研究消费者的兴趣变化过程,即消费者短期兴趣与长期兴趣的依赖关系。

针对消费者会话内的点击行为(即短期兴趣),本文采用会话内相同商品序列指标值合并的方法,计算在同一会话中针对消费者所浏览的所有商品的兴趣度,计算方法如式(2)~式(5)所示。

针对消费者会话间的点击行为(即:长期兴趣),本文采用采用遗忘函数对会话间的消费者兴趣度进行衰减运算,遗忘因子 $ K $ 计算方法如式(6)所示。

$ K_{s-1}^{s} = \exp \left\{ -\frac{\lg 2}{ h } (T_{s}^{{\rm{start}}} - T_{s-1}^{{\rm{end}}}) \right\} $ (6)

其中, $ K_{s-1}^s $ 表示的是会话 $ s$ 相对会话 $ s-1 $ 的遗忘因子。 $ T_{s}^{{\rm{start}}} $ 表示会话 $ s$ 开始的时间, $ T_{s-1}^{{\rm{end}}} $ 表示会话 $ s-1 $ 的结束时间。 $ h$ 表示兴趣遗忘半衰期,即经过 $ h$ d后用户的兴趣以非线性的方式遗忘了50%。遗忘的速度先快后慢。根据艾滨浩斯曲线遗忘规律,2 d的时间可以让人类对事物的遗忘达到72%。综合消费者对商品搜索行为的规律,本文将半衰期 $ h$ 定义为2 d。

因此,考虑会话间依赖关系的多会话累计兴趣度指标 ${B}^{ips}_{mc}$ 的兴趣度值的计算方式为

$ { {B}^{ips}_{mc} = \sum\limits_{n=2}^{s} K_{n-1}^{n} B^{ipn}_{mc} + B^{ips}_{mc} } $ (7)

其中, ${B}^{ips}_{mc}$ 为考虑兴趣依赖后当前会话的兴趣值; $ n$ 表示会话数量, $ n \in \{ 2,\cdots,s \} $

综合消费者的短期兴趣与长期兴趣之后,本文将采用PROMETHEE方法预测消费者的购买意愿。

2.4 PROMETHEE购买意愿预测模型构建

本文采用PROMETHEE多属性决策方法中优先度的计算方式与偏好函数描述消费者在商品浏览时的方案比较行为,进而预测消费者的购买意愿。该决策方法可分为以下4个步骤。

2.4.1 确定权重

本文选取熵权法(Entropy Method)计算消费者点击流指标体系的常权向量。熵权法是一种常用的客观赋权方法,它仅依赖于数据本身的离散性。若消费者在某点击指标上离散性越强,则说明指标对消费者购买意愿的区分度越强。本文以 $\omega_{mc}^{is}$ 表示在会话 $ s $ 针对指标 $ i$ 的熵权值,为常权值。

2.4.2 确定优先指数

对商品点击流指标值进行两两对比,构建优先指数矩阵,使得优先指数不仅仅针对与单会话内的指标值,如式(8)、式(9)所示。

$ {\omega}_{mc}^{is} B^{ips}_{mc} - { \omega}_{mc}^{is} B^{ip's}_{mc} = d_{mc}^i(p_s,p'_s) $ (8)
$ { F_{mc}^i(d_{mc}( p_s,p'_s ))= \varPi^{i}_{mc}(p_s,p'_s) } $ (9)

其中, $d^{i}_{mc}( p_s,p'_s)$ 表示的是在会话 $ s $ 内商品 $ p$ 相对于商品 $ p' $ 在指标 $B_{mc}$ 中的兴趣度差值。 $F^i_{mc}(\cdot)$ 为优先函数。 $\varPi^i_{mc}( p_s,p'_s)$ 则是优先指数,取值从0(会话 $ s$ 内商品 $ p$ 在指标 $B_{mc}$ 上优于或与商品 $ p' $ 无差别)到1(会话 $ s$ 内商品 $ p$ 在指标 $B_{mc}$ 上严格优于商品 $ p' $ )。

考虑到行为复杂度指标(B1)中的收藏以及购物车频率均为0、1变量,因此,优先函数 $ F_{1c}(\cdot) $ 如式(10)所示。

$ F_{1c}^i(d_{1c}^i) = \left\{ {\begin{array}{*{20}{l}} {1,}&{{\mkern 1mu} d_{1c}^i > 0}\\ {0,}&{{\mkern 1mu} d_{1c}^i \leqslant 0} \end{array}} \right. $ (10)

另外,消费者的其他点击行为指标为连续变量,且随着消费者兴趣度的增加,消费者将对少数商品进行对比,点击频率将下降。因此,优先函数 $F_{mc}(\cdot)$ 为非线性的指数函数,如式(11)所示。

$ F_{mc}^i(d_{mc}^i) = \left\{ {\begin{array}{*{20}{l}} {1 - \exp \left\{ { - \dfrac{{{{(d_{mc}^i)}^2}}}{{2{z^2}}}} \right\},}&{d_{mc}^i > 0}\\ {0,}&{d_{mc}^i \leqslant 0} \end{array}} \right. $ (11)

其中, $ z$ 为函数参数,本文设 $ z=2$

2.4.3 计算流入流出量

流出量 $ \varPhi^{+}(p_{s}) $ $\varPi(p_{s},p'_{s})$ 的均值,即:在会话 $ s$ 内,商品 $ p_s $ 级别优于其他商品 $ p'_s $ 的可能性,计算式如式(12)所示。

$ {\varPhi^{+}(p_s) = \frac{1}{n-1} \displaystyle\sum\limits_{m=1}^{3}\sum\limits_{c=1}^{4} \varPi_{mc}^i(p_s,p'_s) } $ (12)

同理,流入量 $ \varPhi^{-}(p_{s}) $ $\varPi(p'_{s},p_{s})$ 的均值,指的是其他商品 $ p'_s $ 级别优于商品 $ p_s $ 的可能性,见式(13)所示。

$ {\varPhi^{-}(p_{s}) = \frac{1}{n-1} \displaystyle\sum\limits_{m=1}^{3}\sum\limits_{c=1}^{4} \varPi_{mc}^i(p'_s,p_s) } $ (13)

最后,净流量 $ \varPhi(p_{s}) $ 为流出量 $ \varPhi^{+}(p_{s}) $ 与流入量 $ \varPhi^{–}(p_{s}) $ 之差,如式(14)所示。

$ { \varPhi(p_s) =\varPhi^+(p_s) - \varPhi^-(p_s) } $ (14)
2.4.4 排序

针对考虑兴趣依赖关系后的每个会话内商品的流入量与流出量,本文综合对比PROMETHEE的两种排序方法。PROMETHEEⅠ对流入流出量进行不完全排序,解释消费者在商品选择时的犹豫心理;PROMETHEEⅡ对净流量进行完全排序,有利于商品推荐。

3 算例分析 3.1 会话内产品依赖关系计算

本文选取ID号码为295193的消费者。该消费者自2016年4月1日00:00:00至2016年4月16日00:00:00共计有1 600次点击浏览记录,根据面向时间阈值T的启发式会话划分方法,可以将该消费者的点击流数据划分为37个会话。其中,消费者在会话22中购买了商品ID为103652的商品。会话22的累计购买兴趣数据如表2所示。

表 2 会话22的累积兴趣度表 Table 2 Cumulative interest table for session 22

表2可见,该消费者在会话22中,购买了ID号码为103652的商品。该商品的点击频率在该会话中最高为28次,然而其点击时长为357 s,小于商品75877。较难判断消费者最感兴趣的商品是否为ID号码为103652商品。可见,仅仅依靠会话中的累计兴趣度较难发现消费者对不同商品的偏好程度。根据表格2,可以计算出不同计算指标的熵权值如表3所示。

表 3 二级指标熵权值表 Table 3 Table of initial entropy weights for secondary indicators
3.2 会话间产品依赖关系计算

本文通过累计兴趣度的方法,计算出会话内产品的依赖关系后,利用式(6)计算出消费者会话间的遗忘因子,以此计算会话间商品兴趣的衰减过程。因此,当消费者295193浏览至会话22时,已经历过21次兴趣衰减的过程。在数值上,会话22中消费者浏览商品的兴趣度如表4所示,而考虑会话间依赖关系的兴趣度权重如表5所示。

表 4 考虑会话间依赖的会话22累积兴趣度表 Table 4 The cumulative interest degree of session 22 considering inter-session dependencies
表 5 考虑会话间依赖的二级指标熵权值表 Table 5 Initial entropy weights of secondary indicators considering inter-session dependencies
3.3 单会话购买意愿预测

表6表示的是不考虑会话间依赖,仅考虑会话22中消费者的点击数据下的多属性评价结果。从表6中可见,综合考虑PROMETHEEⅠ与PROMETHEEⅡ方法的评价结果,可以确定各方案的优异排序:商品75877 $ > $ 103652 $ > $ 81462,而其他商品不存在严格偏好关系,代表了消费者在会话22中对其他商品存在着犹豫与对比的心理。其排序如图1所示。

图 1 会话22的商品购买意愿排序 Figure 1 Sorting of product purchase intentions for session 22
表 6 会话22的PROMETHEE决策法的样本流量值表 Table 6 Sample flow value of PROMETHEE decision method for session 22

但是,在会话22中,消费者真正购买的商品为103652,并非75877。这一点符合了Park等[27]的研究结论:在同一购物网站中的用户若停留的时间越长且浏览的页面越少,则越有可能购买,即:消费者在决策阶段总浏览频率会下降,而总浏览时长不变。因为消费者需要集中精神对意向产品进行比较。因此,仅凭消费者的购物会话数据较难识别消费者的真实购买意愿。因此,需要考虑会话间的依赖关系。

3.4 考虑会话间依赖关系的购买意愿预测

表7表示的是考虑会话间依赖关系的消费者购买意愿预测结果。结果显示,消费者在会话22中浏览的商品呈现严格偏好关系,预测消费者购买意愿最高的商品103652为消费者最终购买的商品。

表 7 考虑会话间依赖的会话22的PROMETHEE决策法的样本流量值表 Table 7 Sample flow value table of the PROMETHEE decision method for session 22 considering inter-session dependencies

因此,通过考虑会话间依赖的多会话购买意愿预测方法考虑了消费者的全局信息,有利于进行商品推荐。

3.5 灵敏度检验

PROMETHEE-GAIA平面方法是Stewart[28]提出的对多属性指标体系评价结构的灵敏度分析方法。该方法通过利用主成分分析方法对决策分析方法进行降维分析,并使用方差极大旋转方法获得属性的最大分离。另外,本文GAIA图的绘制过程使用的软件为DecisionLab,并绘制图2图3

图 2 指标体系未调整前的GAIA平面图 Figure 2 The GAIA before adjustment of the indicator system
图 3 行为深度一级指标调整后的GAIA平面图 Figure 3 The GAIA after behavioral first-level index adjustment

图2图3中,方框代表的是商品,其中灰色方框代表消费者尚未购买的商品,红色方框中的商品103652为消费者在该会话中购买的商品。菱形的方框代表的是指标体系,不同颜色代表了不同的一级指标。其中,紫色的向量代表的是行为复杂度一级指标,蓝色的向量代表的是行为广度一级指标,绿色的向量代表的是行为深度一级指标。最后,红色的向量代表的是决策轴,即综合决策结果。最优决策方案(商品103652)与决策轴方向一致。

图3中可见,汇总后的行为深度(B3)指标与决策轴方向一致,行为复杂度(B1)偏斜程度减少,行为广度(B2)的偏斜程度基本不变。

图2中可见,行为复杂度(B1)的指标向量与决策轴的偏斜程度最小,可见行为复杂度对消费者的购买行为预测性最强,行为广度(B2)次之。但是,行为深度(B3)的指标向量与决策轴的偏斜程度较大,而且点击时长与浏览时长分别位于决策轴的两侧。这说明了点击时长与浏览时长在数据上存在互补。另外,注意到消费者针对某些商品的浏览时长与点击时长为0,然而其浏览频率或点击频率较高。针对以上不合理的情况,本文对行为深度中的点击时长与浏览时长汇总为访问时长,并得到图3

4 结论

本文提出了一个基于点击流与PROMETHEE多属性决策法的电子商务消费者兴趣评估与购买意愿预测模型,本模型主要分为2个步骤:(1) 对消费者点击流中的会话数据进行有效累计;(2) 使用PROMETHEE多属性决策方法测度消费者在每一个购物会话中对不同商品的购买意愿。最后,根据消费者的真实购买记录,验证了本方法的可行性与有效性。

本文主要从3个方面做出了贡献:

(1) 传统的点击流消费者行为研究关注的指标比较单一。因此,本文在周翔学者的研究基础上,构建了一个完整的指标体系,并发现:行为复杂度,行为广度以及行为深度是衡量消费者购买意愿的重要因素。其中行为复杂度最重要,行为深度次之。另外,商品品牌也是消费者进行商品对比的重要指标,不同的消费者会对不同的品牌有不同的忠诚度。

(2) 基于消费者点击行为的特点,选用PROMETHEE多属性决策方法中的偏好函数描述消费者在商品对比过程中的心理过程,通过不完全排序发现消费者兴趣度相似的产品,挖掘消费者的犹豫心理,使得消费者购买兴趣度研究更具有实用价值。

(3) 本文以会话为划分点击流数据的基础,并说明利用点击流数据预测消费者购买意愿时,应该注意以会话为研究基础,动态汇总与识别消费者兴趣度的变化过程。针对消费者的每一次点击会话,都应预测其购买意愿,以识别消费者当前最感兴趣的商品并识别消费者最关注的商品属性。

参考文献
[1]
许波, 张结魁, 周军. 基于行为分析的用户兴趣建模[J]. 情报杂志, 2009, 28(6): 166-169.
XU B, ZHANG J K, ZHOU J. User interest modeling based on behavior analysis[J]. Information Magazine, 2009, 28(6): 166-169. DOI: 10.3969/j.issn.1002-1965.2009.06.039.
[2]
王建军, 王玲玉, 王蒙蒙. 网络口碑、感知价值与消费者购买意愿: 中介与调节作用检验[J]. 管理工程学报, 2019, 33(4): 80-87.
WANG J J, WANG L Y, WANG M M. Internet word of mouth, perceived value and consumers’ willingness to buy: a test of intermediary and moderating effects[J]. Chinese Journal of Management Engineering, 2019, 33(4): 80-87.
[3]
邵景波, 李泽昀, 高子强. 奢侈品母品牌价值感知对延伸品购买意愿的影响−顾客满意和品牌信任的链式中介作用[J]. 预测, 2019, 38(3): 38-44.
SHAO J B, LI Z Y, GAO Z Q. The impact of luxury mother brand value perception on the purchase intention of extended products—chain mediating role of customer satisfaction and brand trust[J]. Forecast, 2019, 38(3): 38-44.
[4]
易明, 操玉杰, 毛进. 基于点击流的个性化信息检索研究[J]. 情报科学, 2011, 29(4): 619-623.
YI M, CAO Y J, MAO J. Research on personalized information retrieval based on click stream[J]. Information Science, 2011, 29(4): 619-623.
[5]
BRANS J P, MARESCHAL B. Promethee V: mcdm problems with segmentation constraints[J]. INFOR: Information Systems and Operational Research, 1992, 30(2): 85-96. DOI: 10.1080/03155986.1992.11732186.
[6]
BEHZADIANA M, ALBADVI A, AGHDASI M. PROMETHEE: a comprehensive literature review on methodologies and applications[J]. European Journal of Operational Research, 2010, 200(1): 198-215. DOI: 10.1016/j.ejor.2009.01.021.
[7]
冯建英, 穆维松, 傅泽田. 消费者的购买意愿研究综述[J]. 现代管理科学, 2006, 2(11): 7-9.
FENG J Y, MU W S, FU Z T. Review of consumers’ purchasing intention[J]. Modern Management Science, 2006, 2(11): 7-9. DOI: 10.3969/j.issn.1007-368X.2006.11.003.
[8]
由丽萍, 王嘉敏. 基于情感分析和VIKOR多属性决策法的电子商务顾客满意感测度[J]. 情报学报, 2015, 34(10): 1098-1110.
YOU L P, WANG J M. E-commerce customer satisfaction measurement based on sentiment analysis and VIKOR multi-attribute decision making method[J]. Journal of the China Society for Scientific and Technical Information, 2015, 34(10): 1098-1110. DOI: 10.3772/j.issn.1000-0135.2015.010.010.
[9]
易明, 毛进, 邓卫华. 基于社会化标签网络的细粒度用户兴趣建模[J]. 现代图书情报技术, 2011, 27(4): 35-41.
YI M, MAO J, DENG W H. Fine-grained user interest modeling based on social tag network[J]. Modern Library and Information Technology, 2011, 27(4): 35-41.
[10]
莫赞, 罗敏瑶. 在线评论对消费者购买决策的影响研究−基于评论可信度和信任倾向的中介、调节作用[J]. 广东工业大学学报, 2019, 36(2): 54-61.
MO Z, LUO M Y. Research on the impact of online reviews on consumers’ purchase decisions—based on the mediating and moderating role of review credibility and trust tendency[J]. Journal of Guangdong University of Technology, 2019, 36(2): 54-61. DOI: 10.12052/gdutxb.180132.
[11]
左文明, 陈少杰, 王旭, 等. 基于前景理论的网络消费者多属性行为决策模型[J]. 管理工程学报, 2019, 33(3): 125-135.
ZUO W M, CHEN S J, WANG X, et al. Multi-attribute behavior decision model for online consumers based on prospect theory[J]. Journal of Management Engineering, 2019, 33(3): 125-135.
[12]
刘洪伟, 高鸿铭, 陈丽, 等. 基于用户浏览行为的兴趣识别管理模型[J]. 数据分析与知识发现, 2018, 2(2): 74-85.
LIU H W, GAO H M, CHEN L, et al. Interest recognition management model based on user browsing behavior[J]. Data Analysis and Knowledge Discovery, 2018, 2(2): 74-85.
[13]
李双双, 陈毅文. 点击流: 一种研究网上消费者的新范式[J]. 心理科学进展, 2007, 15(4): 715-720.
LI S S, CHEN Y W. Clickstream: a new paradigm for studying online consumers[J]. Advances in Psychological Science, 2007, 15(4): 715-720.
[14]
袁兴福, 张鹏翼, 刘洪莲, 等. 基于点击流的电商用户会话建模[J]. 图书情报工作, 2015, 59(1): 119-126.
YUAN X F, ZHANG P Y, LIU H L, et al. Modeling of e-commerce user sessions based on click stream[J]. Library and Information Service, 2015, 59(1): 119-126.
[15]
MOE W W. Buying, searching, or browsing: differentiating between online shoppers using in-store navigational clickstream[J]. Journal of consumer psychology, 2003, 13(1-2): 29-39. DOI: 10.1207/S15327663JCP13-1&2_03.
[16]
MONTGOMERY A L, LI S, SRINIVASAN K, et al. Modeling online browsing and path analysis using clickstream data[J]. Marketing science, 2004, 23(4): 579-595. DOI: 10.1287/mksc.1040.0073.
[17]
刘洪莲, 张鹏翼, 王军. 多会话网络购物商品信息搜寻行为研究[J]. 图书情报工作, 2015(14): 117-125.
LIU H L, ZHANG P Y, WANG J. Research on product information search behavior in multi-session online shopping[J]. Library and Information Service, 2015(14): 117-125.
[18]
MOKRYN O, BOGINA V, KUFLIK T. Will this session end with a purchase? inferring current purchase intent of anonymous visitors[J]. Electronic Commerce Research and Applications, 2019, 34: 100836. DOI: 10.1016/j.elerap.2019.100836.
[19]
JENKINS P. Click Graph: Web page embedding using clickstream data for multitask learning[C]//Companion Proceedings of the 2019 World Wide Web Conference. San Francisco: ACM International World Wide Web Conference, 2019: 37-41.
[20]
左妹华, 刘洪伟, 何锐超, 等. 基于logistic回归模型的消费者购买意向研究[J]. 南昌大学学报(理科版), 2019, 43(4): 398-403.
ZUO M H, LIU H W, HE R C, et al. Research on consumer buying intention based on logistic regression model[J]. Journal of Nanchang University (Science and Technology Edition), 2019, 43(4): 398-403.
[21]
范梦婷, 刘洪伟, 高鸿铭, 等. 电子商务平台下的竞争产品市场结构研究[J]. 广东工业大学学报, 2019, 36(6): 32-37.
FAN M T, LIU H W, GAO H M, et al. Research on the market structure of competitive products under the E-commerce platform[J]. Journal of Guangdong University of Technology, 2019, 36(6): 32-37. DOI: 10.12052/gdutxb.190082.
[22]
ZAIM H, RAMDANI M, HADDI A. Fuzzy-based mining framework of browsing behavior to enhance E-commerce website performance: case study from Kelkoo. com[C]//Proceedings of the 12th International Conference on Intelligent Systems: Theories and Applications. New York: Association for Computing Machinery, 2018: 1-6.
[23]
石磊, 丁鑫, 陶永才, 等. 一种检测兴趣漂移的元路径推荐模型[J]. 小型微型计算机系统, 2019, 40(3): 612-617.
SHI L, DING X, TAO Y C, et al. A meta-path recommendation model for detecting interest drift[J]. Microcomputer System, 2019, 40(3): 612-617. DOI: 10.3969/j.issn.1000-1220.2019.03.027.
[24]
JANNACH D, LERCHE L, JUGOVAC M. Adaptation and evaluation of recommendations for short-term shopping goals[C]//Proceedings of the 9th ACM Conference on Recommender Systems. Vienna: ACM Rec Sys, 2015: 211-218.
[25]
王维, 高岭, 高全力. 融合用户信任和用户兴趣漂移的协同过滤算法[J]. 微电子学与计算机, 2019, 36(7): 103-108.
WANG W, GAO L, GAO Q L. Collaborative filtering algorithm combining user trust and user interest drift[J]. Microelectronics & Computer, 2019, 36(7): 103-108.
[26]
周翔, 张鹏翼, 王军. 移动购物用户信息浏览特征及对购买的影响研究−基于移动电商APP点击流日志的分析[J]. 数据分析与知识发现, 2018, 2(4): 1-9.
ZHOU X, ZHANG P Y, WANG J. Research on the characteristics of mobile shopping users’ information browsing and their impact on purchases—analysis based on the click stream log of mobile e-commerce APP[J]. Data Analysis and Knowledge Discovery, 2018, 2(4): 1-9.
[27]
PARK J, CHUNG H. Consumers’ travel website transferring behaviour: analysis using clickstream data-time, frequency, and spending[J]. The Service Industries Journal, 2009, 29(10): 1451-1463. DOI: 10.1080/02642060903026254.
[28]
STEWART T J. A critical survey on the status of multiple criteria decision making theory and practice[J]. Omega, 1992, 20(5): 569-586.