本文引用格式
罗乐, 王兆红, 方旭东, 等. 中国在线体育用品消费现状与影响因素——基于天猫平台的大数据实证分析[J]. 上海体育学院学报, 2021, 45(6): 35-49, 58. DOI: 10.16099/j.sus.2021.06.002.   
中国在线体育用品消费现状与影响因素——基于天猫平台的大数据实证分析
罗乐 1, 王兆红 1, 方旭东 2, 许寒冰 1, 钟华梅 1, 康晓磊 3     
1. 北京师范大学 体育与运动学院, 北京 100875;
2. 国家体育总局 社会体育指导中心, 北京 100763;
3. 南京体育学院 体育教育与人文学院, 江苏 南京 210014
摘要: 目的 通过在线体育用品交易大数据研究中国在线体育用品消费现状与影响因素。方法 ① 通过天猫平台大数据对中国在线体育用品消费现状进行基于横截面设计的描述性分析;②聚焦EKB理论的信息搜寻环节,进行一系列条件过程分析,探讨消费者购买不同商品时各因素所发挥的中介、调节效应及其路径和影响力;③聚焦方案评估环节,结合定性和定量分析进行探索性研究,归纳消费者购买不同体育用品时关注的商品属性。结果 ① 健身裤、划船机等多数商品的折扣率经过评价数影响商品销量的中介效应受到了收藏数或原价的调节,在路径前半段、后半段或前后半段皆存在这种有调节的中介效应。②哑铃、运动手环等商品的折扣率对销量的影响受到评价数的调节且这种调节自身又受到收藏数的调节。结论 中国在线体育用品消费呈低端化趋势,网络店铺市场占有率呈幂律分布趋势。有调节的中介效应存在于健身裤、划船机等多数商品中;哑铃、运动手环等商品中存在被调节的调节效应。
关键词: 体育用品    在线消费    大数据    中介效应分析    调节效应分析    条件过程分析    天猫平台    
Current Situation and Influencing Factors of Online Sporting Goods Consumption in China: An Empirical Study Based on Big Data from Tmall
LUO Le 1, WANG Zhaohong 1, FANG Xudong 2, XU Hanbing 1, ZHONG Huamei 1, KANG Xiaolei 3     
1. School of Physical Education and Sports, Beijing Normal University, Beijing 100875, China;
2. Social Sports Center, General Administration of Sport of China, Beijing 100763, China;
3. School of Physical Education and Humanities, Nanjing Sport Institute, Nanjing 210014, Jiangsu, China
Abstract: Objective To explore the current situation and influencing factors of online sporting goods consumption in China based on the big data from Tmall. Methods Big data of online sporting goods transactions of Tmall were obtained.Information search of KEB theory and conditioning process analysis were used to probe into the mediated and moderated function, as well as its path and influence.Evaluation was finally adopted to conclude the consumers' attention to commodity attributes. Results The effect of discount rate on sales of fitness pants and rowing machine was moderated by the number of collections or initial price through the number of reviews.For dumbbell, sports bracelet and other kinds of sporting goods, the moderation of discount rate's effect on sales by the number of reviews was itself moderated by number of collections. Conclusions The online sporting goods on sale in China tends to be low-end, and the market share of online stores features itself with a power-law distribution. The mediated role with moderation is shown in most products such as fitness pants and rowing machines, while the products like dumbbell and sports bracelet are affected by moderated role.
Keywords: sporting goods    online consumption    big data    mediation analysis    moderation analysis    conditional process analysis    Tmall    

2020年6月,中国网络购物用户达7.49亿人,占网民整体的79.7%。2020年上半年网上零售额为51 501亿元,其中实物商品零售额为43 481亿元,占社会消费品零售额的25.2%[1]。新冠肺炎疫情发生以来,伴随着居家运动成为健身新常态,消费者在线购买体育用品的需求增强。本文基于消费者行为模式的EKB(engel-kollat-blackwell)理论,聚焦信息搜寻、方案评估等环节,研究中国在线体育用品消费的现状与影响因素。以此,响应《2021年政府工作报告》[2]提出的运用好“互联网+”,推进线上线下更广更深融合,发展健康、体育等服务消费的需求,并为此提供相关理论与实践建议。

1 文献综述 1.1 中国体育用品消费研究现状

在中国知网数据库以“体育、用品、消费”为主题词,检索关系为“并且”,得到CSSCI收录期刊文献126篇(发表截止日期:2020年9月28日)。将所有文章的摘要全文录入ATLAS.ti 8软件进行词条分析,关键词录入CiteSpace软件进行共现聚类分析,节点之间的连线表示共现(或共引)关系,粗细表示共现(或共引)强度,颜色对应节点代表第1次共现(或共引)的时间,从冷色调到暖色调的变化表示时间从早期到近期的变化。如表 1图 1所示,近年来中国学者对体育用品消费的研究多聚焦于宏观层面。2019—2020年主要运用新供给经济学、产业经济学等理论,对体育产业的结构性矛盾与优化路径进行研究[3-4],从供给侧改革视角提出体育产业改革的路径[5],从总量和结构视角研究体育产业发展过程中的宏观经济效应[6],指出产业结构转型升级是推动体育产业高质量发展的关键[7-8],并介绍了国外经验。另有学者对体育用品消费的统计现状[9]、学理脉络[10]、相关政策[11]等进行了研究。以上研究成果为体育用品消费研究奠定了理论基础并构建了框架。但从微观层面看,从广告、自恋以及青少年群体视角进行消费决策及其影响因素的实证研究较少[12-15]

表 1 体育用品消费文献摘要前10位词条统计 Table 1 Top 10 words in the abstracts of literatures on sporting goods consumption
图 1 体育用品消费文献的关键词共现图谱 Figure 1 Co-occurrence map of key words in literatures on sporting goods consumption
1.2 中国在线体育用品消费研究现状

对中国体育用品消费的研究趋于“高大上”,而关于消费者在线体育消费行为的研究多倾向于“细小精”式的具体问题具体分析。在关于整体消费市场的研究中,提出一系列假设或建立一系列模型并予以检验的实证研究已较多见,如基于双因素理论、体验学习理论、感知价值理论、博弈论、消费价值理论等,对购买决策[16]、顾客信任[17]、消费者满意度[18]、“羊群效应”[19]、网络团购[20-21]、强迫性购买[22]、个性化推荐[23]等议题进行研究。研究对象涉及具体群体、企业、城市、产品和细分行业等。

目前,针对中国在线体育用品消费的实证研究较少。张洪振等[24]建立了在线体育消费动机和顾虑的理论模型。全珍[25]、李哲[26]从网络视角分别对体育用品购买决策的影响因素与基本特征进行了论述。李晓聪[27]基于感知价值理论对消费者在线购买体育用品的影响因素进行了研究。

消费影响因素研究多受限于数据可得性而采用问卷调查法,缺乏真实的交易数据[28]。对问卷调查法的依赖引发了不可避免的研究缺陷,即会受到人为因素的影响。调查研究并不能测量社会行动,只能收集回溯性行动的自我报告,或将来的、假设性的行动,并不等同于“真实”的行动,还可能会存在欺骗误差和无能力回答误差等。即便后期定量分析保证了较高的信度,也无法克服调查研究效度较弱的问题[29]。同时,现有研究多为定量分析,缺乏定性研究。定性研究普遍具有较高效度,尤其在观察人们的社会行为时,可以提供调查法常忽略的信息与观点。

从总体中抽出的样本应包含总体所含的各种差异特征,否则抽样误差会降低研究效度。如以某市大学生为样本,仅能反映社会部分(某群体)情况,无法代表社会全貌,若以偏概全则可能引发结论与事实的偏差。在对电商平台的大数据分析中,大数据样本即研究总体本身,其统计特征与研究总体的统计特征等同[30]。大数据应用的优势在于解决小问题,数据案例集中于具体的事情和对具体业务效率的改进[31]

1.3 EKB理论研究

EKB理论是消费者行为学的经典理论且被市场广泛采纳[32] 156-163。EKB理论的决策过程分为问题辨识、信息搜寻、方案评估、购买决策与购后行为等。在进行消费决策时,消费者会一直搜索信息直到这种行为的边际成本等于边际收益[33],他们将信息用于方案评估,形成了对商品的态度、偏好、购买意图。Huang等[34]发现,在互联网情境下消费者对商品的搜索、购买行为有着显著差异,体现在搜索深度、搜索广度、在平台影响下花费精力学习他人经验等方面。

综上,以真实的在线体育用品消费大数据为样本进行定量和定性分析,能实现商家对市场的被动适应与主动适应[35],是对该领域现有研究的有益补充,具有理论与实践价值。

2 研究方法与数据来源

研究方法:①通过大数据对中国在线体育用品消费现状进行基于横截面设计的描述性分析;②聚焦EKB理论的信息搜寻环节,进行一系列条件过程分析,探讨消费者购买不同商品时各因素所发挥的中介效应、调节效应及其路径和影响力;③聚焦方案评估环节,结合定性和定量分析进行探索性研究,归纳消费者购买不同体育用品时关注的商品属性。

数据来源:利用Python调取天猫平台在售体育用品大数据。天猫平台在2019年网络零售市场GMV(网站成交金额)统计中占50.1%,在2020年“双十一”全网总销售额中占59.1%,均超过其他电商平台之和,具有较好的研究代表性。

描述性分析:在天猫平台采集常用的15种体育用品,涉及1.28万个网络认证店铺5.55万个产品1 070.17万次交易数据。经数据清洗得到1.12万个网络认证店铺4.88万个产品900.19万次交易数据。探索性研究:对14种体育用品(运动手环未获得相应数据)各自PC端首页前44个(共616个)商品,提取3 640个评价标签,涉及72.29万次评价。经数据清洗,得到3 208个积极评价标签69.37万次评价和429个消极评价标签2.25万次评价。

3 结果与分析 3.1 中国在线体育用品市场现状 3.1.1 在售体育用品趋于低端化

图 2所示,划船机、椭圆机、跑步机的平均价格在15种体育用品的价格区间中显著高于其他体育用品。运动手环、筋膜枪作为中等价格商品,价格平均值显著高于其他低价商品。

图 2 各类在线体育用品价格区间比较(平均值±标准误) Figure 2 Comparison of price ranges of online sporting goods(mean with SE)

各类体育用品月销量、店铺数、在售商品数如图 3所示。体育用品价格在一定程度上与其制作的复杂程度成正比。将商品按价格平均值由低至高排列,可看出随着制作工艺逐渐复杂,体育用品在售数量和店铺数均呈下降趋势,且二者呈显著正相关(r=0.707,P<0.05)。这反映了中国消费者对各种商品的需求度,也是低水平制造技术在国内被简单重复利用而工艺复杂且需具备设计、研发等要素的体育用品匮乏的表现[36],还是中国制造业的内部链条对外依附较强而体育用品在全球产业价值链“微笑曲线”中低端锁定的表现[37]

图 3 各类在线体育用品月销量、店铺数与在售商品数比较 Figure 3 Comparison of monthly sales, stores and products of online sporting goods
3.1.2 店铺市场占有率呈幂律分布

图 4(a)所示,头部商家占据了极高的市场份额,呈幂律分布。按店铺所售商品的月销量占总销量的排名统计,无论哪类商品,细分市场排第10名以后的店铺,其市场占有率均未超过2.98%。

图 4 各类在线体育用品头部店铺的市场占有率分布 Figure 4 Market share of top online sporting goods stores

图 4(b)所示,前10名店铺的市场占有率依商品种类分化明显。哑铃、体脂秤、划船机等的前10名店铺市场占有率均达到60%以上,但运动袜的前100名店铺的占有率只有76.15%。该分布与消费者在电商平台搜索成本下降、利基产品市场空间增加、明星产品市场份额下降有关[38]。在一个由可变成本与不变成本叠加构成的行业中,若新技术(互联网)更可能降低不变成本,将更有利于新的利基产品商家入围,产品多样化程度提高,销量更加分散,形成长尾效应[39]

3.2 在线体育用品销量影响因素的条件过程分析 3.2.1 在线体育用品销量主要影响因素的相关性分析

消费者在线购买体育用品,常规操作是输入目标内容,在产品列表中做出抉择,其直观可见的信息是月销量、原价、促销价、收藏数、评价数5组重要数据。本文按常用的“销量排名”进行商品搜索,对15种体育用品各自PC端前3页(剔除无效数据后共计2 360个商品,销售记录812.86万次,评价3 152.23万次,收藏6 981.57万次)进行分析。与前文所述幂律分布吻合,各种商品PC端前3页销量之和占总销量的90.3%,具有较强代表性。采用Z-score将数据标准化($ Z=\frac{{\rm X}-\overline{X}}{\sigma } $),提升数据之间的可比性。鉴于消费者购买商品时普遍将促销价与原价对比,审视商家打折力度,故引入商品折扣率作为新变量:

$ \text { 商品折扣率 }=\frac{\text { 原价-现价(促销价) }}{\text { 原价 }} \times 100 \% $ (1)

每种商品的各因素相关分析矩阵如图 5所示。各因素在各商品中的关系有明显区别:健身裤、筋膜枪、体脂秤、瑜伽垫、运动袜的折扣率与销量呈显著正相关(P<0.05);运动手套、泡沫轴、瑜伽服、运动毛巾、划船机、跑步机则为正相关边缘显著(0.05<P<0.1)。以上商品随着折扣率的提高,销量会有所提升。椭圆机、哑铃、运动手环、阻力带的折扣率与销量相关性不显著(P>0.1)。原价与销量的相关性方面,筋膜枪呈显著正相关(P<0.05),运动袜、椭圆机则呈显著负相关(P<0.05),运动手环为负相关边缘显著(0.05<P<0.1),其余商品则不显著(P>0.1)。价格是品牌质量的最直接反映。一般而言,当一款商品具有高品牌价值后,价格会显著提高。筋膜枪的原价与销量呈显著正相关,是消费者已关注该类用品品牌的反映。更多用品的原价与销量的相关性不显著,说明消费者在购买其他用品时,对于原价所代表的质量品牌因素并未非常关注。这从另一个维度验证了中国体育用品在产业价值链“微笑曲线”中的低端锁定。运动袜、椭圆机、运动手环的原价甚至与销量呈负相关,可见消费者购买这类商品时有可能会牺牲品牌,换取低价。评价数与收藏数均与各类商品销量呈显著正相关,且在14种商品(运动手环除外)中评价数与销量的相关系数普遍大于收藏数与销量的相关系数。

图 5 在线体育用品各因素的相关系数分析 Figure 5 Correlation coefficient analysis of online sporting goods
3.2.2 理论假设

自变量X通过变量M对因变量Y的间接效应因调节变量W的变化而变化,则XY的关系可被视为条件过程(conditional process)[40]397。Hayes对条件过程的研究建议是:首先确认关键的、最感兴趣的先导因素X,然后建立其与Y的关系路径。思考X可能通过各类中介要素影响Y,并且该中介部分的路径还可能因某个调节变量的变化而变化。

从EKB理论的信息搜寻视角看,商品销量是消费者最关注的一组信息。从市场营销角度看,将商品售卖出去是商家的最终目的,销售数据可由销量反映。本文将销量视为因变量Y,在各类市场营销研究中,价格对销量的影响是最重要的环节。鉴于各类商品价格差异较大,直接比较商品的价格绝对值无助于商品间的比较,故将商品折扣率作为衡量实际价格的指标,视为自变量X。如图 6所示,评价数与商品各因素的相关性最为常见且显著,假设其是最具影响力的中介变量M。将收藏数、原价视为XMY路径上的调节变量W1W2。建立理论模型1:折扣率通过评价数影响商品销量,且该中介效应受到了收藏数或原价的调节。这种有调节的中介效应可能在路径的前后半段发生作用。

图 6 理论模型1 Figure 6 Theoretical model 1

参照温忠麟等[41]的研究范式,研究的第1步应为检验折扣率X对销量Y的直接效应是否受到了收藏数或原价W的调节。调节检验的回归方程为

$ Y={i}_{y}+{b}_{1}X+{b}_{2}W+{b}_{3}XW+{e}_{y} $ (2)

式(2)中,$ {i}_{y} $是常数项,$ {b}_{1}、{b}_{2}、{b}_{3} $分别是XWXW的系数,$ {e}_{y} $是误差项。Hayes[40]248指出,在调节作用中$ {b}_{3} $显著与否决定了XY的效应是否依托于W。对检验结果中无调节效应的,进行第2步即有调节的中介检验;对产生调节效应的,进一步分析的选择之一是研究该种调节效应是否受到其他变量的中介作用,即有中介的调节效应(mediated moderation)。但Hayes[40]467指出所测量的XW并不具实践意义,他建议将有中介的调节效应转变为有调节的中介效应(moderated mediation)进行分析,即回到了第2步的研究中。另一种思路是进一步观察该调节变量是否被其他变量调节,即被调节的调节效应(moderated moderation)。本文基于第2种思路,提出理论模型2:折扣率对商品销量的影响被评价数所调节,且该调节效应自身又被收藏数或原价所调节(图 7)。

图 7 理论模型2 Figure 7 Theoretical model 2

将评价数作为第1调节变量W,将收藏数或原价作为第2调节变量Z,观察它们在XY路径上的调节效应,检验的回归方程为

$ Y={i}_{y}+{b}_{1}X+{b}_{2}W+{b}_{3}Z+{b}_{4}XW+{b}_{5}XZ+{b}_{6}WZ+{b}_{7}XWZ+{e}_{y} $ (3)

式(3)中,$ {i}_{y} $是常数项,$ {b}_{1}~{b}_{7} $分别是XWZXWXZWZXWZ的系数,$ {e}_{y} $是误差项。$ {b}_{7} $显著与否决定XY的影响是否受W调节且W自身又受到了Z的调节[40]331。如将评价数改为第2调节变量,收藏数或原价改为第1调节变量,并不会改变XWZ的系数和其对应的$ {R}^{2} $(判定系数)与$ ∆{R}^{2} $(修正自由度的判定系数)。

3.2.3 研究结果

(1)各类在线体育用品的收藏数、原价对折扣率—销量的调节效应。采用SPSS的Process 3.5对15种商品的收藏数、原价分别进行研究。结果如表 2所示,发现仅有运动手套、哑铃、运动手环的收藏数的$ {b}_{3} $是显著的,其余均不具调节效应。尽管在运动手套和运动手环中,收藏数所发挥的调节效应仅解释了1.6%和2.3%的效果,但均具有显著性;哑铃的收藏数的调节效应则解释了46.7%的效果。

表 2 在线体育用品各因素的调节效应分析 Table 2 The moderation analysis of online sporting goods

(2)各类在线体育用品有调节的中介模型的建立及效应分析。对不受收藏数、原价所调节的各类商品建立有调节的中介模型。传统的检验方式一般以检测交互项的显著性为准进行报告。新近研究则聚焦于模型整体,对表达间接效应函数中的调节变量权重是否为0进行检测。Hayes[40]425将这个权重称为index of moderated mediation,该指数反映了调节变量在整条中介路径上的影响力。采用这种方式测量间接效应是否被调节时,定义间接效应路径的交互作用是否显著并不重要。在很多检测中,即便交互项显著,该指标也可能包含0,这使得检验标准更为严苛。若该指标包含0,则结合Preacher等[42]提出的亚组分析法原理和Edwards等[43]的检测方法,只要代入某个U值(调节变量)时中介效应显著,而代入另一个U值时中介效应不显著,则说明中介效应随U值变化。本文采用温忠麟等[41]的范式,用bootstrap法检验调节变量U平均值±SD的值进行代入,结果如图 8所示。

图 8 各类在线体育用品有调节的中介模型检验结果 Figure 8 The moderated mediation analysis of online sporting goods 注:①W1为收藏数,W2为原价,在Process 3.5中,W对中介效应的前后半段均有调节作用时,Index指标不呈现[40]536;②运动手套U±SD的中介效应之差无显著性差异,U取平均值时,中介效应显著[95%CI(0.155,1.096)];③表示 P<0.1,*表示P<0.05,**表示P<0.01,***表示P<0.001,bootstrap=5 000;④×表示不满足该验证方式,√表示满足该验证方式。

除哑铃、运动袜、运动手环和跑步机外,各商品的条件过程均存在,只是在路径和程度上有所差别。在瑜伽服的2个分析中,尽管前半段中介路径都不显著,但后半段均显著;且评价数作为中介变量的单独中介分析,总效应C=0.157,P=0.066<0.1,呈边缘显著,间接效应ab=0.152,95%CI[0.012,0.532]不含0,证明显著。

Hayes[44]指出,在现代中介分析中XY直接效应的验证并非是检验其间接关系的前提。在上述商品分析中,折扣率—销量的直接效应c’均不显著。这仅是在统计学上的意义,并未否定二者在实际营销中的关联,只是进一步体现了评价数所代表的间接效应的重要性。

W1=收藏数时,理论模型1在健身裤的有调节的中介效应检验中得到了验证。W2=原价时,运动手套、运动毛巾、划船机也支持模型1。在这些模型中,W在中介路径的前半段发挥了正向调节作用,在后半段发挥了负向调节作用,U±SD的中介效应之差呈显著性差异(运动手套则在U取平均值时中介效应显著)。根据Hayes的建议,采用选点法和bootstrap=5 000的方法制图。如图 9所示:当调节变量处于-0.75~0.47时,简单斜率95%CI不包含0,中介效应显著;当调节变量低于-0.75或高于0.47时,简单斜率95%CI包含0,中介效应不显著。可见,原价所代表的品牌质量对中介效应的调节仅在一段范围内有效,且在这段范围内呈原价越高、中介效应越低的效果。其他商品则部分支持了理论模型1,其路径、程度均因商品不同而各异。

图 9 运动手套的有调节的中介效应分析 Figure 9 The moderated mediation of fitness gloves

(3)各类在线体育用品被调节的调节模型的建立及效应分析。收藏数作为运动手套、哑铃和运动手环的调节变量时,对折扣率—销量的关系起到了调节作用。对上述三者进一步检验是否存在被调节的调节效应。发现被调节的调节效应在运动手套、哑铃和运动手环中分别解释了7.6%、1.4%、4.4%的销量效果且均显著。对跑步机进行补充研究,发现尽管评价数在前文研究中并未发挥中介效应,但发挥了调节效应,且这种调节效应被收藏数调节,结果如表 3所示。

表 3 各类在线体育用品被调节的调节作用效应分析 Table 3 The moderation analysis of online sporting goods

根据方杰等[45]的建议,在调节变量为连续变量时,使用Johnson-Neyman法进行简单斜率检验,能在调节变量Z的整个取值范围[ZminZmax]内,寻找简单斜率显著不为0时调节变量Z的区间,对调节作用进行量化。其公式为

$ \widehat{Z}=\frac{-B\pm \sqrt[]{{B}^{2}-4AC}}{2A} $ (4)

调节变量Z取值$ \widehat{Z} $时,简单斜率a+c$ \widehat{Z} $显著性检验的t值等于$ {t}_{\mathrm{c}\mathrm{r}\mathrm{i}\mathrm{t}} $,显著性概率P等于选定的显著性水平αα=0.05),即$ \widehat{Z} $的简单斜率a+c$ \widehat{Z} $为是否显著的分界点[45]。如图 10所示,当哑铃的收藏数 > 3.361 3,简单斜率95%CI不包含0时,简单斜率显著,折扣率对销量的影响通过评价数得到调节且效应随着收藏数的增加而增强;当运动手环的收藏数<2.668 1时,对应效果随着收藏数的增大而增强,在超过2.668 1后效果不显著;当跑步机的收藏数<1.856 0时,对应效果显著,但随着收藏数的增大而减弱,直至临界值不显著;当运动手套的收藏数<0.558 7或>2.371 8时,对应效果随着收藏数的增大而减弱。在2个临界点之间时,调节效应不显著。

图 10 各类在线体育用品被调节的调节效应分析 Figure 10 The moderation analysis of online sporting goods

汇总模型1的验证结果,可将15种商品分为评价中介型和非评价中介型,后者由哑铃、运动手环、跑步机组成,其他则是评价中介型。在评价中介型中,又可分为4个亚组:①中介效应未被调节的运动袜;②仅受收藏数调节的椭圆机;③仅受原价调节的运动毛巾、泡沫轴、运动手套和划船机;④受收藏数、原价双重调节的阻力带等其他商品。从模型2的角度看,评价数对运动手环、跑步机等4种商品发挥了调节效应,又可分为2个亚组:①在运动手套、跑步机中,收藏数负向调节了这种调节效应;②在哑铃、运动手环中,调节效应被收藏数正向调节。对上述组别的辨析有助于了解不同商品中各种属性发挥效应的路径和影响力,便于营销者制定战略,将有限的资源投放在有价值的因素之上。

3.3 消费者在线购买体育用品关注的属性

消费者将每个商品看作不同属性的组合,这些属性提供特定利益。消费者感兴趣的属性因商品的类别差异有所不同[32]159。那么,消费者在线购买不同类别的体育用品时分别关注哪些属性?如果基于问卷调查法进行研究,该方法的自身缺陷会导致缺乏客观性;而在电商平台中,已有真实可查的用户反馈——体验评价。在天猫平台购买了相关商品的消费者才能对该商品进行评价。评价内容反映了消费者对该商品的关注点,也是其他消费者未来购买该商品的重要依据。消费者对一件商品的体验是复杂多样的,人们潜意识中的价值观、情感欲望、行为动机被外在世界的理性化与自我保护所掩饰,其评价多是定性的,并非像定量数据一般清晰可查,但恰是定性研究对于揭示哪种感觉对消费者更重要很有作用。通过将天猫平台商品评价标签化和量化处理,实现了定性研究和定量研究的互补。本文通过对定性资料的编码等处理识别消费者所关注各类商品的关键属性。

3.3.1 标签编码与积极、消极评价信息流向

天猫平台上常用的14种体育用品(运动手环未获取相应数据)的积极评价标签3 208个、评价69.37万次,消极评价标签429个、评价2.25万次,采用内容分析法对其进行研究。积极、消极评价标签的比例为7.48∶1,积极、消极评价个数的比例为30.88∶1,反映了平台对消极评价的控制。因为在收益和损失处于同等数量时,消费者会对损失更为敏感,即消极口碑比积极口碑对消费者的影响力更大[46-47]

图 11所示,合并意义相同的同类项,对“材料好”“尺寸好”等36个积极评价标签进行编码,对“颜色不好”“物流慢”等18个消极评价标签进行编码;按评价类型分为服务、尺寸、价格、体验、外观和材质6种。设商品、评价类型、实际评价3个节点,通过桑基能量分流图展现节点之间的信息数据流动。节点大小与数据多少成正比,线条粗细与数据流量大小成正比。

图 11 各类在线体育用品评价桑基能量分流图 Figure 11 Sankey diagram of online sporting goods reviews

消费者发布积极评价较多的是运动袜、瑜伽服、瑜伽垫等商品。发布消极评价时,尽管运动袜、瑜伽服依然较多,但瑜伽垫较积极评价减少很多,而划船机等商品有所提升。如图 12所示:当给予积极评价时,消费者尤为关注商品的材质(41.82%)和体验(18.11%),信息主要流向了材料好、穿戴效果好等方面;当给予消极评价时,最为看重材质(69.35%)和服务(14.61%),信息主要流向了材料差、气味不好、物流慢等方面。

图 12 消费者对于各评价类型的关注度 Figure 12 Consumers' attention to the major reviews types
3.3.2 消费者对不同体育用品的评价属性侧重

消费者通过属性评估,建立一组关于商品的各个属性上的优劣观点,形成对商品的态度,进而评估商品。在信息模糊、不明确的网络情景中,个人凭借知识和经验做出最有效的独立决策难度增大,消费者跟随他人选择则是一种简单快速的决策规则,能够帮助个体提高效率,是“羊群效应”的一种体现,即消费者对他人行为决策的模仿[19]。掌握了多数人对商品的体验认知和属性关注点,就有更大概率吸引到“下一个”或“下一次”购买(图 13)。

图 13 消费者对不同在线体育用品的评价侧重 Figure 13 Consumers' emphasis on different reviews on online sporting goods

调查结果显示,在线购物时只看差评的用户占9.55%,只阅读好评的被调查者占1.81%[48]。高质量的消极评价令消费者对商品满意度大幅降低,会更谨慎地选择原本打算购买的产品,并有更多的人最终决定放弃购买[49]。材质差是消费者给予负面反馈的最常见问题,可能会导致商品直接被消费者放弃。购买运动袜时,消费者对其材质、体验、价格都比较重视,但如果服务(客服质量、快递速度)和材质较差,则会影响消费者购买。瑜伽服也有着相似的情况,可见对于运动袜、瑜伽服这类商品,消费者能接受的购买—使用的周期较短,对“即买即用”有着较高期待。

4 讨论

中国在线体育用品趋于低端化,店铺市场占有率呈幂律分布。在EKB理论的信息搜寻阶段,消费者只会搜寻有限的信息;在方案评估阶段,消费者最关注那些能够带给自己利益的商品属性,而他们感兴趣的属性会因商品差异而有所不同[32]159。这就解释了在条件过程分析中,不同种类商品的各因素有的发挥了有调节的中介效应,有的则是被调节的调节效应,效应路径、程度均存在显著差异。

每个人的评估准则是不同的。通过大数据勾勒的评估准则共性,对商家判断趋势、服务目标群体有实践价值,它能反映消费群体在购买某种商品时普遍关注的属性。当关注的属性雷同时,商品间可以形成类。从数据科学的研究范式看,对各商品的分类不仅应从有标记的训练数据推断出各种商品间存在的关系,更应用代表该种关系的函数映射新的商品并赋予其类标记,实现高准确率的预测。依赖于研究者经验知识的分类存有潜在风险,这种风险也是人工智能在机器学习中所面临的2个问题:①存在偏见,任何分类都需基于已知的某个“结论”来对所有数据建立标签,完成分类,若“结论”自身存在偏见,则分类必然存在问题;②为了得到一致假设而使假设过度严格的“过拟合”,如对一种分类过度解释,未必能解释,甚至错误解释未来新纳入的某个具体商品所属类别。

在很多数据科学算法中,分类的预处理技术是聚类,即通过无监督学习的聚类技术寻找未标记数据中隐藏的关系。聚类基于无类标记的数据,将n维属性转换或简化为一个分类属性“簇ID”,降低了维数和复杂度。在实践中,每个商品都是独一无二的,即便是属于同一种商品,不同款式之间的属性特征可能存在极大区别。因此,基于“每种”商品属性的平均值寻求数据间的关系,对于市场实践并不可靠,基于“每个”商品的数据集进行关系挖掘才可能获得有市场价值的信息。

本文采用K-means聚类将前文2 360个商品作为数据集,首先确定k值。使用rapidminer的normalize算子将折扣率以外的数据标准化,将clustering(K-means)和performance(cluster distance)2个算子连接并内嵌至loop parameters算子中。loop parameters参数k设置为min=2,max=10,steps=10,measure_types为mixed、numerical、bregamn divergences 3种,得到27种组合。遵循肘部法则,在k=3时拐点较为明显。在有多个k 值的聚类运行中,Davies-Bouldin指数最低的度量类型可被认为是最优[50](本文k=3时,3种measure_types的Davies-Bouldin指数均为0.740)。随后,运用rapidminer绘制了3个簇的主要鉴别性特征作为X轴和Y轴形成的坐标系(图 14)。

图 14 聚类分析结果 Figure 14 Cluster model

cluster 0的组群特征是评价数和原价的平均值比样本对应的总平均值低45.41%和39.95%;cluster 1的组群特征是原价和促销价平均值比样本对应总平均值高906.03%和905.38%,但销量低96.47%(第3特征);cluster 2的评价数、销量平均值比样本对应总平均值高1 681.88%和1 203.46%。聚类算法并不会明确指出聚类原因,需要研究者凭借实践经验解读。本文将簇视为“元素”,以每种商品所含各簇的比例为表达方式,结合前文定性研究结果制表 4。如表 4所示:高价格、低销量的商品集中出现在划船机、椭圆机、跑步机中;高评价数、高销量的商品则分布于体脂秤、瑜伽垫、运动袜等商品中,但cluster 1和cluster 2的比例均未超过30%,每种商品中的多数款型依然属于cluster 0,这是对市场原貌的真实反映。此外,结合商品、店铺情况,营销者可通过表 4了解消费者在评估各种商品时重点关注的属性,以此获得具有实践价值的市场信息,还可据前文研究结果将有限的营销资源投放在能产生更大中介/调节效应的因素上。

表 4 各类在线体育用品含聚类簇的成分比例及重点评价内容 Table 4 The cluster proportions and key reviews of online sporting goods
5 结论

通过大数据分析发现,中国在线体育用品消费呈低端化趋势,网络店铺市场占有率呈幂律分布趋势。有调节的中介效应存在于健身裤、划船机等多数商品中;在哑铃、运动手环等商品中则存在被调节的调节效应。以上每种商品的效应发挥路径和程度不同。通过编码分析消费者购买体育用品后在线评价的定性资料,总结消费者对各类商品属性的关注点。最后,通过机器学习的聚类分析总结各类商品特征。

作者贡献声明:

罗乐:提出研究主题,设计研究方案,收集并整理数据,撰写论文;

王兆红:修改论文框架,指导修改论文;

方旭东:调研文献,提出研究观点;

许寒冰:调研文献,提出研究观点;

钟华梅:调研文献,修改论文;

康晓磊:调研文献,访谈专家。

参考文献
[1]
CNNIC. 中国互联网络发展状况统计报告[EB/OL]. [2021-04-07]. http://www.cac.gov.cn/2020-09/29/c_1602939918747816.htm (0)
[2]
中国政府网. 2021年政府工作报告[EB/OL]. [2021-04-07]. http://www.gov.cn/zhuanti/2021lhzfgzbg/index.htm (0)
[3]
任波, 黄海燕, 戴俊, 等. 新时代我国体育产业结构性矛盾与优化路径[J]. 体育文化导刊, 2019(3): 64-69 (0)
[4]
任波, 戴俊, 黄海燕. 中国体育产业结构的形塑逻辑与供给侧改革路径[J]. 天津体育学院学报, 2019, 34(1): 52-59 (0)
[5]
付群, 王萍萍, 陈文成. 挑战、机会、出路: 我国体育产业供给侧结构性改革研究[J]. 天津体育学院学报, 2019, 34(1): 44-51 (0)
[6]
戴腾辉, 王跃, 周孝, 等. 我国体育产业发展过程中的宏观经济效应分析: 基于总量和结构的视角[J]. 西安体育学院学报, 2019, 36(3): 257-263 (0)
[7]
陈林会. 我国体育产业高质量发展的结构升级与政策保障研究[J]. 成都体育学院学报, 2019, 45(4): 8-14 (0)
[8]
郑和明, 尚志强, 薛林峰. 日本的体育产业发展现状、发展方式及启示[J]. 首都体育学院学报, 2020, 32(2): 116-121 (0)
[9]
杨涛, 李法伟, 蔡军. 文化产业与体育产业中体育消费统计现状研究[J]. 首都体育学院学报, 2019, 31(4): 316-320 (0)
[10]
刘东升, 徐光辉, 陈艳, 等. 体育消费的学理脉络、统计内容及其实施策略[J]. 体育学研究, 2019, 2(4): 29-36 DOI:10.3969/j.issn.1008-1909.2019.04.005 (0)
[11]
王睿, 杨越. 家庭视域下扩大我国体育消费的政策研究[J]. 体育科学, 2020, 40(1): 42-50 DOI:10.3969/j.issn.1004-3624.2020.01.008 (0)
[12]
吕兴洋, 郭璇, 刘悦. 体育明星代言的专业性体育用品平面广告对消费者购买决策的影响研究: 以网球拍平面广告为例[J]. 首都体育学院学报, 2019, 31(3): 215-220 (0)
[13]
黄亨奋, 吕庆华, 景凯雯. 体育消费过程中消费者特性对仿冒品购买意愿影响机理研究: 基于自恋的视角[J]. 中国体育科技, 2019, 55(11): 31-40 (0)
[14]
张瑞林, 李凌, 贾文帅. 冰雪体育广告对消费行为的影响研究: 基于态度的调节效应[J]. 武汉体育学院学报, 2020, 54(5): 13-20 (0)
[15]
徐开娟, 曾鑫峰, 黄海燕. 青少年体育消费特征及影响因素的实证分析: 基于上海市青少年体育消费的调查研究[J]. 体育学研究, 2019, 2(4): 41-47 (0)
[16]
陈梅梅, 薛阳阳. 基于消费群体聚类的网络购买决策关键影响因素分析[J]. 统计与决策, 2015(3): 49-51 (0)
[17]
杨锴, 刘建华. 网络消费环境下顾客信任的影响因素研究[J]. 现代管理科学, 2013(10): 112-114 DOI:10.3969/j.issn.1007-368X.2013.10.037 (0)
[18]
宁连举, 闫春晓, 肖海弘. 在线消费顾客满意影响因素的分类研究[J]. 东北大学学报(社会科学版), 2014, 16(1): 32-37 (0)
[19]
王财玉, 雷雳. 网络购物情境下的羊群效应: 内涵、影响因素与机制[J]. 心理科学进展, 2017, 25(2): 298-311 (0)
[20]
彭惠军, 黄翅勤, 胡最. 游客网络团购旅游线路意愿及阻碍因素研究[J]. 商业研究, 2013(10): 104-109 DOI:10.3969/j.issn.1001-148X.2013.10.016 (0)
[21]
魏欢, 李君轶. 游客在线团购行为的影响因素研究: 以西安温泉团购为例[J]. 软科学, 2014, 28(3): 101-105 DOI:10.3969/j.issn.1001-8409.2014.03.022 (0)
[22]
赵占波, 杜晓梦, 陈凯. 网络强迫性购买倾向的影响机制及应对措施研究[J]. 管理评论, 2014, 26(4): 130-141 (0)
[23]
万晓榆, 吴继飞, 林瑛. 信息服务在线个性化定制决策影响因素研究: 基于大学生移动通信服务定制实验[J]. 北京邮电大学学报(社会科学版), 2014, 16(4): 55-61 (0)
[24]
张洪振, 陈文新, 姜川, 等. 体育营销中消费者的消费动机与顾虑研究: 以在线体育消费为视角[J]. 北京体育大学学报, 2010, 33(8): 19-23 (0)
[25]
全珍. 网络口碑对鞋服体育用品购买决策的影响研究[D]. 泉州: 华侨大学, 2014: 8-11 (0)
[26]
李哲. 大学生网购体育用品的基本特征分析[D]. 武汉: 武汉体育学院, 2014: 9-10 (0)
[27]
李晓聪. 基于感知价值的体育用品消费者网购意愿影响因素模型研究[D]. 临汾: 山西师范大学, 2018: 27-29 (0)
[28]
李宗伟, 张艳辉, 栾东庆. 哪些因素影响消费者的在线购买决策?: 顾客感知价值的驱动作用[J]. 管理评论, 2017, 29(8): 136-146 (0)
[29]
巴比. 社会学研究方法[M]. 邱泽奇, 译. 北京: 华夏出版社, 2009: 276-277 (0)
[30]
解明明. 政府统计视角下的大数据样本与总体关系探讨[J]. 中国统计, 2014, 12: 54-55 (0)
[31]
胡小明. 大数据应用的误区、风险与优势[J]. 电子政务, 2014(11): 80-86 (0)
[32]
科特勒, 凯勒. 营销管理[M]. 15版. 王永贵, 陈荣, 于洪彦, 等, 译. 上海: 格致出版社, 2009 (0)
[33]
STIGLER G J. The economics of information[J]. Journal of Political Economy, 1961, 69(6): 213-225 (0)
[34]
HUANG P, LURIE N H, MITRA S. Searching for experience on the web: An empirical examination of consumer behavior for search and experience goods[J]. Journal of Marketing, 2013, 73(2): 55-69 (0)
[35]
刘祎, 王玮. 工业大数据资源转化为竞争优势的内在机理: 基于资源编排理论的案例研究[J]. 华东经济管理, 2019, 33(12): 165-172 (0)
[36]
孔令夷. 中国体育用品产业运营战略因素评估与对策[J]. 北京体育大学学报, 2013, 36(8): 24-32 (0)
[37]
范尧. 供给侧改革背景下体育用品供需困境与调和[J]. 体育科学, 2017, 37(11): 11-20 (0)
[38]
赵冬梅, 王明. 电商市场长尾现象的形成机理与实证研究[J]. 西安交通大学学报(社会科学版), 2019, 39(3): 32-40 (0)
[39]
KENDALL T D, TSUI K. The economics of the long tail[J]. The B E Journal of Economic Analysis & Policy, 2012, 11(1): 1-34 DOI:10.2202/1935-1682.2845 (0)
[40]
HAYES A F. Introduction to mediation, moderation, and conditional process analysis: A regression-based approach[M]. 2 ed.New York: The Guilford Press, 2018. (0)
[41]
温忠麟, 叶宝娟. 有调节的中介模型检验方法: 竞争还是替补?[J]. 心理学报, 2014, 46(5): 714-726 (0)
[42]
PREACHER K J, RUCKER D D, HAYES A F. Addressing moderated mediation hypotheses: Theory, methods, and prescriptions[J]. Multivariate Behavioral Research, 2007, 42: 185-227 DOI:10.1080/00273170701341316 (0)
[43]
EDWARDS J R, LAMBERT L S. Methods for integrating moderation and mediation: A general analytical framework using moderated path analysis[J]. Psychological Methods, 2007, 12: 1-22 DOI:10.1037/1082-989X.12.1.1 (0)
[44]
HAYES A F. Beyond Baron and Kenny: Statistical mediation analysis in the new millennium[J]. Communication Monographs, 2009, 76: 408-420 DOI:10.1080/03637750903310360 (0)
[45]
方杰, 温忠麟, 梁东梅, 等. 基于多元回归的调节效应分析[J]. 心理科学, 2015, 38(3): 715-720 (0)
[46]
CHEN Y B, WANG Q, XIE J H. Online social interactions: A natural experiment on word of mouth versus observational learning[J]. Journal of Marketing Research, 2011, 48(2): 238-254 DOI:10.1509/jmkr.48.2.238 (0)
[47]
CUI G, LUI H K, GUO X N. The effect of online consumer reviews on new product sales[J]. International Journal of Electronic Commerce, 2012, 17(1): 39-58 DOI:10.2753/JEC1086-4415170102 (0)
[48]
CNNIC. 网购用户浏览评论情况[EB/OL]. [2021-04-07]. http://www.199it.com/archives/207184.html (0)
[49]
李宏, 喻葵, 夏景波. 负面在线评论对消费者网络购买决策的影响: 一个实验研究[J]. 情报杂志, 2011, 30(5): 202-207 DOI:10.3969/j.issn.1002-1965.2011.05.044 (0)
[50]
库图, 德什潘德. 数据科学概念与实践[M]. 2版. 黄智濒, 白鹏, 译. 北京: 机械工业出版社, 2020: 149 (0)