PLS-SEM多变量统计分析在赛事观众研究领域中的应用

本文引用格式

骆雷. PLS-SEM多变量统计分析在赛事观众研究领域中的应用[J]. 上海体育学院学报, 2020, 44(11): 86-94. DOI: 10.16099/j.sus.2020.11.010.

骆雷

上海体育学院经济管理学院，上海 200438

收稿日期: 2019-07-16; 修回日期: 2019-11-02

基金项目: 教育部人文社会科学研究一般项目（14YJC890018）

作者简介: 骆雷(ORCID:0000-0002-4503-7603), 男, 江苏徐州人, 上海体育学院副教授; Tel.:18801768303, E-mail:12831975@qq.com

摘要: 运用文献资料法探讨基于偏最小平方法的结构方程模型（partial least squares structural equation modeling，PLS-SEM）多变量统计分析在当前赛事观众研究领域的应用方法与注意事项。发现：调节变量与中介变量的引入有助于深入理解和分析赛事消费多变量间的影响机理；理解形成性指标与反映性指标的差异对构建赛事消费潜变量测量模型具有重要意义；与基于共变异数的结构方程模型（covariance-based structural equation modeling，CB-SEM）相比，PLS-SEM适用于小样本、非正态分布、多变量复杂模型以及形成性测量模型等多种研究情境。建议：根据赛事消费变量的特点合理选择测量指标；在样本量较小、测量指标包含形成性指标或进行变量间关系的探索性研究中选择使用PLS-SEM。

关键词: 多变量统计分析赛事观众形成性指标反映性指标调节变量中介变量 PLS-SEM

Application of PLS-SEM Multivariate Data Analysis on Sports Spectators Research

LUO Lei

School of Economics and Management, Shanghai University of Sport, Shanghai 200438, China

Abstract: The literature review was used to assess the application of PLS-SEM (partial least squares structural equation modeling) multivariate data analysis on sports spectators.The findings include:Adopting mediating variables and moderating variables is helpful for understanding the relationship between spectator consumption variables. It is important to distinguish the differences between informative variables and reflective variables. Compared with CB-SEM (covariance-based structural equationmodeling), PLS-SEM has the advantages of small sample sizes, non-formal distributions, multiple-variables in complex models and informative measurement models. It is advisable to choose suitable indicators in accordance with latent variables. PLS-SEM is better applied when using small sample sizes, formative indicators included or conducting exploratory research on spectator fields.

Keywords: multivariate data analysis sport spectator formative indicator reflective indicator moderator variable mediator variable PLS-SEM

多变量统计分析方法是当前开展赛事观众消费研究的重要工具。随着多变量统计理论与统计软件的发展，中外学者对赛事观众消费行为的研究视域不断扩展。其中，从单变量统计分析到多变量统计分析是最为显著的变化趋势之一。在赛事观众研究领域，观众消费涉及许多变量，如观赛动机、观赛需求、球队认同、观赛体验、观赛情绪、感知价值、观赛满意度、观赛行为意向等。与单变量统计分析不同，多变量统计分析能同时处理多个潜在变量之间的影响关系，从而更深刻地理解各类观众的消费行为。当前，赛事研究人员运用的多变量统计分析工具主要包括2大类：CB-SEM(covariance-based structural equation modeling)和PLS-SEM(partial least squares structural equation modeling)。它们都属于第2代统计分析技术，即结构方程模型，其中CB-SEM是基于共变异数的结构方程模型，主要用于验证(或拒绝)相关理论。CB-SEM通过判定理论模型和样本数据共变异数矩阵之间的适配程度实现上述目的。PLS-SEM则是基于偏最小平方法的结构方程模型，主要用于探索性研究中的理论建构。与CB-SEM不同，PLS-SEM通过考察理论模型中自变量对因变量变异程度的解释量实现上述目的。2类结构方程模型在基本原理和适用条件等方面存在诸多差异，且各自都有一定的优势和劣势^[1]^14-22。

近年来，由于PLS-SEM基本不受样本规模和样本分布形态的限制，且在处理形成性指标、调节作用、中介效应以及高阶结构模型等方面存在显著优势，很多学者(尤其是国外学者)开始使用PLS-SEM处理和分析社会科学领域的数据。然而，通过文献分析发现，一些学者在研究过程中，对于模型构建与识别、形成性指标与反映性指标的理解以及调节或中介效应分析等方面存在一些问题，影响了实证研究的准确性与可靠性。为此，本文以国内外相关文献为基础，介绍PLS-SEM处理赛事消费多变量结构模型的基本方法，并结合相关示例对使用PLS-SEM过程中的常见问题进行梳理和分析，旨在为国内学者更好地开展赛事观众领域多变量研究提供参考。

1 多变量研究与单变量研究

作为赛事产业的消费者，赛事观众是国内外学者长期关注的重要研究对象。与赛事观众相关的研究主要集中于观众消费心理与消费行为等诸多领域^[2]。如果将赛事观众视为一幅“肖像画”，相关学者正是通过他们的研究，试图将这幅“肖像画”变得更为清晰、立体、生动，为了更好地完成这幅“作品”，学者们不断尝试运用“工具箱”中的各类研究工具。具体而言，对赛事观众的研究和刻画大致包括3个方面：①人口统计学特征(生理性或社会性特征)，包括种族、职业、家庭成员、教育背景、收入状况、婚姻状况以及社会规范等；②观众消费心理特征，包括观赛动机、情绪、体验、认知、满意度和球迷认同等；③观众消费行为特征，包括观赛意向、口碑宣传意向以及具体行为等。对以上观众特征的某个单独变量进行研究即可称为单变量统计，而对以上观众特征的2个及以上变量间的关系进行研究则可称为多变量统计。例如：如仅研究赛事观众的观赛动机由哪些具体因子构成，此为单变量研究；如需研究赛事观众观赛动机与赛后观赛行为意向之间的关系，则为多变量研究。

单变量研究和多变量研究在数理统计与分析方面存在较大差异。当前，赛事观众领域的单变量研究主要采用描述性统计分析获取赛事消费变量的集中趋势和离散趋势(频数、频率、众数、中位数、平均数、方差和标准差等)、采用均值比较分析获取不同类别观众在赛事消费变量水平上的差异(独立样本t检验、配对样本t检验、单因素方差分析、多元方差分析等)，而赛事观众领域的多变量研究探讨的是多个赛事消费变量之间的相关关系、因果路径关系以及变量的调节作用和中介效果等。多变量研究的常用方法包括相关分析、回归分析、因子分析和路径分析等。随着测量理论和多变量统计方法的发展，赛事观众领域的多变量研究工具愈加多元，大致包括第1代多变量统计工具(如SPSS统计软件)和第2代多变量统计工具(如CB-SEM和PLS-SEM)。第1代多变量统计工具主要用于聚类分析、探索性因子分析、方差分析和多元回归分析等。第1代统计工具虽然能处理多变量关系，但只能处理观察变量，无法有效分析潜在变量间的关系；而第2代多变量统计工具不仅能处理潜在变量，而且便于测算观察变量的测量误差。由于赛事观众的许多消费变量都是潜在变量，因而第2代多变量统计工具成为当前的主流数据分析工具。如前所述，在第2代多变量统计工具中，PLS-SEM不仅适用于小样本和非正态分布等情形，且能同时处理包含许多潜在变量的复杂模型，以及由形成性指标构成的测量模型等，因而受到许多赛事研究人员的关注。

2 测量模型与结构模型 2.1 概念与示例

在PLS-SEM多变量分析中，结构方程模型由测量模型(measurement model)与结构模型(structural model)共同构成。其中，测量模型也被称为外部模型(outer model)，结构模型也被称为内部模型(inner model)。由于绝大多数赛事消费变量难以通过直接观察测量，需借助其他可直接观察的变量(indicator variables)，因此，测量模型即用于对潜在变量的测量，反映的是赛事消费变量(潜在变量)与测量指标(观察变量)之间的关系，而结构模型用于反映各潜在变量之间的路径关系。若要研究赛事服务满意度与赛后行为意愿之间的路径关系，PLS-SEM中的结构方程模型示意图如图 1所示。

图 1 测量模型与结构模型示例 Figure 1 Examples of measurement model and structural model

该模型中共有2个测量模型：①赛事满意度测量模型反映了潜在变量(赛事满意度)及其3个观察变量(满意度1、满意度2与满意度3)之间的关系；②赛后行为意向测量模型反映了潜在变量(赛后行为意向)及其3个观察变量(行为意向1、行为意向2与行为意向3)之间的关系。另外，该模型中的结构模型指赛事满意度与赛后行为意向2个潜在变量之间的路径关系。可以看出，结构模型中的关系箭头从赛事满意度指向赛后行为意向，即赛事满意度是自变量，赛后行为意向是因变量。在PLS-SEM中，自变量也被称为外生变量(exogenous latent variable)，因变量也被称为内生变量(endogenous latent variable)。

2.2 测量模型的评估

PLS-SEM的主要目的是最大化自变量对因变量的变异解释量(R square value)。为了提高模型的预测能力，必须对测量模型的质量进行系统评估。由于当前学者大多采用反映性指标进行测量模型的构建，故本部分仅介绍这种测量模型的信度与效度评估方法，而由形成性指标构成的测量模型的评估方法详见本文的第3部分。与CB-SEM类似，PLS-SEM测量模型的评估内容主要包括信度、聚合效度(收敛效度)和区分效度。与CB-SEM不同的是，PLS-SEM通常并不使用模型适配度指标，虽然近年来相关学者提出了若干基于PLS-SEM的模型适配度测量方法，但这些方法并不成熟，很少在当前研究中使用。

2.2.1 测量模型的信度

在测量模型的信度评估方面，内部一致性水平(internal consistency reliability)是常用的评判标准。内部一致性测量指标包括Cronbach's α系数和组合信度(composite reliability)。Cronbach's α系数是相对保守的信度测量指标，其取值通常有低估内部一致性水平的倾向。相反，组合信度的取值则通常存在高估内部一致性水平的倾向。因此，通常测量模型信度水平的评估需同时报告Cronbach's c系数和组合信度。在分析和评估测量模型的内部一致性水平时，测量模型的真正信度通常介于Cronbach's α系数(信度的下限值)和组合信度(信度的上限值)之间^[1]^111-112。2类系数的取值范围都介于0~1，取值越高代表测量模型的信度越高。具体而言，在探索性研究中：①如果取值范围为0.60~0.70，代表测量模型的信度可以接受；②如果取值范围为0.70~0.90，代表测量模型的信度令人满意；③如果取值高于0.90，特别是高于0.95，表明测量模型的观察变量之间存在高度的替代性，需删除多余的观察题项；④如果取值低于0.60，则表示测量模型的内部一致性水平较低^[3]。

2.2.2 测量模型的收敛效度

在测量模型的收敛效度(聚合效度)评估方面，为了评价某个测量模型中各测量题项之间的相关性程度，即潜在变量解释所有观察题项变异量的程度，研究人员可采用各观察题项的载荷值(outer loading)和平均变异萃取量(average variance extracted)进行判断。各观察题项的载荷值越高，表明其在测量潜在变量方面具有的共同性越高，测量模型的收敛效度越好。与此同时，所有载荷值均需达到统计显著性水平。有学者建议，在通常情况下潜在变量至少能解释每个观察题项50%的变异量(即潜在变量与观察题项之间的变异解释量至少应大于测量误差)，因此，观察题项的载荷值应大于0.708(0.708²≈0.50)，在实际研究中，研究人员可选取0.70(近似等于0.708)作为考察的临界值。如果观察题项载荷值小于0.70，研究者可检验删除该题项后组合信度的变化情况，当然还要考虑测量模型的内容效度。一般而言，如果载荷值位于0.40~0.70，且删除该题项后测量模型的组合信度值增加到临界值以上，则可考虑删除该观察题项，否则应保留该题项。如果载荷值小于0.40，则通常考虑删除该题项^[4-5]。当然，在删除任何观察题项时，均需仔细评判该题项对测量模型内容效度的影响，如果题项对内容效度具有较大贡献，即便载荷值较小，仍可考虑保留。除了外部载荷值外，平均变异萃取量也是评判测量模型收敛效度的常用指标，其临界值通常为0.50。每个测量模型的平均变异萃取量都需大于或等于0.50^[1]¹¹⁵。

2.2.3 测量模型的区分效度

测量模型的区分效度是指某个潜在构面与另一个潜在构面在测量内容上是否具有独特性和差异性，即潜在构面之间不存在测量内容上的重叠和覆盖。在PLS-SEM中，常用的区分效度指标包括交叉载荷值(cross⁃loading)、福内尔-拉克尔准则(fornell-larcker criterion)以及HTMT值(heterotrait-monotrait ratio)。交叉载荷值是指某潜在构面的任一观察题项与其他任一潜在构面之间的载荷值。如果观察题项的外部载荷值大于其与其他潜在构面间的任意交叉载荷值，说明测量模型具有区分效度，反之则无区分效度。福内尔-拉克尔准则主要考察测量模型的平均变异萃取量的平方根与其他潜在变量间的相关系数。具体而言，如果平均变异萃取量的平方根大于该潜在构面与其他任意潜在构面之间的相关系数，则表明测量模型具有较好的区分效度。HTMT值是指不同潜在构面观察变量之间的交叉相关系数均值与同一潜在构面观察变量之间的相关系数均值之间的比较系数。如果潜在构面之间在概念内涵上本来就具有较强的相似性(如赛事满意度与赛事感知价值)，则HTMT的临界值通常设置为0.90。如果潜在构面之间在概念内涵上本来就存在较大差异(如赛事辅助服务与赛事核心产品)，则HTMT的临界值通常设置为0.85^[6]。如果大于临界值，表明相对于同一潜在构面观察变量的相关性而言，不同潜在构面观察变量之间的相关系数过高，从而判定测量模型缺乏区分效度。

2.3 结构模型的评估

结构模型旨在反映潜在因子之间的因果路径关系，也是多变量研究中最重要的内容。结构模型的评估指标主要包括变异解释量R²值、预测效果f²值、预测相关性Q²值、路径系数和显著性水平等。

(1) 结构模型的评估需对预测因子之间的共线性进行诊断，诊断方法借鉴形成性指标共线性诊断中使用的方差膨胀因子，即VIF值作为标准。例如，如图 2所示，赛事情感体验(QGTY)、赛事感官体验(GGTY)和赛事关联体验(GLTY)均是赛事形象(因变量)的预测因子，因而需诊断以上3个预测因子间的共线性问题。同时，赛事情感体验、赛事感官体验、赛事关联体验和赛事形象等4个因子是赛后行为意向(因变量)的预测因子，因此，也需诊断以上4个预测因子间的共线性问题。如果预测因子之间存在共线性问题(VIF > 5)，则需考虑删除个别潜在因子或将其合并成新的单独潜在因子或构建更高阶(二阶或以上)的潜在因子。

图 2 赛事体验结构模型示例 Figure 2 Examples of structural model associated with spectator experiences 注：“[+]”表示对该潜在因子的所属观察题项进行了隐藏处理。

(2) 在完成潜在因子共线性诊断的基础上，研究人员需考察结构模型中的路径系数。结构模型中潜在因子间的路径关系通常来自理论假设，路径系数的大小和显著性水平是验证假设是否成立的重要依据。标准化的路径系数介于0~1，越接近于0，代表预测因子与被预测因子之间的路径关系越弱。在通常情况下，非常低的路径系数往往也无法达到统计显著性标准。在PLS-SEM中，统计显著性的计算均使用Bootstrap方法，即反复从样本中抽取(样本有放回抽取)一定规模的子样本进行多次(通常为5 000次)测算，获取样本统计量(如路径系数)的分布以及置信区间等。如果路径系数的置信区间不包括0，则代表路径系数为0的原假设被拒绝，说明因子间的影响具有显著性。温忠麟等^[7]指出，用偏差校正的非参数百分位Bootstrap方法得到的置信区间更为可靠。

(3) 变异解释量R²值、预测效果f ²值、预测相关性Q²值等也是结构模型中潜在因子预测作用的常用指标。其中，R²值代表自变量对因变量变异程度的解释量，该值介于0~1，R²值越大代表解释能力越强。在通常情况下，R²值没有统一的临界值或判定标准。在消费行为领域，R²值如果达到0.20即可认为具有较好的变异解释能力。还有学者^[8]提出了在市场营销领域研究中的参考性判定标准，即因变量的R²值如果为0.75、0.50和0.25，则分别代表高解释量、中等解释量和低解释量。基于更为严格或更为保守的考虑，调整后的R²值(调整决定系数，adjusted coefficient of determination)也可用于变异解释量的判定。近年来，除R²值外，越来越多的学者使用f²值对潜在因子的预测作用进行评价。该预测值旨在比较删除某个潜在因子之后与删除该潜在因子之前被预测因子R²值的变化情况，并将R²值的变化量除以被预测因子的未解释部分。因变量f ²值的参考评判标准为0.02、0.15和0.35，分别代表较小影响、中等影响和较大影响。另外，预测相关性Q²值也是判定预测相关性的主要指标，其临界值为0，即如果因变量的Q²值大于0，说明预测相关性较好。

3 反映性指标与形成性指标

在赛事领域乃至其他社会科学领域的多变量研究中，反映性指标与形成性指标的甄别与应用问题通常被许多学者忽视，从而造成测量模型的可靠性降低，进而影响研究的准确性。反映性测量模型(reflective measurement model)是基于经典测量理论形成的潜在变量测量模型。长期以来，该测量模型被广泛应用于社会科学研究领域，而赛事消费行为领域的许多研究也采用反映性测量模型。根据该理论，在反映性测量模型中，潜在因子的变化会引起测量指标的变化，测量指标是潜在因子的效应指标，即反映性测量模型中的因果关系是从潜在因子指向测量指标，且每个测量指标都是由潜在因子所引起的。因此，潜在因子的所有测量指标之间通常具有高度相关性，且能相互替代(即删除任何一个测量指标都不会改变潜在因子的完整性)。以“赛事吸引力”这一潜在因子为例，图 3中的测量模型即为反映性测量模型。其中“我喜欢到球场观看赛事”(EA₁)、“我被球员的个人表现所吸引”(EA₂)、“我喜欢球员在赛场上的激烈对抗”(EA₃)等3个测量指标均为“赛事吸引力”的反映指标，变量间的关系箭头由“赛事吸引力”指向每个观察变量。可以看出，“赛事吸引力”的存在导致EA₁、EA₂、EA₃等观察变量出现，且这些观察变量之间具有高度的相关性和可替代性。

图 3 “赛事吸引力”因子的反映性测量模型示例 Figure 3 Examples of reflective measurement model associated with event attractiveness

与反映性测量模型不同，形成性测量模型(formative measurement model)基于潜在因子是若干测量指标的线性组合这一假设。测量指标之间无法相互替代，每个测量指标均代表潜在因子的某个独特方面，其组合在一起共同反映潜在因子的构面。因此，删除任何一个测量指标均会影响潜在因子的概念完整性。以“赛场服务”因子为例，图 4中的测量模型即为形成性测量模型。其中，“赛场停车服务便捷”(ES₁)、“工作人员专业性强”(ES₂)、“安全保障措施到位”(ES₃)等测量指标之间无法相互替代，其共同构成和解释“赛场服务”这一潜在因子，变量间的关系箭头由每个观察变量指向“赛场服务”，即ES₁、ES₂、ES₃等变量共同构成了“赛场服务”概念的完整性。如果单独删除变量ES₁，则“赛场服务”因子就不再完整。类似地，如需测量“观众满意度”因子，则通常可包括“赛事核心产品满意度”和“赛事辅助产品满意度”，而这2个观察变量同样属于形成性指标，因为它们之间无法相互替代，分别属于观众满意度的不同维度。

图 4 “赛场服务”因子的形成性测量模型示例 Figure 4 Examples of formative measurement model associated with event services

虽然形成性指标在社会科学研究领域得到了广泛应用，但在体育管理和赛事研究领域的应用实例尚不多见。Sato等^[9]以参与性赛事为研究对象，基于PLS-SEM考察了路跑赛事参与程度、行为忠诚度、心理卷入度和生活幸福感等变量间的关系。其中，行为忠诚度的测量模型采用了2个形成性指标(每周的跑步天数、每周的跑步距离)。Kunkel等^[10]以职业足球联赛为研究对象，探讨了联赛品牌、球队品牌、球迷现场观赛意向、电视观赛意向以及纪念品消费意向等变量间的关系。与以往研究不同的是，该研究运用了若干形成性指标对球队品牌联想(team brand associations)、联赛品牌联想(league brand associations)等概念进行测量。

反映性测量模型与形成性测量模型在模型识别、信度与效度检验、分析工具等方面均存在较大差异^[11]。①形成性指标的选取和测量模型的构建需基于严格的定性研究程序，包括专家对指标的评估、大量文献支撑、理论依据以及小样本测试等^[12]，因为形成性指标强调指标的全面性，特别是不能遗漏一些重要指标。②由于形成性指标之间无必然的高度相关性，因此不需进行内部一致性检验，但需进行共线性诊断和聚合效度、指标权重评估等。与反映性指标不同的是，聚合效度的检验需要研究人员在测量量表中对每个潜在因子增加若干(1个或多个)反映性指标，并测算由形成性指标构成的潜在因子与由反映性指标构成的潜在因子之间的路径系数。如图 5所示，为了测量赛事满意度形成性指标(sat1，sat2，sat3)的聚合效度，增加由1个反映性指标(sat4)构成的赛事满意度反映性测量模型。如果2个潜在因子间的路径系数达到0.70，表明变异解释量达到0.5左右，即形成性测量模型具有一定的聚合效度。如果路径系数达到0.80，表明变异解释量达到0.64，即聚合效度较好^[13]。如果路径系数低于0.70，则代表聚合效度较差，研究人员需重新对形成性指标进行调整。另外，形成性指标之间的共线性诊断同样使用方差膨胀因子，即以VIF值为标准(VIF < 5)。③在形成性指标的权重(outer weight)方面，该权重代表某个形成性指标对潜在因子的贡献程度，权重的获得来自于多元回归(潜在因子为因变量，各形成性指标为自变量)的结果。随着形成性指标数量的增加，各形成性指标对潜在变量贡献权重降低乃至完全不显著的可能性会越来越高。因此，如果某个潜在变量包含的形成性指标过多，建议将该变量拆分成2个或多个潜在变量(这种拆分必须具有理论和现实依据)或构建更高阶的测量模型。另外，如果形成性指标的权重未达到显著性水平，但当其作为反映性指标载荷值大于0.5时，表明该指标对潜在因子而言具有绝对重要性，但缺乏相对重要性，建议保留该指标。如果形成性指标的权重既未达到显著性水平，且载荷值低于0.5，则应从内容效度和理论相关性的角度考虑是否保留该指标。如果理论相关性或内容效度方面均无法强烈支持该指标，则应考虑删除该指标。

图 5 形成性测量模型聚合效度测量示例 Figure 5 Convergent validity of formative measurement model

当前，形成性测量模型已得到众多西方学者的重视，且在社会科学领域得到应用。需要指出的是，潜在因子采用哪种测量模型并不是绝对的，观众消费领域的多数潜在因子既可全部采用形成性指标或反映性指标，也可部分采用形成性指标或反映性指标。研究人员需根据潜在因子的特性以及研究目的的需要，仔细辨别潜在因子适合哪种测量模型，避免因错误选择测量模型影响研究结果的可靠性。

4 调节作用与中介效应

调节作用(moderating effect)和中介效应(mediating effect)是赛事观众研究领域的常见问题。从理论上而言，调节作用和中介效应进一步深化和丰富了赛事观众研究中相关变量间的关系。具体而言，调节作用旨在阐释自变量在何种条件下会影响因变量，即自变量与因变量的相关性大小或正负方向如果受到其他变量的影响，则该变量可被称为调节变量。中介效应是为了解释自变量如何影响因变量。如果自变量的变化会引起某个中间变量的变化，而中间变量的变化又会影响因变量的变化，则这个中间变量可被视为中介变量。

4.1 调节作用及其分析方法

赛事观众的消费心理和消费行为往往受到性别、年龄、职业、收入水平、球队认同度等诸多因素影响，这些因素通常在赛事观众研究领域具有调节作用。例如，赛事观众对现场服务质量的感知可能会影响赛后的行为意向，但对不同的观众群体而言，自变量(服务质量感知)对因变量(赛后行为意向)的影响程度可能存在差异。如果观众是球队的忠实“粉丝”，即便赛场服务质量的感知水平不高，这些“粉丝”的赛后行为意愿(再次观赛意愿)可能仍然较高。对于普通观众而言，他们与球队之间无情感依附关系和认同感，赛场服务质量的感知水平可能会显著影响其再次观赛意愿。即球队认同可能会在赛场服务质量感知与赛后行为意向的关系中起到调节作用(图 6)。

图 6 赛事观众研究中的调节作用示例 Figure 6 Examples of moderation effect model

实质上，调节作用分析是在自变量与因变量确定的情况下，分析自变量与调节变量对因变量的交互作用。调节作用与交互作用的含义相近，调节作用分析中的自变量与因变量是明确的，而交互作用分析通常无明确的自变量。该模型中变量间的关系公式表达如下：

$ Y{\rm{ = }}{P_1} \times X + {P_2} \times M + {P_3}\left( {X \times M} \right) $

式中，赛场服务质量感知是自变量(X)，赛后行为意向是因变量(Y)，球队认同为调节变量(M)。在加入调节变量(球队认同)后，赛后行为意向(Y)不仅受到赛场服务质量感知(X)的直接影响，也受到球队认同(M)的影响以及球队认同与赛场服务质量感知的交互(X×M)影响。P₃表示随着观众球队认同程度增强或减弱一个标准差，现场服务质量感知与赛后行为意向之间路径系数的变化情况。如图 7所示，该模型是最简单的调节作用模型，在此基础上，还有更为复杂的调节作用模型，如调节变量与因变量之间的关系还会受到其他变量的影响等。在本例中，如果性别变量在球队认同和赛后行为意向之间存在调节作用，则性别变量又会成为新的调节变量。

图 7 赛事观众研究中的变量间交互作用示例 Figure 7 Examples of interaction term in moderation analysis

值得注意的是，调节变量既可是类别变量、定序变量，也可是连续变量。不同种类的调节变量在PLS-SEM中的分析方法并不相同。

(1) 如果调节变量是类别变量或定序变量(如性别、受教育水平等)，通常采用多群组模型比较方法(multi⁃group model analysis)分析调节作用。首先依据调节变量的类别(如男性与女性，青年与中老年，中低学历水平与高学历水平)对样本数据进行分组。然后采用多群组模型比较方法对群组间差异进行显著性检验。与其他方法相比，该方法使用Bootstrap随机抽样进行多次迭代，检验结果具有较好的稳定性。显著性检验的置信区间方法通常选用修正偏倚和加速(BCa)Bootstrap(5 000个子样本)进行双尾检验(显著性水平设置为0.05)。如果满足路径系数差异的绝对值显著大于0，或路径系数差异的置信区间不包括0，则可判定分组变量具有调节作用，反之则无调节作用。

(2) 如果调节变量是连续变量，PLS-SEM通常使用2个步骤(two⁃stage approach)进行分析^[14]。第1步需分析模型的主效应(即在无交互作用影响下的自变量和调节变量各自与因变量的关系)；第2步则需分析调节变量与自变量对因变量的交互作用。在本例中，分析球队认同变量对赛场服务质量感知和赛后行为意向关系的调节作用，主要考察“赛场服务质量感知×球队认同”对赛后行为意向影响的路径系数及其显著性水平。显著性检验的条件设置与类别变量调节作用的条件设置类似，如果该路径系数达到显著性水平，则表明存在调节作用，反之则不存在调节作用。

4.2 中介效应及其分析方法

中介效应旨在解释自变量是如何影响因变量的，即探讨自变量影响因变量的内在机理。赛事体验可能会影响赛事忠诚度，但两者之间的影响路径可能会受到其他变量(如赛事满意度)中介作用的影响。具体而言，赛事体验的变化会影响赛事满意度的变化，而赛事满意度的变化又会影响赛事忠诚度的变化，其理论模型如图 8所示。在中介效应分析中，一些学者^[15]认为，应首先检验自变量对因变量的总效应，即未加入中介变量之前自变量是否显著影响因变量。只有自变量对因变量的总效应是显著的，才有分析中介效应的必要性。也有学者^[16]认为没有必要首先检验自变量对因变量的总效应。他们认为，间接效应和直接效应的符号可能相反[即存在遮掩效应(suppressing effect)]，从而导致总效应并不显著，但中介效应仍然存在。对此，温忠麟等^[7]认为，中介效应分析应首先检验总效应：如果总效应显著，可按照中介效应进行立论；如果总效应不显著，则按照遮掩效应立论(也可称为广义的中介分析)。

图 8 赛事观众研究中的中介效应示例 Figure 8 Examples of general mediation model

在中介效应的检验方法和技术方面，早期对中介效应分析的代表性观点来自于Baron和Kenny的逐步法检验技术以及Sobel检验方法^[8]。随着后续研究对中介效应分析的深入，PLS-SEM根据Bootstrapping原理进行中介效应分析，并将中介效应划分成如下类别(表 1)，该判定类别和方法主要基于Zhao等^[16]的研究成果。以图 8为例：①如果P₃(直接效果)和P₁×P₂(间接效果)均不显著，则表示赛事体验与赛事忠诚度之间无任何路径关系，赛事满意度也不具有中介效应；②如果P₃显著，而P₁×P₂并不显著，则表示赛事体验与赛事忠诚度之间具有直接路径关系，但赛事满意度不具有中介效应；③如果P₃和P₁×P₂均显著，且方向具有一致性(同时是正向或负向关系)，则表明赛事满意度具有补充性中介效应，且不排除存在其他中介变量的可能性；④如果P₃和P₁×P₂均显著，但方向并不一致(1个是正向关系，1个是负向关系)，则表明赛事满意度具有竞争性中介效应；⑤如果P₁×P₂显著，而P₃并不显著，则表明赛事满意度具有完全中介效应(full mediation)。需要指出的是，补充性中介效应和竞争性中介效应也可被统称为部分中介效应(partial mediation)，而竞争性中介效应通常也被称为遮掩效应^[7]。PLS-SEM能同时测算所有路径关系的直接效应和间接效应，研究人员只需判别直接效应与间接效应的显著性水平和置信区间。

表 1 中介效应的类型及判别标准^[1]^232-233 Table 1 Types and discrimination criterion of mediation effects

值得注意的是，中介效应在很多研究中并不是单一的，多元中介分析(multiple mediation analysis)就是解决多个中介变量的中介效应问题。多元中介分析涉及单独间接效果(specific indirect effect)与总间接效果(total indirect effect)等内容。另外，中介变量的选取须基于充分的理论支持和文献基础，否则中介效应的分析结果就会缺乏可靠性与合理性。

5 结束语

观众是竞赛表演产品的主要消费者，赛事观众心理与消费行为是中外学者长期关注的重要议题。近年来，PLS-SEM多变量统计分析方法在国内赛事观众领域的应用实例尚不多见。与CB-SEM相比，PLS-SEM至少存在如下优势：①样本的分布可以不是正态分布；②潜在变量可由少量观察变量(少于3个)进行测量；③理论模型可包括大量潜在变量和观察变量；④能灵活处理形成性测量模型和反映性测量模型等。因此，PLS-SEM在赛事观众研究领域具有广阔的应用前景，尤其适用于赛事观众消费研究领域的探索性研究。在PLS-SEM的应用方面，研究人员应谨慎处理形成性指标与反映性指标，根据研究需要和潜在变量的基本内涵，合理选择指标类型。为深入探究赛事消费相关变量间的关系，建议赛事研究人员基于理论分析和文献研究，在理论模型中合理设置调节变量或中介变量，进一步拓宽国内赛事观众研究的视域。

参考文献

[1]	HAIR J F, HULT G T M, RINGLE C M, et al. A primer on partial least squares structural equation modeling[M]. Los Angeles: Sage, 2017. (0)
[2]	骆雷. 基于观众视角的西方竞赛表演产业研究综述[J]. 中国体育科技, 2019, 55(11): 41-51 (0)
[3]	HAYDUK L A, LITTVAY L. Should researchers use single indicators, best indicators, or multiple indicators in structural equation models[J]. BMC Medical Research Methodology, 2012, 12(1): 159-175 DOI:10.1186/1471-2288-12-159 (0)
[4]	BAGOZZI R P, YI Y, PHILLIPS L W. Assessing construct validity in organizational research[J]. Administrative Science Quarterly, 1991, 36(3): 421-458 DOI:10.2307/2393203 (0)
[5]	HAIR J F, RINGLE C M, SARSTEDT M. PLS-SEM:Indeed a silver bullet[J]. Journal of Marketing Theory and Practice, 2011, 19(2): 139-152 (0)
[6]	HENSELER J, RINGLE C M, SARSTEDT M. A new criterion for assessing discriminant validity in variance-based structural equation modeling[J]. Journal of the Academy of Marketing Science, 2015, 43(1): 115-135 DOI:10.1007/s11747-014-0403-8 (0)
[7]	温忠麟, 叶宝娟. 中介效应分析:方法和模型发展[J]. 心理科学进展, 2014, 22(5): 731-745 (0)
[8]	HENSELER J, RINGLE C M, SINKOVICS R R. The use of partial least squares path modeling in international marketing[J]. Advances in International Marketing, 2009, 8(20): 277-319 (0)
[9]	SATO M, JORDAN J S, FUNK D C. A distance-running event and life satisfaction:The mediating roles of involvement[J]. Sport Management Review, 2016, 19(5): 536-549 DOI:10.1016/j.smr.2016.04.001 (0)
[10]	KUNKEL T, FUNK D C, LOCK D. The effect of league brand on relationship between the team brand and behavioral intentions:A formative approach examining brand associations and brand relationships[J]. Journal of Sport Management, 2017, 31(4): 317-332 DOI:10.1123/jsm.2016-0166 (0)
[11]	王晓丽, 李西营, 邵景进. 形成性测量模型:结构方程模型的新视角[J]. 心理科学进展, 2011, 19(2): 293-300 (0)
[12]	DIAMANTOPOULOS A, WINKLHOFER H M. Index construction with formative indicators:An alternative to scale development[J]. Journal of Marketing Research, 2001, 38(2): 269-277 (0)
[13]	RINGLE C M, SARSTEDT M, SCHLITTGEN R, et al. PLS path modeling and evolutionary segmentation[J]. Journal of Business Research, 2013, 66(9): 1318-1324 DOI:10.1016/j.jbusres.2012.02.031 (0)
[14]	CHIN W W, MARCOLIN B L, NEWSTED P R. A partial least squares latent variable modeling approach for measuring interaction effects:Results from a Monte Carlo simulation study and an electronic-mail emotion/adoption study[J]. Information Systems Research, 2003, 14(2): 189-217 DOI:10.1287/isre.14.2.189.16018 (0)
[15]	BARON R M, KENNY D A. The moderator-mediator variable distinction in social psychological research:Conceptual, strategic, and statistical considerations[J]. Journal of Personality and Social Psychology, 1986, 51(6): 1173-1182 DOI:10.1037/0022-3514.51.6.1173 (0)
[16]	ZHAO X, LYNCH J G, CHEN Q. Reconsidering Baron and Kenny:Myths and truths about mediation analysis[J]. Journal of Consumer Research, 2010, 37(2): 197-206 DOI:10.1086/651257 (0)