基于时序相关性的建筑能耗预测方法

郭茂祖; 于丰宁; 王鹏跃; 刘晓龙

doi:10.11992/tis.202503013

基于时序相关性的建筑能耗预测方法

doi: 10.11992/tis.202503013

郭茂祖^{1, 2,},
于丰宁^{1, 2,},
王鹏跃^{1, 2, ,},
刘晓龙^{1, 2}

1.
北京建筑大学智能科学与技术学院, 北京 102616;
2.
北京建筑大学城市建筑超级智能技术北京市重点实验室, 北京 102616

基金项目: 北京市自然科学基金项目(4232021).

详细信息

作者简介:
郭茂祖，教授，博士生导师，主要研究方向为机器学习、时空数据分析、智能建造与智慧城市、生物信息学。主持国家重点研发计划课题、国家自然科学基金重点和面上项目、北京市自然科学基金面上项目等多项，牵头获教育部自然科学奖、吴文俊人工智能自然科学奖、黑龙江省自然科学奖。发表学术论文300余篇。E-mail：guomaozu@bucea.edu.cn;

于丰宁，硕士研究生，主要研究方向为深度学习、计算性设计。E-mail：13563037298@163.com;

王鹏跃，讲师，博士，主要研究方向为机器学习、城市计算、计算性设计。E-mail：wangpengyue@bucea.edu.cn.

通讯作者:
王鹏跃. E-mail：wangpengyue@bucea.edu.cn.

中图分类号: TP3-05
出版历程
- 收稿日期: 2025-03-07
- 网络出版日期: 2025-09-16

Building energy consumption prediction method based on temporal correlation

GUO Maozu^{1, 2,},
YU Fengning^{1, 2,},
WANG Pengyue^{1, 2, ,},
LIU Xiaolong^{1, 2}

1.
School of Intelligence Science and Technology, Beijing University of Civil Engineering and Architecture, Beijing 102616, China;
2.
Beijing Key Laboratory of Super Intelligent Technology for Urban Architecture, Beijing University of Civil Engineering and Architecture, Beijing 102616, China

摘要

摘要:
建筑能耗预测对优化能源资源配置、推进节能减排措施及支撑可持续发展目标至关重要。建筑能耗数据因受季节更迭、节假日效应等因素影响，在时间序列上显现出周期性和非平稳性特征。现有方法通常采用滑动窗口建模局部时序特征，但仅能捕捉窗口内部变化，难以挖掘窗口之间潜在的长期演化趋势。此外，建筑形态对能耗具有显著影响，却在能耗预测任务中常被忽略。针对上述局限，本文提出一种基于时序相关性的建筑能耗预测方法，主要包含局部特征学习、全局特征学习及损失函数设计。针对窗口外部长期变化难以被捕捉的问题，全局特征学习模块采用编码器−解码器架构，建模滑动窗口之间的长期时序依赖。设计自监督对比损失函数，以窗口为单位构建正负样本对，进一步挖掘能耗数据的全局相关性。针对建筑形态特征未被重视的问题，通过嵌入建筑形态特征，并利用线性层捕捉滑动窗口内时间邻近能耗数据的局部相关性。实验结果表明，该方法在处理多座建筑能耗长短期预测任务中均取得了最好的预测精度，在未来24 h预测任务中，较常用能耗预测方法ARIMA、LSTM、GRU、Transformer、GWO-SARIMA-LSTM、Informer和Autoformer方法，该方法的预测精度分别提高了约17.06%、8.37%、9.79%、9.58%、9.83%、6.94%和5.55%，为建筑节能管理和用能行为优化提供科学支撑。
- 建筑能耗预测 /
- 时序相关性挖掘 /
- 建筑形态特征 /
- 自监督学习 /
- 对比损失函数 /
- 编码器-解码器架构 /
- 长期依赖 /
- 时间卷积网络
Abstract:
Building energy consumption prediction is crucial for optimizing energy resource allocation, advancing energy-saving and emission-reduction measures, and supporting sustainable development goals. Due to the influence of factors such as seasonal changes and holiday effects, building energy consumption data exhibits periodic and non-stationary characteristics in time series. Existing methods typically use sliding windows to model local temporal features, but they can only capture changes within the window and are limited in uncovering the long-term evolution trends across windows. In addition, architectural morphology significantly impacts energy consumption; however, it is often neglected in energy consumption prediction tasks. To address these limitations, this paper innovatively proposes a temporal correlation-based building energy consumption prediction method, which primarily includes local feature learning, global feature learning, and loss function design. To capture long-term changes beyond the window, the global feature learning module adopts an encoder-decoder architecture to model long-term temporal dependencies between sliding windows. Furthermore, a self-supervised contrastive loss function is designed, constructing positive and negative sample pairs at the window level to further explore the global correlations of energy consumption data. To address the neglect of architectural morphology features, building morphological features are embedded, and a linear layer is used to capture the local correlations of temporally adjacent energy consumption data within the sliding window. Experimental results show that the proposed method achieves the best prediction accuracy in multi-building energy consumption forecasting tasks, and in 24-hour ahead prediction tasks, the method improves prediction accuracy by approximately 17.06%, 8.37%, 9.79%, 9.58%, 9.83%, 6.94%, and 5.55% compared to commonly used energy consumption prediction methods including ARIMA, LSTM, GRU, Transformer, GWO-SARIMA-LSTM, Informer, and Autoformer. This method provides scientific support for building energy-saving management and energy usage behavior optimization.
- building energy consumption prediction /
- temporal correlation mining /
- building morphology features /
- self-supervised learning /
- contrastive loss function /
- encoder-decoder architecture /
- long-term dependency /
- temporal convolutional network

HTML全文

在当前可持续发展目标的背景下，建筑能源消耗约占全球能源消耗总量的35%，其中，电能消耗占据建筑总能耗的30%~40%，是主要的能源消耗来源^[1-2]。实现建筑用能的精细化预测与调控，是推动能源效率提升、落实节能减排政策的关键手段。建筑能耗数据通常呈现出多周期性和趋势性特征，受日间高峰、周末效应及季节变化等多因素影响，预测难度较大。

目前，建筑能源预测方法主要分为3类，分别是统计学方法、工程模拟方法和机器学习方法。统计学方法是基于大量工程实践而总结出来的，该方法通常要求数据具有稳定的统计特性(如均值、方差)，其预测的精度无法得到保障^[3]。工程模拟方法利用建筑本身物理特性和传热原理，通过仿真软件建立建筑的热力学模型来模拟建筑实际运行中的能耗过程，从而实现对建筑能耗的预测，目前应用最多的物理建模软件有EnergyPlus、TRNSYS、DeST等^[4]。该方法需要大量详细的建筑设计信息来确保所建立模型的预测精度^[5]，在建模过程中还需要物理、热力学等领域的专业知识^[6]，对模型进行验证和校准也是一个复杂的过程，同时这些物理建模软件在模拟的过程中需要进行大量计算，无法提供实时预测^[7]。

时间序列模型的主要优势是其能有效捕捉数据中的时间依赖性，建筑能耗数据呈现出周期性、趋势性变化的时间序列特征，常用滑动窗口方法将其划分为较短的子序列(即窗口)，该方法能帮助模型在较短的时间段内捕捉局部依赖关系，从而提高短期预测的准确性和可靠性。He等^[8]最早提出了基于自回归综合移动平均(autoregressive integrated moving average model, ARIMA)的方法来预测建筑的能耗，但ARIMA模型无法捕捉到建筑能源数据之间的非线性关系。近年来，基于深度学习的时间序列预测模型通过提取建筑能耗数据中的长期依赖关系和复杂非线性特征，显著提升了预测精度与跨场景适应能力，广泛应用于建筑能耗预测任务。Jiang等^[9]的研究结果表明，长短期记忆(long short-term memory, LSTM)模型在短期负荷预测问题上较ARIMA模型表现出更优的预测精度。Doan等^[10]采用能够更好地识别建筑能耗数据序列中特征的门控循环单元(gate recurrent unit, GRU)方法进行能耗预测，但短长时记忆网络(long short-term memory, LSTM)、GRU模型在处理时间序列较长的数据时易出现序列信息丢失的问题，影响预测结果的稳定性。

随着行业需求从短期向更长期预测的转变，学者们开始探索延长输入数据窗口的方法。Han等^[11]基于Transformer及其改进模型进行建筑能耗预测，其通过优化注意力机制，减少了在使用较长数据窗口时的特征提取偏差^[12]，从而提高了进行建筑能耗预测任务的精度。尽管上述方法在提升模型性能方面取得了一定的进展，但由于数据窗口长度受限，这些模型无法学习到超出窗口长度的变化趋势，同时窗口长度的增加也会带来过量噪声或计算资源不足的问题^[13]。

Zheng等^[14]提出了结合发明问题解决(teoriya resheniya izobretatelskikh zadach, TRIZ)理论与GWO-SARIMA-LSTM的混合模型，在建筑能耗预测中取得了明显的精度提升。该模型通过引入TRIZ理论，系统地分析建筑能耗优化中的矛盾，指导模型设计，平衡能效、成本和舒适度。同时，采用灰狼优化算法(grey wolf optimizer, GWO)优化SARIMA和LSTM模型的参数，提高了模型的预测精度和稳定性。实验结果显示，该模型在多个数据集上的预测误差明显低于传统方法，提供了新的思路和方法用于建筑能效优化和碳排放减少。Zhou等^[15]提出的Informer模型作为高效的Transformer架构，通过引入ProbSparse自注意力机制和生成式解码器，有效降低了计算复杂度并提升了长序列预测的效率和精度。Wu等^[16]提出的Autoformer模型在建筑能耗预测中取得了重要进展。该模型采用了深度分解架构和自相关机制，能够有效捕捉时间序列中的季节性和趋势性变化，从而增强了长期预测的准确性。

针对窗口长度受限的问题，学者们提出基于窗口间关联性构造窗口间的正负对，有效地学习窗口间关系的对比学习方法^[17]。Yue等^[18]提出的TS2Vec(towards universal representation of time series)方法通过时间戳和实例维度的层次化对比学习，在增强上下文视图中构建不同窗口间的正负样本对，利用最大池化机制实现多尺度窗口关联，使局部子序列能够感知全局窗口的时序依赖。Woo等^[19]设计的CoST(contrastive learning of disentangled seasonal-trend)方法通过解耦式频域对比损失，在频域窗口间建立季节性成分的判别性映射，有效解决了长期窗口的季节模式混淆问题。Wang等^[20]研究的LaST(learning latent seasonal-trend)方法采用变分贝叶斯推断框架，引入窗口间残差连接强化长期依赖传播路径。这3种方法仅考虑了时间上邻近的窗口对，忽略了由于时序数据的周期性，较远时间点的窗口对可能仍相似并对预测精度产生影响。因此，Kożuch等^[21]提出的AutoCon对比损失函数，首先通过全局自相关性矩阵识别跨窗口的相似趋势模式，将具有同步周期特征但间隔超过设定时间步的窗口对标记为正样本，其次基于趋势斜率符号差异筛选负样本，该方法能有效捕获窗口间长期趋势关联性。基于建筑能耗数据的周期性波动特征，预测方法对窗口间关联性的学习，将有助于捕捉建筑跨周期的重复性能耗模式，从而提高预测精度。

然而，上述方法在提到可通过提升建筑能耗预测精度的同时，却未涉及到建筑形态特征这一与建筑能耗存在密切关联的因素。当前建筑能耗预测研究仍主要依赖于历史能耗数据、温度及天气等时序信息作为模型输入^[22]，而建筑形态特征(如建筑物面积比、朝向、紧凑度指数及形状系数等)虽已被证实与能耗存在显著关联^[23-25]，却鲜有被纳入预测模型^[26]。这种对建筑形态特征的系统性忽视，导致现有预测方法难以充分解析建筑形态特征对能耗的影响。

上述研究表明目前存在建筑能耗预测可通过学习窗口间关联性提升精度、建筑形态特征鲜有考虑的问题。鉴于此，本文的研究目的是结合建筑形态特征与时序数据特征，提高建筑能耗预测的精度，提出基于时序相关性的建筑能耗预测方法(local-global time-series correlation learning, LG-TCL)。该方法分别构建了局部特征学习模块、全局特征学习模块以及损失函数设计模块。局部特征学习模块针对建筑形态特征易被忽视的问题，将建筑形态特征嵌入滑动窗口，利用线性层捕捉窗口内相邻时间点的能耗局部相关性，建立形态属性与短期能耗变化的关联映射；全局特征学习模块采用编码器−解码器架构，融合时间顺序信息与全局上下文，解析跨窗口的长期趋势变化，并与局部特征进行加权融合，实现短期与长期能耗变化的协同预测；损失函数设计模块突破传统滑动窗口的长度限制，通过自监督方式在窗口间构造正负样本对，引入对比损失函数，学习跨周期窗口的相似性，增强方法对季节性、节假日等长周期能耗模式的捕获能力，提升建筑能耗预测的精度。本文的主要贡献点如下：

1)提升了建筑能耗局部变化趋势的捕捉能力，有效融合了形态信息和时序数据，结合多项建筑形态特征充分地挖掘建筑能耗数据滑动窗口内的关联性。

2)提高了对长期周期性模式的识别能力，通过构造窗口间正负样本对，设计基于时序自相关的对比学习策略，增强了模型对全局时序依赖的学习。

3)实现了建筑能耗的长短期高精度预测，为建筑全生命周期节能决策提供科学依据。提出了基于时序相关性的建筑能耗预测方法(LG-TCL)，实验结果表明，该方法能更好地拟合真实能耗数据。

1. 本文方法

本节主要从问题描述、方法构建、模型训练3个小节来介绍。

1.1 问题描述

本文将建筑能耗预测建模为时间序列预测问题。基于历史能耗数据、环境信息及建筑形态特征，预测未来若干时间步内的建筑能耗情况。模型需要学习映射$ f\colon X\rightarrow Y $，其中$ X $为输入特征，$ Y $为预测的能耗序列，本文通过在时序数据上滑动一个固定长度为$ w $的窗口，生成了一组窗口集合，表示为$ {W}_{1},{W}_{2},\cdots ,{W}_{k} $，其中$ k $为窗口的总数，每个窗口覆盖了$ w $个时间步长。假设输入时序序列长度为$ w $，输出预测序列长度为$ L $。输入特征包含两部分：时序特征$ {X}_{n} $和形态特征$ {M}_{\delta } $。

输入的时序特征$ {X}_{n}=\left\{{S}_{n},{H}_{n},{A}_{n},{B}_{n},{E}_{n}\right\} $，包含以下特征：

$ {S}_{n}=\left\{{s}_{n},{s}_{n+1}, \cdots ,{s}_{n+w-1}\right\} $表示从时间步$ n $开始的建筑能耗数据；$ {H}_{n}=\left\{{h}_{n},{h}_{n+1}, \cdots ,{h}_{n+w-1}\right\} $表示节假日数据，若$ {h}_{n}=0 $表示工作日，若$ {h}_{n}=1 $表示节假日；$ {A}_{n}=\left\{{a}_{n},{a}_{n+1}, \cdots ,{a}_{n+w-1}\right\} $表示从时间步$ n $开始的空气温度；$ {B}_{n}=\left\{{b}_{n},{b}_{n+1}, \cdots ,{b}_{n+w-1}\right\} $表示从时间步$ n $开始的空气湿度；$ {E}_{n}=\left\{{e}_{n},{e}_{n+1}, \cdots ,{e}_{n+w-1}\right\} $表示从时间步$ n $开始的风速。

输入的形态特征为非时序的静态特征，用于描述建筑形态信息。这些特征在模型训练过程中会与时序特征进行特征融合。形态特征$ M_{{\delta }}= \big\{M_{{{\mathrm{area}}\_{\mathrm{ration}} }}, M_{\text {oriention }}, M_{{{\mathrm{ccd}}\_{\mathrm{means}}}}, M_{\text {convexity }}, M_{\text {elongation }}, M_{{{\mathrm{squ}}\_{\mathrm{comp}} }}, M_{{{\mathrm{long}}\_{\mathrm{ax}} }}, M_{{{\mathrm{shape}}\_{\mathrm{index}} }}\big\} $。输出序列$ {Y}_{n}=\left\{{s}_{n+w},{s}_{n+w+1}, \cdots , {s}_{n+w+O-1}\right\} $，其中$ O $表示为预测的输出长度。

1.2 基于时序相关性的建筑能耗预测方法

本文提出的基于时序相关性的建筑能耗预测方法(LG-TCL)，主要包括局部特征学习模块、全局特征学习模块以及损失函数设计模块，整体框架如图1所示。

图 1 基于时序自相关的建筑能耗预测模型结构

Fig. 1 Architecture of building energy consumption prediction model based on temporal autocorrelation

下载: 全尺寸图片

在局部特征学习模块中，为了解决局部时序依赖与形态信息的联合捕捉问题，本文结合建筑形态特征与时序滑动窗口进行局部特征编码。在全局特征学习模块中，为了解决跨窗口的长期依赖及多周期变化的问题，本文以所有滑动窗口为输入，采用时间卷积网络(temporal convolutional network，TCNs)^[27]编码器和多尺度移动平均(moving average，MA)^[28]解码器，生成全局特征表示。在损失函数设计模块中，为了进一步强化模型对长期时序依赖的学习能力，本文以滑动窗口构造正负样本对，提高预测精度。

整体工作流程为：方法通过滑动窗口将长时序数据划分为多个子序列，局部特征学习模块融合形态特征与时序数据，提取局部相关特征；全局特征学习模块学习窗口间的长期依赖，输出全局特征表示；损失函数设计模块基于自监督对比学习机制增强全局特征判别能力。通过迭代训练，模型不断提升预测精度，最终输出预测结果，实现对建筑能耗的长短期高精度预测。

1.2.1 局部特征学习

建筑能耗数据在时间接近的序列中呈现相似的模式，建筑能耗预测需要将建筑的形态特征$ {M}_{\delta } $与时序特征$ {X}_{n}=\left\{{S}_{n},{H}_{n},{A}_{n},{B}_{n},{E}_{n}\right\} $进行融合，挖掘窗口内的局部关联性。

本文构造的全部建筑形态特征如表1所示。

表 1 建筑形态特征说明

Table 1 Description of building morphological features

形态特征及计算(获取)方式	含义
$ {M}_{{\mathrm{area}}\_ {\mathrm{ration}}}=\dfrac{{A}_{{\mathrm{building}}}}{{A}_{{\mathrm{convex}}\_ {\mathrm{hull}}}} $	建筑物面积比
$ {M}_{{\mathrm{oriention}}}=\arctan 2\left(\Delta c,\Delta g\right) $	建筑物朝向
$ {M}_{{\mathrm{ccd}}\_ {\mathrm{means}}}=\dfrac{1}{n}\displaystyle\sum\limits_{i=1}^{n}{d}_{i} $	建筑中心角点的平均距离
$ {M}_{{\mathrm{convexity}}}=\dfrac{{A}_{{\mathrm{region}}}}{{A}_{{\mathrm{convex}}\_ {\mathrm{hull}}}} $	建筑物凸度
$ {M}_{{\mathrm{elongation}}}=\sqrt{1-\dfrac{{I}_{{\mathrm{minor}}}}{{I}_{{\mathrm{major}}}}} $	建筑物伸长率
$ {M}_{{\mathrm{squ}}\_ {\mathrm{comp}}}=\dfrac{4 {\text{π}} {A}_{{\mathrm{building}}}}{C_{{\mathrm{building}}}^{2}} $	建筑紧凑度指数
$ {M}_{{\mathrm{long}}\_ {\mathrm{ax}}}={\max }_{i,j}\sqrt{{\left({c}_{i}-{c}_{j}\right)}^{2}+{\left({g}_{i}-{g}_{j}\right)}^{2}} $	最长轴的长度值
$ {M}_{{\mathrm{shape}}\_ {\mathrm{index}}}=\dfrac{\sqrt{\dfrac{{A}_{{\mathrm{building}}}}{\text{π}}}}{0.5 {M}_{{\mathrm{long}}\_ {\mathrm{ax}}}} $	形状系数

表1中$ {A}_{\text{building}} $是建筑物面积，$ {A}_{\text{convex}\_{\mathrm{hull}}} $是包含该区域的最小凸多边形的面积，$ \Delta c、\Delta g $分别为最小外接矩形长轴两端点在两个坐标轴上的坐标差，$ {d}_{i} $是质心到第$ i $个角点的距离，$ n $是多边形角点的数量，$ {A}_{\text{region}} $是建筑物实际占用的地面面积，$ {I}_{\text{minor}} $和$ {I}_{\text{major}} $分别是最小和最大的主惯性矩，$ {C}_{\text{building}} $是建筑的周长，$ \left({c}_{i},{g}_{i}\right) $和$ \left({c}_{j},{g}_{j}\right) $为建筑物轮廓上任意两点的坐标。

本文首先选取了在已有研究^[23-25]中已被证明与建筑能耗存在密切关联的形态特征建筑物面积比$ {M}_{\text{area}\_{\mathrm{ration}}} $、建筑物朝向$ {M}_{\text{oriention}} $、建筑紧凑度指数$ {M}_{\text{squ}\_{\mathrm{comp}}} $及形状系数$ {M}_{\text{shape}\_{\mathrm{index}}} $。为了更加全面地描述建筑的形态特征，本文又选取了能够反映建筑物的形状规则性的建筑中心角点的平均距离$ {M}_{\text{ccd}\_{\mathrm{means}}} $、反映建筑物的形状复杂性的建筑物凸度$ {M}_{\text{convexity}} $、反映建筑物在主要方向上的拉伸程度的建筑物伸长率$ {M}_{\text{elongation}} $及可以提供建筑物的主要延伸方向，对建筑内部空间的组织有重要影响的最长轴的长度值$ {M}_{\text{long}\_{\mathrm{ax}}} $4种形态特征^[29]。这些特征涵盖了建筑物的大小、形状规则性、朝向和复杂度等方面，为建筑物的几何特性和形态信息提供了较为全面的描述，且特征之间相对独立，容易计算，便于后续的数据处理^[26]。

本文采用窗口单位归一化方法来缓解时间序列的非平稳性而引起的分布偏移问题，计算方式为

$$ {X}_{\text{norm}}=X-\overline{X} $$

(1)

式中$ \overline{X} $是输入序列的均值。

本文采用线性层挖掘局部变化。首先将建筑能耗数据$ {S}_{n} $，节假日特征$ {H}_{n} $及天气数据$ {A}_{n}、{B}_{n}、{E}_{n} $进行编码后，将其与建筑形态特征$ {M}_{\delta } $进行融合，输入线性层进行预测。其中每层线性层的计算方式为

$$ {Y}_{\text{short}}=\text{Linear}\left(\text{Linear}\left({X}_{\text{norm}}\right)+{M}_{\delta }\right) $$

(2)

式中$ \text{Linear} $表示沿着时间维度的线性层。

1.2.2 全局特征学习

该模块采用编码器−解码器架构来挖掘全局相关性。编码器采用序列信息和全局信息学习长期表示，计算方式为

$$ v=\text{Enc}\left({X}_{\text{norm}},T\right) $$

(3)

式中：$ \text{Enc} $表示编码器，$ T=kw $表示序列长度。编码器选择TCN^[27]，其可以捕捉时间序列数据中的复杂模式和依赖性，且计算效率较高，适合处理建筑能耗数据的特性。建筑能耗数据不仅在一天内呈现早晚高峰、中午低谷的周期性变化，在一周内也会因工作日和双休日呈现周期性变化，TCN能通过分层的时间分析，同时捕捉这些不同时间段的规律。在遇到极端天气或设备故障导致的能耗突变，TCN也能区分正常波动和异常情况。

解码器采用了多尺度的具有不同的核大小$ \left\{{{\textit{z}}}_{i}\right\}_{i=1}^{n} $的MA块^[28]，根据表示$ v $捕获多个周期，计算方式为

$$ {Y}_{\text{long}}=\frac{1}{n}\sum\limits_{i=1}^{n}\text{AvgPool}{\left(\text{Padding}\left(\text{MLP}\left(v\right)\right)\right)}_{{{{\textit{z}}}_{i}}} $$

(4)

式中：$ \text { AvgPool } $是平均池化操作，Padding是填充操作，MLP是多层感知机。针对建筑能耗存在的日内周期变化与周内规律性，MA块通过设置不同核尺寸，可分别提取不同变化周期。

将局部特征学习模块和全局特征学习模块得到的预测结合，并去归一化得到对建筑能耗的预测值，计算方式为

$$ {Y}_{\text{pred}}=\left({Y}_{\text{short}}+{Y}_{\text{long}}\right)+\overline{X} $$

(5)

1.2.3 损失函数设计

由于常规的窗口长度外仍存在非零的相关性。而一个小批处理的窗口中可能存在时间相距非常远的情况。因此，两个窗口间的时间距离可以和整个序列长度$ T $一样长，并且比窗口长度$ w $长得多。基于这一事实以及建筑能耗数据中也存在相同的特点，本文损失函数设计的核心考虑是建筑能耗数据的周期性和长期相关性特征，通过在窗口之间建立关系来解决整个序列中存在的长期依赖关系，捕捉建筑跨周期的重复性能耗模式。

为了学习彼此相距很远但由于长期周期性而相似的窗口间关系，本文通过自监督学习的方式，对窗口间关系的定义为

$$ r\left({T}_{{{t}_{1}}},{T}_{{{t}_{2}}}\right)=\left| {R}_{\text{SS}}\left(\left| {t}_{1}-{t}_{2}\right| \right)\right| $$

(6)

$ {R}_{\text{SS}} $为自相关函数，计算方式见为

$$ {R}_{\text{SS}}\left(h\right)=\underset{T\rightarrow \mathrm{\infty }}{\lim }\frac{1}{T}\sum\limits_{t=1}^{T}{X}_{t}{X}_{t-h} $$

(7)

若相关值$ {R}_{\text{SS}}\left(h\right) $接近1或−1，表示时间序列$ {X}_{n} $中相隔$ h $的所有点线性相关，正负号则表示它们以相同或相反的方向变化。

两个窗口之间的关系$ r\left({T}_{{{t}_{1}}},{T}_{{{t}_{2}}}\right) $度量的是不同时间点的观测值之间(即时间滞后$ h $)的相关性，其以相对的方式来定义正负样本。若$ {r}^{\left(i,o\right)} $低于锚对$ {r}^{\left(i,j\right)} $则作为负对，否则指定为正对，由此，形成时序自监督学习方式，并在损失函数中引入自相关对比损失项$ {L}_{\text{AutoCon}} $来引导模型学习窗口间的相关性。

$ {L}_{\text{AutoCon}} $的计算方式为

$$ \begin{gathered} {L}_{\text{AutoCon}}=-\frac{1}{k}\displaystyle\sum\limits_{i=1}^{k}\frac{1}{k-1}\displaystyle\sum\limits_{j=1,j\neq i}^{k}{r}^{\left(i,j\right)}\\ \log \frac{\exp \left(\text{Sim}\left({v}^{\left(\mathrm{i}\right)},{v}^{\left(j\right)}\right)/r\right)}{\displaystyle\sum\limits_{o=1}^{k}{1}_{\left[o\neq i,{r}^{\left(i,o\right)}\leq {r}^{\left(i,j\right)}\right]}\exp \left(\text{Sim}\left({v}^{\left(i\right)},{v}^{\left(o\right)}\right)/r\right)} \end{gathered} $$

(8)

式中：$ \text{Sim}\left(\right) $表示的是两个表示之间的相似性，$ {r}^{\left(i,j\right)}=r\left({T}^{\left(i\right)},{T}^{\left(j\right)}\right) $表示两个窗口之间的时序相关性。在训练过程中，共有$ k\times \left(k-1\right) $个索引锚对。

需要注意的是，相对选择策略并不能保证正对窗口具有高相关性，只是比同一批次中其他负窗口具有更高的相关性。因此，引入了$ {r}^{\left(i,j\right)} $作为权重，以区分具有不同相关性程度的正对，类似于焦点损失。

本文的损失函数$ L $采用随机梯度下降方法求解，其计算方式见公式为

$$ L={L}_{\text{MSE}}+\lambda \cdot {L}_{\text{AutoCon}} $$

式中$ L\mathrm{_{MSE}} $为均方误差，计算方式为

$$ {L}_{\text{MSE}}=\frac{1}{n}\sum\limits_{i=1}^{n}{\left({y}_{i}-{\hat{y}}_{i}\right)}^{2} $$

$ {L}_{\text{AutoCon}} $为自相关对比损失项，$ \lambda $为权重，$ \lambda $每一训练轮次都进行更新，更新的计算方式为

$$ \lambda =\frac{\lambda }{1+\beta \cdot i} $$

式中：$ i $表示当前训练轮次，$ \beta $表示衰减率为常量。

1.3 模型训练

本文提出的基于时序相关性挖掘的能耗预测方法(LG-TCL)训练过程如下：

算法　基于时序相关性挖掘的建筑能耗预测算法

输入　训练集$ D=\left\{\left({X}_{n},{Y}_{n}\right)\right\}_{n=1}^{k} $，建筑形态特征$ {M}_{\delta } $，$ L\mathrm{_{AutoCon}} $权重$ \lambda $，衰减率$ \beta $，训练轮次epochs

输出　预测值$ {Y}_{{\mathrm{pred}}} $

过程：

初始化权重$ \lambda =1 $

for $ i=1 $ to $ \text{epochs} $ do

从$ D $中提取出一个含$ k' $个样本的小批量$ \left\{\left({X}^{\left(n\right)},{Y}^{\left(n\right)}\right)\right\}_{n=1}^{k'} $

由$ \left\{X_{{}_{\text{norm}}}^{\left(n\right)}\right\}_{n=1}^{k'}=\left\{{X}^{\left(n\right)}-\overline{X}\right\}_{n=1}^{k'} $计算得到$ \left\{X_{\text{norm}}^{\left(n\right)}\right\}_{n=1}^{k'} $

由$ \left\{Y_{\text{short}}^{\left(n\right)}\right\}_{n=1}^{k'}=\left\{\text{Linear}\left(\text{Linear}\left(X_{{}^{\text{norm}}}^{\left(\mathrm{n}\right)}\right)+{M}_{\delta }\right)\right\}_{n=1}^{k'} $计算得到$ \left\{Y_{\text{short}}^{\left(n\right)}\right\}_{n=1}^{k'} $

由式(3)计算得到相应的表示$ \left\{{v}^{\left(n\right)}\right\}_{n=1}^{k'} $，由式(4)计算得到$ \left\{Y_{\text{long}}^{\left(n\right)}\right\}_{n=1}^{k'} $

由$ \left\{Y_{\text{pred}}^{\left(n\right)}\right\}_{n=1}^{k'}=\left\{\left(Y_{\text{short}}^{\left(n\right)}+Y_{\text{long}}^{\left(n\right)}\right)+\overline{X}\right\}_{n=1}^{k'} $计算得到$ \left\{Y_{\text{pred}}^{\left(n\right)}\right\}_{n=1}^{k'} $

由式(6)和式(7)计算得窗口关系$ r $

由式(8)计算$ {L}_{\text{AutoCon}} $

计算预测损失$ {L}_{\text{MSE}}=\dfrac{1}{k'}\displaystyle\sum\limits_{n=1}^{k'}{\left(Y_{\text{pred}}^{\left(n\right)}-{Y}^{\left(n\right)}\right)}^{2} $

计算整体损失$ L={L}_{\text{MSE}}+\lambda \cdot {L}_{\text{AutoCon}} $

$$ \lambda \leftarrow \frac{\lambda }{1+\beta \cdot i} $$

end for

2. 实验设置

本文实验所使用的硬件配置为单卡NVIDIA GeForce RTX 3070 GPU，在此硬件环境下使用PyTorch深度学习框架进行实验训练。为了确保实验的公平性和可重复性，本文对LG-TCL模型及对比模型设置了如下参数：滑动窗口长度为168(对应一周小时数据)；预测时长分别设为12、24、96、128、720 h；TCN编码器设置3层卷积，卷积核大小为3，隐藏通道数为64；多尺度移动平均(MA)解码器设置核大小分别为24、48、96，覆盖不同时间周期；权重衰减率$ \beta $为0.95；训练轮次为100$ \text{epochs} $；批次大小为64；优化器选择Adam，学习率设为0.001；损失函数选择均方误差(MSE)与自监督对比损失加权组合，权重$ \lambda $为0.3。本节主要介绍数据来源、预处理方法与评价指标。

2.1 数据集来源

本文采用的建筑能耗数据来自建筑数据基因组2(the building data genome 2, BDG2)的公开数据集^[30]。该数据集由美国匹兹堡卡内基梅隆大学发布，是建筑能耗研究领域中广泛应用的开放数据集。数据集收集了2016年1月1日—2017年12月31日，来自欧美19个城市(如芝加哥、旧金山、纽约、奥斯陆等)共1 636个电能表的建筑电力使用情况，数据采样间隔为1 h，时间跨度为2 a，具备明显的季节性、周期性和节假日波动。

2.2 数据预处理

本文从数据集中遵循以下两个要求选取建筑来确保数据质量：

1)每个特征的缺失率应小于5%；

2)所选建筑物的平均能耗应大于20 kW·h。

筛选完成后，共得到27栋住宿类型的建筑能耗数据。本文在选择好建筑物后，采用随机森林模型(random forest, RF)来填充缺失值。此过程以迭代的方式完成，首先选择缺失率最高的特征作为输出。然后，剩余的特征将作为输入，输入矩阵的缺失值将由每个特征的平均值临时填充，RF的预测将填补输出变量的缺失值，对于缺失值数量第二高的特征，重复相同的迭代过程，直到每个特征都没有缺失值。将处理后的建筑数据按建筑标签随机划分为：训练集(约占70%)，验证集(约占15%)，测试集(约占15%)。这种划分方式有助于真实模拟能耗预测的实际场景。

通过数据集中建筑位置的描述，本文在开放地图(open street map，OSM)上获取了与建筑对应的矢量数据，根据表1计算建筑形态信息。此外，本文还添加了与时间相关的节假日特征。数据预处理完成后，其特征构成如表2所示。

表 2 数据特征构成

Table 2 Composition of data features

特征类型	特征名
时间	日期$ {T}_{t} $
时间	节假日$ {H}_{i} $
建筑形态	建筑物面积比$ {M}_{\text{area}\_{\mathrm{ration}}} $
	建筑物朝向$ {M}_{\text{oriention}} $
	建筑重心角点的平均距离$ {M}_{\text{ccd}\_{\mathrm{means}}} $
	凸度$ {M}_{\text{convexity}} $
	伸长率$ {M}_{\text{elongation}} $
	建筑紧凑度指数$ {M}_{\text{squ}\_{\mathrm{comp}}} $
	最长轴的长度值$ {M}_{\text{long}\_{\mathrm{ax}}} $
	形状系数$ {M}_{\text{shape}\_{\mathrm{index}}} $
天气	空气温度$ A $
	湿度$ B $
	风速$ E $
能耗	电能消耗数据$ S $

2.3 评价指标

本文采用建筑能耗预测相关研究中常用的3个评估指标：平方根误差(MSE)、平均绝对误差(mean absolute error, MAE)和决定系数($ {R}^{2} $)，计算方式为

$$ E_{\mathrm{MS}}=\frac{1}{m}\sum\limits_{n=1}^m\left(y_n-\hat{y}_n\right)^2 $$

$$ E_{\mathrm{MA}}=\frac{1}{m}\sum\limits_{n=1}^m\left|y_n-\hat{y}_n\right| $$

$$ {R}^{2}=1-\frac{\displaystyle\sum\limits_{n}{\left({y}_{n}-{\hat{y}}_{n}\right)}^{2}}{\displaystyle\sum\limits_{n}{\left({y}_{n}-\overline{y}\right)}^{2}} $$

式中：$ {\hat{y}}_{n} $表示时间步$ n $时的预测值，$ {y}_{n} $表示时间步$ n $时的初始值，$ m $表示测试样本总数。MAE、MSE的值越小，则表示预测值与初始值之间的偏差越小；若$ {R}^{2} $值为1，则样本中预测值和真实值完全相等，没有任何误差。

3. 实验结果及分析

为了验证LG-TCL方法的有效性和优势性，本文首先采用LG-TCL方法对处理后的数据进行不同时间尺度的预测实验，之后设计了一系列对比实验和消融实验。

3.1 对比实验

本文选取多种较常见的能耗预测方法ARIMA^[8]、LSTM^[9]、GRU^[10]、Transformer^[11]、GWO-SARIMA-LSTM^[14]、Informer^[15]和Autoformer^[16]与LG-TCL方法进行了不同时间尺度的预测实验，以验证所提出的LG-TCL方法在建筑能耗长短期预测的有效性，实验结果如表3所示。

表 3 在不同预测时长下不同模型能耗预测实验结果

Table 3 Experimental results of different models predicting energy consumption at various time steps

评价指标	MSE↓					MAE↓					R²↑
预测时长/h	12	24	96	128	720	12	24	96	128	720	12	24	96	128	720
LG-TCL	0.7943	0.8232	0.8531	0.8865	0.9024	0.6542	0.7887	0.8205	0.8666	0.8928	0.6105	0.5727	0.5196	0.4727	0.4313
ARIMA	0.9605	0.9764	1.0976	1.4180	1.5786	0.8748	0.9509	0.9348	1.2457	1.4956	0.4036	0.4638	0.4512	0.3571	0.3417
LSTM	0.9723	0.9292	1.0825	1.2667	1.4549	0.7641	0.8607	0.9218	1.1096	1.4520	0.4918	0.4619	0.4386	0.4085	0.3923
GRU	1.0626	1.1609	1.3716	1.4610	1.6273	0.8016	0.8743	0.9002	0.9751	1.2415	0.5869	0.5074	0.4806	0.4112	0.3659
Transformer	0.8771	0.9361	0.9625	1.1802	1.3891	0.7453	0.8723	0.9245	1.1019	1.3538	0.5719	0.5065	0.4819	0.4002	0.3948
GWO-SARIMA-LSTM	0.8768	0.9283	0.9691	1.1707	1.3519	0.7337	0.8385	0.9038	1.1015	1.3623	0.5731	0.5612	0.4960	0.4397	0.4159
Informer	0.8841	0.9023	0.9448	1.0991	1.3642	0.7951	0.8647	0.9118	1.0904	1.1285	0.5574	0.4995	0.4822	0.4123	0.3957
Autoformer	0.8793	0.9361	0.9625	1.0765	1.0558	0.8004	0.8879	0.9215	1.1048	1.1201	0.5619	0.4869	0.4733	0.4018	0.3899
注：加粗代表该预测步长同指标最优。

在不同预测时长(12、24、96、128、720 h)的建筑能耗预测中，本文提出的LG-TCL方法在3项评价指标(MSE、MAE、R²)上均优于ARIMA、LSTM、GRU、Transformer、GWO-SARIMA-LSTM、Informer和Autoformer方法，表现出更高的预测精度。其中，在短期(12、24 h)能耗预测任务中，LG-TCL在MSE和MAE上分别达到0.7943和0.6542，较Transformer降低了9.44%和12.22%，同时R²提高至0.6105。该结果表明，LG-TCL在短期预测任务中具有更强的拟合能力和波动捕捉能力。其优势主要源于滑动窗口内的局部特征学习模块，能够有效提取能耗时序中的短期局部动态变化模式。在中长期预测任务(96、128和720 h)中，LG-TCL的性能依旧保持领先，尤其在MSE、MAE指标上相较于ARIMA分别降低了22.28%和12.23%。此外，R²分别为0.6105、0.5727、0.5196、0.4727、0.4313，均高于对比方法。其原因在于本方法捕获跨窗口的长期依赖及多周期变化，有效建模了跨时间段的全局趋势与周期性特征，从而提升了长期预测的精度。

为了更好地体现5种不同方法对建筑能耗的预测能力，图2给出了随机选取的一天(0:00—24:00)对某一建筑的真实能耗与预测能耗的拟合曲线。从图2可以看出，本文提出的LG-TCL方法相较于ARIMA、LSTM、GRU、Transformer、GWO-SARIMA-LSTM、Informer和Autoformer方法，预测曲线与真实能耗曲线在主趋势变化上保持了更高的一致性。具体而言，LG-TCL在能耗峰值与谷值区间的预测更为精准，峰谷时刻与真实值具有较强的同步性。ARIMA、LSTM和GRU虽能部分捕捉趋势，但在高频波动处存在偏移，Transformer等其他方法难以准确还原突变时段的负荷波动。这也是由于LG-TCL在局部特征提取与全局趋势建模方面的优势。一方面，通过引入静态建筑特征与滑动窗口结构能够捕捉小时级能耗数据的短周期波动，提升对局部非线性变化的响应能力；另一方面，全局特征学习模块增强了模型对不同时间段能耗变化趋势的感知能力。

图 2 不同方法未来24 h预测对比图

Fig. 2 Comparison of different methods for 24-hour ahead forecasting

下载: 全尺寸图片

本文进一步将$ {L}_{\text{AutoCon}} $与TS2Vec^[18]、CoST^[19]、LaST^[20]3种不同对比损失函数进行了对比，通过如图3所示的统一流形逼近与投影(uniform manifold approximation and projection，UMAP)图^[31]直观给出。UMAP图表示的是经过降维后样本相对位置的抽象表示，代表了方法对时序数据变化趋势学习的能力。从图3可以看出，本文所采用的$ {L}_{\text{AutoCon}} $相较于其他3种自相关计算方式在时间轴上呈现连续带状分布，能清晰反映能耗从工作日到周末的渐变规律，而其他3种损失模块的数据点分散，在连续性上表现较差，这表明本文所采用的自相关计算方式能够较好学习长期趋势变化。

图 3 不同对比损失函数UMAP图

Fig. 3 UMAP visualizations of different contrastive loss functions

下载: 全尺寸图片

3.2 消融实验

为了验证本文所提出的LG-TCL方法各模块对预测精度的影响，本文进行了消融实验，表4给出了消融实验的结果。

表 4 消融实验结果

Table 4 Ablation experiment results

LG-TCL方法				评价指标
全局特征学习模块	局部特征学习模块	损失函数设计模块		MSE↓	MAE↓	R²↑
全局特征学习模块	局部特征学习模块	$ L_{\text {AutoCon }} $	$ {L}_{{\mathrm{MSE}}} $	MSE↓	MAE↓	R²↑
√	√	√	√	0.8232	0.7887	0.5727
×	√	√	√	0.9787	0.9297	0.3557
√	×	√	√	0.9798	0.9261	0.4825
√	√	×	√	0.9117	0.9283	0.4627
√	√	√	×	0.9279	0.8363	0.5271
注：红色代表该预测步长同指标最优，蓝色代表该预测步长同指标次优。

从表4可以看出，当移除全局特征学习模块时，模型性能下降幅度最大，各指标分别降低15.888%、15.166%、37.891%，这一结果说明，该模块在建模长时间依赖关系、捕捉全局趋势变化方面具有关键作用。当移除局部特征学习模块时，各指标分别降低15.98%、14.84%、15.75%，说明窗口内的局部建模对于提高模型预测能力具有重要意义。相比之下，损失函数设计模块的移除对性能影响相对较小，说明对比学习损失起到了一定的辅助作用。

为了量化不同建筑形态特征对建筑能耗预测精度的影响，本文开展特征消融实验，结果如表5所示。

表 5 不同建筑形态特征对建筑能耗预测精度影响实验结果

Table 5 Experimental results on the impact of different building morphological features on building energy consumption prediction accuracy

形态特征						评价指标
$ {M}_{{\mathrm{area}}\_ {\mathrm{ration}}} $ $ {M}_{{\mathrm{oriention}}} $	$ {M}_{{\mathrm{squ}}\_ {\mathrm{comp}}} $ $ {M}_{{\mathrm{shape}}\_ {\mathrm{index}}} $	$ {M}_{{\mathrm{ccd}}\_ {\mathrm{means}}} $	$ {M}_{{\mathrm{convexity}}} $	$ {M}_{{\mathrm{elongation}}} $	$ {M}_{{\mathrm{long}}\_ {\mathrm{ax}}} $	MSE↓	MAE↓	R²↑
√	√	√	√	√	√	0.8232	0.7887	0.5727
×	√	√	√	√	√	0.9763	0.8122	0.5328
√	×	√	√	√	√	0.9839	0.8674	0.4968
√	√	×	√	√	√	0.9124	0.8795	0.4702
√	√	√	×	√	√	0.9186	0.8629	0.4770
√	√	√	√	×	√	0.8872	0.8412	0.5100
√	√	√	√	√	×	0.8719	0.8170	0.4980
注：红色代表该预测步长同指标最优，蓝色代表该预测步长同指标次优。

从表5可以看出，在加入选定的建筑形态特征后，LG-TCL方法的精度均有所提升，验证了加入新的建筑形态特征对预测建筑能耗的有效性。但不同的建筑形态特征对模型的精度提升效果是不同的，当不采用建筑重心角点的平均距离$ {M}_{\text{ccd}\_{\mathrm{means}}} $时，模型的预测精度下降最大，各评价指标分别降低9.776%、10.324%、17.898%，说明该特征对模型的预测精度影响最大。当不采用最长轴长度值$ {M}_{\text{long}\_{\mathrm{ax}}} $时，各评价指标降低最少为3.464%，最多为8.560%，其中MSE指标为次优值，说明该特征对模型的精度影响最小。实验证明，建筑形状特征对能耗预测的效果影响不同，其中建筑重心角点的平均距离等关键特征的加入能让模型更准确预测能耗变化。

4. 结束语

本文提出了基于时序相关性的建筑能耗预测方法(LG-TCL)，该方法有效融合了建筑形态信息与时序能耗数据，通过对局部时序特征与跨窗口全局趋势的联合学习，突破滑动窗口长度的限制，有效解决了传统方法难以捕捉长期依赖和忽视建筑形态特征的问题，提高了建筑能耗预测的准确性。经实验验证，该模型较其他的能耗预测方法ARIMA、LSTM、GRU、Transformer、GWO-SARIMA-LSTM、Informer和Autoformer方法，在定量和定性对比上具有明显优势，对时序数据趋势学习上连续性和聚合性较好，分布更加合理。本文进一步论证了窗口内局部特征学习、窗口间全局特征学习、损失函数设计以及加入建筑形态特征对提升建筑能耗预测精度的有效性。通过这一创新性方法，本文能够更加精准地反映建筑能耗的变化规律，为智能建筑的能源管理和节能优化提供了更为可靠的数据支撑。

在未来的研究工作中，面向更复杂、动态的能耗预测场景，本文方法仍有拓展空间。方法层面，未来将引入鲁棒性建模机制，分析异常值对样本构造与特征表示的影响，并评估建模参数对性能表现的敏感性；数据层面，将引入动态变量(如入住率、设备使用率)，提升模型对用能行为变化的响应能力；应用层面，将进一步挖掘本方法在跨区域、跨建筑类型中的泛化能力与适应边界。

图 1 基于时序自相关的建筑能耗预测模型结构

Fig. 1 Architecture of building energy consumption prediction model based on temporal autocorrelation

下载: 全尺寸图片

图 2 不同方法未来24 h预测对比图

Fig. 2 Comparison of different methods for 24-hour ahead forecasting

下载: 全尺寸图片

图 3 不同对比损失函数UMAP图

Fig. 3 UMAP visualizations of different contrastive loss functions

下载: 全尺寸图片

表 1 建筑形态特征说明

Table 1 Description of building morphological features

形态特征及计算(获取)方式	含义
$ {M}_{{\mathrm{area}}\_ {\mathrm{ration}}}=\dfrac{{A}_{{\mathrm{building}}}}{{A}_{{\mathrm{convex}}\_ {\mathrm{hull}}}} $	建筑物面积比
$ {M}_{{\mathrm{oriention}}}=\arctan 2\left(\Delta c,\Delta g\right) $	建筑物朝向
$ {M}_{{\mathrm{ccd}}\_ {\mathrm{means}}}=\dfrac{1}{n}\displaystyle\sum\limits_{i=1}^{n}{d}_{i} $	建筑中心角点的平均距离
$ {M}_{{\mathrm{convexity}}}=\dfrac{{A}_{{\mathrm{region}}}}{{A}_{{\mathrm{convex}}\_ {\mathrm{hull}}}} $	建筑物凸度
$ {M}_{{\mathrm{elongation}}}=\sqrt{1-\dfrac{{I}_{{\mathrm{minor}}}}{{I}_{{\mathrm{major}}}}} $	建筑物伸长率
$ {M}_{{\mathrm{squ}}\_ {\mathrm{comp}}}=\dfrac{4 {\text{π}} {A}_{{\mathrm{building}}}}{C_{{\mathrm{building}}}^{2}} $	建筑紧凑度指数
$ {M}_{{\mathrm{long}}\_ {\mathrm{ax}}}={\max }_{i,j}\sqrt{{\left({c}_{i}-{c}_{j}\right)}^{2}+{\left({g}_{i}-{g}_{j}\right)}^{2}} $	最长轴的长度值
$ {M}_{{\mathrm{shape}}\_ {\mathrm{index}}}=\dfrac{\sqrt{\dfrac{{A}_{{\mathrm{building}}}}{\text{π}}}}{0.5 {M}_{{\mathrm{long}}\_ {\mathrm{ax}}}} $	形状系数

表 2 数据特征构成

Table 2 Composition of data features

特征类型	特征名
时间	日期$ {T}_{t} $
时间	节假日$ {H}_{i} $
建筑形态	建筑物面积比$ {M}_{\text{area}\_{\mathrm{ration}}} $
	建筑物朝向$ {M}_{\text{oriention}} $
	建筑重心角点的平均距离$ {M}_{\text{ccd}\_{\mathrm{means}}} $
	凸度$ {M}_{\text{convexity}} $
	伸长率$ {M}_{\text{elongation}} $
	建筑紧凑度指数$ {M}_{\text{squ}\_{\mathrm{comp}}} $
	最长轴的长度值$ {M}_{\text{long}\_{\mathrm{ax}}} $
	形状系数$ {M}_{\text{shape}\_{\mathrm{index}}} $
天气	空气温度$ A $
	湿度$ B $
	风速$ E $
能耗	电能消耗数据$ S $

表 3 在不同预测时长下不同模型能耗预测实验结果

Table 3 Experimental results of different models predicting energy consumption at various time steps

评价指标	MSE↓					MAE↓					R²↑
预测时长/h	12	24	96	128	720	12	24	96	128	720	12	24	96	128	720
LG-TCL	0.7943	0.8232	0.8531	0.8865	0.9024	0.6542	0.7887	0.8205	0.8666	0.8928	0.6105	0.5727	0.5196	0.4727	0.4313
ARIMA	0.9605	0.9764	1.0976	1.4180	1.5786	0.8748	0.9509	0.9348	1.2457	1.4956	0.4036	0.4638	0.4512	0.3571	0.3417
LSTM	0.9723	0.9292	1.0825	1.2667	1.4549	0.7641	0.8607	0.9218	1.1096	1.4520	0.4918	0.4619	0.4386	0.4085	0.3923
GRU	1.0626	1.1609	1.3716	1.4610	1.6273	0.8016	0.8743	0.9002	0.9751	1.2415	0.5869	0.5074	0.4806	0.4112	0.3659
Transformer	0.8771	0.9361	0.9625	1.1802	1.3891	0.7453	0.8723	0.9245	1.1019	1.3538	0.5719	0.5065	0.4819	0.4002	0.3948
GWO-SARIMA-LSTM	0.8768	0.9283	0.9691	1.1707	1.3519	0.7337	0.8385	0.9038	1.1015	1.3623	0.5731	0.5612	0.4960	0.4397	0.4159
Informer	0.8841	0.9023	0.9448	1.0991	1.3642	0.7951	0.8647	0.9118	1.0904	1.1285	0.5574	0.4995	0.4822	0.4123	0.3957
Autoformer	0.8793	0.9361	0.9625	1.0765	1.0558	0.8004	0.8879	0.9215	1.1048	1.1201	0.5619	0.4869	0.4733	0.4018	0.3899
注：加粗代表该预测步长同指标最优。

表 4 消融实验结果

Table 4 Ablation experiment results

LG-TCL方法				评价指标
全局特征学习模块	局部特征学习模块	损失函数设计模块		MSE↓	MAE↓	R²↑
全局特征学习模块	局部特征学习模块	$ L_{\text {AutoCon }} $	$ {L}_{{\mathrm{MSE}}} $	MSE↓	MAE↓	R²↑
√	√	√	√	0.8232	0.7887	0.5727
×	√	√	√	0.9787	0.9297	0.3557
√	×	√	√	0.9798	0.9261	0.4825
√	√	×	√	0.9117	0.9283	0.4627
√	√	√	×	0.9279	0.8363	0.5271
注：红色代表该预测步长同指标最优，蓝色代表该预测步长同指标次优。

表 5 不同建筑形态特征对建筑能耗预测精度影响实验结果

Table 5 Experimental results on the impact of different building morphological features on building energy consumption prediction accuracy

形态特征						评价指标
$ {M}_{{\mathrm{area}}\_ {\mathrm{ration}}} $ $ {M}_{{\mathrm{oriention}}} $	$ {M}_{{\mathrm{squ}}\_ {\mathrm{comp}}} $ $ {M}_{{\mathrm{shape}}\_ {\mathrm{index}}} $	$ {M}_{{\mathrm{ccd}}\_ {\mathrm{means}}} $	$ {M}_{{\mathrm{convexity}}} $	$ {M}_{{\mathrm{elongation}}} $	$ {M}_{{\mathrm{long}}\_ {\mathrm{ax}}} $	MSE↓	MAE↓	R²↑
√	√	√	√	√	√	0.8232	0.7887	0.5727
×	√	√	√	√	√	0.9763	0.8122	0.5328
√	×	√	√	√	√	0.9839	0.8674	0.4968
√	√	×	√	√	√	0.9124	0.8795	0.4702
√	√	√	×	√	√	0.9186	0.8629	0.4770
√	√	√	√	×	√	0.8872	0.8412	0.5100
√	√	√	√	√	×	0.8719	0.8170	0.4980
注：红色代表该预测步长同指标最优，蓝色代表该预测步长同指标次优。

参考文献(31)

[1]	SANTAMOURIS M, VASILAKOPOULOU K. Present and future energy consumption of buildings: Challenges and opportunities towards decarbonisation[J]. E-prime-advances in electrical engineering, electronics and energy, 2021, 1: 100002. doi: 10.1016/j.prime.2021.100002
[2]	GIBB D, LEDANOIS N, RANALDER L, et al. Renewables 2022 global status report[EB/OL]. (2024−06−05)[2025−03−07]. https://pure.iiasa.ac.at/id/eprint/19781/1/GSR2022_Full_Report.pdf.
[3]	ZHANG Jianxin, HUANG Yao, CHENG Hengda, et al. Ensemble learning-based approach for residential building heating energy prediction and optimization[J]. Journal of building engineering, 2023, 67: 106051. doi: 10.1016/j.jobe.2023.106051
[4]	冯增喜, 杨芸芸, 赵锦彤, 等. 基于人工智能的建筑能耗预测研究综述[J]. 建筑节能(中英文), 2023, 51(3): 22−29. doi: 10.3969/j.issn.2096-9422.2023.03.004 FENG Zengxi, YANG Yunyun, ZHAO Jintong, et al. A review of research on artificial intelligence-based building energy consumption prediction[J]. Building energy efficiency (Chinese and English), 2023, 51(3): 22−29. doi: 10.3969/j.issn.2096-9422.2023.03.004
[5]	刘兆濡, 燕达, 吴如宏, 等. 基于DeST的城市建筑能耗模拟平台开发[J]. 建筑科学, 2021, 37(10): 16−23. doi: 10.13614/j.cnki.11-1962/tu.2021.10.03 LIU Zhaoru, YAN Da, WU Ruhong, et al. Development of an urban building energy consumption simulation platform based on DeST[J]. Building science, 2021, 37(10): 16−23. doi: 10.13614/j.cnki.11-1962/tu.2021.10.03
[6]	CHEN Yongbao, GUO Mingyue, CHEN Zhisen, et al. Physical energy and data-driven models in building energy prediction: a review[J]. Energy reports, 2022, 8: 2656−2671. doi: 10.1016/j.egyr.2022.01.162
[7]	韩少锋, 吴迪, 张圣原, 等. 基于EMD与机器学习算法的近零能耗建筑负荷预测方法[J]. 暖通空调, 2024, 54(7): 82−89,97. doi: 10.19991/j.hvac1971.2024.07.13 HAN Shaofeng, WU Di, ZHANG Shengyuan, et al. EMD and machine learning algorithms-based load prediction method for near-zero energy buildings[J]. Heating ventilating & air conditioning, 2024, 54(7): 82−89,97. doi: 10.19991/j.hvac1971.2024.07.13
[8]	HE Yuxuan, GONG Qijian, ZHOU Zhenxin, et al. Development of a hybrid VRF system energy consumption prediction model based on data partitioning and swarm intelligence algorithm[J]. Journal of building engineering, 2023, 74: 106868. doi: 10.1016/j.jobe.2023.106868
[9]	JIANG Pei, WANG Zuoxue, LI Xiaobin, et al. Energy consumption prediction and optimization of industrial robots based on LSTM[J]. Journal of manufacturing systems, 2023, 70: 137−148. doi: 10.1016/j.jmsy.2023.07.009
[10]	DOAN C. Comparing encoder-decoder architectures for neural machine translation: a challenge set approach[D]. Ottawa: University of Ottawa, 2021.
[11]	HAN Mingdong, FAN Lingyan. A short-term energy consumption forecasting method for attention mechanisms based on spatio-temporal deep learning[J]. Computers and electrical engineering, 2024, 114: 109063. doi: 10.1016/j.compeleceng.2023.109063
[12]	PATRO B N, NAMBOODIRI V P, AGNEESWARAN V S. SpectFormer: frequency and attention is what you need in a vision transformer[EB/OL]. (2023−04−13)[2025−03−07]. https://arxiv.org/abs/2304.06446.
[13]	KLYUEV R V, MORGOEV I D, MORGOEVA A D, et al. Methods of forecasting electric energy consumption: a literature review[J]. Energies, 2022, 15(23): 8919. doi: 10.3390/en15238919
[14]	ZHENG Shirong, LIU Shaobo, ZHANG Zhenhong, et al. TRIZ method for urban building energy optimization: GWO-SARIMA-LSTM forecasting model[EB/OL]. (2024−10−02)[2025−03−07]. https://arxiv.org/abs/2410.15283.
[15]	ZHOU Haoyi, ZHANG Shanghang, PENG Jieqi, et al. Informer: beyond efficient transformer for long sequence time-series forecasting[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Virtual Event: ACM, 2021, 35(12): 11106−11115.
[16]	WU Haixu, XU Jiehui, WANG Jianmin, et al. Autoformer: decomposition transformers with auto-correlation for long-term series forecasting[J]. Advances in neural information processing systems, 2021, 34: 22419−22430.
[17]	TONEKABONI S, EYTAN D, GOLDENBERG A. Unsupervised representation learning for time series with temporal neighborhood coding[EB/OL]. (2021−06−01)[2025−03−07]. https://arxiv.org/abs/2106.00750.
[18]	YUE Zhihan, WANG Yujing, DUAN Juanyong, et al. TS2Vec: towards universal representation of time series[C]//Proceedings of the AAAI Conference on Artificial Intelligence. Vancouver: AAAI, 2022, 36(8): 8980−8987.
[19]	WOO G, LIU Chenghao, SAHOO D, et al. CoST: contrastive learning of disentangled seasonal-trend representations for time series forecasting[EB/OL]. (2022−02−03)[2025−3−77]. https://arxiv.org/abs/2202.01575.
[20]	WANG Zhiyuan, XU X, ZHAGN Weifeng, et al. Learning latent seasonal-trend representations for time series forecasting[J]. Advances in neural information processing systems, 2022, 35: 38775−38787.
[21]	KOŻUCH A, CYWICKA D, ADAMOWICZ K, et al. A comparison of artificial neural network and time series models for timber price forecasting[J]. Forests, 2023, 14(2): 177. doi: 10.3390/f14020177
[22]	EMAMI P, SAHU A, GRAF P. BuildingsBench: a large-scale dataset of 900K buildings and benchmark for short-term load forecasting[EB/OL]. Advances in neural information processing systems, 2023, 36: 19823−19857.
[23]	LU Xingyu, LIU Zhining, GUAN Yanchu, et al. GreenFlow: a computation allocation framework for building environmentally sound recommendation system[C]//Proceedings of the Thirty-Second International Joint Conference on Artificial Intelligence. Macao: IJCAI, 2023: 6103−6111.
[24]	姜之点, 杨峰. 街区尺度城市形态因子对建筑能耗影响的模拟研究[J]. 建筑科学, 2022, 38(6): 140−149. doi: 10.13614/j.cnki.11-1962/tu.2022.06.18 JIANG Zhidian, YANG Feng. Simulation study on the impact of neighborhood-scale urban morphological factors on building energy consumption[J]. Building science, 2022, 38(6): 140−149. doi: 10.13614/j.cnki.11-1962/tu.2022.06.18
[25]	BOSE S, LI Yijiang, VAN SANT A, et al. From RNNs to foundation models: an empirical study on commercial building energy consumption[EB/OL]. (2024−11−21)[2025−03−07]. https://arxiv.org/abs/2411.1442.
[26]	POTOČNIK P, ŠKERL P, GOVEKAR E. Machine-learning-based multi-step heat demand forecasting in a district heating system[J]. Energy and buildings, 2021, 233: 110673. doi: 10.1016/j.enbuild.2020.110673
[27]	晏雄锋, 袁拓, 杨敏, 等. 建筑物形状特征分析表达与自适应化简方法[J]. 测绘学报, 2022, 51(2): 269−278. YAN Xiongfeng, YUAN Tuo, YANG Min, et al. Analysis and expression of building shape features and adaptive simplification method[J]. Acta geodaetica et cartographica sinica, 2022, 51(2): 269−278.
[28]	JENA M, DEHURI S. An integrated novel framework for coping missing values imputation and classification[J]. IEEE access, 2022, 10: 69373−69387. doi: 10.1109/ACCESS.2022.3187412
[29]	CHUNG J, GULCEHRE C, CHO K, et al. Empirical evaluation of gated recurrent neural networks on sequence modeling[EB/OL]. (2014−12−11)[2025−03−07]. https://arxiv.org/abs/1412.3555.
[30]	WANG Huiqiang, PENG Jian, HUANG Feihu, et al. MICN: multi-scale local and global context modeling for long-term series forecasting[C]//International Conference on Learning Representations. Kigali: ILCR, 2023.
[31]	MILLER C, KATHIRGAMANATHAN A, PICCHETTI B, et al. The building data genome project 2, energy meter data from the ASHRAE great energy predictor III competition[J]. Scientific data, 2020, 7: 368. doi: 10.1038/s41597-020-00712-x

点击查看大图

图(3) / 表(5)

摘要

基于时序相关性的建筑能耗预测方法

doi: 10.11992/tis.202503013

通讯作者: 王鹏跃. E-mail：wangpengyue@bucea.edu.cn.

出版历程

Building energy consumption prediction method based on temporal correlation

1. 本文方法

1.1 问题描述

1.2 基于时序相关性的建筑能耗预测方法

1.2.1 局部特征学习

1.2.2 全局特征学习

1.2.3 损失函数设计

1.3 模型训练

2. 实验设置

2.1 数据集来源

2.2 数据预处理

2.3 评价指标

3. 实验结果及分析

3.1 对比实验

3.2 消融实验

4. 结束语

出版历程

目录

通讯作者:
王鹏跃. E-mail：wangpengyue@bucea.edu.cn.