一种考虑节假日影响的时空网络流量预测方法

武欣茹1,李爱萍1,段利国1,2

(1.太原理工大学 计算机科学与技术学院(大数据学院),山西 太原 030024;2.山西电子科技学院,山西 临汾 041000)

摘 要:现有深度学习方法在网络流量预测时没有充分考虑节假日的影响,针对此,在分析历史数据对预测性能影响的基础上,提出了一种考虑节假日影响的时空网络流量预测方法。首先,提出一种考虑节假日这一外部因素的生成历史数据的方法,使得历史数据中的节假日这一语义特征对网络流量预测产生作用;其次,通过时空学习块来学习网络流量的时间相关性、复杂空间相关性以及时空异构性,获得历史数据包含的时空综合特征;最后,通过跳跃连接融合多个块的结果,输出最后的预测结果。在意大利米兰数据集和中国台湾数据集上的实验结果表明:与最近的同类模型AHSTGNN相比,所提模型在意大利米兰数据集和中国台湾数据集上的MAE分别降低了0.9和24.35,RMSE分别降低了1.81和58.25,说明了该方案的有效性。

关键词:网络流量预测; 时空数据; 节假日特征; 神经网络; 深度学习

随着网络技术和智能终端的快速发展,网络应用和用户行为的复杂性显著增加,这给网络管理和资源分配带来了严峻挑战[1]。面对日益复杂的网络环境,服务提供商亟须有效的解决方案来确保服务质量并控制运营成本[2]。网络流量预测成为解决这个挑战的关键策略之一。网络流量数据不仅在时间上表现出高度非线性和周期性的动态变化,而且由于用户移动性和城市交通系统的便捷性等原因存在空间相关性[3]。因此,建立高精度的时空网络流量预测模型对于服务提供商具有重大意义。

时空网络流量预测面临着诸多挑战,其中,如何对时空网络流量数据集进行预处理,来生成与要预测的网络流量相关性较强的历史输入数据,是现有工作中考虑较少的。本文针对如何生成相关历史数据的问题进行分析,发现现有方法通过叠加近期、上周及前日数据构建输入特征时,未有效区分节假日带来的模式偏移。当预测目标时段与历史参考时段存在工作日/非工作日差异时,传统方法引入的周期性数据反而会产生干扰噪声。因此,开发融合节假日特征的数据生成机制,实现历史数据与预测时段的模式匹配,成为提升模型精度的关键突破口。

本文主要贡献如下:①提出了PHSTNN(pre_holiday spatial temporal neural network)模型,设计了一种考虑节假日的历史输入数据生成方法Pre_Holiday,排除节假日这一特征的干扰,并从Pre_Holiday方法生成的历史数据中学习网络流量的时空特征,从而获得要预测的网络流量值;②在真实网络流量数据集上的实验表明,本文模型PHSTNN 优于当前比较先进的同类方法,验证了本文方法的有效性。

1 相关工作

目前,采用深度学习方法来进行时空网络流量预测时,常用的神经网络包括循环神经网络 (recurrent neural network,RNN)、卷积神经网络 (convolutional neural network,CNN)、图神经网络(graph neural network,GNN)以及它们的变体。在提取时间特征方面,RNN虽能捕捉序列时序特征但难以并行化。为了解决序列并行化的问题,一维CNN也被用于时间建模以实现并行化[4]。在提取空间特征方面,CNN仅适用于具有规则结构的数据,无法准确捕获空间依赖性[5]。近几年,GNN被广泛用于预测非欧几里得空间流量,并将其与不同的时间模型相结合以实现时空流量预测[6]

然而,现有工作都着重研究结合不同的深度学习方法来更好地获得网络流量的特征,而对如何生成与预测数据更相关的历史数据的研究却很少。在目前所有工作中,只提出了2种历史数据的生成方法。2019年,Wu等[7]提出了Graph WaveNet,通过滑动窗口方法生成要预测的网络流量及其紧邻的前一段窗口的网络流量,但是其只考虑到未来的网络流量受最近的网络流量趋势的影响。2023年,Wang等[8]提出了一种自适应混合时空图神经网络(adaptive hybrid spatial-temporal graph neural network,AHSTGNN),该方法加入了与预测数据对应的周期性数据,预测结果更好,但是该方法未考虑节假日因素的影响,加入的这些周期性数据并不是全部都与预测数据相关的,导致加入的部分数据成了干扰因素,影响了预测性能。

2 问题定义

为建模和预测所有区域的网络流量,本文将一个城市的地理区域划分为X×Y个不重叠的网格区域,将一个区域视为一个节点,并使用图结构来表示网络中的节点及节点之间的空间相关性。具体来说,定义一个静态无向图G =(V,E,A)[9],V表示节点集合,N为节点数,N=X×Y;E表示节点之间连接性的边的集合;ARN×N为节点之间的距离邻接矩阵,使用高斯核来构造,如式(1)所示。

(1)

式中:σ为标准差;dvi,vj为节点vivj之间的距离。

在上述定义基础上,将表示图网络GN个节点在时间步t的网络流量观测值定义为图信号矩阵,如式(2)所示。

(2)

式中:F为网络流量的特征维度,本文只有网络流量的测量值,无其他特征值,则F=1。

综上,本文研究的时空网络流量预测问题可以定义为学习一个映射函数f,将历史时间步T的图信号矩阵映射到未来M个时间步的图信号矩阵[10],如式(3)所示。

(3)

式中:θ为模型的可学习参数。

3 问题分析

3.1 节假日特征

本文提到的节假日包括周六、周日以及其他法定假日。图1是取自意大利米兰数据集中某一区域在2013年11月的数据。可以看出,第1天是法定节假日,第2天和第3天是周末,这3天的网络流量明显低于接下来的5个工作日。这表明节假日和非节假日的网络流量差异显著,是否为节假日对日常流量有重要影响。

图1 某区域一个月的网络流量

Figure 1 Network traffic in a certain area for one month

在生成历史数据时,目前的工作中只是单纯地加入周期性数据,而没有考虑节假日这一特征,使得加入的历史数据中存在与预测数据不相关的情况。例如图1中的第8天为工作日周五,但其前一周的同一时间(即图1中的第1天)为节假日周五;又如图1中的第4天为工作日周一,但其前一天的同一时间(即图1中的第3天)为节假日周日。因此,当历史数据与要预测数据的节假日特征不同时,它们的网络流量值差距很大,使得加入的周数据和日数据中的部分数据成为降低预测精度的原因。基于上述的节假日特征对生成历史数据影响的分析,认为在生成历史数据时不能只单纯地加入周期性数据,而需要考虑节假日这一特征。

3.2 时空相关性

3.2.1 时间相关性

网络流量的时间相关性表现为强烈的每日和每周周期性[11]。这些特性与人们的日常生活规律等息息相关。具体来说,一方面,网络流量具有明显的7 d周期性,如图1所示,除了第1 d为特殊的法定节假日,其他情况下网络流量表现为以一周为单位的规律性变化;另一方面,网络流量呈现出24 h周期性变化的特征。图2是取意大利米兰数据集中某一区域的某一天数据。由图2可以看出,网络流量在7∶00左右开始增加,随着人们开始正常的日常工作和学习,网络流量保持在较高水平,在18∶00左右逐渐下降。

图2 某区域某一天的网络流量

Figure 2 Network traffic in a certain area on a certain day

3.2.2 空间相关性

为了分析不同区域的空间相关性,提取意大利米兰数据集中的11×11个区域,并分别计算中间区域与其他所有区域的相关性。采用皮尔逊相关系数测量方法[12],如式(4)所示。

(4)

式中:P1为中间区域的网络流量值;P2为其他区域的网络流量值;COV为协方差;σ为标准差。

计算结果绘制成的热力图如图3所示。

图3 每个区域与中心区域的皮尔逊相关系数热力图

Figure 3 Heat map of the Pearson correlation coefficient between each area and the central area

在图3中,方框标注的为中心区域,用两个圈标注出来的区域为与中心区域距离相同的两个区域,但是其相关系数差距却较大。分析可知,相关性的高低不仅取决于地理距离的远近,还取决于区域的功能属性等。例如某区域为办公区,与其距离较近的某个区域为商场,它们的相关性就较低,而与其距离较远的某区域为办公区,它们的相关性则较高。因此,需要考虑的是全局空间相关性。

另外,区域间的空间相关性存在相对静态和动态的区分。具体来说,每个工作日人们往返于商业区与住宅区,这种空间相关性是相对稳定的;而在周末,人们可能自发地去周围的商场等娱乐场所,这种空间相关性是不确定的、相对动态的。

3.2.3 时空异构性

时空异构性是指网络流量在空间和时间维度上表现出的复杂多样性和不一致性[13]。这种异构性主要体现在空间异构性和时间异构的空间相关性。空间异构性表现为即使在同一时间点,不同区域的网络流量需求也可能表现出截然不同的模式。例如受到地理环境、人口密度以及基础设施建设等因素的影响,使得中心区域比边缘区域的网络流量密集且网络流量值相对较高。时间异构的空间相关性体现为区域之间的网络流量需求虽然在空间上相互关联,但这种相关性并非固定不变,而是随着时间的变化而变化。例如在工作日的高峰时段,住宅区的网络流量可能以出行为主,而商业区的网络流量则以进入为主,两者之间存在明显的互补关系。然而,在非高峰时段(如晚上或周末),住宅区和商业区的网络流量需求可能会变得随机且独立。

法定节假日会打破常规的工作日与周末的流量模式,对日常网络流量产生重要影响。此外,网络流量的时间相关性、空间相关性以及时空异构性反映了不同时间和空间下网络流量模式的多样性。因此,在进行网络流量预测时,需要充分考虑到这些特性,以捕捉更精确的网络流量变化规律。

4 PHSTNN

针对上述数据的特点分析,提出了一种时空网络流量预测模型PHSTNN,其结构如图4所示。首先,该模型在考虑节假日影响的基础上将原始数据集通过Pre_Holiday方法来生成要输入的历史周期数据XDXR,XD表示日周期数据,XR表示最近数据;其次,将历史数据输入多个带有跳跃连接的时空学习块(spatial-temporal learning block,STL Block)中进行学习,每个块包含3个主要模块:门控时间卷积模块(gated temporal convolution module,GTCM)、图学习模块(graph learning module,GLM)和时空异构模块(spatial-temporal heterogeneous module,STHM),其中,GLM又包括静态图学习(static graph learning,SGL)、动态图学习(dynamic graph learning,DGL)和空间门融合;最后,经过多个 STL Block的逐层处理后,模型通过输出层生成对未来时间步的网络流量预测结果。

图4 PHSTNN模型

Figure 4 PHSTNN model

4.1 考虑节假日的生成数据方法Pre_Holiday

现有数据中,历史数据包含最近、日、周这3种数据,受节假日特征的影响,部分数据的前一周/天的数据与目标数据不相关。因此,本文提出了Pre_Holiday方法来生成相关历史数据,其流程如图5所示。

图5 Pre_Holiday流程图

Figure 5 Pre_Holiday flow chart

Pre_Holiday方法具体步骤如下。

步骤1 为每个数据添加节假日特征(0/1,0表示工作日,1表示非工作日)以及周几特征(0~6,分别表示周一到周日)。由于增加了两个特征,使得特征维度F由原来的1暂时变为3(在预处理后又去掉了这两个特征)。

步骤2 使用滑动窗口方法提取目标数据Y以及对应的最近数据XR和前7 d数据XD。如图6所示,要预测11月8日8点到9点的网络流量值Y,则XRY的前1 h的数据,即11月8日7点到8点的网络流量值,前7 d数据XDY的前一周中相同时间段的一小时的数据,即11月1日至7日这7天中每天的8点到9点的网络流量值,如式(5)~(8)所示。

Y=[Xt,Xt+1,…,Xt+M-1]∈RM×N×F;

(5)

XR=[Xt-1,Xt-2,…,Xt-T]∈RT×N×F;

(6)

(7)

(8)

图6 生成数据YXDXR

Figure 6 Generate data Y,XD and XR

式中:Ld∈{1,2,…,LD}为选择7天中的第几天;为第Ld天的网络流量值;t表示当前的时间点;q表示每天的采样频率;M为要预测的时间步长;T为历史时间步长;LD=7表示选择的过去天数。

XD的7 d数据中挑选出与目标数据节假日特征相同的历史数据。由于获得的数据数量n不同(例如,在周一到周五都为工作日、周六周日都为非工作日的情况下,n为5或2)。为了充分利用数据并保持n相同,取一般情况中数量的最大值5(由于存在春节假期的特殊情况,n可能取值到7,但是情况很少),因此当n>5时,取前5个天数据;当n<5时,需要补充5-n个数据。

步骤3 5-n个数据的补充方法为利用训练数据的周几特征,统计所有目标数据与其前一周的7 d数据的相关性排名,按排名由高到低寻找5-n个与目标数据节假日特征相同的数据。此时,得到目标数据Y、最近数据XR和只包含5 d数据的XD

步骤4 去掉步骤1加入的两个特征,则F=1,得到YRM×N×F,XRRT×N×F,XDR5T×N×F

Pre_Holiday方法在增加历史数据时考虑节假日这一特征,依据本文增加的节假日特征来与目标数据进行对比筛选,只留下与目标数据的节假日特征相同的历史输入数据,使得添加的历史数据与目标数据更相关,进而提升预测精度。

4.2 时空学习块(STL Block)

在图4中,将第i个STL Block的输入表示为Hi-1,包括最近特征和每日特征,它们是第i-1块中GTCM的输出。第i块GTCM和GLM的输出分别为在STHM之后,获得第i个块的输出,表示为Hi

4.2.1 门控时间卷积模块(GTCM)

门控时间卷积模块通过接收周期性的历史数据,来提取网络流量在时间上的复杂周期特征。GTCM由两个门控时间卷积网络(gated temporal convolutional network,Gated TCN)[14]组成,分别命名为Gated TCN-R和Gated TCN-D。其中,TCN[15]是一种基于CNN的模型,它与传统CNN不同之处在于使用因果卷积,避免了未来信息的“泄露”,非常适用于时间序列,同时利用了膨胀卷积的特性。Gated TCN是一种基于TCN模型的改进版本,结合了CNN的高效并行性和RNN门控机制的强大建模能力,特别适合处理时间序列数据。

第1个GTCM的输入为Pre_Holiday方法生成的XRXD,其余的则为前一块GTCM的输出,分别表示最近特征和日特征。Gated TCN-D与Gated TCN-R计算方式相同,以Gated TCN-R为例,第i块Gated TCN-R的输出

(9)

式中:*为卷积算子;Wt1Wt2bt1bt2均为可学习参数;⊙为逐元素乘积;tanh为双曲正切函数。

将得到的两个时间特征输入多层感知器(multilayer perceptron,MLP),将这两个输入特征经过非线性变换映射为一个输出特征,使得输出符合下一模块的输入大小。第i个GTCM的最终输出其中D为隐藏状态特征维度。

4.2.2 图学习模块(GLM)

GLM包括静态图学习SGL、动态图学习DGL和空间门融合。SGL和DGL分别捕获稳定和偶然的空间相关性,经由空间门融合得到最终空间特征。在第i块中,将SGL和DGL的输出表示为空间门融合后,第i个 GLM 的输出为

(1)SGL是为了获得节点间相对静态的全局空间相关性。用GCN来获得节点间相对静态的空间相关性,GCN[16]是一种专门用于处理图结构数据的神经网络模型,它通过在图的节点和边上进行多层卷积操作来有效地捕捉图中节点与其多阶邻居之间的关系和依赖性。但是由于其使用的邻接矩阵只考虑节点地理距离,无法获得节点间的全局空间相关性,因此,将其中的地理邻接矩阵替换为自适应邻接矩阵[17],其计算公式如式(10)所示。

(10)

式中:RELU为线性整流函数;EGRN×d为图节点嵌入,d为节点嵌入维度;EG为源节点嵌入,为目标节点嵌入,通过将两者相乘,可以得出源节点和目标节点之间的空间依赖权重;softmax为归一化指数函数,用于标准化自适应邻接矩阵。

因此,第i块SGL的输出计算公式为

(11)

式中:INRN×N为单位矩阵;Θ为可学习的图卷积核。

(2)DGL是为了捕获偶尔存在的动态空间关系。通过图注意力网络(graph attention network,GAT)[18]来执行动态空间特征聚合,因为 GAT 能够根据节点之间的关系动态地为每个邻居节点分配不同的权重,进而捕获节点邻居的动态影响。以图节点vi为例,来说明DGL的实现过程。首先,获取中节点vit时刻的特征ht,vi,计算节点vi与其邻居节点vj之间的注意力分数evivj,计算公式如式(12)所示。

(12)

式中:LeakyReLU为带泄露线性整流函数;a为可学习的向量;为拼接操作。

然后,为了确保注意力权重的总和为1,GAT 使用softmax函数对每个节点的邻居节点的注意力分数进行归一化,计算公式如式(13)所示。

(13)

式中:Nvi为节点vi的邻居集合。

最后,为了增强模型的表达能力,GAT通常使用多头注意力机制,即在每个图卷积层中并行执行多个独立的注意力机制,然后将它们的结果相加。DGL的最终输出计算公式为

(14)

式中:K为多头注意力机制的头数;Wk为头k对应的可学习权重矩阵。

每个节点为同样的计算方式,因此,在第i个块中,DGL的最终输出为

(3)空间门融合模块将SGL的输出和DGL的输出进行融合,来自适应地调整每个节点的静态和动态空间依赖性。门控融合机制计算公式为

(15)

(16)

式中:Wg1Wg2bg为可学习参数。

因此,GLM的最终输出为

4.2.3 时空异构模块(STHM)

STHM 的作用是自适应地建模节点时空趋势,以解决时空异质性问题。它结合了时间和空间维度的信息,能够动态调整对不同区域和不同时段的建模方式。通过引入自适应机制,STHM 可以灵活应对不同区域的网络流量模式差异,确保模型在处理复杂时空数据时具有更高的鲁棒性和泛化能力。STHM的实现步骤如下。

步骤1 使用与GLM模块相同的图节点嵌入EG,对其进行线性变换,获得图节点查询Q,计算公式如式(17)所示。

Q=EGWq

(17)

式中:Wq为可学习参数。

步骤2 将 GTCM的输出进行变换,以获得节点在时间维度上的键。类似地,GLM 的输出也进行变换,得到节点在空间维度上的键。计算公式为

(18)

(19)

式中:WKtWKs为可学习参数。

步骤3 利用Q和相应的键分别计算出图节点的时间和空间注意力权重,并进行归一化,以确保时间和空间的注意力权重的总和为 1,计算公式为

(20)

(21)

式中:为归一化前的时间注意力权重;为归一化前的空间注意力权重。

步骤4 得到STHM的输出,计算公式为

(22)

式中:HiRT×N×D为STHM的输出,即第i个STL Block的输出。

4.3 输出层

为了增强模型的学习能力,在每个STL Block之间引入了跳跃连接。跳跃连接允许低层特征直接传递到高层,可以保留更多的细节信息,提高模型的表达能力。在跳跃连接之后,使用求和来融合所有 STL Block的输出,结果表示为HfRT×N×D。最后,用两个MLP实现输出层,以生成最终的多步预测计算公式为

(23)

式中:Wf1bf1Wf2bf2为可学习参数。

5 实验部分

5.1 数据集

本文使用意大利米兰数据集[19]和中国台湾数据集[20]进行实验。通过输入每个节点的历史T时间步的网络流量值,得到预测的未来M个时间步的网络流量值。由于本文输入的天数据、最近数据以及要预测的目标数据都是一小时的数据,而两个数据集的记录间隔分别为10 min和5 min,因此本文将两个数据集的TM分别设置为6和12。

考虑到设备内存等的限制,本文取意大利米兰数据集中900个区域在2013年11月1日至2013年11月30日的数据来进行实验[21]。由于数据集节点较多,使得样本的数量较少(样本数为4 320),因此只对该数据集进行训练集和测试集的划分,比例为2∶1。

中国台湾数据集记录了中国台湾某区域6个节点在2020年1月1日至2020年6月30日的网络流量值。由于该数据集节点数较少,因此本文采用该数据集的全部数据。由于样本数较多(样本数为52 415),本文将该数据集划分为训练集、验证集和测试集,比例为8∶1∶1。

5.2 实验设置

本文实验使用的主要硬件为一块GeForce RTX 4080 GPU显卡,显存为16 GB,算法用Python语言实现,在Python 3.9,Pytorch 1.8环境下运行。模型由Adam优化器训练,模型的部分参数如表1所示。

表1 模型参数

Table 1 Model parameters

参数含义取值意大利米兰数据集中国台湾数据集BlocksSTLBlock的块数24D隐层特征维度3232kernel_size卷积核大小22d节点嵌入维度106K多头注意力机制的头数44skip_channels跳跃连接特征维度256256end_channels输出特征维度512512batch_size批次大小32512epochs迭代次数400200

本文采用平均绝对误差MAE和均方根误差RMSE这两种常用的回归任务中的评价指标来衡量模型预测值与真实值之间的差异[22]。当预测值与真实值完全吻合时等于0(即完美模型),误差越小,MAERMSE的值越小[23]

(24)

(25)

式中:y为真实值;为预测值;n为样本总数。

5.3 对比实验

本文的对比模型为Graph WaveNet[7]和AHSTGNN[8]。Graph WaveNet的生成数据只有最近数据,通过Gated TCN和使用自适应邻接矩阵的GCN方法来提取时空特征;AHSTGNN在Graph WaveNet的基础上加入了周数据和天数据,同时用GAT捕获动态的空间相关性和时空异构性。

表2为意大利米兰数据集和中国台湾数据集使用Graph WaveNet、AHSTGNN和PHSTNN时的MAERMSE的预测结果。

表2 对比实验结果

Table 2 Comparative experimental results

模型意大利米兰数据集中国台湾数据集MAERMSEMAERMSEGraphWaveNet29.2958.16151.45314.01AHSTGNN28.6257.24142.43290.72PHSTNN27.7255.43118.08232.47

由表2可知,Graph WaveNet的结果最差,AHSTGNN次之,PHSTNN在两个评价指标上都取得了最好的结果。Graph WaveNet只使用自适应邻接矩阵来获得相对静态的空间相关性,没有考虑动态的空间相关性和时空异构性,另外,输入的历史数据只有最近的历史数据。而AHSTGNN在Graph WaveNet的基础上进一步加入了捕获动态的空间相关性和时空异构性的方法,还在输入历史数据时加入了周数据和日数据,因而实验结果比Graph WaveNet更好一些,但是其新加入的历史数据中存在部分不相干的数据,生成历史数据的方法考虑不够全面。本文的模型PHSTNN则在生成历史输入数据时考虑节假日的影响,排除节假日这一因素的干扰,使得输入的历史数据与要预测的目标数据更相关,因而取得了更好的实验结果。

5.4 消融实验

为验证本文模型PHSTNN中各个模块是否对总体模型有贡献,从而进行了消融实验,结果如表3所示。

表3 消融实验结果

Table 3 Ablation experiment results

模型意大利米兰数据集中国台湾数据集MAERMSEMAERMSEPHSTNN27.7255.43118.08232.47w/oPre_Holiday28.6257.24142.43290.72w/oSGL28.1556.41128.14243.29w/oDGL28.5157.05126.68239.37w/oSTHM29.3358.49133.64255.56

注:w/o代表“without”,表示在PHSTNN的基础上去掉某个模块。

由表3可知,PHSTNN中各个模块对总体模型都有一定的贡献。具体来说,本文提出的生成历史数据的Pre_Holiday方法由于考虑了节假日这一外部因素的影响,生成了充分的相关历史数据,使得预测结果进一步提升;SGL获得节点间相对稳定的空间依赖性,而DGL则获得的是节点间动态的空间依赖性,两者都在一定程度上更充分地捕捉到了网络流量的复杂空间相关性;STHM通过时间和空间注意力来解决网络流量的时空异构性问题,获得了更复杂的网络流量时空特征,对提升模型的预测能力做出了比较大的贡献。

5.5 参数敏感性实验

为了验证模型的稳健性,对本文涉及的一些重要参数进行参数敏感性实验。在本文的参数中,要预测的未来时间步长M由于关系到预测长度,可以验证模型对短期和长期网络流量预测的性能;时空学习的块数Blocks关系到模型提取特征的深度,累加更多块可以学习到更长期的时间特征和更全面的空间特征;多头注意力机制的头数K越多,可以学习到相对更复杂的特征。本文针对这3个重要参数进行实验,在两个数据集上的结果分别如表4所示。由表4可知,模型在短期和长期网络流量预测的性能变化相对较小,证明本文的模型PHSTNN具有一定的稳健性。

表4 参数敏感性实验结果

Table 4 Parameter sensitivity experiment results

参数意大利米兰数据集MAERMSE参数中国台湾数据集MAERMSEM=124.7750.04M=2103.09218.93M=225.6251.48M=4107.24222.41M=326.2052.43M=6110.08224.52M=426.7853.33M=8112.97227.70M=527.2654.12M=10115.76230.73M=627.7255.43M=12118.08232.47Blocks=129.1357.71Blocks=2137.85274.30Blocks=227.7255.43Blocks=3126.37248.04Blocks=327.3654.78Blocks=4118.08232.47K=228.1256.23K=2119.28234.11K=427.7255.43K=4118.08232.47K=827.9355.86K=8118.89233.85

6 结论

时空网络流量预测面临的主要挑战就是网络流量具有的复杂时空特征,为了更好地解决这一问题,本文提出一种考虑节假日影响的时空网络流量预测方法PHSTNN。首先,提出一种生成历史数据的Pre_Holiday方法,通过排除节假日这一外部因素的干扰,获得与要预测的目标数据更相关的历史输入数据;其次,通过STL Block来学习网络流量的复杂的时空特征。具体来说,用Gated TCN来捕获网络流量时间特征;联合GCN和GAT对节点间相对静态和动态的复杂空间相关性进行建模;用时间和空间注意力来学习网络流量的时空异构性;最后,将多个STL Block的输出经过跳跃连接进行相加,通过输出层来获得最后的预测结果。在意大利米兰数据集和中国台湾数据集上进行的与其他同类方法的对比实验结果表明,本文模型PHSTNN的预测性能优于对比方法,验证了该方案的有效性。

参考文献:

[1] 陈浩杰,黄锦,左兴权,等.基于宽度&深度学习的基站网络流量预测方法[J].郑州大学学报(工学版),2022,43(1): 7-13.CHEN H J,HUANG J,ZUO X Q,et al.Base station network traffic prediction method based on wide &deep learning[J].Journal of Zhengzhou University (Engineering Science),2022,43(1): 7-13.

[2] WANG D,LIU Y J,SONG B.A credible traffic prediction method based on self-supervised causal discovery[J].Science China Information Sciences,2024,67(5): 152303.

[3] QIN X,ZHU W W,HU Q,et al.DenseNet-Transformer: a deep learning method for spatial-temporal traffic prediction in optical fronthaul network[J].Computer Networks,2024,253: 110674.

[4] YU B,YIN H T,ZHU Z X.Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]∥Proceedings of the 27th International Joint Conference on Artificial Intelligence.New York: ACM,2018: 3634-3640.

[5] ZHANG C Y,PATRAS P.Long-term mobile traffic forecasting using deep spatio-temporal neural networks[C]∥Proceedings of the Eighteenth ACM International Symposium on Mobile Ad Hoc Networking and Computing.New York:ACM,2018: 231-240.

[6] LAN S Y,MA Y T,HUANG W K,et al.DSTAGNN: dynamic spatial-temporal aware graph neural network for traffic flow forecasting[C]∥Proceedings of the 39th International Conference on Machine Learning.Baltimore:PMLR,2022: 11906-11917.

[7] WU Z H,PAN S R,LONG G D,et al.Graph WaveNet for deep spatial-temporal graph modeling[C]∥Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence.Macao: International Joint Conferences on Artificial Intelligence Organization,2019: 1907-1913.

[8] WANG X,YANG K X,WANG Z D,et al.Adaptive hybrid spatial-temporal graph neural network for cellular traffic prediction[C]∥ICC 2023-IEEE International Conference on Communications.Piscataway:IEEE,2023: 4026-4032.

[9] GUO K,HU Y L,QIAN Z,et al.Dynamic graph convolution network for traffic forecasting based on latent network of Laplace matrix estimation[J].IEEE Transactions on Intelligent Transportation Systems,2022,23(2): 1009-1018.

[10] JIN Z L,QIAN J,KONG Z X,et al.A mobility aware network traffic prediction model based on dynamic graph attention spatio-temporal network[J].Computer Networks,2023,235: 109981.

[11] HE K,VU T X,CHATZINOTAS S,et al.Spatio-temporal traffic prediction using crossover attention for communications and networking[C]∥2024 IEEE Globecom Workshops (GC Wkshps).Piscataway:IEEE,2024: 1-6.

[12] RAO Z H,XU Y Y,PAN S M,et al.Cellular traffic prediction: a deep learning method considering dynamic nonlocal spatial correlation,self-attention,and correlation of spatiotemporal feature fusion[J].IEEE Transactions on Network and Service Management,2023,20(1): 426-440.

[13] SONG C,LIN Y F,GUO S N,et al.Spatial-temporal synchronous graph convolutional networks: a new framework for spatial-temporal network data forecasting[C]∥Proceedings of the AAAI Conference on Artificial Intelligence.New York: AAAI Press,2020: 914-921.

[14] GUO K,HU Y L,SUN Y F,et al.Hierarchical graph convolution network for traffic forecasting[C]∥Proceedings of the AAAI Conference on Artificial Intelligence.New York: AAAI Press,2021: 151-159.

[15] 张翔.基于ST-LSTM神经网络的网络流量预测方法研究[D].北京: 北京工业大学,2021.ZHANG X.Research on network traffic prediction method based on ST-LSTM neural network[D].Beijing: Beijing University of Technology,2021.

[16] 徐冰冰,岑科廷,黄俊杰,等.图卷积神经网络综述[J].计算机学报,2020,43(5):755-780.XU B B,CEN K T,HUANG J J,et al.Survey of graph convolutional neural networks[J].Chinese Journal of Computers,2020,43(5): 755-780.

[17] LEI B,YAO L N,LI C,et al.Adaptive graph convolutional recurrent network for traffic forecasting[EB/OL].(2020-10-22)[2025-02-10].https:∥arxiv.org/abs/2007.02842.

[18] VELICKOVIC P,CUCURULL G,CASANOVA A,et al.Graph attention networks[EB/OL].(2018-02-04)[2025-02-11].https:∥arxiv.org/abs/1710.10903.

[19] 康梦轩,宋俊平,范鹏飞,等.基于深度学习的网络流量预测研究综述[J].计算机工程与应用,2021,57(10): 1-9.KANG M X,SONG J P,FAN P F,et al.Survey of network traffic forecast based on deep learning[J].Computer Engineering and Applications,2021,57(10): 1-9.

[20] LIN C Y,SU H T,TUNG S L,et al.Multivariate and propagation graph attention network for spatial-temporal prediction with outdoor cellular traffic[C]∥Proceedings of the 30th ACM International Conference on Information &Knowledge Management.New York: ACM,2021: 3248-3252.

[21] HE K W,CHEN X,WU Q,et al.Graph attention spatial-temporal network with collaborative global-local learning for citywide mobile traffic prediction[J].IEEE Transactions on Mobile Computing,2022,21(4): 1244-1256.

[22] 于江燕,王倩,孟宪静,等.基于动态时空Transformer的城市网络流量预测方法[J].计算机工程与应用,2025,61(18):290-299.YU J Y,WANG Q,MENG X J,et al.Urban network traffic forecasting method based on dynamic spatio-temporal Transformer[J].Computer Engineering and Applications,2025,61(18):290-299.

[23] 孙博.基于机器学习的蜂窝网络流量预测及其应用研究[D].北京: 北京邮电大学,2024.SUN B.Research on cellular network traffic prediction and its application based on machine learning[D].Beijing: Beijing University of Posts and Telecommunications,2024.

A Spatial-temporal Network Traffic Prediction Method Considering the Impact of Holidays

WU Xinru1,LI Aiping1,DUAN Liguo1,2

(1.College of Computer Science and Technology (College of Data Science),Taiyuan University of Technology,Taiyuan 030024,China; 2.Shanxi University of Electronic Science and Technology,Linfen 041000,China)

AbstractExisting deep learning methods could not fully consider the impact of holidays when predicting network traffic.To address this issue,based on an analysis of the influence of historical data on prediction performance,a spatio-temporal network traffic prediction method that was proposed to account for the impact of holidays.Firstly,a method for generating historical data that incorporates holidays as an external factor was introduced,enabling the semantic feature of holidays within the historical data to play a role in network traffic prediction.Secondly,spatiotemporal learning blocks were employed to capture the temporal correlations,complex spatial correlations,and spatiotemporal heterogeneity of network traffic,thereby obtaining the comprehensive spatio-temporal features embedded in the historical data.Finally,the results from multiple blocks were fused through skip connections to output the final prediction results.Experimental results on the Milan (Italy) and Taiwan (China) datasets demonstrated that,compared with the recent similar model AHSTGNN,the proposed model reduced the MAE by 0.9 and 24.35 on the two datasets,respectively,and decreased the RMSE by 1.81 and 58.25,respectively.This illustrated the effectiveness of the proposed approach.

Keywordsnetwork traffic prediction; spatio-temporal data; holiday characteristics; neural network; deep learning

中图分类号: TN929.53;TP183

文献标志码:A

doi:10.13705/j.issn.1671-6833.2025.06.007

收稿日期:2025-11-11;修订日期:2025-12-20

基金项目:山西省自然科学基金资助项目(202303021211052;202203021221234)

作者简介:武欣茹(1999—),女,山西运城人,太原理工大学硕士研究生,主要从事网络流量预测研究,E-mail:13753952918@163.com。

通信作者:段利国(1970—),男,山西繁峙人,太原理工大学教授,博士,主要从事中文信息处理、知识图谱研究,E-mail:851074365@qq.com。

引用本文:武欣茹,李爱萍,段利国.一种考虑节假日影响的时空网络流量预测方法[J].郑州大学学报(工学版),2026,47(3):117-125.(WU X R,LI A P,DUAN L G.A spatial-temporal network traffic prediction method considering the impact of holidays[J].Journal of Zhengzhou University (Engineering Science),2026,47(3):117-125.)

文章编号:1671-6833(2026)03-0117-09