基于BLR并行结构的多模态调制识别方法

自动调制识别(automatic modulation recognition,AMR)是通信侦察和电子对抗中的关键技术,旨在未知信号样式和缺乏先验信息的条件下,自动识别目标信号的调制方式。传统AMR方法主要分为两类:基于假设检验的最大似然方法[1]和基于特征提取的模式识别方法[2]。前者依赖大量先验信息,计算复杂度高,难以适应复杂电磁环境;后者虽理论成熟,但在低信噪比(signal-to-noise ratio,SNR)条件下识别精度有限。尽管这些方法在某些场景下表现良好,但其对先验知识和人工特征的依赖限制了其在实际应用中的鲁棒性和泛化能力。

近年来,深度学习[3](deep learning,DL)在图像分类[4-5]、自然语言处理[6]等领域的成功为AMR提供了新的解决方案。基于深度学习的AMR能够自动提取信号特征,显著降低对先验信息的依赖,同时在复杂电磁环境中展现出优越的识别性能。2016年O’Shea等[7]率先提出基于CNN(convolutional neural network)的模型,利用RML2016.10a数据集中信号的I/Q特性进行调制识别,打破了传统调制识别方法的固有技术路线。随后,Wu等[8]利用长短时记忆网络(long short-term memory network,LSTM)提取信号的时间序列特性,在CNN的基础上引入了LSTM,并取得了更好的性能。为了在复杂的调制方式下进一步提高精度,Wang等[9]设计了一种基于星座图的模型,在低信噪比下也能实现较好的识别效果。王晓明等[10]采用ResNet在公开数据集上取得约95%的分类效果。章昕亮等[11]引入双向长短期记忆网络(BiLSTM)更好地提取样本的时序特征,从而提高了多径衰落信道下信号的识别率。查雄等[12]利用多端卷积神经网络将电磁信号转换成眼图和矢量图进行学习,在低信噪比条件下,取得了较好的识别性能。任彦洁等[13]提出了一种基于时间卷积网络的调制识别方法,解决了端到端调制识别方法下识别率较低和神经网络参数量大的问题。West等[14]提出CLDNN混合架构,通过CNN、LSTM和DNN的级联设计实现了时空特征的联合提取。翁建新等[15]提出了一种CNN-LSTM并联的调制样式识别算法,该算法将I路和Q路数据作为模型输入,通过上下两条支路分别提取信号的空间特征和时间特征,从而提高模型的特征表达能力。

尽管上述研究在提高识别精度方面取得了成果,但大多数方法仍主要依赖单一的IQ[16]数据,并未充分利用信号中的多模态信息。随着多模态数据融合的发展,研究者们逐渐认识到不同模态间的互补性对提升识别性能的重要性。例如,张富强等[17]利用多模态数据融合的方法,解决了动态手势识别过程中的信息缺乏导致的识别准确率难以提高的问题。Qi等[18]提出了基于ResNet的波形-频谱多模态融合方法,相较于传统的基于CNN的单模态方法取得了显著的性能提升,并在256QAM和1024QAM 等高阶数字调制类型下取得了较好的效果。

信号表示大致可以分为3类[19]:基于专家特征表示(如高阶统计量特征、频谱特征)、序列表示(如IQ序列、振幅相位序列)和图像表示(如星座图、时频图、循环谱图)。其中,IQ数据包含信号的相位和幅度信息,而星座图能够直观反映信号的噪声情况和调制方式分布差异。因此,本文选取IQ数据和星座图作为多模态输入,以便充分挖掘不同模态的互补性。

基于以上背景,本文提出了一种基于双向长短时记忆网络和残差网络并联结构的多模态调制识别方法(BiLSTM-ResNet,简称为BLR网络)。该方法将信号的同向分量(I路)、正交分量(Q路)和星座图数据并行输入BiLSTM和ResNet网络,BiLSTM 通过双向结构捕捉IQ数据的时序信息,并利用遗忘门优化梯度消失问题;ResNet通过卷积层提取星座图中的几何特征和分布模式。BiLSTM从时域动态变化中提取时序特征,ResNet从静态的几何分布中获取空间特征,加强了一维和二维数据的不同层次特征的互补性。最后,将两支路输出的特征向量经过串行融合,并送入全连接层,实现了对常见调制信号的自动调制识别。

1 系统模型与问题分析

基于DL的AMR系统架构[18]如图 1所示。发射端的信号xsig(t)经过调制后得到ssig(t),ssig(t)经过信道时受到衰落和噪声干扰的影响,接收端接收到的信号rsig(t)可以表示为

式中:hsig(t)代表信道冲激响应;nsig(t)代表加性噪声;*表示卷积操作。

在预处理阶段,经过参数估计和下变频处理后,可以获得基带信号ysig(t),可以表示为

式中:ysigI(t) 表示基带信号的I路信号;ysigQ(t)表示基带信号的Q路信号;ysig(t)表示基带信号的复数形式。

I、Q两路既可以转换为复数表达形式,也可以捕获和表征信号的幅度和相位信息,可以表示为

式中:Asig(t)表示信号瞬时幅度;Psig(t)表示信号瞬时相位。

2 多模态下的BLR并联网络结构

本文所提BLR网络模型图如图2所示,主要分为样本预处理、网络框架和决策融合3个部分。

预处理模块主要用于完成数据输入网络前的准备工作。每个样本为2×1 024大小的矩阵,其中2代表I、Q两路;1 024代表每个样本在I路和Q路上的采样点数目。将输入的原始数据直接输入上支路、经过星座映射转换为星座图后输入下支路。

网络框架由双向长短期记忆网络(BiLSTM)和残差网络(ResNet)并联组成。上支路的BiLSTM网络实现了对原始IQ数据在时间序列上的特征提取。BiLSTM网络结构图如图3所示。

BiLSTM是一种带有正反向连接的LSTM网络,研究表明,针对长序列建模任务,循环神经网络在捕捉双向时序依赖方面仍具有独特优势[20]。正向LSTM按时间步从左到右处理输入序列,LSTM 的每一个隐藏层都包括遗忘门、输入门、输出门3个门结构[21]。遗忘门可以控制历史信息的输入,滤掉没用的信息。输入门可以通过对细胞状态进行添加或移除信息,从而有选择性地更新细胞状态。输出门可以决定当前时间下输出的隐藏状态ht。LSTM的具体计算过程为

式中:ft、it、ot分别表示遗忘门、输入门、输出门的输出;σ表示Sigmoid激励函数;Wf表示用于连接上一时刻隐藏状态ht-1和当前输入xt的权重矩阵;[ht-1,xt]表示将上一时刻隐藏状态和当前输入拼成向量;Wi,Wc,Wo分别表示输入门、备选状态、输出门的权重矩阵;ht表示当前时刻的隐藏状态;bf,bi,bo,bc分别表示遗忘门、输入门、输出门、备选状态的偏置向量;tanh为双曲正切激活函数;

表示当前时刻用来备选的更新内容;ct和ct-1分别表示当前时刻的单元状态和上一时刻的单元状态;⊙表示逐元素乘法。

反向LSTM按时间步从右到左处理输入序列,每个时间步的隐藏状态

和单元状态

可以由类似的公式计算,而BiLSTM的输出由2个方向的隐藏状态拼接而成,如式(11)所示。

下支路为多个残差块拼接而成的ResNet-18网络,用于获取信号的空间特征。如图4所示。

ResNet通过在不同层之间添加捷径连接(shortcut)形成残差块(residual block)实现了模型的训练速度的提升,并解决了网络层数加深时出现的网络退化问题[22]。加入批量规范化层(batch normalization,BN)在一定程度上解决了梯度消失和梯度爆炸的问题。ResNet结构如图5所示。

ResNet-18网络由多个残差块堆叠而成,每个残差块后有一个激活函数,从而使得网络学习到恒等映射,并避免了网络过深而造成的梯度消失的问题。残差块的详细结构如图5所示。

当不需要改变前后输入输出维度的层时,ResNet-18的残差块和残差映射可以分别表示为

式中:H(x)表示网络映射关系;F(x)表示残差映射;x表示输入;Conv表示卷积操作;BN表示批量规范化处理;ReLU表示激活函数。

当上一层的输出通道不符合当前层所需的输入通道时,则应对残差块做出如下调整。

式中:Conv1×1表示对输入信号进行1×1卷积操作。

当前的研究中,模态融合主要有3个阶段:数据级融合、特征级融合和决策级融合[23]。本文采用特征级融合和决策级融合来提高信号识别准确率。将原始IQ两路信号以(Nall,1,1 024,2)的维度送入BiLSTM网络,将星座图数据以(Nall,3,256,256)的维度送入ResNet网络(Nall表示样本数量),决策融合就是将BiLSTM和ResNet网络输出的特征矩阵(1×1 024)按特征维度进行拼接,从而形成(1×2 048)的特征矩阵。串行融合策略借鉴了时空特征联合的思想[24],通过不同层次特征的互补增强模型对调制信号的判别能力。最后,经过全连接层通过权重参数学习到特征之间的非线性关系,实现信号多种调制方式的分类。

在串行融合前,由于BiLSTM和ResNet网络的输出结果可能具有不同的尺度和单位,使用了归一化确保不同尺度和单位的特征对模型的影响是均衡的。串行融合后的特征维度的增加,导致模型参数量增大,本文使用正则化方法来防止过拟合。

3 算法仿真及实验分析

3.1 数据集介绍

本文采用了由DeepSig公司于2018年发布的RML2018.01a数据集[25]。该数据集是经过数字化处理的无线通信信号数据集,模拟了真实通信场景下的调制信号,包含多种调制方式(如FM,QAM,BPSK,AM等),并以I/Q数据格式存储,适用于调制方式分类的研究。RML2018.01a数据集相比于RML2016数据集涵盖了更多的调制信号类型和更广泛的信噪比范围,以及实际硬件采集的信号数据。

该数据集中的信号是基于GNU Radio软件生成,考虑到了信号在无线信道中传输的多种干扰因素,生成的信号共有24种不同的调制方式,其中包含了5种模拟调制信号AM-SSB-WC,AM-SSB-SC,AM-DSB-WC,AM-DSB-SC,FM,19种数字调制信号OOK,4ASK,8ASK,BPSK,QPSK,8PSK,16PSK,32PSK,16APSK,32APSK,64APSK,128APSK,16QAM,32QAM,64QAM,128QAM,256QAM,GMSK,OQPSK。该数据集包括2 555 904个调制信号,具有26种不同的信噪比(SNR),范围从-20 dB到30 dB,步长为2 dB,每种调制方式中每信噪比有4 096个信号。数据集每个信号都是由1 024×2的IQ信号组成。

图6是6 dB下24种调制方式的星座图。其中,横轴表示同相分量xI,纵轴表示正交分量yQ。研究表明,当信噪比低于6 dB时,RML2 018.01a的24类调制样式在星座图上难以区分,无法进行准确识别。

因此,本文采用了信噪比从6 dB到30 dB,步进为2 dB,包含24种调制方式的新数据集RML2018.01_New进行实验。为了方便训练和验证模型,按照8∶2的比例将新数据集划分为训练集和测试集。训练批量的大小受限于GPU显存,采用渐进式增加批量的方式,最终每个批次选取256个样本,使用自适应学习率方案,初始学习率设置为0.001。采用Adam优化器,通过动量和梯度平方的均值动态调整学习率,加快模型的收敛速度并达到最优解。采用交叉熵损失函数,星座图尺寸为256×256像素。为了防止模型在训练过程中出现过拟合问题,采用Dropout正则化方法,在每次训练迭代时随机舍弃部分神经元,减少模型对某些特征的过度依赖。同时,训练过程中保存每个Epoch训练的模型。

所有的训练、测试实验都是基于两块Nvidia GeForce RTX3090 GPU实现,借助轻量级的VS Code平台进行实验仿真和调试,BLR算法流程如图7所示。

本文算法步骤如下。

步骤1 加载读取RML2018.01a数据集,通过预处理模块生成新的数据集

new。

步骤2 将

new进行批量归一化处理,并将其划分为训练集

train和测试集

test。

步骤3 将训练集中IQ序列Xi=[I1,Q1,…,I1 024,Q1 024]映射为星座图Mi。

步骤4 构建BiLSTM-ResNet网络模型。

步骤5 按照批次将从训练集中提取的I/Q数据、星座图和标签送入BiLSTM-ResNet网络行训练,计算损失并更新模型参数,当损失值收敛时,网络达到稳态时,保存最优模型参数W*。

步骤6 利用保存的最佳模型对测试数据集进行分类识别,得到信号的预测结果并计算准确率。

3.2 实验结果与分析

将数据集RML2016.10a、RML2018.01a进行预处理后的样本作为输入,通过对CNN网络进行训练,保存最佳的训练参数和模型,然后加载测试训练集,自动对信号的调制方式作出预测,从而得到不同数据集下CNN的平均识别率,如图8所示。

由图8可以看出,对调制样式较少的RML2016.10a数据集CNN识别率较高,但对调制样式更为丰富的RML2018.01a数据集,CNN识别效果出现了显著下降。结合实验结果分析,当训练迭代次数(Epoch)达到50轮时,信号的平均识别正确率最高,随后识别率趋于稳定,表明网络训练到一定程度后,识别性能并不会随着Epoch的增加不断提升,甚至会产生过拟合导致性能下降。

为了探究BiLSTM不同层数对模型的性能影响,本文分别选取单层、双层和三层BiLSTM,对24种信号的平均识别率进行实验。实验结果表明,当上支路采用两层BiLSTM网络时,平均识别率最高,达92.57%,表明网络能够充分提取信号的时序信息。当层数增多或减少时,平均识别率(Accuracy)均出现不同程度的下降。因此,本研究选择采用双层BiLSTM结构进行实验。

为验证不同深度学习模型在提升RML2018.01a数据集中调制样式识别准确率的有效性,进行了基于CNN、ResNet、BiLSTM和CNN-LSTM方法的训练。实验选取24种调制方式,每种调制方式下选取13种信噪比(从6 dB到30 dB,步长为2 dB),每种信噪比下包含4 096个样本。表1展示了不同算法的时间复杂度和平均识别率。

由表1可以看出,BiLSTM和ResNet在识别准确率上相较于传统的CNN提升了31.98%～33.28%,说明了ResNet,BiLSTM在RML2018.01a数据集有更高效的识别效果。结合实验过程,对上述网络结构的时间复杂度进行分析,如表1第2列所示。其中N=2×1 024表示输入数据有2个特征维度和1 024个时间步长;Kh,Kw分别表示对应网络模型的卷积核的高度和宽度;Kh×Kw为计算卷积操作时间复杂度的重要组成;D表示输出通道数;L表示卷积层的总数;H=256表示隐藏层维度。

为了验证本文所提网络的有效性,将表1中的BiLSTM和ResNet进行并联,形成BLR网络。对BLR网络的多模态特征融合实验结果如图9所示。数据与上述实验规格相同,一种调制方式下的单一信噪比随机挑选400个样本。

图9给出BiLSTM-ResNet方法在训练过程中的损失与准确率曲线。其中Accuracy达到了96.48%。由表1和图9可以看出,BLR算法在多模态环境下的平均识别率在测试集上比单一网络模型(如BiLSTM和ResNet)提升了2.61%～3.91%。相较于CNN-LSTM,本文所提算法以增加12.89%的时间复杂度为代价换取了平均识别率1.25%的提升。从结果分析来看,本文提出的BiLSTM-ResNet多模态特征融合方法在多样式调制识别任务中展现了优越的识别性能。这种性能的提升在需要更高识别精度的卫星通信的场景下是值得的,但在资源受限的低功耗场景中,CNN-LSTM等复杂度较低的模型可能更具有吸引力。

从表1可以看出,模型在选定的信噪比范围内对RML2018.01a数据集的整体识别率为96.48%。为进一步分析BLR网络对调制信号的分类能力,本文绘制了该模型分类下的混淆矩阵,如图10所示。图10中预测标签与真实标签的交叉位置表示对应调制方式的分类准确度,反映了模型将这类数据预测为该调制方式的可信度。其中对BPSK,FM,GMSK,OOK,OQPSK,QPSK数据实现了100%的分类效果,但在AM-DSB-SC和AM-DSB-WC,AM-SSB-SC和AM-SSB-WC中产生了一定程度的混淆。整体来看,BLR模型能够准确地区分不同调制方式的数据。由图10可以看出,该模型可以准确对低阶调制方式进行分类,但对同一调制方式下不同阶的数据容易产生混淆。尤其是较高阶的调制方式(如64APSK,32QAM等),其识别准确度仅有0.8。

4 结论

为提升模型在复杂调制识别环境中的准确率,并减少对单一数据模态的依赖,本文提出了一种基于多模态的BLR并联的调制识别方法。通过替换特征提取网络,增强了模型对信号时间和空间维度特征的提取能力,并采用串行融合策略捕捉不同模态间的特征依赖关系,从而提供更全面的信号特征。仿真实验表明,与传统卷积神经网络相比,本文方法通过捕捉更多维度的信号特征,在复杂的调制识别场景中显著增强了识别性能。这验证了多模态BLR网络架构在复杂信号调制识别任务中的有效性及其应用前景。未来可进一步优化网络结构与参数,提升易混淆的调制方式的分类准确率,并对算法进行轻量化处理,以进一步提高该方法的泛化能力和实际应用价值。

[1] WEI W,MENDEL J M.Maximum-likelihood classification for digital amplitude-phase modulations[J].IEEE Transactions on Communications,2000,48(2): 189-193.

[2] 张承畅,余洒,徐余,等.人工神经网络在调制识别中的应用综述[J].重庆邮电大学学报(自然科学版),2022,34(2): 181-192.ZHANG C C,YU S,XU Y,et al.Survey of artificial neural network applied to modulation recognition[J].Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition),2022,34(2): 181-192.

[3] HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786): 504-507.

[4] POSTADJIAN T,LE BRIS A,MALLET C,et al.Superpixel partitioning of very high resolution satellite images for large-scale classification perspectives with deep convolutional neural networks[C]∥IGARSS 2018-2018 IEEE International Geoscience and Remote Sensing Symposium.Piscataway: IEEE,2018: 1328-1331.

[5] 周鑫,何晓新,郑昌文.基于图像深度学习的无线电信号识别[J].通信学报,2019,40(7): 114-125.ZHOU X,HE X X,ZHENG C W.Radio signal recognition based on image deep learning[J].Journal on Communications,2019,40(7): 114-125.

[6] CHUNG J S,SENIOR A,VINYALS O,et al.Lip reading sentences in the wild[C]∥2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Piscataway: IEEE,2017: 3444-3453.

[7] O’SHEA T J,CORGAN J,CLANCY T C.Convolutional radio modulation recognition networks[M]∥Engineering Applications of Neural Networks.Cham: Springer International Publishing,2016: 213-226.

[8] WU Y L,LI X J,FANG J.A deep learning approach for modulation recognition via exploiting temporal correlations[C]∥2018 IEEE 19th International Workshop on Signal Processing Advances in Wireless Communications (SPAWC).Piscataway: IEEE,2018: 1-5.

[9] WANG Y,LIU M,YANG J,et al.Data-driven deep learning for automatic modulation recognition in cognitive radios[J].IEEE Transactions on Vehicular Technology,2019,68(4): 4074-4077.

[10] 王晓明,许梦竹.基于深度学习的调制识别方法研究[J].中国无线电,2023(5): 47-51.WANG X M,XU M Z.Radio signal modulation recognition method based on deep learning[J].China Radio,2023(5): 47-51.

[11] 章昕亮,李天昀,龚佩,等.联合深度学习和专家先验特征的信号调制识别[J].信息工程大学学报,2023,24(2): 129-134.ZHANG X L,LI T Y,GONG P,et al.Signal modulation recognition based on joint deep learning and expert prior features[J].Journal of Information Engineering University,2023,24(2): 129-134.

[12] 查雄,彭华,秦鑫,等.基于多端卷积神经网络的调制识别方法[J].通信学报,2019,40(11): 30-37.ZHA X,PENG H,QIN X,et al.Modulation recognition method based on multi-inputs convolution neural network[J].Journal on Communications,2019,40(11): 30-37.

[13] 任彦洁,唐晓刚,张斌权,等.基于时间卷积网络的通信信号调制识别算法[J].无线电工程,2023,53(4): 807-814.REN Y J,TANG X G,ZHANG B Q,et al.Communication signal modulation recognition algorithm based on a temporal convolutional network[J].Radio Engineering,2023,53(4): 807-814.

[14] WEST N E,O'SHEA T.Deep architectures for modulation recognition[C]∥2017 IEEE International Symposium on Dynamic Spectrum Access Networks (DySPAN).Piscataway: IEEE,2017: 1-6.

[15] 翁建新,赵知劲,占锦敏.利用并联CNN-LSTM的调制样式识别算法[J].信号处理,2019,35(5): 870-876.WENG J X,ZHAO Z J,ZHAN J M.Modulation recognition algorithm by using parallel CNN-LSTM[J].Journal of Signal Processing,2019,35(5): 870-876.

[16] SNOAP J A,POPESCU D C,SPOONER C M.On deep learning classification of digitally modulated signals using raw I/Q data[C]∥2022 IEEE 19th Annual Consumer Communications &Networking Conference (CCNC).Piscataway: IEEE,2022: 441-444.

[17] 张富强,曾夏,白筠妍,等.多模态数据融合的加工作业动态手势识别方法[J].郑州大学学报(工学版),2024,45(5): 30-36.ZHANG F Q,ZENG X,BAI J Y,et al.Dynamic gesture recognition method for machining operations based on multi-modal data fusion[J].Journal of Zhengzhou University (Engineering Science),2024,45(5): 30-36.

[18] QI P H,ZHOU X Y,ZHENG S L,et al.Automatic modulation classification based on deep residual networks with multimodal information[J].IEEE Transactions on Cognitive Communications and Networking,2021,7(1): 21-33.

[19] 张茜茜,王禹,林云,等.基于深度学习的自动调制识别方法综述[J].无线电通信技术,2022,48(4): 697-710.ZHANG X X,WANG Y,LIN Y,et al.A comprehensive survey of deep learning-based automatic modulation recognition methods[J].Radio Communications Technology,2022,48(4): 697-710.

[20] BAI S J,KOLTER J Z,KOLTUN V.An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[EB/OL].(2018-04-19)[2025-08-27].https:∥arxiv.org/abs/1803.01271.

[21] YU L,CHEN J,DING G R,et al.Spectrum prediction based on taguchi method in deep learning with long short-term memory[J].IEEE Access,2018,6: 45923-45933.

[22] HE K M,ZHANG X Y,REN S Q,et al.Deep residual learning for image recognition[C]∥2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Piscataway: IEEE,2016: 770-778.

[23] 黄杰,张顺生,陈爽.基于深度学习网络融合的自动调制分类方法[J].信号处理,2023,39(1): 42-50.HUANG J,ZHANG S S,CHEN S.Automatic modulation classification method based on deep learning network fusion[J].Journal of Signal Processing,2023,39(1): 42-50.

[24] 邓远征,白立云.基于时空联合与注意力机制的调制识别研究与实现[J].无线电工程,2024,54(12): 2913-2922.DENG Y Z,BAI L Y.Research and implementation of modulation recognition based on spatiotemporal joint and attention mechanism[J].Radio Engineering,2024,54(12): 2913-2922.

[25] O’SHEA T J,ROY T,CLANCY T C.Over-the-air deep learning based radio signal classification[J].IEEE Journal of Selected Topics in Signal Processing,2018,12(1): 168-179.