半刚性基层松散病害是沥青路面结构常见的病害形式,通常由基层材料失效、施工不当或长期交通荷载引发[1]。松散病害的形成会导致路基强度降低、不均匀沉降及裂缝扩展,最终影响路面的整体使用性能。因此,如何有效识别和评估松散病害是提升路面养护与管理水平的重要技术挑战。现今,探地雷达(ground penetrating radar,GPR)技术已广泛应用于路面[2]、堤坝[3]等基础设施,然而,松散病害GPR数据中通常含有大量噪声及复杂背景信号,病害特征易被掩盖,现有方法难以实现高效、准确的自动化识别。
随着计算能力的提升,深度学习技术因其强大的特征提取和识别能力,逐渐成为解决GPR数据解译问题的主要方案。在深度学习领域中,松散病害的检测使用目标检测技术。基于深度学习的目标检测方法主要分为两大类:候选区域方法和回归方法。候选区域方法以具有卷积神经网络(convolution neural network,CNN)特征的Fast R-CNN[4]为主流。尽管候选区域方法在精度上表现出色,但由于其需要经过多个阶段的计算,所以检测速度较慢,无法满足对实时性要求较高的应用场景。相比之下,回归方法通过简化检测流程,提高了目标检测速度。YOLO(you only look once) [5]系列回归方法采用单阶段结构,将目标检测的定位和分类任务合并,显著提高了检测速度。YOLO算法因其较高的检测速度和良好的精度,在国内外各种应用场景中得到了广泛的应用。宋娟等[6]提出了卷积模块TP Block对YOLOv7进行改进,提高了网络的特征提取能力,但该算法仍存在模型参数量较大的问题。叶发茂等[7]为充分利用检测道路病害的边缘特征信息,设计了边缘特征提取模块和特征增强融合模块,显著提高了道路缺陷检测的精度,但该算法检测过程较为复杂。申铉京等[8]提出了自适应多尺度特征融合网络对YOLOv4进行了改进,但该算法在UA-DETRAC数据集上检测性能与原始YOLOv5l无明显差距。赵平等[9]提出一种基于注意力机制的DA-YOLO缺陷检测算法,在NEU-DET钢面数据集上平均精度均值增长了3.8百分点,但检测过程中涉及复杂背景、模糊目标场景时准确性难以保证。
以上研究虽然提升了模型性能,但是依然存在一些弊端:尽管YOLO算法检测速度较快,但其泛化能力较弱,面对道路探地雷达图多杂波背景、松散病害形态多变难以辨识的问题,依然存在精度较低和漏检率较高的缺点,需要继续提升模型性能才能满足复杂场景下的检测要求。因此,本文选择了检测速度较快、模型量级较轻的YOLO系列算法,并对其中的YOLOv8进行了改进,旨在提升模型的检测精度和鲁棒性,为松散病害的识别提供更高效的解决方案,本文主要研究内容如下:
(1)构建DBBNCSPELAN4(简称DN)模块替换原YOLOv8结构中的C2f模块,该模块能够在减少计算量的同时增强对复杂场景中病害特征的捕捉能力,提升检测精度和速度。
(2)引入DN模块对YOLOv5也进行相同改进,以便后续对比分析。
(3)在数据集上训练并使用真实数据进行验证,实验结果表明,改进后的模型在mAP和召回率等关键指标上有明显提升。
YOLOv8是YOLO系列中较新版本的目标检测算法,其在保持高效性的基础上进一步优化了模型结构[10]。
YOLOv8相较于前代模型,在模型结构、特征融合及目标定位等方面进行了改进,使其在复杂场景中的检测能力进一步提升。主干网络是YOLOv8的核心部分,用于提取输入图像的多层特征,通过逐层提取图像的低级和高级特征,确保在检测过程中不丢失关键信息。在颈部网络中,特征金字塔网络负责融合来自不同尺度的特征,以便更好地检测多尺度的目标和更加精确地定位目标,并避免漏检。检测头部分采用更高效的目标定位机制,结合各类损失函数,可以更加准确地预测目标的位置和区域大小。
相较于原始的YOLOv8模型,本文在主干网络阶段引入了DN模块,该模块是对DBB模块[11]与RepNCSPELAN4模块[12]进行结合得以构建的,用于替换原结构中的传统卷积模块C2f模块。YOLOv8-DN网络结构如图1所示。
图1 YOLOv8-DN 网络结构
Figure 1 Structure of YOLOv8-DN
在主干网络中,通过DN模块的多种卷积方式增强模型对复杂场景下目标特征的捕捉能力;在颈部网络,使用DN模块优化了原有的多尺度特征融合过程,提升了对不同尺度目标的检测精度。
DN模块是本文提出的YOLOv8-DN算法的关键组件之一,其主要由两个核心部分构成:DBB模块和RepNCSPELAN4模块,下文将对两种模块进行详细介绍。
DBB模块是一种动态形变卷积模块,能够有效地处理目标的形变问题。DBB模块结构如图2所示,其通过多分支的卷积操作(包括1×1卷积和3×3卷积等),结合批量归一化和激活函数SiLU来提升特征提取能力。此外,DBB模块还引入了一个3×3的平均池化分支,用于进一步融合局部特征。变形卷积可以通过学习动态的卷积核形状来灵活适应目标的几何变形,从而提高模型对不规则目标的识别能力。
图2 DBB模块结构
Figure 2 Structure of DBB module
RepNCSPELAN4模块主要通过多个卷积层和分支设计来实现高效的特征提取和融合,其结构如图3所示。输入特征首先通过卷积层(Conv1)进行处理,接着被分割为两个分支,每个分支经过不同的RepNCSP模块[13]操作,在该模块中,输入特征会在训练阶段被多分支卷积进行特征提取,随后在推理阶段将这些卷积合并为一个单卷积操作,从而提高推理速度。然后,经过额外的卷积处理后,特征被拼接(Concat),将多分支的信息进行融合,形成最终的特征输出。通过这种设计,RepNCSPELAN4模块能够有效地捕捉多尺度特征,增强模型对复杂场景的适应性,减少通道数重新调整所带来的计算开销,同时提升检测精度。
图3 RepNCSPELAN4模块结构
Figure 3 Structure of RepNCSPELAN4 module
在两个模块的基础上,首先构建了DBBNCSP模块,其结构如图4所示,该模块是DBB模块和RepNCSP模块的结合体,旨在增强模型的特征提取能力。输入特征首先经过分割(Split),将输入的特征图通道数减半,形成两个分支。一个分支进入DBB模块,DBB模块使用多分支卷积操作来提取多尺度特征,并能够通过动态卷积核调整,灵活应对复杂目标的几何形变;另一个分支经过卷积处理后进入RepNCSP模块,用于提取不同层次的特征信息。最后,两个经过不同分支提取的特征在Concat操作中进行拼接,形成更丰富的特征表达。融合过程保留了来自不同卷积路径的信息,确保在输出时既有全局特征,也有细节特征。
图4 DBBNCSP模块结构
Figure 4 Structure of DBBNCSP module
DN模块的结构如图5所示,输入特征首先经过两次通道分割,分割方式相同,每次分割又分为两个路径。然后一个路径经过DBBNCSP模块、DBB模块处理,另一个路径则又加入了RepNCSP模块。经所有路径处理后的特征在Concat操作中进行特征融合,最终输出经过一次卷积操作生成完整的特征图。这种多分支设计确保了不同层次的特征被有效提取和融合。
图5 DN模块结构
Figure 5 Structure of DN module
在DN模块中,DBBNCSP模块的作用是处理目标的几何形变、丰富特征表达。首先通过动态卷积核调整,该模块能够根据松散病害的复杂形态灵活变化,提高了模型在检测松散病害时的精度。然后DBB模块的多分支卷积设计(如1×1卷积、3×3卷积、平均池化等)确保了对多尺度特征的全面捕捉,使得模型能够适应多种松散病害的复杂背景。经前面两种模块处理的松散病害雷达图像特征随后进入RepNCSP模块,在此处,训练阶段将采用复杂的多分支结构进行特征提取,在推理阶段再将这些复杂结构简化为单层卷积,从而显著提高推理速度。所以,DN模块在特征提取时不仅能够提高对复杂背景下基层松散病害的识别能力,还能减少计算开销。最后,分别经过不同路径中DBBNCSP、DBB、RepNCSP 3种模块处理的特征在Concat中被拼接,这使得模型可以同时利用来自不同路径的信息,包括几何变形处理后的特征和多尺度融合的特征。
在YOLOv8-DN中,原模型的C2f模块将被DN模块替换。C2f模块是固定卷积结构,缺乏对目标形变的灵活处理能力。图6为DN模块与C2f模块卷积方式对比。如图6所示,DN模块中的卷积方式除标准卷积外还有膨胀卷积、变形卷积等,这使得DN模块在应对复杂目标形状时表现更加出色。另外,DN模块通过多路径特征提取实现了更有效的多尺度特征融合,而C2f模块的特征融合方式较为单一。DN模块通过动态形变卷积核和多分支结构,能够更好地捕捉多尺度目标。
图6 DN模块与C2f模块卷积方式对比
Figure 6 Comparison of convolution methods between DN module and C2f module
算法1 YOLOv8-DN算法。
输入:数据集,迭代次数,批次大小,学习率等;
输出:检测结果(边界框、置信度、掩膜等)。
① 初始化YOLOv8-DN模型M,加载预训练权重;
② 对输入数据集进行预处理:
调整图像大小:统一缩放到640×640;
归一化处理:将像素值归一化到[0,1];
③ 读取图像Ibatch和对应标签Tbatch;
④ 使用算法进行前向传播:
动态形变卷积:适应松散病害区域复杂形态;
多尺度特征融合结构:融合不同尺度的特征;
⑤ 生成检测结果;
⑥ 计算多任务损失函数:
分类损失Lcls:优化目标类别的预测准确性;
边界框回归损失Lbox:提升边界框定位精度;
置信度损失Lconf:提高检测目标分类置信度;
掩膜损失Lmask:提升掩膜分割的准确性;
⑦ 使用Adam优化器更新模型参数;
⑧ 在测试数据集上进行推理:
使用非最大抑制(NMS)去除冗余检测框;
筛选置信度高于阈值的有效检测结果;
⑨ 输出最终检测结果。
在PyTorch深度学习平台上进行实验,采用Python 3.8编程语言,模型训练采用随机权值初始化策略,而非依赖预训练模型进行初始设置。
为确保模型训练的有效性和性能优化,设置了一系列关键超参数。其中,学习率设为0.001,用于控制每次参数更新的步长;批次大小为16,以平衡训练速度和模型稳定性;训练共迭代200轮次,确保模型对特征的充分学习;损失函数采用了YOLOv8标准的分类损失、边界框回归损失等,各损失函数共同作用以逐步提升模型目标检测能力。
本文的数据集由真实数据与模拟数据构成。真实数据收集于河南郑州,经选取后截图共计322张,数据采集设备为RIS Fastwave探地雷达,天线频率设置为600 MHz。
为解决实际采集数据不足的问题,生成了多种形状、面积、位置和松散程度的模拟图像。研究构建了多相离散随机介质模型[14],该模型通过为各组成介质赋予特定的介电常数、电导率,模拟了多相介质特性。根据道路层结构的实际厚度和随机分布特性,针对各层材料设置了不同的介电常数分布范围,不同道路结构层参数如表1所示。
表1 不同道路结构层参数
Table 1 Parameters of various road structural layers
结构层厚度/cm相对介电常数电导率/(S·m-1)沥青面层154.4~7.00.005半刚性基层407.0~11.00.005底基层204.0~6.00.005土基2510.0~14.00.005
在道路结构中,松散病害通常表现为基层中的局部密实度下降使材料内部形成空隙。松散病害的形成往往具有随机性,松散程度在不同路段之间存在较大差异。病害区域的典型特征包括材料密度降低、电磁波阻抗增大,进而在探地雷达图像中产生强烈的反射信号。为丰富数据样本,本研究提出了一种用于构建不同松散病害工况的道路结构模型来生成模拟数据的方法。该模型基于随机介质模型,利用空隙单元代表松散区域,使得模拟数据更真实地反映病害区域的特征。
本方法使用Python代码调用gprMax 3.0软件实现松散病害模拟数据的批量生成,共生成3 845张模拟图像。模拟中首先设置了3种不同的天线频率(1.6,1.2和0.8 GHz),随后通过设置尺寸、位置、松散程度等控制参数范围来自动、批量生成模拟数据。其中,模型尺寸为1 m×5 m,松散区域生成范围为基层与底基层范围内,松散程度为10%~40%。道路松散病害及模型模拟数据与真实GPR数据图像对比如图7所示。
图7 道路松散病害模型及模拟数据图像与真实GPR数据图像对比
Figure 7 Modeling of road loose defects and comparison between simulated data image and real GPR data image
在数据增强部分,针对真实数据进行了多种操作,包括随机旋转、增加高斯噪声等操作。随机旋转用于改变目标的方向,使模型能够适应不同角度的目标区域。增加高斯噪声用于模拟复杂环境下的噪声干扰。经过数据增强后的真实图像数量为966张。本文将数据总量(共计4 811张)的80%划分为训练集、10%划分为验证集和10%划分为测试集,确保有足够的数据用于训练模型,同时保留一定比例的数据用于验证和最终评估。
本文实验采用了多项常用的目标检测评价指标:精确率(P)表示模型在检测出的病害区域中真正属于病害的比例,精确率越高,算法误检率越低;召回率(R)表示模型能够检测出实际病害区域的比例,召回率越高,算法漏检率越低;平均精度均值(mAP)表示算法在所有检测类别上的平均检测精度,是评价算法总体性能的重要指标;帧率表示每秒处理的帧数,帧率越高,表明算法的实时性越好。这些指标共同反映了算法的检测精度和鲁棒性。
为了验证改进算法中DN模块的有效性,本文对比了5种目标检测算法,分别为YOLOv5[15]、YOLOv7[16]、YOLOv8[10]和改进后的YOLOv5-DN、YOLOv8-DN。通过在同一数据集上进行实验,评估各个模型在各项指标上的表现。表2展示了5种不同YOLO算法的性能对比。
表2 不同YOLO算法性能对比
Table 2 Comparison of performance for different YOLO algorithms
算法P/%R/%mAP/%帧率/(帧·s-1)YOLOv593.6494.3392.9616.54YOLOv794.2194.1894.6319.61YOLOv893.9193.4091.9627.70YOLOv5-DN95.0192.8893.4926.64YOLOv8-DN95.5795.7397.2532.05
从表2的结果可以看出,YOLOv5-DN、YOLOv8-DN模型在各项性能指标上相较于原始算法都有很大提升。YOLOv5-DN精度较YOLOv5提升了1.37百分点,mAP提升了0.53百分点;YOLOv8-DN精度较YOLOv8提升了1.66百分点,mAP提升了5.29百分点,两种模型的帧率都有所提升。这表明DN模块不仅在检测精度的提升上发挥了良好的作用,还有效减少了推理过程中的计算开销,提升了模型的推理速度。同时,通过RepNCSP模块高效多尺度特征融合机制,YOLOv8-DN的召回率提升至95.73%,漏检率明显下降。综合实验结果来看,DN模块在不同阶段发挥了重要作用,尤其在YOLOv8-DN中表现更加突出,不仅提升了模型对复杂形变目标的精确度,还优化了计算效率,显著提高了模型的整体性能。
不同YOLO算法的精确率曲线如图8所示。从图8中可以看出,不同模型的精度随训练轮数变化表现出不同的趋势。YOLOv7和YOLOv8在训练初期精确率提升迅速,随后趋于平稳。YOLOv5和YOLOv5-DN的精确率曲线上升趋势相对平缓,同时YOLOv5-DN的精确率显著高于YOLOv5,说明DN模块的引入对提升检测精度有所帮助,但效果较YOLOv8-DN稍差。相比之下,YOLOv8-DN在整个训练过程中也保持了稳定的精度提升,且在每个阶段的精确率水平上始终高于其他模型,显示出其在检测精度上的显著优势。总体而言,YOLOv8-DN在复杂场景下的病害检测任务中具备更快的速度和更高的检测精度,是改进YOLO算法在道路病害检测中更为理想的选择。
图8 不同YOLO算法的精确率曲线
Figure 8 Precision curves for different YOLO algorithms
为了更好地验证本文算法对松散病害的检测与识别的效果,在真实数据上进行了实验,不同YOLO算法的松散病害的识别效果如图9所示。
图9 不同YOLO算法对松散病害的识别效果
Figure 9 Recognition effectiveness of different YOLO algorithms for loose defects
从图9中可以看出,5种算法在松散病害的检测任务中有着不同的表现。YOLOv5检测的边框覆盖面积不完整,且存在误检现象。YOLOv7在两个检测图像中分别得到了0.67和0.51的置信度,相对较低,同时也存在误检现象。虽然YOLOv8相比YOLOv5和YOLOv7在松散病害的检测中表现有所提升,但YOLOv8在处理较为复杂的松散病害时仍然存在误检和漏检的风险。
YOLOv8-DN和YOLOv5-DN在检测置信度和区域完整性上显著优于其他模型,其中YOLOv5-DN在检测精度上较YOLOv5也有比较大的提高,置信度分别从0.87上升至0.94、0.79上升至0.93,且没有误检现象;YOLOv8-DN在两个检测的病害区域边界更加全面和细腻,识别精度更高,边界框范围更准确。
为更准确地检测和识别探地雷达复杂场景中的松散病害,本文在YOLOv8中引入了DN模块,显著提升了检测性能。DN模块通过集成DBB模块,增强了模型对目标形变的适应能力,同时,通过结合RepNCSPELAN4模块,在保证模型高效性的前提下有效降低了计算复杂度,进一步提升了推理速度。实验结果表明,与YOLOv5、YOLOv7、YOLOv5-DN以及原始YOLOv8算法相比,YOLOv8-DN算法在松散病害检测任务中表现出更高的精度和鲁棒性,充分验证了所提方法的有效性。未来的工作将聚焦于如何进一步提升模型的泛化能力,在无监督或弱监督条件下,将算法扩展到更多的复杂场景中。
[1] 袁江, 程怀磊, 孙立军, 等. 基于温度应力分析的半刚性基层沥青路面拱胀病害成因[J]. 中国公路学报, 2024, 37(12): 182-196.
YUAN J, CHENG H L, SUN L J, et al. Causes of arch expansion on semi-rigid base asphalt pavement based on temperature-stress analysis[J]. China Journal of Highway and Transport, 2024, 37(12): 182-196.
[2] SUI X, LENG Z, WANG S Q, et al. In-situ grouting rate prediction of semi-flexible pavement based on a novel composite dielectric constant model and ground-penetrating radar[J]. Construction and Building Materials, 2024, 438: 137209.
[3] 方宏远, 董智峰, 薛冰寒, 等. 高聚物注浆修复的面板堤坝探地雷达波场特征分析[J]. 郑州大学学报(工学版), 2024, 45(3): 1-6, 13.
FANG H Y, DONG Z F, XUE B H, et al. Analysis of ground penetrating radar wave field characteristics of dam face disengaging repaired by polymer grouting[J]. Journal of Zhengzhou University (Engineering Science), 2024, 45(3): 1-6, 13.
[4] GIRSHICK R. Fast R-CNN[EB/OL]. (2015-04-30)[2024-11-19].https:∥doi.org/10.48550/arXiv.1504.08083.
[5] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]∥2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway: IEEE, 2016: 779-788.
[6] 宋娟, 贺龙喜, 龙会平. 基于深度学习的隧道衬砌多病害检测算法[J]. 浙江大学学报(工学版), 2024, 58(6): 1161-1173.
SONG J, HE L X, LONG H P. Deep learning-based algorithm for multi defect detection in tunnel lining[J]. Journal of Zhejiang University (Engineering Science), 2024, 58(6): 1161-1173.
[7] 叶发茂, 张立, 袁燎, 等. DB-YOLO: 特征增强融合的双骨干YOLOv8道路缺陷检测模型[J]. 计算机工程与应用, 2024, 60(24): 260-269.
YE F M, ZHANG L, YUAN L, et al. DB-YOLO: dual backbone YOLOv8 model with feature enhancement fusion for road defect detection[J]. Computer Engineering and Applications, 2024, 60(24): 260-269.
[8] 申铉京, 李涵宇, 黄永平, 等. 基于自适应多尺度特征融合网络的车辆检测方法[J/OL]. 电子学报, 2023: 1-9(2023-03-31)[2024-11-19].:https:∥kns.cnki.net/kcms/detail/11.2087.tn.20230330.1000.056.html.
SHEN X J, LI H Y, HUANG Y P, et al. Vehicle detection method based on adaptive multi-scale feature fusion network[J/OL]. China Industrial Economics, 2023: 1-9(2023-03-31)[2024-11-19].:https:∥kns.cnki.net/kcms/detail/11.2087.tn.20230330.1000.056.html.
[9] 赵平, 周永霞. 基于注意力机制的DA-YOLO缺陷检测算法[J]. 中国计量大学学报, 2024, 35(2): 326-332, 348.
ZHAO P, ZHOU Y X. A DA-YOLO defect detection algorithm based on the attention mechanism[J]. Journal of China University of Metrology, 2024, 35(2): 326-332, 348.
[10] SOHAN M, SAI RAM T, RAMI REDDY C V. A review on YOLOv8 and its advancements[C]∥Data Intelligence and Cognitive Informatics. New York: Springer, 2024: 529-545.
[11] DING X H, ZHANG X Y, HAN J G, et al. Diverse branch block: building a convolution as an inception-like unit[C]∥2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2021: 10881-10890.
[12] YANG S M, CAO Z, LIU N B, et al. Maritime electro-optical image object matching based on improved YOLOv9[J]. Electronics,2024, 13(14):2774.
[13] LI X W, NI X B, CAO Z Y, et al. Detection method for power workers′ protection rope compliance based on improved YOLOv8[C]∥Advanced Intelligent Computing Technology and Applications. New York: Springer, 2024: 335-344.
[14] 郭士礼, 岳光华, 蔡文才, 等. 多相离散随机介质探地雷达波传输特性研究[J]. 地球物理学进展, 2021, 36(1): 351-360.
GUO S L, YUE G H, CAI W C, et al. Study on transmission characteristics of GPR in multiphase discrete random medium[J]. Progress in Geophysics, 2021, 36(1): 351-360.
[15] ZHANG Y, GUO Z Y, WU J Q, et al. Real-time vehicle detection based on improved YOLO v5[J]. Sustainability, 2022, 14(19): 12274.
[16] WANG C Y, BOCHKOVSKIY A, LIAO H M. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors[C]∥2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway: IEEE, 2023: 7464-7475.