彩色可见光与红外图像显著性目标检测方法
未命名
10-18
阅读:128
评论:0
1.本发明涉及一种显著物体检测技术,尤其是涉及一种彩色可见光与红外图像显著性目标检测方法。
背景技术:
2.显著性目标检测(salient object detection,sod)旨在捕捉和分割图像或视频中的突出对象。显著性目标检测作为一个重要的预处理步骤,它已被广泛应用于计算机视觉和图像处理任务,如图像分割、对象跟踪、图像检索和图像质量评估等。近年来,卷积/深度神经网络因强大的学习能力和在特征提取方面的优秀表现,将显著性目标检测的性能推向了一个新的高度。然而,当遇到具有挑战性的场景(例如多个物体、杂乱无章的背景、不利的光照条件或透明物体)时,仅使用彩色可见光图像的显著性目标检测会出现性能下降。因此,在显著性目标检测任务中,额外引入其他类型的模态并将其与彩色可见光图像相结合是一种常见的解决方案。
3.具有辅助深度图像的彩色可见光与深度图像显著性目标检测、具有红外图像的彩色可见光与红外图像显著性目标检测已被开发,使用广泛的深度传感器和红外相机作为附加模态信息。深度信息包含丰富的空间结构和3d布局信息,但在一些极端环境(例如,较差的照明和混乱的场景)中为显著性目标检测提供有用的信息是不可靠的。由于红外图像可以反映物体表面的热辐射,因此在这些极端环境下与彩色可见光图像自然互补,近年来对彩色可见光与红外图像显著性目标检测的研究越来越受到关注。
4.当前针对多模态显著性目标检测还存在以下几个问题:
5.第一,如何采取一个合理的多模态特征交互策略来处理两种模态之间的差异?在理想情况下,彩色可见光图像和红外图像都可以提供丰富的几何信息和物体边界。此外,彩色可见光图像可以在良好的光照条件下提供充足的颜色信息,红外图像可以提供物体表面的温度信息,这就导致了这两种模态之间的差异,并且在识别显著性目标的过程中,人们倾向于通过彩色可见光图像而不是红外图像来确定目标的位置。同时,红外图像更有可能提供干扰性信息,从而影响对目标的识别。因此,为了减少干扰性信息的引入并且尽可能利用好两种模态各自的信息,采用不对称的特征交互策略是更为合理的。
6.第二,如何平衡不同模态的内部差距并融合多模态的特征?在特征交互后,由于这些单模态特征除了自身模态的信息外,只携带了来自另一模态的部分判别信息,因此必须研究一种有效的融合策略,充分利用跨模态的互补信息。大多数现有的方法使用线性操作、卷积操作、注意力方法或其他组合方法等简单的手段,未能充分利用两个模态的互补信息。因此,选择和融合不同模态内部有价值的特征对于提高彩色可见光与红外图像显著性目标检测的准确度是十分必要的。
技术实现要素:
7.本发明所要解决的技术问题是提供一种彩色可见光与红外图像显著性目标检测
方法,其能够有效地提高显著性目标检测的准确度。
8.本发明解决上述技术问题所采用的技术方案为:一种彩色可见光与红外图像显著性目标检测方法,该方法首先构建一个包含数对彩色可见光图像和与其对应的红外图像的训练集,并搭建一个神经网络;其次将训练集中的数对彩色可见光图像和与其对应的红外图像输入到神经网络中进行多轮网络训练,网络训练结束后得到神经网络训练模型;再次使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像,其特征在于:所述的神经网络主要由特征提取模块、非对称特征互补模块、特征选择与融合模块、语义增强解码器构成,其中:
9.所述的特征提取模块包括两个resnet50骨干网路;第1个resnet50骨干网络的第一层的输入端接收一幅大小为h
×w×
3的彩色可见光图像,第1个rsenet50骨干网络的第一层的输出端输出的特征图记为fr1,第1个resnet50骨干网络的第二层的输入端接收fr1,第1个rsenet50骨干网络的第二层的输出端输出的特征图记为fr2,第1个resnet50骨干网络的第三层的输入端接收fr2,第1个rsenet50骨干网络的第三层的输出端输出的特征图记为fr3,第1个resnet50骨干网络的第四层的输入端接收fr3,第1个rsenet50骨干网络的第四层的输出端输出的特征图记为fr4,第1个resnet50骨干网络的第五层的输入端接收fr4,第1个rsenet50骨干网络的第五层的输出端输出的特征图记为fr5;第2个resnet50骨干网络的第一层的输入端接收一幅大小为h
×w×
3的红外图像,第2个rsenet50骨干网络的第一层的输出端输出的特征图记为ft1,第2个resnet50骨干网络的第二层的输入端接收ft1,第2个rsenet50骨干网络的第二层的输出端输出的特征图记为ft2,第2个resnet50骨干网络的第三层的输入端接收ft2,第2个rsenet50骨干网络的第三层的输出端输出的特征图记为ft3,第2个resnet50骨干网络的第四层的输入端接收ft3,第2个rsenet50骨干网络的第四层的输出端输出的特征图记为ft4,第2个resnet50骨干网络的第五层的输入端接收ft4,第2个rsenet50骨干网络的第五层的输出端输出的特征图记为ft5;其中,resnet50骨干网络共有五层,fr1和ft1的大小为fr2和ft2的大小为fr3和ft3的大小为fr4和ft4的大小为fr5和ft5的大小为
10.所述的非对称特征互补模块由彩色可见光特征互补模块和红外特征互补模块构成;
11.所述的彩色可见光特征互补模块包括结构相同的五个彩色可见光特征互补块;第1个彩色可见光特征互补块的第一输入端接收fr1、第二输入端接收ft1,第1个彩色可见光特征互补块的输出端输出的特征图记为第2个彩色可见光特征互补块的第一输入端接收fr2、第二输入端接收ft2,第2个彩色可见光特征互补块的输出端输出的特征图记为第3个彩色可见光特征互补块的第一输入端接收fr3、第二输入端接收ft3,第3个彩色可见光特征互补块的输出端输出的特征图记为第4个彩色可见光特征互补块的第一输入端接收fr4、第二输入端接收ft4,第4个彩色可见光特征互补块的输出端输出的特征图记为第5个彩色可见光特征互补块的第一输入端接收fr5、第二输入端接收ft5,第5个彩色
可见光特征互补块的输出端输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为
12.所述的红外特征互补模块包括结构相同的五个红外特征互补块;第1个红外特征互补块的第一输入端接收ft1、第二输入端接收fr1,第1个红外特征互补块的输出端输出的特征图记为第2个红外特征互补块的第一输入端接收ft2、第二输入端接收fr2,第2个红外特征互补块的输出端输出的特征图记为第3个红外特征互补块的第一输入端接收ft3、第二输入端接收fr3,第3个红外特征互补块的输出端输出的特征图记为第4个红外特征互补块的第一输入端接收ft4、第二输入端接收fr4,第4个红外特征互补块的输出端输出的特征图记为第5个红外特征互补块的第一输入端接收ft5、第二输入端接收fr5,第5个红外特征互补块的输出端输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为
13.所述的特征选择与融合模块包括五个结构相同的特征选择与融合块;第1个特征选择与融合块的第一输入端接收第二输入端接收第1个特征选择与融合块的输出端输出的特征图记为第2个特征选择与融合块的第一输入端接收第二输入端接收第2个特征选择与融合块的输出端输出的特征图记为第3个特征选择与融合块的第一输入端接收第二输入端接收第3个特征选择与融合块的输出端输出的特征图记为第4个特征选择与融合块的第一输入端接收第二输入端接收第4个特征选择与融合块的输出端输出的特征图记为第5个特征选择与融合块的第一输入端接收第二输入端接收第5个特征选择与融合块输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为
14.所述的语义增强解码器包括三个结构相同的语义增强解码块;第1个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第1个语义增强解码块的输出端输出的特征图记为s1,并将s1作为第1幅粗显著性目标图像;第2个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第2个语义增强解码块的输出端输出的特征图记为s2,并将s2作为第2幅粗显著性目标图像;第3个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第3个语义
增强解码块的输出端输出的特征图记为s3,并将s3作为第3幅粗显著性目标图像;其中,s1的大小为s2的大小为s3的大小为
15.将第1幅粗显著性目标图像s1、第2幅粗显著性目标图像s2、第3幅粗显著性目标图像s3进行逐元素相加操作并进行上采样操作,将得到的特征图记为sf,并将sf作为最终的显著性目标图像;其中,上采样操作的模式为双线性,sf的大小为h
×w×
1。
16.训练集的构建过程为:选取至少200对原始彩色可见光图像和与其对应的原始红外图像;然后对每幅原始彩色可见光图像和与其对应的原始红外图像进行降采样操作,将图像大小降采样为h
×
w;再将所有大小为h
×
w的彩色可见光图像和与其对应的红外图像构成训练集。
17.神经网络训练模型的获得过程为:将训练集中的每对彩色可见光图像和与其对应的红外图像输入到神经网络中进行网络训练,在每轮网络训练结束之前计算损失函数l来优化神经网络,在总共进行150轮网络训练后得到神经网络训练模型;其中,在网络训练的前40轮中在网络训练的后110轮中sf表示神经网络输出的最终的显著性目标图像,g表示标签图像,sj表示神经网络中得到的第j幅粗显著性目标图像,l
bce
()表示二元交叉熵损失,l
iou
()表示交并比损失。
18.使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像的过程为:任意选取一对原始彩色可见光图像和与其对应的原始红外图像;然后对该对原始彩色可见光图像和原始红外图像进行降采样操作,将图像大小降采样为h
×
w,并作为测试图像对;再将测试图像对输入到神经网络训练模型中,预测得到测试图像对的显著性目标图像。
19.彩色可见光特征互补块主要由第1个卷积层至第5个卷积层、第1个batch normalization层至第5个batch normalization层、第1个relu激活层至第5个relu激活层组成;对于第i个彩色可见光特征互补块,第1个卷积层的输入端作为第i个彩色可见光特征互补块的第一输入端接收fri,第1个batch normalization层的输入端接收第1个卷积层的输出端输出的特征图,第1个relu激活层的输入端接收第1个batch normalization层的输出端输出的特征图,第1个relu激活层的输出端输出的特征图记为第2个卷积层的输入端作为第i个彩色可见光特征互补块的第二输入端接收fti,第2个batch normalization层的输入端接收第2个卷积层的输出端输出的特征图,第2个relu激活层的输入端接收第2个batch normalization层的输出端输出的特征图,第2个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第3个卷积层的输入端接收第3个batch normalization层的输入端接收第3个卷积层的输出端输出的特征图,
第3个relu激活层的输入端接收第3个batch normalization层的输出端输出的特征图,第3个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为第4个卷积层的输入端接收第4个batch normalization层的输入端接收第4个卷积层的输出端输出的特征图,第4个relu激活层的输入端接收第4个batch normalization层的输出端输出的特征图,第4个relu激活层的输出端输出的特征图记为第5个卷积层的输入端接收fri,第5个batch normalization层的输入端接收第5个卷积层的输出端输出的特征图,第5个relu激活层的输入端接收第5个batch normalization层的输出端输出的特征图,第5个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为即为第i个彩色可见光特征互补块的输出端输出的特征图;其中,1≤i≤5,fri表示第1个resnet50骨干网络的第i层的输出端输出的特征图,fti表示第2个resnet50骨干网络的第i层的输出端输出的特征图,第1个卷积层至第5个卷积层均为2d卷积层,第1个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第2个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第3个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填
充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第4个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第5个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1。
20.红外特征互补块主要由第6个卷积层至第9个卷积层、第6个batch normalization层至第9个batch normalization层、第6个relu激活层至第9个relu激活层、第1个空间注意力层组成;对于第i个红外特征互补块,第6个卷积层的输入端作为第i个红外特征互补块的第一输入端接收fti,第6个batch normalization层的输入端接收第6个卷积层的输出端输出的特征图,第6个relu激活层的输入端接收第6个batch normalization层的输出端输出的特征图,第6个relu激活层的输出端输出的特征图记为第7个卷积层的输入端作为第i个红外特征互补块的第二输入端接收fri,第7个batch normalization层的输入端接收第7个卷积层的输出端输出的特征图,第7个relu激活层的输入端接收第7个batch normalization层的输出端输出的特征图,第7个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和
进行通道连接操作,并将得到的特征图记为第8个卷积层的输入端接收第8个batch normalization层的输入端接收第8个卷积层的输出端输出的特征图,第8个relu激活层的输入端接收第8个batch normalization层的输出端输出的特征图,第8个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为第9个卷积层的输入端接收第9个batch normalization层的输入端接收第9个卷积层的输出端输出的特征图,第9个relu激活层的输入端接收第9个batch normalization层的输出端输出的特征图,第9个relu激活层的输出端输出的特征图记为第1个空间注意力层的输入端接收fri,第1个空间注意力层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为进行元素相乘操作,并将得到的特征图记为即为第i个红外特征互补块的输出端输出的特征图;其中,1≤i≤5,fri表示第1个resnet50骨干网络的第i层的输出端输出的特征图,fti表示第2个resnet50骨干网络的第i层的输出端输出的特征图,第6个卷积层至第9个卷积层均为2d卷积层,第1个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第2个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第3个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第4个红外特征互补块中:第6个
卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第5个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1。
21.特征选择与融合块主要由第1个平均池化层、第2个平均池化层、第1个最大池化层、第2个最大池化层、第1个全连接层、第2个全连接层、第1个sigmoid激活层、第2个sigmoid激活层、第10个卷积层至第19个卷积层、第10个batch normalization层至第17个batch normalization层、第10个relu激活层至第12个relu激活层、第1个prelu激活层至第6个prelu激活层组成;对于第i个特征选择与融合块,第1个平均池化层和第1个最大池化层各自的输入端均作为第i个特征选择与融合块的第一输入端接收第1个平均池化层的输出端输出的特征图记为第1个最大池化层的输出端输出的特征图记为第2个平均池化层和第2个最大池化层各自的输入端均作为第i个特征选择与融合块的第二输入端接收第2个最大池化层的输出端输出的特征图记为第2个平均池化层的输出端输出的特征图记为对和进行通道连接操作,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第1个全连接层的输入端接收第1个全连接层的输出端输出的特征图记为第2个全连接层的输入端接收第2个全连接层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图作为第1个sigmoid激活层的输入,将对第1个sigmoid激活层的输出端输出的特征图进行通道分割后输出的特征图分别记为和对和进行逐通道相乘操作,并将得到的特征图记为对和进行逐通道相乘操作,并将得到的特征图记为第10个卷积层的输入端接收第10个batch normalization层的输入端接收第10个卷积层的输出端输出的特征图,第1个prelu激活层的输入端接收第10个batch normalization层的输出端输出的特征图,第1个prelu
激活层的输出端输出的特征图记为第11个卷积层的输入端接收第11个batch normalization层的输入端接收第11个卷积层的输出端输出的特征图,第2个prelu激活层的输入端接收第11个batch normalization层的输出端输出的特征图,第2个prelu激活层的输出端输出的特征图记为第12个卷积层的输入端接收第12个batch normalization层的输入端接收第12个卷积层的输出端输出的特征图,第3个prelu激活层的输入端接收第12个batch normalization层的输出端输出的特征图,第3个prelu激活层的输出端输出的特征图记为第13个卷积层的输入端接收第13个batch normalization层的输入端接收第13个卷积层的输出端输出的特征图,第4个prelu激活层的输入端接收第13个batch normalization层的输出端输出的特征图,第4个prelu激活层的输出端输出的特征图记为第14个卷积层的输入端接收第14个batch normalization层的输入端接收第14个卷积层的输出端输出的特征图,第5个prelu激活层的输入端接收第14个batch normalization层的输出端输出的特征图,第5个prelu激活层的输出端输出的特征图记为第15个卷积层的输入端接收第15个batch normalization层的输入端接收第15个卷积层的输出端输出的特征图,第6个prelu激活层的输入端接收第15个batch normalization层的输出端输出的特征图,第6个prelu激活层的输出端输出的特征图记为对和进行通道连接操作,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第16个卷积层的输入端接收第16个batch normalization层的输入端接收第16个卷积层的输出端输出的特征图,第10个relu激活层的输入端接收第16个batch normalization层的输出端输出的特征图,第10个relu激活层的输出端输出的特征图记为第17个卷积层的输入端接收第17个batch normalization层的输入端接收第17个卷积层的输出端输出的特征图,第11个relu激活层的输入端接收第17个batch normalization层的输出端输出的特征图,第11个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对进行通道连接操作,并将得到的特征图记为第18个卷积层的输入端接收第12个relu激活层的输入端接收第18个卷积层的输出端输出的特征图,第19个卷积层的输入端接收第12个relu激活层的输出端输出的特征图,第19个卷积层的输出端输出的特征图记为第2个sigmoid激活层的输入端接收第2个sigmoid激活层的输出端输出的特征图进行通道分割后得到的特征图分别记为和对和进行元素相乘操作,并将得到的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元
素相加操作,并将得到的特征图记为即为第i个特征选择与融合块的输出端输出的特征图;其中,1≤i≤5,表示第i个红外特征互补块的输出端输出的特征图,表示第i个彩色可见光特征互补块的输出端输出的特征图,第10个卷积层至第19个卷积层均为2d卷积层,第1个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第2个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
512、中间隐藏层的尺寸为1
×1×
256、输出尺寸为1
×1×
512,和的尺寸为1
×1×
256,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积
层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第3个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的
输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、
22.滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第4个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀
率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第5个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为
23.所述的语义增强解码块主要由第20个卷积层至第29个卷积层、第18个batch normalization层至第23个batch normalization层、第13个relu激活层至第19个relu激活
层、第3个sigmoid激活层、transformer层、第2个空间注意力层、第1个通道注意力层、第2个通道注意力层、第1个上采样层至第3个上采样层组成;对于第j个语义增强解码块,第20个卷积层的输入端作为第j个语义增强解码块的第一输入端接收第18个batch normalization层的输入端接收第20个卷积层的输出端输出的特征图,第13个relu激活层的输入端接收第18个batch normalization层的输出端输出的特征图,第1个上采样层的输入端接收第13个relu激活层的输出端输出的特征图,第21个卷积层的输入端接收第1个上采样层的输出端输出的特征图,第19个batch normalization层的输入端接收第21个卷积层的输出端输出的特征图,第14个relu激活层的输入端接收第19个batch normalization层的输出端输出的特征图,transformer层的输入端接收第14个relu激活层的输出端输出的特征图,transformer层的输出端输出的特征图记为第2个空间注意力层的输入端接收第2个上采样层的输入端接收第2个空间注意力层的输出端输出的特征图,第2个上采样层的输出端输出的特征图记为第j个语义增强解码块的第二输入端接收对与进行元素相乘操作,并将得到的特征图记为第22个卷积层的输入端接收第20个batch normalization层的输入端接收第22个卷积层的输出端输出的特征图,第15个relu激活层的输入端接收第20个batch normalization层的输出端输出的特征图,第3个上采样层的输入端接收第15个relu激活层的输出端输出的特征图,第23个卷积层的输入端接收第3个上采样层的输出端输出的特征图,第21个batch normalization层的输入端接收第23个卷积层的输出端输出的特征图,第16个relu激活层的输入端接收第21个batch normalization层的输出端输出的特征图,第16个relu激活层的输出端输出的特征图记为对和进行通道拼接操作,并将得到的特征图记为第1个通道注意力层的输入端接收第24个卷积层的输入端接收第1个通道注意力层的输出端输出的特征图,第25个卷积层的输入端接收第24个卷积层的输出端输出的特征图,第22个batch normalization层的输入端接收第25个卷积层的输出端输出的特征图,第17个relu激活层的输入端接收第22个batch normalization层的输出端输出的特征图,第26个卷积层的输入端接收第17个relu激活层的输出端输出的特征图,第23个batch normalization层的输入端接收第26个卷积层的输出端输出的特征图,第18个relu激活层的输入端接收第23个batch normalization层的输出端输出的特征图,第18个relu激活层的输出端输出的特征图记为第j个语义增强解码块的第一输入端接收对与进行元素相乘操作,并将得到的特征图记为对和进行通道拼接操作,并将得到的特征图记为第2个通道注意力层的输入端接收第27个卷积层的输入端接收第2个通道注意力层的输出端输出的特征图,第27个卷积层的输出端输出的特征图记为第28个卷积层的输入端接收第19个relu激活层的输入端接收第28个卷积层的输出端输出的特征图,第29个卷积层的输入端接收第19个relu激活层的输出端输出的特征图,第3个sigmoid激活层的输入端接收第29个卷积层的输出端
输出的特征图,第3个sigmoid激活层的输出端输出的特征图记为sj,sj即为第j个语义增强解码块的输出端输出的特征图;其中,1≤j≤3,表示第j+2个特征选择与融合块的输出端输出的特征图,第20个卷积层至第29个卷积层均为2d卷积层,第1个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为
24.输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,transformer层的输入尺寸为输出尺寸为第2个语义增强解码块中:第20个卷积层
的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,transformer层的输入尺寸为输出尺寸为第3个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为
输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为
25.卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,transformer层的输入尺寸为输出尺寸为
26.与现有技术相比,本发明的优点在于:
27.1)本发明方法构建的神经网络采用resnet50骨干网络进行特征提取,从彩色可见光图像、红外图像中提取特征;然后采用非对称特征互补模块,通过非对称策略让不同模态特征之间充分交互;再采用特征选择与融合模块在通道和空间维度上选择并融合有价值的特征;最后采用三个语义增强解码块解码出准确的显著性目标检测结果。
28.2)本发明方法基于两种模态之间的固有差异以及各自的特点,在构建的神经网络中采用了非对称特征互补模块(包括彩色可见光特征互补模块与红外特征互补模块)来让两个模态之间充分交互的同时减少干扰信息的引入,以充分交互多模态互补信息,减小不同模态之间的模态差异,提高彩色可见光与红外图像显著目标检测的准确性。
29.3)本发明方法针对多模态特征难以高质量融合的问题,在构建的神经网络中采用
了特征选择与融合模块,该模块可以在通道维度和空间维度上筛选出有价值的特征,并设计了融合策略以实现彩色可见光特征与红外特征的融合来解决不同模态的内部差距的问题,从而有效地提高了彩色可见光与红外图像显著目标检测的准确性。
附图说明
30.图1为本发明方法的总体实现框架图;
31.图2为本发明方法搭建的神经网络的组成结构示意图;
32.图3为本发明方法搭建的神经网络中的彩色可见光特征互补块的组成结构示意图;
33.图4为本发明方法搭建的神经网络中的红外特征互补块的组成结构示意图;
34.图5为本发明方法搭建的神经网络中的特征选择与融合块的部分组成结构示意图;
35.图6为本发明方法搭建的神经网络中的特征选择与融合块的剩余部分组成结构示意图;
36.图7为本发明方法搭建的神经网络中的语义增强解码块的组成结构示意图。
具体实施方式
37.以下结合附图实施例对本发明作进一步详细描述。
38.本发明提出的一种彩色可见光与红外图像显著性目标检测方法,其总体实现框架图如图1所示,该方法首先构建一个包含数对彩色可见光图像和与其对应的红外图像的训练集,并搭建一个神经网络;其次将训练集中的数对彩色可见光图像和与其对应的红外图像输入到神经网络中进行多轮网络训练,网络训练结束后得到神经网络训练模型;再次使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像,其特征在于:如图2所示,所述的神经网络主要由特征提取模块、非对称特征互补模块、特征选择与融合模块、语义增强解码器构成,其中:
39.特征提取模块包括两个resnet50骨干网路;第1个resnet50骨干网络的第一层的输入端接收一幅大小为h
×w×
3的彩色可见光图像,第1个rsenet50骨干网络的第一层的输出端输出的特征图记为fr1,第1个resnet50骨干网络的第二层的输入端接收fr1,第1个rsenet50骨干网络的第二层的输出端输出的特征图记为fr2,第1个resnet50骨干网络的第三层的输入端接收fr2,第1个rsenet50骨干网络的第三层的输出端输出的特征图记为fr3,第1个resnet50骨干网络的第四层的输入端接收fr3,第1个rsenet50骨干网络的第四层的输出端输出的特征图记为fr4,第1个resnet50骨干网络的第五层的输入端接收fr4,第1个rsenet50骨干网络的第五层的输出端输出的特征图记为fr5;第2个resnet50骨干网络的第一层的输入端接收一幅大小为h
×w×
3的红外图像,第2个rsenet50骨干网络的第一层的输出端输出的特征图记为ft1,第2个resnet50骨干网络的第二层的输入端接收ft1,第2个rsenet50骨干网络的第二层的输出端输出的特征图记为ft2,第2个resnet50骨干网络的第三层的输入端接收ft2,第2个rsenet50骨干网络的第三层的输出端输出的特征图记为ft3,第2个resnet50骨干网络的第四层的输入端接收ft3,第2个rsenet50骨干网络的第四层的输出端输出的特征图记为ft4,第2个resnet50骨干网络的第五层的输入端接收ft4,第2个
rsenet50骨干网络的第五层的输出端输出的特征图记为ft5;其中,resnet50骨干网络为已有的结构框架,其网络结构已公开,如文献k.he,x.zhang,s.ren and j.sun,"deep residual learning for image recognition,"2016ieee conference on computer vision and pattern recognition(cvpr),pp.770-778,2016.(“基于深度残差学习的图像识别”)中有记载,resnet50骨干网络共有五层,fr1和ft1的大小为fr2和ft2的大小为fr3和ft3的大小为fr4和ft4的大小为fr5和ft5的大小为在本实施例中取h
×
w为256
×
256。
40.非对称特征互补模块由彩色可见光特征互补模块和红外特征互补模块构成。彩色可见光特征互补模块包括结构相同的五个彩色可见光特征互补块;第1个彩色可见光特征互补块的第一输入端接收fr1、第二输入端接收ft1,第1个彩色可见光特征互补块的输出端输出的特征图记为第2个彩色可见光特征互补块的第一输入端接收fr2、第二输入端接收ft2,第2个彩色可见光特征互补块的输出端输出的特征图记为第3个彩色可见光特征互补块的第一输入端接收fr3、第二输入端接收ft3,第3个彩色可见光特征互补块的输出端输出的特征图记为第4个彩色可见光特征互补块的第一输入端接收fr4、第二输入端接收ft4,第4个彩色可见光特征互补块的输出端输出的特征图记为第5个彩色可见光特征互补块的第一输入端接收fr5、第二输入端接收ft5,第5个彩色可见光特征互补块的输出端输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为红外特征互补模块包括结构相同的五个红外特征互补块;第1个红外特征互补块的第一输入端接收ft1、第二输入端接收fr1,第1个红外特征互补块的输出端输出的特征图记为第2个红外特征互补块的第一输入端接收ft2、第二输入端接收fr2,第2个红外特征互补块的输出端输出的特征图记为第3个红外特征互补块的第一输入端接收ft3、第二输入端接收fr3,第3个红外特征互补块的输出端输出的特征图记为第4个红外特征互补块的第一输入端接收ft4、第二输入端接收fr4,第4个红外特征互补块的输出端输出的特征图记为第5个红外特征互补块的第一输入端接收ft5、第二输入端接收fr5,第5个红外特征互补块的输出端输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为
41.特征选择与融合模块包括五个结构相同的特征选择与融合块;第1个特征选择与
融合块的第一输入端接收第二输入端接收第1个特征选择与融合块的输出端输出的特征图记为第2个特征选择与融合块的第一输入端接收第二输入端接收第2个特征选择与融合块的输出端输出的特征图记为第3个特征选择与融合块的第一输入端接收第二输入端接收第3个特征选择与融合块的输出端输出的特征图记为第4个特征选择与融合块的第一输入端接收第二输入端接收第4个特征选择与融合块的输出端输出的特征图记为第5个特征选择与融合块的第一输入端接收第二输入端接收第5个特征选择与融合块输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为的大小为
42.语义增强解码器包括三个结构相同的语义增强解码块;第1个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第1个语义增强解码块的输出端输出的特征图记为s1,并将s1作为第1幅粗显著性目标图像;第2个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第2个语义增强解码块的输出端输出的特征图记为s2,并将s2作为第2幅粗显著性目标图像;第3个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第3个语义增强解码块的输出端输出的特征图记为s3,并将s3作为第3幅粗显著性目标图像;其中,s1的大小为s2的大小为s3的大小为
43.将第1幅粗显著性目标图像s1、第2幅粗显著性目标图像s2、第3幅粗显著性目标图像s3进行逐元素相加操作并进行上采样操作,将得到的特征图记为sf,并将sf作为最终的显著性目标图像;其中,逐元素相加操作为神经网络中的常规操作,上采样操作的模式为双线性(bilinear),sf的大小为h
×w×
1。
44.在一个具体的实施例中,训练集的构建过程为:选取至少200对原始彩色可见光图像和与其对应的原始红外图像;然后对每幅原始彩色可见光图像和与其对应的原始红外图像进行降采样操作,将图像大小降采样为h
×
w;再将所有大小为h
×
w的彩色可见光图像和与其对应的红外图像构成训练集;其中,在该实施例中选取2500对原始彩色可见光图像和与其对应的原始红外图像,h=w=256。
45.在一个具体的实施例中,神经网络训练模型的获得过程为:将训练集中的每对彩色可见光图像和与其对应的红外图像输入到神经网络中进行网络训练,在每轮网络训练结束之前计算损失函数l来优化神经网络,在总共进行150轮网络训练后得到神经网络训练模型;其中,在网络训练的前40轮中在网络训练的后110轮中sf表示神经网络输出的最终的
显著性目标图像,g表示标签图像,sj表示神经网络中得到的第j幅粗显著性目标图像,l
bce
()表示二元交叉熵(bce)损失,l
iou
()表示交并比(iou)损失。
46.在一个具体的实施例中,使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像的过程为:任意选取一对原始彩色可见光图像和与其对应的原始红外图像;然后对该对原始彩色可见光图像和原始红外图像进行降采样操作,将图像大小降采样为h
×
w,并作为测试图像对;再将测试图像对输入到神经网络训练模型中,预测得到测试图像对的显著性目标图像;其中,h=w=256。
47.五个彩色可见光特征互补块的结构相同,只是输入和输出不同,在一个具体的实施例中,如图3所示,彩色可见光特征互补块主要由第1个卷积层至第5个卷积层、第1个batch normalization层(批量归一化层)至第5个batch normalization层、第1个relu激活层至第5个relu激活层组成;对于第i个彩色可见光特征互补块,第1个卷积层的输入端作为第i个彩色可见光特征互补块的第一输入端接收fri,第1个batch normalization层的输入端接收第1个卷积层的输出端输出的特征图,第1个relu激活层的输入端接收第1个batch normalization层的输出端输出的特征图,第1个relu激活层的输出端输出的特征图记为第2个卷积层的输入端作为第i个彩色可见光特征互补块的第二输入端接收fti,第2个batch normalization层的输入端接收第2个卷积层的输出端输出的特征图,第2个relu激活层的输入端接收第2个batch normalization层的输出端输出的特征图,第2个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行通道连接操作(concatenation),并将得到的特征图记为第3个卷积层的输入端接收第3个batch normalization层的输入端接收第3个卷积层的输出端输出的特征图,第3个relu激活层的输入端接收第3个batch normalization层的输出端输出的特征图,第3个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为第4个卷积层的输入端接收第4个batch normalization层的输入端接收第4个卷积层的输出端输出的特征图,第4个relu激活层的输入端接收第4个batch normalization层的输出端输出的特征图,第4个relu激活层的输出端输出的特征图记为第5个卷积层的输入端接收fri,第5个batch normalization层的输入端接收第5个卷积层的输出端输出的特征图,第5个relu激活层的输入端接收第5个batch normalization层的输出端输出的特征图,第5个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为即为第i个彩色可见光特征互补块的输出端输出的特征图;其中,1≤i≤5,fri表示第1个resnet50骨干网络的第i层的输出端输出的特征图,fti表示第2个resnet50骨干网络的第i层的输出端输出的特征图,第1个卷积层至第5个卷积层均为2d卷积层,第1个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个
卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第2个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第3个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第4个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为
卷积核大小为3
×
3、滑动步长为1、自动填充为1;第5个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1。
48.在此,元素相乘操作、元素相加操作、元素相减操作、通道连接操作(concatenation)均为神经网络中的常规操作;图3中bn层为batch normalization层的简写。
49.五个红外特征互补块的结构相同,只是输入和输出不同,在一个具体的实施例中,如图4所示,红外特征互补块主要由第6个卷积层至第9个卷积层、第6个batch normalization层至第9个batch normalization层、第6个relu激活层至第9个relu激活层、第1个空间注意力层组成;对于第i个红外特征互补块,第6个卷积层的输入端作为第i个红外特征互补块的第一输入端接收fti,第6个batch normalization层的输入端接收第6个卷积层的输出端输出的特征图,第6个relu激活层的输入端接收第6个batch normalization层的输出端输出的特征图,第6个relu激活层的输出端输出的特征图记为ft
i2_1
,第7个卷积层的输入端作为第i个红外特征互补块的第二输入端接收fri,第7个batch normalization层的输入端接收第7个卷积层的输出端输出的特征图,第7个relu激活层的输入端接收第7个batch normalization层的输出端输出的特征图,第7个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行通道连接操作(concatenation),并将得到的特征图记为第8个卷积层的输入端接收第8个batch normalization层的输入端接收第8个卷积层的输出端输出的特征图,第8个relu激活层的输入端接收第8个batch normalization层的输出端输出的特征图,第8个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为第9个卷积层的输入端接收第9个batch normalization层的输入端接收第9个卷积层的输出端输出的特征图,第9个relu激活层的输入端接收第9个batch normalization层的输出端输出的特征图,第9个relu激活层的输出端输出的特征图记为第1个空间注意力层的输入端接收fri,第1个空间注意力层的输出端输出的特征图记为对和进行元素相乘操作,并将得到
的特征图记为即为第i个红外特征互补块的输出端输出的特征图;其中,1≤i≤5,fri表示第1个resnet50骨干网络的第i层的输出端输出的特征图,fti表示第2个resnet50骨干网络的第i层的输出端输出的特征图,第6个卷积层至第9个卷积层均为2d卷积层,第1个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第2个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第3个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第4个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第5个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为
卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1。
50.在此,元素相乘操作、元素相加操作、元素相减操作、通道连接操作(concatenation)均为神经网络中的常规操作;图4中bn层为batch normalization层的简写。在此,空间注意力层为神经网络中已有的模块,在很多文献中有公开使用,如文献s.woo,j.park,j.-y.lee,and i.s.kweon,“cbam:convolutional block attention module,”in proc.of european conference on computer vision,pp.3-19,sep.2018(“cbam:卷积块的注意力模块”)中有记载。
51.五个特征选择与融合块的结构相同,只是输入和输出不同,在一个具体的实施例中,如图5和图6所示,特征选择与融合块主要由第1个平均池化层、第2个平均池化层、第1个最大池化层、第2个最大池化层、第1个全连接层、第2个全连接层、第1个sigmoid激活层、第2个sigmoid激活层、第10个卷积层至第19个卷积层、第10个batch normalization层至第17个batch normalization层、第10个relu激活层至第12个relu激活层、第1个prelu激活层至第6个prelu激活层组成;对于第i个特征选择与融合块,第1个平均池化层和第1个最大池化层各自的输入端均作为第i个特征选择与融合块的第一输入端接收第1个平均池化层的输出端输出的特征图记为第1个最大池化层的输出端输出的特征图记为第2个平均池化层和第2个最大池化层各自的输入端均作为第i个特征选择与融合块的第二输入端接收第2个最大池化层的输出端输出的特征图记为第2个平均池化层的输出端输出的特征图记为对和进行通道连接操作(concatenation),并将得到的特征图记为对和进行通道连接操作(concatenation),并将得到的特征图记为第1个全连接层的输入端接收第1个全连接层的输出端输出的特征图记为第2个全连接层的输入端接收第2个全连接层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图作为第1个sigmoid激活层的输入,将对第1个sigmoid激活层的输出端输出的特征图进行通道分割后输出的特征图分别记为和对和进行逐通道相乘操作,并将得到的特征图记为对和进行逐通道相乘操作,并将得到的特征图记为第10个卷积层的输入端接收第10个batch normalization层的输入端接收第10个卷积层的输出端输出的特征图,第1个prelu激活层的输入端接收第10个batch normalization层的输出端输出的特征图,第1个prelu激活层的输出端输出的特征图记为第11个卷积层的输入端接收第11个batch normalization层的输入端接收第11个卷积层的输出
端输出的特征图,第2个prelu激活层的输入端接收第11个batch normalization层的输出端输出的特征图,第2个prelu激活层的输出端输出的特征图记为第12个卷积层的输入端接收第12个batch normalization层的输入端接收第12个卷积层的输出端输出的特征图,第3个prelu激活层的输入端接收第12个batch normalization层的输出端输出的特征图,第3个prelu激活层的输出端输出的特征图记为第13个卷积层的输入端接收第13个batch normalization层的输入端接收第13个卷积层的输出端输出的特征图,第4个prelu激活层的输入端接收第13个batch normalization层的输出端输出的特征图,第4个prelu激活层的输出端输出的特征图记为第14个卷积层的输入端接收第14个batch normalization层的输入端接收第14个卷积层的输出端输出的特征图,第5个prelu激活层的输入端接收第14个batch normalization层的输出端输出的特征图,第5个prelu激活层的输出端输出的特征图记为第15个卷积层的输入端接收第15个batch normalization层的输入端接收第15个卷积层的输出端输出的特征图,第6个prelu激活层的输入端接收第15个batch normalization层的输出端输出的特征图,第6个prelu激活层的输出端输出的特征图记为对和进行通道连接操作(concatenation),并将得到的特征图记为对和进行通道连接操作(concatenation),并将得到的特征图记为第16个卷积层的输入端接收第16个batch normalization层的输入端接收第16个卷积层的输出端输出的特征图,第10个relu激活层的输入端接收第16个batch normalization层的输出端输出的特征图,第10个relu激活层的输出端输出的特征图记为第17个卷积层的输入端接收第17个batch normalization层的输入端接收第17个卷积层的输出端输出的特征图,第11个relu激活层的输入端接收第17个batch normalization层的输出端输出的特征图,第11个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对进行通道连接操作(concatenation),并将得到的特征图记为第18个卷积层的输入端接收第12个relu激活层的输入端接收第18个卷积层的输出端输出的特征图,第19个卷积层的输入端接收第12个relu激活层的输出端输出的特征图,第19个卷积层的输出端输出的特征图记为第2个sigmoid激活层的输入端接收第2个sigmoid激活层的输出端输出的特征图进行通道分割后得到的特征图分别记为和对和进行元素相乘操作,并将得到的特征图记为对和进行元素相乘操
作,并将得到的特征图记为对和进行元素相加操作,并将得到的特征图记为即为第i个特征选择与融合块的输出端输出的特征图;其中,1≤i≤5,表示第i个红外特征互补块的输出端输出的特征图,表示第i个彩色可见光特征互补块的输出端输出的特征图,第10个卷积层至第19个卷积层均为2d卷积层,第1个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第2个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
512、中间隐藏层的尺寸为1
×1×
256、输出尺寸为1
×1×
512,和的尺寸为1
×1×
256,第10个卷积层的输入尺寸为输出尺寸为卷积
核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第3个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺
寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第4个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第5个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为
52.在此,通道连接操作(concatenation)、元素相加操作、元素相乘操作、元素相减操
作、逐通道相乘操作、通道分割均为神经网络中的常规操作,其中,通道分割是把一个三维的特征图在通道维度上拆分成两个特征图,它们的高度和宽度与原特征图相同,它们的通道数之和等于原特征图的通道数;逐通道相乘中,两个特征图的宽度、高度不同但通道数相同,其中一个特征图的宽度和高度均为1,逐通道相乘相当于将该特征在每一个通道上进行复制,使其与另一个特征大小相同后再进行逐元素相乘;图6中bn层为batch normalization层的简写。
53.三个语义增强解码块的结构相同,只是输入和输出不同,在一个具体的实施例中,如图7所示,所述的语义增强解码块主要由第20个卷积层至第29个卷积层、第18个batch normalization层至第23个batch normalization层、第13个relu激活层至第19个relu激活层、第3个sigmoid激活层、transformer层、第2个空间注意力层、第1个通道注意力层、第2个通道注意力层、第1个上采样层至第3个上采样层组成;对于第j个语义增强解码块,第20个卷积层的输入端作为第j个语义增强解码块的第一输入端接收第18个batch normalization层的输入端接收第20个卷积层的输出端输出的特征图,第13个relu激活层的输入端接收第18个batch normalization层的输出端输出的特征图,第1个上采样层的输入端接收第13个relu激活层的输出端输出的特征图,第21个卷积层的输入端接收第1个上采样层的输出端输出的特征图,第19个batch normalization层的输入端接收第21个卷积层的输出端输出的特征图,第14个relu激活层的输入端接收第19个batch normalization层的输出端输出的特征图,transformer层的输入端接收第14个relu激活层的输出端输出的特征图,transformer层的输出端输出的特征图记为第2个空间注意力层的输入端接收第2个上采样层的输入端接收第2个空间注意力层的输出端输出的特征图,第2个上采样层的输出端输出的特征图记为第j个语义增强解码块的第二输入端接收对与进行元素相乘操作,并将得到的特征图记为第22个卷积层的输入端接收第20个batch normalization层的输入端接收第22个卷积层的输出端输出的特征图,第15个relu激活层的输入端接收第20个batch normalization层的输出端输出的特征图,第3个上采样层的输入端接收第15个relu激活层的输出端输出的特征图,第23个卷积层的输入端接收第3个上采样层的输出端输出的特征图,第21个batch normalization层的输入端接收第23个卷积层的输出端输出的特征图,第16个relu激活层的输入端接收第21个batch normalization层的输出端输出的特征图,第16个relu激活层的输出端输出的特征图记为对和进行通道拼接操作,并将得到的特征图记为第1个通道注意力层的输入端接收第24个卷积层的输入端接收第1个通道注意力层的输出端输出的特征图,第25个卷积层的输入端接收第24个卷积层的输出端输出的特征图,第22个batch normalization层的输入端接收第25个卷积层的输出端输出的特征图,第17个relu激活层的输入端接收第22个batch normalization层的输出端输出的特征图,第26个卷积层的输入端接收第17个relu激活层的输出端输出的特征图,第23个batch normalization层的输入端接收第26个卷积层的输出端输出的特征图,第18个relu激活层的输入端接收第23个batch normalization层的输出端输出的特征图,第18个
relu激活层的输出端输出的特征图记为第j个语义增强解码块的第一输入端接收对与进行元素相乘操作,并将得到的特征图记为对和进行通道拼接操作,并将得到的特征图记为第2个通道注意力层的输入端接收第27个卷积层的输入端接收第2个通道注意力层的输出端输出的特征图,第27个卷积层的输出端输出的特征图记为第28个卷积层的输入端接收第19个relu激活层的输入端接收第28个卷积层的输出端输出的特征图,第29个卷积层的输入端接收第19个relu激活层的输出端输出的特征图,第3个sigmoid激活层的输入端接收第29个卷积层的输出端输出的特征图,第3个sigmoid激活层的输出端输出的特征图记为sj,sj即为第j个语义增强解码块的输出端输出的特征图;其中,1≤j≤3,表示第j+2个特征选择与融合块的输出端输出的特征图,第20个卷积层至第29个卷积层均为2d卷积层,第1个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动
填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),transformer层的输入尺寸为输出尺寸为第2个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),第3个上采样层的输出特征尺寸
固定为通道数不变、模式为双线性插值(bilinear),transformer层的输入尺寸为输出尺寸为第3个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值(bilinear),transformer层的输入尺寸为输出尺寸为
54.在此,元素相乘操作、通道拼接操作均为神经网络中的常规操作;图7中bn层为
batch normalization层的简写。在此,空间注意力层和通道注意力层为神经网络中已有的模块,在很多文献中有公开使用,如文献s.woo,j.park,j.-y.lee,and i.s.kweon,“cbam:convolutional block attention module,”in proc.of european conference on computer vision,pp.3-19,sep.2018(“cbam:卷积块的注意力模块”)中有记载。在此,transformer层为神经网络中已有的模块,在很多文献中有公开使用,如文献z.liu,y.wang,z.tu,y.xiao,and b.tang,“tritransnet:rgb-d salient object detection with atriplet transformer embedding network,”arxiv preprint arxiv:2108.03990,2021(“tritransnet:使用三重transformer编码器的rgb-d显著目标检测”)中有记载。
55.为了进一步说明本发明方法的可行性和有效性,对本发明方法进行试验。
56.在本实施例中,采用本发明方法对安徽大学建立的彩色可见光与红外图像显著目标检测数据集(vt5000)进行测试。vt5000中的训练集包括2500对彩色可见光图像和红外图像,vt5000中的测试集总共有2500对彩色可见光图像和红外图像,即2500对测试图像对。
57.在本实施例中,选用4个常用的客观参量来评估本发明方法的性能,它们分别是s-measure、e-measure、f-measure、mean absolute error(mae)。表1给出了在vt5000数据集上采用本发明方法得到的显著性目标图像与标签图像之间的相关性。
58.表1采用本发明方法在vt5000数据集上得到的显著性目标图像与标签图像之间的s-measure、e-measure、f-measure、mean absolute error(mae)
[0059] s-measuree-measuref-measuremae本发明方法0.8990.9430.8730.027
[0060]
从表1中给出的结果可以发现,本发明方法在现有的彩色可见光与红外图像显著目标检测数据集上取得了较高的s-measure、e-measure、f-measure和较低的mae,这说明本发明方法取得的显著性目标图像和标签图像之间较为接近,本发明方法可以有效地完成彩色可见光与红外图像的显著性目标检测。
技术特征:
1.一种彩色可见光与红外图像显著性目标检测方法,该方法首先构建一个包含数对彩色可见光图像和与其对应的红外图像的训练集,并搭建一个神经网络;其次将训练集中的数对彩色可见光图像和与其对应的红外图像输入到神经网络中进行多轮网络训练,网络训练结束后得到神经网络训练模型;再次使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像,其特征在于:所述的神经网络主要由特征提取模块、非对称特征互补模块、特征选择与融合模块、语义增强解码器构成,其中:所述的特征提取模块包括两个resnet50骨干网路;第1个resnet50骨干网络的第一层的输入端接收一幅大小为h
×
w
×
3的彩色可见光图像,第1个rsenet50骨干网络的第一层的输出端输出的特征图记为fr1,第1个resnet50骨干网络的第二层的输入端接收fr1,第1个rsenet50骨干网络的第二层的输出端输出的特征图记为fr2,第1个resnet50骨干网络的第三层的输入端接收fr2,第1个rsenet50骨干网络的第三层的输出端输出的特征图记为fr3,第1个resnet50骨干网络的第四层的输入端接收fr3,第1个rsenet50骨干网络的第四层的输出端输出的特征图记为fr4,第1个resnet50骨干网络的第五层的输入端接收fr4,第1个rsenet50骨干网络的第五层的输出端输出的特征图记为fr5;第2个resnet50骨干网络的第一层的输入端接收一幅大小为h
×
w
×
3的红外图像,第2个rsenet50骨干网络的第一层的输出端输出的特征图记为ft1,第2个resnet50骨干网络的第二层的输入端接收ft1,第2个rsenet50骨干网络的第二层的输出端输出的特征图记为ft2,第2个resnet50骨干网络的第三层的输入端接收ft2,第2个rsenet50骨干网络的第三层的输出端输出的特征图记为ft3,第2个resnet50骨干网络的第四层的输入端接收ft3,第2个rsenet50骨干网络的第四层的输出端输出的特征图记为ft4,第2个resnet50骨干网络的第五层的输入端接收ft4,第2个rsenet50骨干网络的第五层的输出端输出的特征图记为ft5;其中,resnet50骨干网络共有五层,fr1和ft1的大小为fr2和ft2的大小为fr3和ft3的大小为fr4和ft4的大小为fr5和ft5的大小为所述的非对称特征互补模块由彩色可见光特征互补模块和红外特征互补模块构成;所述的彩色可见光特征互补模块包括结构相同的五个彩色可见光特征互补块;第1个彩色可见光特征互补块的第一输入端接收fr1、第二输入端接收ft1,第1个彩色可见光特征互补块的输出端输出的特征图记为第2个彩色可见光特征互补块的第一输入端接收fr2、第二输入端接收ft2,第2个彩色可见光特征互补块的输出端输出的特征图记为第3个彩色可见光特征互补块的第一输入端接收fr3、第二输入端接收ft3,第3个彩色可见光特征互补块的输出端输出的特征图记为第4个彩色可见光特征互补块的第一输入端接收fr4、第二输入端接收ft4,第4个彩色可见光特征互补块的输出端输出的特征图记为第5个彩色可见光特征互补块的第一输入端接收fr5、第二输入端接收ft5,第5个彩色可见光特征互补块的输出端输出的特征图记为其中,的大小为的大小为的大小为为的大小为的大小为的大小为的大小为的大小为
所述的红外特征互补模块包括结构相同的五个红外特征互补块;第1个红外特征互补块的第一输入端接收ft1、第二输入端接收fr1,第1个红外特征互补块的输出端输出的特征图记为第2个红外特征互补块的第一输入端接收ft2、第二输入端接收fr2,第2个红外特征互补块的输出端输出的特征图记为第3个红外特征互补块的第一输入端接收ft3、第二输入端接收fr3,第3个红外特征互补块的输出端输出的特征图记为第4个红外特征互补块的第一输入端接收ft4、第二输入端接收fr4,第4个红外特征互补块的输出端输出的特征图记为第5个红外特征互补块的第一输入端接收ft5、第二输入端接收fr5,第5个红外特征互补块的输出端输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为的大小为的大小为的大小为的大小为所述的特征选择与融合模块包括五个结构相同的特征选择与融合块;第1个特征选择与融合块的第一输入端接收第二输入端接收第1个特征选择与融合块的输出端输出的特征图记为第2个特征选择与融合块的第一输入端接收第二输入端接收第2个特征选择与融合块的输出端输出的特征图记为第3个特征选择与融合块的第一输入端接收第二输入端接收第3个特征选择与融合块的输出端输出的特征图记为第4个特征选择与融合块的第一输入端接收第二输入端接收第4个特征选择与融合块的输出端输出的特征图记为第5个特征选择与融合块的第一输入端接收第二输入端接收第5个特征选择与融合块输出的特征图记为其中,的大小为的大小为的大小为的大小为的大小为的大小为的大小为的大小为的大小为所述的语义增强解码器包括三个结构相同的语义增强解码块;第1个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第1个语义增强解码块的输出端输出的特征图记为s1,并将s1作为第1幅粗显著性目标图像;第2个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第2个语义增强解码块的输出端输出的特征图记为s2,并将s2作为第2幅粗显著性目标图像;第3个语义增强解码块的第一输入端接收第二输入端接收第三输入端接收第3个语义增强解码块的输出端输出的特征图记为s3,并将s3作为第3幅粗显著性目标图像;其中,s1的大小为s2的大小为s3的大小为
将第1幅粗显著性目标图像s1、第2幅粗显著性目标图像s2、第3幅粗显著性目标图像s3进行逐元素相加操作并进行上采样操作,将得到的特征图记为s
f
,并将s
f
作为最终的显著性目标图像;其中,上采样操作的模式为双线性,s
f
的大小为h
×
w
×
1。2.根据权利要求1所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:训练集的构建过程为:选取至少200对原始彩色可见光图像和与其对应的原始红外图像;然后对每幅原始彩色可见光图像和与其对应的原始红外图像进行降采样操作,将图像大小降采样为h
×
w;再将所有大小为h
×
w的彩色可见光图像和与其对应的红外图像构成训练集。3.根据权利要求2所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:神经网络训练模型的获得过程为:将训练集中的每对彩色可见光图像和与其对应的红外图像输入到神经网络中进行网络训练,在每轮网络训练结束之前计算损失函数l来优化神经网络,在总共进行150轮网络训练后得到神经网络训练模型;其中,在网络训练的前40轮中在网络训练的后110轮中s
f
表示神经网络输出的最终的显著性目标图像,g表示标签图像,s
j
表示神经网络中得到的第j幅粗显著性目标图像,l
bce
()表示二元交叉熵损失,l
iou
()表示交并比损失。4.根据权利要求3所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像的过程为:任意选取一对原始彩色可见光图像和与其对应的原始红外图像;然后对该对原始彩色可见光图像和原始红外图像进行降采样操作,将图像大小降采样为h
×
w,并作为测试图像对;再将测试图像对输入到神经网络训练模型中,预测得到测试图像对的显著性目标图像。5.根据权利要求1至4中任一项所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:彩色可见光特征互补块主要由第1个卷积层至第5个卷积层、第1个batch normalization层至第5个batch normalization层、第1个relu激活层至第5个relu激活层组成;对于第i个彩色可见光特征互补块,第1个卷积层的输入端作为第i个彩色可见光特征互补块的第一输入端接收fr
i
,第1个batch normalization层的输入端接收第1个卷积层的输出端输出的特征图,第1个relu激活层的输入端接收第1个batch normalization层的输出端输出的特征图,第1个relu激活层的输出端输出的特征图记为第2个卷积层的输入端作为第i个彩色可见光特征互补块的第二输入端接收ft
i
,第2个batch normalization层的输入端接收第2个卷积层的输出端输出的特征图,第2个relu激活层的输入端接收第2个batch normalization层的输出端输出的特征图,第2个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第3个卷积层的输入端接收第3个batch normalization层的输入端接收第3个卷积层的输出端输出的特征图,
第3个relu激活层的输入端接收第3个batch normalization层的输出端输出的特征图,第3个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为第4个卷积层的输入端接收第4个batch normalization层的输入端接收第4个卷积层的输出端输出的特征图,第4个relu激活层的输入端接收第4个batch normalization层的输出端输出的特征图,第4个relu激活层的输出端输出的特征图记为第5个卷积层的输入端接收fr
i
,第5个batch normalization层的输入端接收第5个卷积层的输出端输出的特征图,第5个relu激活层的输入端接收第5个batch normalization层的输出端输出的特征图,第5个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为即为第i个彩色可见光特征互补块的输出端输出的特征图;其中,1≤i≤5,fr
i
表示第1个resnet50骨干网络的第i层的输出端输出的特征图,ft
i
表示第2个resnet50骨干网络的第i层的输出端输出的特征图,第1个卷积层至第5个卷积层均为2d卷积层,第1个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第2个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第3个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填
充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第4个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1;第5个彩色可见光特征互补块中:第1个卷积层和第2个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第3个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第4个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1,第5个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1。6.根据权利要求1至4中任一项所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:红外特征互补块主要由第6个卷积层至第9个卷积层、第6个batch normalization层至第9个batch normalization层、第6个relu激活层至第9个relu激活层、第1个空间注意力层组成;对于第i个红外特征互补块,第6个卷积层的输入端作为第i个红外特征互补块的第一输入端接收ft
i
,第6个batch normalization层的输入端接收第6个卷积层的输出端输出的特征图,第6个relu激活层的输入端接收第6个batch normalization层的输出端输出的特征图,第6个relu激活层的输出端输出的特征图记为第7个卷积层的输入端作为第i个红外特征互补块的第二输入端接收fr
i
,第7个batch normalization层的输入端接收第7个卷积层的输出端输出的特征图,第7个relu激活层的输入端接收第7个batch normalization层的输出端输出的特征图,第7个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对
和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第8个卷积层的输入端接收第8个batch normalization层的输入端接收第8个卷积层的输出端输出的特征图,第8个relu激活层的输入端接收第8个batch normalization层的输出端输出的特征图,第8个relu激活层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图记为第9个卷积层的输入端接收第9个batch normalization层的输入端接收第9个卷积层的输出端输出的特征图,第9个relu激活层的输入端接收第9个batch normalization层的输出端输出的特征图,第9个relu激活层的输出端输出的特征图记为第1个空间注意力层的输入端接收fr
i
,第1个空间注意力层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为图记为即为第i个红外特征互补块的输出端输出的特征图;其中,1≤i≤5,fr
i
表示第1个resnet50骨干网络的第i层的输出端输出的特征图,ft
i
表示第2个resnet50骨干网络的第i层的输出端输出的特征图,第6个卷积层至第9个卷积层均为2d卷积层,第1个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第2个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第3个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为
输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第4个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1;第5个红外特征互补块中:第6个卷积层和第7个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第8个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第9个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1。7.根据权利要求1至4中任一项所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:特征选择与融合块主要由第1个平均池化层、第2个平均池化层、第1个最大池化层、第2个最大池化层、第1个全连接层、第2个全连接层、第1个sigmoid激活层、第2个sigmoid激活层、第10个卷积层至第19个卷积层、第10个batch normalization层至第17个batch normalization层、第10个relu激活层至第12个relu激活层、第1个prelu激活层至第6个prelu激活层组成;对于第i个特征选择与融合块,第1个平均池化层和第1个最大池化层各自的输入端均作为第i个特征选择与融合块的第一输入端接收第1个平均池化层的输出端输出的特征图记为第1个最大池化层的输出端输出的特征图记为第2个平均池化层和第2个最大池化层各自的输入端均作为第i个特征选择与融合块的第二输入端接收第2个最大池化层的输出端输出的特征图记为第2个平均池化层的输出端输出的特征图记为对和进行通道连接操作,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第1个全连接层的输入端接收第1个全连接层的输出端输出的特征图记为第2个全连接层的输入端接收第2个全连接层的输出端输出的特征图记为对和进行元素相加操作,并将得到的特征图作为第1个sigmoid激活层的输入,将对第1个sigmoid激活层的输出端输出的特征图进行通道分割后输出的特征图分别记为和对
和进行逐通道相乘操作,并将得到的特征图记为对和进行逐通道相乘操作,并将得到的特征图记为第10个卷积层的输入端接收第10个batch normalization层的输入端接收第10个卷积层的输出端输出的特征图,第1个prelu激活层的输入端接收第10个batch normalization层的输出端输出的特征图,第1个prelu激活层的输出端输出的特征图记为第11个卷积层的输入端接收第11个batch normalization层的输入端接收第11个卷积层的输出端输出的特征图,第2个prelu激活层的输入端接收第11个batch normalization层的输出端输出的特征图,第2个prelu激活层的输出端输出的特征图记为第12个卷积层的输入端接收第12个batch normalization层的输入端接收第12个卷积层的输出端输出的特征图,第3个prelu激活层的输入端接收第12个batch normalization层的输出端输出的特征图,第3个prelu激活层的输出端输出的特征图记为第13个卷积层的输入端接收第13个batch normalization层的输入端接收第13个卷积层的输出端输出的特征图,第4个prelu激活层的输入端接收第13个batch normalization层的输出端输出的特征图,第4个prelu激活层的输出端输出的特征图记为第14个卷积层的输入端接收第14个batch normalization层的输入端接收第14个卷积层的输出端输出的特征图,第5个prelu激活层的输入端接收第14个batch normalization层的输出端输出的特征图,第5个prelu激活层的输出端输出的特征图记为第15个卷积层的输入端接收第15个batch normalization层的输入端接收第15个卷积层的输出端输出的特征图,第6个prelu激活层的输入端接收第15个batch normalization层的输出端输出的特征图,第6个prelu激活层的输出端输出的特征图记为对和进行通道连接操作,并将得到的特征图记为对和进行通道连接操作,并将得到的特征图记为第16个卷积层的输入端接收第16个batch normalization层的输入端接收第16个卷积层的输出端输出的特征图,第10个relu激活层的输入端接收第16个batch normalization层的输出端输出的特征图,第10个relu激活层的输出端输出的特征图记为第17个卷积层的输入端接收第17个batch normalization层的输入端接收第17个卷积层的输出端输出的特征图,第11个relu激活层的输入端接收第17个batch normalization层的输出端输出的特征图,第11个relu激活层的输出端输出的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对和进行元素相减操作,其中作为被减特征,并将得到的特征图记为对进行通道连接操作,并将得到的特征图记为第18个卷积层的输入端接收第12个relu激活层的输入端接收第18个卷积层的输出端输出的特征图,第19个卷积层的输入端接收第12个relu激活层的输出端输出
的特征图,第19个卷积层的输出端输出的特征图记为第2个sigmoid激活层的输入端接收第2个sigmoid激活层的输出端输出的特征图进行通道分割后得到的特征图分别记为和对和进行元素相乘操作,并将得到的特征图记为对和进行元素相乘操作,并将得到的特征图记为对和进行元素相加操作,并将得到的特征图记为即为第i个特征选择与融合块的输出端输出的特征图;其中,1≤i≤5,表示第i个红外特征互补块的输出端输出的特征图,表示第i个彩色可见光特征互补块的输出端输出的特征图,第10个卷积层至第19个卷积层均为2d卷积层,第1个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第2个特征选择与融合块中:第1个全连接层和第
2个全连接层的输入尺寸为1
×1×
512、中间隐藏层的尺寸为1
×1×
256、输出尺寸为1
×1×
512,和的尺寸为1
×1×
256,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第3个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个
卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第4个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为
输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为第5个特征选择与融合块中:第1个全连接层和第2个全连接层的输入尺寸为1
×1×
128、中间隐藏层的尺寸为1
×1×
64、输出尺寸为1
×1×
128,和的尺寸为1
×1×
64,第10个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第11个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第12个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第13个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第14个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为2、膨胀率为2,第15个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为4、膨胀率为4,第16个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第17个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第18个卷积层的输入尺寸为输出尺寸为
卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第19个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,和的尺寸为8.根据权利要求1至4中任一项所述的彩色可见光与红外图像显著性目标检测方法,其特征在于:所述的语义增强解码块主要由第20个卷积层至第29个卷积层、第18个batch normalization层至第23个batch normalization层、第13个relu激活层至第19个relu激活层、第3个sigmoid激活层、transformer层、第2个空间注意力层、第1个通道注意力层、第2个通道注意力层、第1个上采样层至第3个上采样层组成;对于第j个语义增强解码块,第20个卷积层的输入端作为第j个语义增强解码块的第一输入端接收第18个batch normalization层的输入端接收第20个卷积层的输出端输出的特征图,第13个relu激活层的输入端接收第18个batch normalization层的输出端输出的特征图,第1个上采样层的输入端接收第13个relu激活层的输出端输出的特征图,第21个卷积层的输入端接收第1个上采样层的输出端输出的特征图,第19个batch normalization层的输入端接收第21个卷积层的输出端输出的特征图,第14个relu激活层的输入端接收第19个batch normalization层的输出端输出的特征图,transformer层的输入端接收第14个relu激活层的输出端输出的特征图,transformer层的输出端输出的特征图记为第2个空间注意力层的输入端接收第2个上采样层的输入端接收第2个空间注意力层的输出端输出的特征图,第2个上采样层的输出端输出的特征图记为第j个语义增强解码块的第二输入端接收对与进行元素相乘操作,并将得到的特征图记为第22个卷积层的输入端接收第20个batch normalization层的输入端接收第22个卷积层的输出端输出的特征图,第15个relu激活层的输入端接收第20个batch normalization层的输出端输出的特征图,第3个上采样层的输入端接收第15个relu激活层的输出端输出的特征图,第23个卷积层的输入端接收第3个上采样层的输出端输出的特征图,第21个batch normalization层的输入端接收第23个卷积层的输出端输出的特征图,第16个relu激活层的输入端接收第21个batch normalization层的输出端输出的特征图,第16个relu激活层的输出端输出的特征图记为对和进行通道拼接操作,并将得到的特征图记为第1个通道注意力层的输入端接收第24个卷积层的输入端接收第1个通道注意力层的输出端输出的特征图,第25个卷积层的输入端接收第24个卷积层的输出端输出的特征图,第22个batch normalization层的输入端接收第25个卷积层的输出端输出的特征图,第17个relu激活层的输入端接收第22个batch normalization层的输出端输出的特征图,第26个卷积层的输入端接收第17个relu激活层的输出端输出的特征图,第23个batch normalization层的输入端接收第26个卷积层的输出端输出的特征图,第18个relu激活层的输入端接收第23个batch normalization层的输出端输出的特征图,第18个relu激活层的输出端输出的特征图记为第j个语义增强解码块的第一输入端接收
对与进行元素相乘操作,并将得到的特征图记为对和进行通道拼接操作,并将得到的特征图记为第2个通道注意力层的输入端接收第27个卷积层的输入端接收第2个通道注意力层的输出端输出的特征图,第27个卷积层的输出端输出的特征图记为第28个卷积层的输入端接收第19个relu激活层的输入端接收第28个卷积层的输出端输出的特征图,第29个卷积层的输入端接收第19个relu激活层的输出端输出的特征图,第3个sigmoid激活层的输入端接收第29个卷积层的输出端输出的特征图,第3个sigmoid激活层的输出端输出的特征图记为s
j
,s
j
即为第j个语义增强解码块的输出端输出的特征图;其中,1≤j≤3,表示第j+2个特征选择与融合块的输出端输出的特征图,第20个卷积层至第29个卷积层均为2d卷积层,第1个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性
插值,第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,transformer层的输入尺寸为输出尺寸为第2个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,transformer
层的输入尺寸为输出尺寸为第3个语义增强解码块中:第20个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第21个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第22个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第23个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第24个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第25个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第26个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为1,第27个卷积层的输入尺寸为输出尺寸为卷积核大小为1
×
1、滑动步长为1、自动填充为0、膨胀率为0,第28个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第29个卷积层的输入尺寸为输出尺寸为卷积核大小为3
×
3、滑动步长为1、自动填充为1、膨胀率为1,第1个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第2个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,第3个上采样层的输出特征尺寸固定为通道数不变、模式为双线性插值,transformer层的输入尺寸为输出尺寸为
技术总结
本发明公开了一种彩色可见光与红外图像显著性目标检测方法,其构建一个包含数对彩色可见光图像和与其对应的红外图像的训练集,并搭建一个神经网络,神经网络主要由特征提取模块、非对称特征互补模块、特征选择与融合模块、语义增强解码器构成,非对称特征互补模块由彩色可见光特征互补模块和红外特征互补模块构成;将训练集中的数对彩色可见光图像和与其对应的红外图像输入到神经网络中进行多轮网络训练,网络训练结束后得到神经网络训练模型;使用神经网络训练模型对测试图像对进行预测,预测得到测试图像对的显著性目标图像;优点是其能够有效地提高显著性目标检测的准确度。其能够有效地提高显著性目标检测的准确度。其能够有效地提高显著性目标检测的准确度。
技术研发人员:金东泽 邵枫
受保护的技术使用者:宁波大学
技术研发日:2023.06.29
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
