一种基于特征融合的水下静态小目标检测方法

未命名 07-13 阅读：146 评论：0

1.本发明涉及水下静态目标检测领域，特别涉及一种基于特征融合的水下静态小目标检测方法。

背景技术：

2.水下静态小目标检测是水声领域的热点研究方向之一，它通过自主检测算法对声呐图像进行有效识别与定位，这一研究也被广泛应用于水下打捞与搜救、石油勘探、可疑物探测等诸多方面，无论是对于提高我国国防科技实力还是挖掘海洋资源方面，都有着重要的研究意义与应用价值。
3.大量声呐数据用于水下静态小目标检测时，传统的人工判读方式效率低，不足以满足任务要求，如何实现自主、高效的水下静态小目标检测已成为当前亟需解决的问题之一。
4.由于水下成像环境复杂多变、声呐数据先验样本数较少、目标相较于海底背景较小，难以提取出较具表达力的特征，导致水下静态小目标的检测难度加剧。卷积神经网络(convolutional neural networks，cnn)提取的深度特征是一种具有丰富特征表达的隐式特征，但它用于水下静态小目标检测分类时，其中的多层卷积和池化结构易导致部分底层特征信息丢失，常出现漏检、误检的问题。

技术实现要素：

5.本发明的目的在于为实现自主且准确的水下静态小目标检测，提出了一种基于特征融合的水下静态小目标检测方法。本发明针对水下静态小目标特征以及水下目标检测的任务要求，通过利用目标的浅层形状特征hu矩与cnn深度特征相融合的方式实现目标的自主检测，从而有效提升不同水下环境中静态小目标的检测性能。
6.为达到上述目的，本发明通过下述技术方案实现。
7.本发明提出了一种基于特征融合的水下静态小目标检测方法，所述方法包括：
8.对声呐图像的回波数据依次进行预处理、分割与后处理，得到潜在目标区域；
9.提取潜在目标区域的hu矩特征，并通过卷积神经网络提取潜在目标区域的cnn深度特征；
10.将提取的hu矩特征和cnn深度特征拼接融合得到目标分类结果。
11.作为上述技术方案的改进之一，所述预处理，包括：对声呐回波数据进行区域尺度校正和对声呐图像进行增强；所述后处理包括对分割后的声呐图像进行尺寸约束。
12.作为上述技术方案的改进之一，所述对声呐回波数据进行区域尺度校正，具体包括：
13.按照x
′
ij
＝x
ij
/aj对声呐回波数据进行区域尺度校正，其中，第j列校正因子aj＝b
j-b
min
/b
max-b
min
，bj为第j列均值，b
max
和b
min
分别表示各列均值的最大值和最小值，x
′
ij
是校正后的第i行第j列的强度值，x
ij
为第i行第j列的强度值，x
ij
∈x，x为大小m
×
n的声呐图像
原始回波数据，m、n表示回波数据的宽和高。
14.作为上述技术方案的改进之一，所述对声呐图像进行增强，具体包括：利用分段伽马校正对声呐图像的回波数据进行变换；
15.变换后的回波值i
′
计算如下：
[0016][0017]
其中，γ1表示对cdf》95.44％的回波值进行拉伸的程度，γ2表示对cdf≤95.44％的回波值进行压缩的程度，cdf表示累计分布函数，i1表示cdf＞95.44％的回波值，i2表示cdf≤95.44％的回波值。
[0018]
作为上述技术方案的改进之一，所述对声呐图像进行尺寸约束，具体包括：对分割后的声呐图像中形状尺寸不符合检测要求的区域进行删除，得到筛选后的潜在目标区域。
[0019]
作为上述技术方案的改进之一，所述对分割后的声呐图像中形状尺寸不符合检测要求的区域进行删除，具体为：将分割后的声呐图像中大于a个和小于b个数据点的连通区域去除，a≥2000，b≤500。
[0020]
作为上述技术方案的改进之一，所述分割，具体包括：采用基于potts模型的mrf算法对声呐图像进行分割。
[0021]
作为上述技术方案的改进之一，所述卷积神经网络包括：三个卷积层conv-1、conv-2和conv-3，三个池化层maxpool-1、maxpool-2和maxpool-3，以及三个全连接层fc-1、fc-2和fc-3。
[0022]
作为上述技术方案的改进之一，所述通过卷积神经网络提取潜在目标区域的cnn深度特征，具体包括：
[0023]
通过双线性插值对潜在目标区域进行大小调整后输入卷积神经网络；
[0024]
通过卷积层conv-1和池化层maxpool-1对输入的潜在目标区域进行特征提取，获得第一特征图；
[0025]
通过卷积层conv-2和池化层maxpool-2对第一特征图进行特征提取，获得第二特征图；
[0026]
通过卷积层conv-3和池化层maxpool-3对第二特征图进行特征提取，获得第三特征图；
[0027]
最后通过全连接层fc-1输出cnn深度特征。
[0028]
作为上述技术方案的改进之一，所述将提取的hu矩特征和cnn深度特征拼接融合得到目标分类结果，具体包括：
[0029]
构建全连接层fc-4，并将提取的hu矩特征输入到全连接层fc-4进行维数扩展；
[0030]
将拓展的hu矩特征与cnn深度特征进行拼接融合；
[0031]
将拼接融合后的特征输入全连接层fc-2进行映射；
[0032]
最后通过全连接层fc-3得到目标分类结果。
[0033]
本发明与现有技术相比优点在于：
[0034]
1)第一阶段的区域提取利用预处理、分割与后处理相结合的方式能够将声图中绝大多数目标提取出来，同时最大限度地保留目标的完整性；
[0035]
2)第二阶段的特征融合分类网络将目标低级形状特征hu矩和cnn深度特征进行融
合，形成形状特征表达能力更强的特征融合网络用于分类，有效提高了目标检测的精度；
[0036]
3)本发明适用于不同成像环境下的水下静态小目标检测，具有广泛的应用场景。
附图说明
[0037]
图1是本发明整体流程图；
[0038]
图2是区域提取流程图；
[0039]
图3是特征融合网络的结构。
具体实施方式
[0040]
下面结合附图和实施例对本发明的技术方案进行详细的说明。
[0041]
本发明通过两个阶段对水下静态小目标进行检测，分别是区域提取和潜在目标区域分类。第一阶段通过四个步骤提取潜在目标区域，包括区域尺度校正、声图增强、马尔可夫随机场(markov random field，mrf)分割以及尺度约束；第二阶段结合目标hu矩特征和cnn深度特征形成形状特征表达能力更强的特征融合网络对上一阶段提取的潜在目标区域进行分类。
[0042]
本发明具体技术方案如下：如图1所示，为本发明整体流程图，包括：
[0043]
s1、区域提取：
[0044]
1)区域尺度校正：
[0045]
由于声波在水中进行传播存在一定的衰减，随着接收时间的延长，回波强度逐渐变弱，难以从远场声图中提取潜在目标区域。利用声呐回波强度局部增益变化缓慢这一特征，通过区域尺度校正可以使回波数据分布均匀，从而便于后续的处理。
[0046]
设大小为m
×
n声图的原始回波数据为x＝{x
ij
},i＝1,
…
,m,j＝1,
…
,n，x
ij
为第i行第j列的强度值。按照x
′
ij
＝x
ij
/aj对区域数据进行校正。其中aj＝b
j-b
min
/b
max-b
min
，bj为第j列均值，b
max
和b
min
分别表示各列均值的最大值和最小值。
[0047]
2)声图增强：
[0048]
为将目标与海底进行初步区分，利用分段伽马校正对声图进行增强，根据2sigma法则，累计分布函数(cumulative distribution function，cdf)大于95.44％的回波值可认为不属于海底，则增强后的回波值i
′
计算如下：
[0049][0050]
γ1表示对cdf》95.44％的回波值进行拉伸的程度，γ2表示对cdf≤95.44％的回波值进行压缩的程度，一般情况下，γ1》1，γ2《1；本实施例中，经多次实验验证，γ1＝1.2,γ2＝0.8时更有利于后续分割，i1和i2分别表示cdf大于和小于等于95.44％的回波值。
[0051]
3)mrf分割：
[0052]
利用基于potts模型的mrf算法对声图进行分割，设置迭代次数为1，标签类别数为2。
[0053]
4)尺寸约束：
[0054]
依据目标形状尺寸的先验知识，对分割后的声图中形状尺寸不符合检测要求的区域进行删除，经多次实验，将分割后声图中大于2000个和小于500个数据点的连通区域去
除，得到筛选后的潜在目标区域。如图2所示，为区域提取流程图。
[0055]
s2、潜在目标区域分类：
[0056]
该阶段通过构建的特征融合分类网络对潜在目标区域进行分类。分类网络在基础cnn的架构上，通过提取潜在目标区域的七维hu矩特征并在特征融合网络后端进行拼接融合，得到分类结果。其中基础cnn由三个卷积层、三个池化层、三个全连接层构成。分类具体步骤如下：
[0057]
1)基础cnn特征提取：
[0058]
潜在目标区域首先通过双线性插值将大小调整为64*64，从而适应网络的输入，然后通过卷积层conv-1和池化层maxpool-1得到32*32的特征图，再通过conv-2和maxpool-2网络层得到16*16的特征图，接着通过conv-3和maxpool-3网络层得到8*8的特征图，最后经过全连接层fc-1输出256维cnn深度特征，其中的卷积核大小均为3*3，步长为1，池化层的核大小均为2，激活函数均为relu函数。
[0059]
2)hu矩特征提取：
[0060]
提取潜在目标区域的hu矩特征，具体包括：
[0061]
设f(x,y),(x＝1,
…
,m,y＝1,
…
,n)为大小m
×
n的声呐图像在(x,y)处的回波值，则它的p+q阶几何矩定义为：
[0062][0063]
通过几何矩m
pq
构建p+q阶中心矩μ
pq
，如下式所示：
[0064][0065]
其中，(x0,y0)是声呐图像的重心坐标，x0＝m
10
/m
00
，y0＝m
01
/m
00
。
[0066]
该声呐图像的p+q阶归一化中心矩η
pq
定义为：
[0067][0068]
其中，
[0069]
通过归一化中心矩η
pq
的多种线性组合，可计算出7个hu矩，如下式所示：
[0070]
h1＝η
20
+η
02
[0071][0072]
h3＝(η
30-3η
12
)2+(3η
21-η
03
)2[0073]
h4＝(η
30
+η
12
)2+(η
21
+η
03
)2[0074]
h5＝(η
30-3η
12
)(η
30
+η
12
)[(η
30
+η
12
)
2-3(η
21
+η
03
)2]+(3η
21-η
03
)(η
21
+η
03
)[3(η
30
+η
12
)
2-(η
21
+η
03
)2]
[0075]
h6＝(η
20-η
02
)[(η
30
+η
12
)
2-(η
21
+η
03
)2]+4η
11
(η
30
+η
12
)(η
21
+η
03
)
[0076]
h7＝(3η
21-η
03
)(η
30
+η
12
)[(η
30
+η
12
)
2-3(η
21
+η
03
)2]-(η
30-3η
12
)(η
21
+η
03
)[3(η
30
+η
12
)
2-(η
21
+η
03
)2]
[0077]
上述7个hu矩构成了目标的hu特征向量h＝(h1,h2,h3,h4,h5,h6,h7)。
[0078]
将提取的原始潜在目标区域的七维hu矩特征输入全连接层fc-4进行拓展，得到48维特征向量。
[0079]
3)特征融合与分类：
[0080]
拓展的48维hu矩特征与256维cnn深度特征在分类网络后端进行拼接融合，形成304维融合特征，输入全连接层fc-2映射成128维，最后通过全连接层fc-3得到目标分类结果。如图3所示，为特征融合网络的结构。
[0081]
最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

技术特征：
1.一种基于特征融合的水下静态小目标检测方法，所述方法包括：对声呐图像的回波数据依次进行预处理、分割与后处理，得到潜在目标区域；提取潜在目标区域的hu矩特征，并通过卷积神经网络提取潜在目标区域的cnn深度特征；将提取的hu矩特征和cnn深度特征拼接融合得到目标分类结果。2.根据权利要求1所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述预处理，包括：对声呐回波数据进行区域尺度校正和对声呐图像进行增强；所述后处理包括对分割后的声呐图像进行尺寸约束。3.根据权利要求2所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述对声呐回波数据进行区域尺度校正，具体包括：按照x
′
ij
＝x
ij
/a
j
对声呐回波数据进行区域尺度校正，其中，第j列校正因子a
j
＝b
j-b
min
/b
max-b
min
，b
j
为第j列均值，b
max
和b
min
分别表示各列均值的最大值和最小值，x
′
ij
是校正后的第i行第j列的强度值，x
ij
为第i行第j列的强度值，x
ij
∈x，x为声呐图像原始回波数据。4.根据权利要求2所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述对声呐图像进行增强，具体包括：利用分段伽马校正对声呐图像的回波数据进行变换；变换后的回波值i
′
计算如下：其中，γ1表示对cdf>95.44％的回波值进行拉伸的程度，γ2表示对cdf≤95.44％的回波值进行压缩的程度，cdf表示累计分布函数，i1表示cdf＞95.44％的回波值，i2表示cdf≤95.44％的回波值。5.根据权利要求2所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述对声呐图像进行尺寸约束，具体包括：对分割后的声呐图像中形状尺寸不符合检测要求的区域进行删除，得到筛选后的潜在目标区域。6.根据权利要求5所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述对分割后的声呐图像中形状尺寸不符合检测要求的区域进行删除，具体为：将分割后的声呐图像中大于a个和小于b个数据点的连通区域去除，a≥2000，b≤500。7.根据权利要求1所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述分割，具体包括：采用基于potts模型的mrf算法对声呐图像进行分割。8.根据权利要求1所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述卷积神经网络包括：三个卷积层conv-1、conv-2和conv-3，三个池化层maxpool-1、maxpool-2和maxpool-3，以及三个全连接层fc-1、fc-2和fc-3。9.根据权利要求8所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述通过卷积神经网络提取潜在目标区域的cnn深度特征，具体包括：通过双线性插值对潜在目标区域进行大小调整后输入卷积神经网络；通过卷积层conv-1和池化层maxpool-1对输入的潜在目标区域进行特征提取，获得第一特征图；通过卷积层conv-2和池化层maxpool-2对第一特征图进行特征提取，获得第二特征图；
通过卷积层conv-3和池化层maxpool-3对第二特征图进行特征提取，获得第三特征图；最后通过全连接层fc-1输出cnn深度特征。10.根据权利要求9所述的基于特征融合的水下静态小目标检测方法，其特征在于，所述将提取的hu矩特征和cnn深度特征拼接融合得到目标分类结果，具体包括：构建全连接层fc-4，并将提取的hu矩特征输入到全连接层fc-4进行维数扩展；将拓展的hu矩特征与cnn深度特征进行拼接融合；将拼接融合后的特征输入全连接层fc-2进行映射；最后通过全连接层fc-3得到目标分类结果。

技术总结
本发明涉及水下静态目标检测领域，特别涉及一种基于特征融合的水下静态小目标检测方法。本发明方法包括：对声呐图像的回波数据依次进行预处理、分割与后处理，得到潜在目标区域；提取潜在目标区域的Hu矩特征，并通过卷积神经网络提取潜在目标区域的CNN深度特征；将提取的Hu矩特征和CNN深度特征拼接融合得到目标分类结果。本发明方法能够将声图中绝大多数目标提取出来，同时最大限度地保留目标的完整性；将目标低级形状特征Hu矩和CNN深度特征进行融合，形成形状特征表达能力更强的特征融合网络用于分类，有效提高了目标检测的精度；本发明适用于不同成像环境下的水下静态小目标检测，具有广泛的应用场景。具有广泛的应用场景。具有广泛的应用场景。

技术研发人员：许枫符书楠刘佳逄岩
受保护的技术使用者：中国科学院声学研究所
技术研发日：2023.03.10
技术公布日：2023/7/12

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种化学药剂配比装置的制作方法 下一篇：一种排水性能好的并列风道式通风天窗的制作方法

一种基于特征融合的水下静态小目标检测方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于特征融合的水下静态小目标检测方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表