一种无人机目标跟踪方法和无人机目标跟踪系统

未命名 07-12 阅读:75 评论:0


1.本发明涉及无人机目标跟踪技术领域,具体涉及了一种无人机目标跟踪方法、一种无人机目标跟踪系统,以及一种计算机可读存储介质。


背景技术:

2.近年来,无人机产业发展迅速,无人机目标跟踪已逐渐成为目前无人机领域热点研究方向之一。无人机的目标跟踪能够通过在跟踪目标上绑定电子标签或安装gps追踪器,或通过相机对视频中的运动目标进行视觉识别与跟踪等多种方式实现。
3.目前,传统的视觉目标跟踪方式面临所的问题在于,对视觉盲区无法进行跟踪,以及易受到光线、视野等外界因素的影响,这些问题会导致无人机在目标识别过程中无法识别目标或目标跟踪丢失等情况的发生。相比于上述根据图像信息进行的视觉目标跟踪,音频信息可以不受盲区、光线和视野的限制,且在存储空间和处理难度上存在优势。因此,通过音频信号实现无人机目标跟踪是另一种可行的方式。然而,目前通过音频信号进行目标的定位和追踪应用在了安防监控领域中,并且其识别的声音类型仅为两种,不足以应对声音类别复杂的声场场景。
4.为了解决现有技术中存在的上述问题,本领域亟需一种无人机目标跟踪技术,能够在声音类别较为复杂的声场环境下,识别多种声音类型,并基于声音信号,实现无人机的目标跟踪。


技术实现要素:

5.以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之前序。
6.为了克服现有技术存在的上述缺陷,本发明提供了一种无人机目标跟踪方法、一种无人机目标跟踪系统,以及一种计算机可读存储介质,能够在声音类别较为复杂的声场环境下,识别多种声音类型,并基于声音信号以较低的存储、处理难度实现无人机的目标跟踪。
7.具体来说,根据本发明的第一方面提供的上述无人机目标跟踪方法,包括以下步骤:获取该无人机周围的声音信号,并从中提取声音特征;经由预先训练的声音识别模型,根据该声音特征判断该无人机周围是否存在指定的跟踪目标;响应于存在该跟踪目标的判断结果,对该声音信号进行声源定位,以确定该跟踪目标的位置信息;以及根据该位置信息确定该无人机的飞行指令,以控制该无人机跟踪该跟踪目标。
8.进一步地,在本发明的一些实施例中,获取该无人机周围的声音信号,并从中提取声音特征的步骤包括:对获取的声音信号进行分帧处理及时频域转换,以获得对应的mel频谱表示;以及根据该mel频谱表示,确定该声音特征。
9.进一步地,在本发明的一些实施例中,对获取的声音信号进行分帧处理及时频域转换,以获得对应的mel频谱表示的步骤包括:对经过该分帧处理的声音信号进行端点检测,以提取有效的音频数据;以及对该音频数据进行时频域转换,以获得该mel频谱表示。
10.进一步地,在本发明的一些实施例中,获取该无人机周围的声音信号,并从中提取声音特征的步骤包括:解析获取的声音信号,以确定该无人机所处的声场环境;以及响应于该声场环境为预设的目标声场环境,从该声音信号提取对应该目标声场环境的声音特征。
11.进一步地,在本发明的一些实施例中,经由预先训练的声音识别模型,根据该声音特征判断该无人机周围是否存在指定的跟踪目标的步骤包括:根据该目标声场环境,调用对应的目标声音识别模型来解析该声音特征,以确定该声音信号中包含的至少一种声音类别,其中,该目标声音识别模型是经由该目标声场环境的声音信号训练集学习得到;以及将该跟踪目标对应的指定声音类别与该声音信号中包含的至少一种声音类别进行比对,以判断该无人机周围是否存在该跟踪目标。
12.进一步地,在本发明的一些实施例中,在将该跟踪目标对应的指定声音类别与该声音信号中包含的至少一种声音类别进行比对,以判断该无人机周围是否存在该跟踪目标之前,该无人机目标跟踪方法还包括以下步骤:经由人机交互接口,获取用户对该跟踪目标的指定信息;以及根据该指定信息,从该目标声场环境涉及的至少一种候选声音类别中确定该跟踪目标对应的指定声音类别。
13.进一步地,在本发明的一些实施例中,该目标声场环境包括城市声场环境,其涉及空调运行声、汽车喇叭声、儿童嬉戏声、狗吠声、钻孔声、引擎空转声、警笛声、直升机声、街头音乐声中的至少一种候选声音类别。
14.进一步地,在本发明的一些实施例中,获取该无人机周围的声音信号的步骤包括:经由分布于声场空间内的多维麦克风阵列,获取来自该无人机周围不同方向的声音信号。
15.进一步地,在本发明的一些实施例中,该声源定位是基于球形插值的时延估计定位算法来实现,其中,对该声音信号进行声源定位,以确定该跟踪目标的位置信息的步骤包括:在n+1元的多维麦克风阵列中,以矢量mi表示麦克风mi空间位置,以矢量m表示声源s的空间位置,选取麦克风m0所在的位置为参考位置,并将麦克风mi与麦克风m0之间的距离定义为:
16.di=||m
i-m||-||m||;
17.将麦克风mi到麦克风m0的距离定义为ri,并将声源s到麦克风m0的距离定义为rs,以得到:
[0018][0019]
将距离di的估计值受环境噪声影响的误差函数表示为:
[0020][0021]
以得到在该n+1元的多维麦克风阵列中的n个误差函数的矩阵形式:
[0022]
ε=δ-2rsd-2cs
[0023]
其中,δ,d,m分别表示为:
[0024][0025]
在该n个误差函数取得最小值时得到声源位置方程:
[0026][0027]
以及
[0028]
求解该声源位置方程,以确定该跟踪目标的估计位置为:
[0029][0030]
进一步地,在本发明的一些实施例中,根据该位置信息确定该无人机的飞行指令,以控制该无人机跟踪该跟踪目标的步骤包括:将该无人机作为被控对象,经由pid控制器控制该无人机飞往该跟踪目标的估计位置。
[0031]
进一步地,在本发明的一些实施例中,训练该声音识别模型的步骤包括:利用卷积神经网络,构建待训练的声音识别模型;定义至少一种声场环境,并获取该声场环境下多种声源的声音信号;对获取的该声音信号进行特征提取,以确定对应的声音特征;经由该待训练的声音识别模型,对该声场环境下各该声源的声音特征进行声音识别,以确定对应的声音类别输出值;以及根据各该声音类别输出值及其对应的真实类别标注,修正该卷积神经网络的学习参数,以训练该声音识别模型。
[0032]
进一步地,在本发明的一些实施例中,获取该声场环境下多种声源的声音信号的步骤包括:经由不同位置的多个扬声器,以相同的音量随机播放一种候选声音类别的音频;以及经由分布于声场空间内的多维麦克风阵列,获取来自该无人机周围不同方向的声音信号。
[0033]
进一步地,在本发明的一些实施例中,对获取的该声音信号进行特征提取,以确定对应的声音特征的步骤包括:对获取的该声音信号进行分帧和/或加窗的预处理;将预处理后的声音信号从时域转到频域,并利用快速傅里叶变换求得每一帧该声音信号的频谱图;以及使用mel滤波器组将该声音信号的频谱图映射到mel频谱图,以作为该声音特征。
[0034]
此外,根据本发明的第二方面提供的上述无人机目标跟踪系统,包括:存储器,其上存储有计算机指令;以及处理器,连接该存储器,并被配置用于执行该存储器上存储的计算机指令,以实施本发明的第一方面提供的上述的无人机目标跟踪方法。
[0035]
此外,根据本发明的第三方面还提供了一种计算机可读存储介质,其上存储有计算机指令。该计算机指令被处理器执行时,实施本发明的第一方面提供的上述无人机目标跟踪方法。
附图说明
[0036]
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的
上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
[0037]
图1示出了根据本发明的一些实施例所提供的一种无人机目标跟踪方法的流程图;
[0038]
图2示出了根据本发明的一些实施例所提供的判断无人机周围是否存在指定的跟踪目标的流程图;以及
[0039]
图3示出了根据本发明的一些实施例所提供的一种无人机目标跟踪系统的结构框图。
[0040]
附图标记:
[0041]
s110~s140
ꢀꢀꢀꢀ
步骤;
[0042]
s121~s122
ꢀꢀꢀꢀ
步骤;
[0043]
300
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
无人机目标跟踪系统;
[0044]
310
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储器;
[0045]
320
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理器。
具体实施方式
[0046]
以下由特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其他优点及功效。虽然本发明的描述将结合优选实施例一起介绍,但这并不代表此发明的特征仅限于该实施方式。恰恰相反,结合实施方式作发明介绍的目的是为了覆盖基于本发明的权利要求而有可能延伸出的其它选择或改造。为了提供对本发明的深度了解,以下描述中将包含许多具体的细节。本发明也可以不使用这些细节实施。此外,为了避免混乱或模糊本发明的重点,有些具体细节将在描述中被省略。
[0047]
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0048]
另外,在以下的说明中所使用的“上”、“下”、“左”、“右”、“顶”、“底”、“水平”、“垂直”应被理解为该段以及相关附图中所绘示的方位。此相对性的用语仅是为了方便说明之用,其并不代表其所叙述的装置需以特定方位来制造或运作,因此不应理解为对本发明的限制。
[0049]
如上所述,目前,传统的视觉目标跟踪方式面临所的问题在于,对视觉盲区无法进行跟踪,以及易受到光线、视野等外界因素的影响,这些问题会导致无人机在目标识别过程中无法识别目标或目标跟踪丢失等情况的发生。相比于上述根据图像信息进行的视觉目标跟踪,音频信息可以不受盲区、光线和视野的限制,且在存储空间和处理难度上存在优势。因此,通过音频信号实现无人机目标跟踪是另一种可行的方式。然而,目前通过音频信号进行目标的定位和追踪应用在了安防监控领域中,并且其识别的声音类型仅为两种,不足以应对声音类别复杂的声场场景。
[0050]
为了解决现有技术中存在的上述问题,本发明提供了一种无人机目标跟踪方法,
一种无人机目标跟踪系统,以及一种计算机可读存储介质,能够在声音类别较为复杂的声场环境下,识别多种声音类型,并基于声音信号以较低的存储、处理难度实现无人机的目标跟踪。
[0051]
在一些非限制性的实施例中,本发明的第一方面提供的上述无人机目标跟踪方法可以由本发明的第二方面提供的上述无人机目标跟踪系统实施。
[0052]
请参看图1,图1示出了根据本发明的一些实施例所提供的一种无人机目标跟踪方法的流程图。
[0053]
如图1所示,在本发明的一些实施例中,无人机目标跟踪方法主要包括以下步骤:
[0054]
s110:获取无人机周围的声音信号,并从中提取声音特征。
[0055]
具体来说,在一些实施例中,可以在无人机所处的声场环境中的多个位置处,放置多个扬声器,通过扬声器激活并随机播放一种声音类别的音频,作为声场内的未知声源,其中,该未知声源的空间位置可以表示为rs=(xs,ys,zs)。在声场空间内可以分布有多维麦克风阵列,例如三维麦克风列阵。通过这种拓扑结构的麦克风列阵,本实施例可以满足对于空间内不同方向的声音信号的接收,其中,麦克风的空间位置可由r
p
=(x
p
,y
p
,z
p
),p∈{1,2,...,p}表示,用以获取上述来自无人机周围多维度的、不同方向的声音信号。
[0056]
随后,对获取到的声音信号进行解析,以确定无人机所处的声场环境。具体来说,可以先判断当前无人机所处的声场环境是否为预设的目标声场环境。可选地,在一些实施例中,目标声场环境可以包括模拟城市的城市声场环境,其可以涉及空调运行声、汽车喇叭声、儿童嬉戏声、狗吠声、钻孔声、引擎空转声、警笛声、直升机声、街头音乐声中的至少一种候选声音类别。进一步地,可以将这些候选声音类别分别分配对应的编号(例如,c1-c8),并由模拟声场空间范围内的不同位置处的多个扬声器播放。当确定无人机所处的声场环境为预设的目标声场环境后,从获取到的声音信号中提取对应目标声场环境的声音特征。
[0057]
在一些实施例中,可以先将通过麦克风阵列获取目标声场环境下的所有种类的多组声音信号,构建该目标声场环境的音频数据集。对音频数据集内的所有声音信号进行分帧处理和时频域转换。
[0058]
具体来说,先对声音信号进行分帧处理,重叠率可以设为例如50%。之后,对经过分帧处理的声音信号进行端点检测,以提取有效的音频数据。对经过端点检测后的音频数据进行时频域转换,例如,可以包括对音频数据进行滤波与标准化处理。之后,解析滤波与标准化处理后的音频数据,提取音频数据的梅尔频谱(mel spectrogram)特征。根据获得的梅尔频谱表示,确定声音特征。本实施例中,通过梅尔频谱表示作为声音信号的特征,与声谱图等声音特征相比,梅尔频谱特征尺寸大小合适,且更符合人耳的听觉特性。
[0059]
s120:经由预先训练的声音识别模型,根据声音特征判断无人机周围是否存在指定的跟踪目标。
[0060]
具体来说,在预先训练声音模型的过程中,可以选用卷积神经网络,构建待训练的声音识别模型。进一步地,优选一种多尺度注意力的卷积神经网络模型进行训练,以得到声音识别模型,其中,多尺度特征融合的结构可以丰富提取的特征信息,注意力模块的存在可以提高神经网络模型对不同尺度空间信息和通道信息的适应性。
[0061]
定义至少一种声场环境,并获取该声场环境下多种声源的声音信号。可选地,可以经由该声场环境内的不同位置的多个扬声器,以相同的音量随机播放一种候选声音类别的
音频,再经由分布于声场空间内的多维麦克风阵列,获取来自无人机周围不同方向的声音信号。
[0062]
之后,对获取到的声音信号进行特征提取,以确定对应的声音特征。具体来说,在一些实施例中,可以对获取的声音信号进行分帧和/或加窗的预处理。可选地,在对声音信号进行分帧的处理过程中,帧移选为帧长的一半。对声音信号可以使用汉明窗(hamming window)进行加窗处理,汉明窗的公式如下:
[0063][0064]
随后,进行特征提取,将预处理后的声音信号从时域转到频域,并利用快速傅里叶变换求得每一帧声音信号的频谱图;使用mel滤波器组将这些声音信号的频谱图映射到mel频谱图,以作为该声音特征。
[0065]
经由上述待训练的声音识别模型,对声场环境下各声源的声音特征进行声音识别,以确定对应的声音类别输出值。最后,可以根据各声音类别输出值及其对应的真实类别标注,修正卷积神经网络的学习参数,以训练声音识别模型,并获得完成训练的声音识别模型。
[0066]
请参看图2,图2示出了根据本发明的一些实施例所提供的判断无人机周围是否存在指定的跟踪目标的流程图,上述步骤s120还可以进一步包括以下步骤s121~s122。
[0067]
s121:根据目标声场环境,调用对应的目标声音识别模型来解析上述声音特征,以确定获得的声音信号中所包含的至少一种声音类别。
[0068]
可选地,在本发明的一些实施例中目标声音识别模型可以由目标声场环境的声音信号训练集学习得到,训练所得的声音识别模型最终可以实现对上述设置的八种候选声音类别(例如,空调运行声、汽车喇叭声、儿童嬉戏声、狗吠声、钻孔声、引擎空转声、警笛声、直升机声、街头音乐声)进行识别。
[0069]
s122:将跟踪目标对应的指定声音类别与声音信号中包含的至少一种声音类别进行比对,以判断无人机周围是否存在跟踪目标。
[0070]
在一些优选的实施例中,可以经由人机交互接口或者其他方式,获取用户对跟踪目标的指定信息。根据该指定信息,可以从上述目标声场环境涉及的至少一种候选声音类别中,确定出跟踪目标对应的指定声音类别。然后,将跟踪目标对应的指定声音类别与目标声场环境中获取到的声音信号中包含的至少一种声音类别进行比对,从而判断出无人机周围是否存在该跟踪目标。
[0071]
举例来说,可以将声场环境中的音频数据的特征输入到训练完成的声音识别模型中,并输出识别结果(可以对应于上述候选声音类别的编号c1/c2/.../c8)。比对设定的跟踪目标的指定信息,若其与识别结果一致,则当前音频数据属于需要跟踪的目标,若与识别结果不一致,则当前音频数据并非需要跟踪的目标。
[0072]
s130:响应于存在跟踪目标的判断结果,对声音信号进行声源定位,以确定跟踪目标的位置信息。
[0073]
在一些可选的实施例中,声源定位可以采用基于球形插值的时延估计定位算法来实现。具体来说,在n+1元的多维麦克风阵列中,以矢量mi表示麦克风mi空间位置,以矢量m表示声源s的空间位置,选取麦克风m0所在的位置为参考位置,并将麦克风mi与麦克风m0之间
的距离定义为:
[0074]di
=||m
i-m||-||m||;
[0075]
将麦克风mi到麦克风m0的距离定义为ri,并将声源s到麦克风m0的距离定义为r
s,
以得到:
[0076][0077]
将距离di的估计值受环境噪声影响的误差函数表示为:
[0078][0079]
以得到在n+1元的多维麦克风阵列中的n个误差函数的矩阵形式:
[0080]
ε=δ-2rsd-2cs
[0081]
其中,δ,d,m分别表示为:
[0082][0083]
在所述n个误差函数取得最小值时得到声源位置方程:
[0084][0085]
以及
[0086]
求解上述声源位置方程,从而可以确定跟踪目标的估计位置为:
[0087][0088]
本实施例中,基于球形插值的时延估计定位算法的优势在于计算量小、实时性能更好。
[0089]
s140:根据位置信息确定无人机的飞行指令,以控制无人机跟踪上述目标。
[0090]
在一些实施例中,可以将无人机作为被控对象,将跟踪目标的位置信息,即坐标信息,发送给无人机,并经由比例积分微分(proportion integration differentiation,pid)控制器控制无人机飞往跟踪目标的估计位置。该过程中的信息传输符合微型飞行器连接通信协议(micro air vehicle link,mavlink)。
[0091]
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
[0092]
至此,已介绍完本发明第一方面提供的一种无人机目标跟踪方法,本发明第二方面还提供了一种无人机目标跟踪系统。请参看图3,图3示出了根据本发明的一些实施例所提供的一种无人机目标跟踪系统的结构框图。
[0093]
如图3所示,该无人机目标跟踪系统300中可以配置存储器310及处理器320。该存
储器310包括但不限于本发明的第三方面提供的上述计算机可读存储介质,其上存储有计算机指令。该处理器320连接该存储器310,被配置用于执行该存储器310上存储的计算机指令,以实施本发明的第一方面提供的上述无人机目标跟踪方法。
[0094]
另外,本领域的技术人员可以理解,上述第一方面所述的这些无人机目标跟踪方法的实施例只是本发明提供的一些非限制性的实施方式,旨在清楚地展示本发明的主要构思,并提供一些便于公众实施的具体方案,而非用于限制该无人机目标跟踪系统300的全部工作方式或全部功能。同样地,该无人机目标跟踪系统300也只是本发明提供的一种非限制性的实施方式,不对上述无人机目标跟踪方法中各步骤的实施主体构成限制。
[0095]
综上所述,本发明提供了一种无人机目标跟踪方法、一种无人机目标跟踪系统,以及一种计算机可读存储介质,能够在声音类别较为复杂的声场环境下,识别多种声音类型,并基于声音信号以较低的存储、处理难度实现无人机的目标跟踪。
[0096]
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

技术特征:
1.一种无人机目标跟踪方法,其特征在于,包括以下步骤:获取所述无人机周围的声音信号,并从中提取声音特征;经由预先训练的声音识别模型,根据所述声音特征判断所述无人机周围是否存在指定的跟踪目标;响应于存在所述跟踪目标的判断结果,对所述声音信号进行声源定位,以确定所述跟踪目标的位置信息;以及根据所述位置信息确定所述无人机的飞行指令,以控制所述无人机跟踪所述跟踪目标。2.如权利要求1所述的无人机目标跟踪方法,其特征在于,所述获取所述无人机周围的声音信号,并从中提取声音特征的步骤包括:对获取的声音信号进行分帧处理及时频域转换,以获得对应的mel频谱表示;以及根据所述mel频谱表示,确定所述声音特征。3.如权利要求2所述的无人机目标跟踪方法,其特征在于,所述对获取的声音信号进行分帧处理及时频域转换,以获得对应的mel频谱表示的步骤包括:对经过所述分帧处理的声音信号进行端点检测,以提取有效的音频数据;以及对所述音频数据进行时频域转换,以获得所述mel频谱表示。4.如权利要求1所述的无人机目标跟踪方法,其特征在于,所述获取所述无人机周围的声音信号,并从中提取声音特征的步骤包括:解析获取的声音信号,以确定所述无人机所处的声场环境;以及响应于所述声场环境为预设的目标声场环境,从所述声音信号提取对应所述目标声场环境的声音特征。5.如权利要求4所述的无人机目标跟踪方法,其特征在于,所述经由预先训练的声音识别模型,根据所述声音特征判断所述无人机周围是否存在指定的跟踪目标的步骤包括:根据所述目标声场环境,调用对应的目标声音识别模型来解析所述声音特征,以确定所述声音信号中包含的至少一种声音类别,其中,所述目标声音识别模型是经由所述目标声场环境的声音信号训练集学习得到;以及将所述跟踪目标对应的指定声音类别与所述声音信号中包含的至少一种声音类别进行比对,以判断所述无人机周围是否存在所述跟踪目标。6.如权利要求5所述的无人机目标跟踪方法,其特征在于,在将所述跟踪目标对应的指定声音类别与所述声音信号中包含的至少一种声音类别进行比对,以判断所述无人机周围是否存在所述跟踪目标之前,所述无人机目标跟踪方法还包括以下步骤:经由人机交互接口,获取用户对所述跟踪目标的指定信息;以及根据所述指定信息,从所述目标声场环境涉及的至少一种候选声音类别中确定所述跟踪目标对应的指定声音类别。7.如权利要求6所述的无人机目标跟踪方法,其特征在于,所述目标声场环境包括城市声场环境,其涉及空调运行声、汽车喇叭声、儿童嬉戏声、狗吠声、钻孔声、引擎空转声、警笛声、直升机声、街头音乐声中的至少一种候选声音类别。8.如权利要求1所述的无人机目标跟踪方法,其特征在于,所述获取所述无人机周围的声音信号的步骤包括:
经由分布于声场空间内的多维麦克风阵列,获取来自所述无人机周围不同方向的声音信号。9.如权利要求8所述的无人机目标跟踪方法,其特征在于,所述声源定位是基于球形插值的时延估计定位算法来实现,其中,所述对所述声音信号进行声源定位,以确定所述跟踪目标的位置信息的步骤包括:在n+1元的多维麦克风阵列中,以矢量m
i
表示麦克风m
i
空间位置,以矢量m表示声源s的空间位置,选取麦克风m0所在的位置为参考位置,并将麦克风m
i
与麦克风m0之间的距离定义为:d
i
=||m
i-m||-||m||;将麦克风m
i
到麦克风m0的距离定义为r
i
,并将声源s到麦克风m0的距离定义为r
s
,以得到:将距离d
i
的估计值受环境噪声影响的误差函数表示为:以得到在所述n+1元的多维麦克风阵列中的n个误差函数的矩阵形式:ε=δ-2r
s
d-2cs其中,δ,d,m分别表示为:在所述n个误差函数取得最小值时得到声源位置方程:在所述n个误差函数取得最小值时得到声源位置方程:以及求解所述声源位置方程,以确定所述跟踪目标的估计位置为:10.如权利要求9所述的无人机目标跟踪方法,其特征在于,所述根据所述位置信息确定所述无人机的飞行指令,以控制所述无人机跟踪所述跟踪目标的步骤包括:将所述无人机作为被控对象,经由pid控制器控制所述无人机飞往所述跟踪目标的估计位置。11.如权利要求1所述的无人机目标跟踪方法,其特征在于,训练所述声音识别模型的步骤包括:利用卷积神经网络,构建待训练的声音识别模型;定义至少一种声场环境,并获取所述声场环境下多种声源的声音信号;
对获取的所述声音信号进行特征提取,以确定对应的声音特征;经由所述待训练的声音识别模型,对所述声场环境下各所述声源的声音特征进行声音识别,以确定对应的声音类别输出值;以及根据各所述声音类别输出值及其对应的真实类别标注,修正所述卷积神经网络的学习参数,以训练所述声音识别模型。12.如权利要求11所述的无人机目标跟踪方法,其特征在于,获取所述声场环境下多种声源的声音信号的步骤包括:经由不同位置的多个扬声器,以相同的音量随机播放一种候选声音类别的音频;以及经由分布于声场空间内的多维麦克风阵列,获取来自所述无人机周围不同方向的声音信号。13.如权利要求11所述的无人机目标跟踪方法,其特征在于,所述对获取的所述声音信号进行特征提取,以确定对应的声音特征的步骤包括:对获取的所述声音信号进行分帧和/或加窗的预处理;将预处理后的声音信号从时域转到频域,并利用快速傅里叶变换求得每一帧所述声音信号的频谱图;以及使用mel滤波器组将所述声音信号的频谱图映射到mel频谱图,以作为所述声音特征。14.一种无人机目标跟踪系统,其特征在于,包括:存储器,其上存储有计算机指令;以及处理器,连接所述存储器,并被配置用于执行所述存储器上存储的计算机指令,以实施如权利要求1~13中任一项所述无人机目标跟踪方法。15.一种计算机可读介质,其上存储有计算机指令,其特征在于,所述计算机指令被处理器执行时,实施如权利要求1~13中任一项所述的无人机目标跟踪方法。

技术总结
本发明提供了一种无人机目标跟踪方法和无人机目标跟踪系统。该无人机目标跟踪方法包括以下步骤:获取所述无人机周围的声音信号,并从中提取声音特征;经由预先训练的声音识别模型,根据所述声音特征判断所述无人机周围是否存在指定的跟踪目标;响应于存在所述跟踪目标的判断结果,对所述声音信号进行声源定位,以确定所述跟踪目标的位置信息;以及根据所述位置信息确定所述无人机的飞行指令,以控制所述无人机跟踪所述跟踪目标。通过执行这些步骤,该无人机目标跟踪方法能够在声音类别较为复杂的声场环境下,识别多种声音类型,并基于声音信号以较低的存储、处理难度实现无人机的目标跟踪。目标跟踪。目标跟踪。


技术研发人员:金晶 徐瑞甜
受保护的技术使用者:华东理工大学深圳研究院
技术研发日:2023.05.23
技术公布日:2023/7/7
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐