一种多边形区域内声源分离和定位方法与流程
未命名
10-18
阅读:95
评论:0
1.本发明涉及声源分离和定位领域,更具体地说,涉及一种多边形区域内声源分离和定位方法。
背景技术:
2.随着城市化进程的加速,城市噪声污染问题越来越受到人们的关注。传统的噪声监测方式多依赖于固定的噪声监测点,但这种方法由于监测点数量有限,很难全面、准确地获取城市各个区域的噪声数据。
3.解决这种方法的途径包括增加监测点数量、采用移动监测等,但这些方法要么成本较高、要么实际操作起来困难。因此,如何在保证监测准确性的同时,降低成本,成为了噪声监测领域亟待解决的问题。同时,如何能够智能化识别噪声的类别,也是一个待解决的问题。
4.另外,在城市环境中,与自然环境和其他环境相比,噪音具有一些独特的特点。城市噪音一般呈现连续的、多声源混合的状态。这些声源包括车辆、人群、建筑工地、公共活动等,它们在时间和空间上都有一定的分布。这使得城市噪音的特点既复杂又多变。而现有的声音检测和定位技术,大多数是为单一声源设计的。对于复杂的多声源混合环境,这些技术很难准确地识别和定位声源。尤其是在声源数量多、分布广、相互干扰的情况下,传统的声音定位方法常常会受到限制。因此,在构建城市声源地图的时候,如何区分并识别声源位置,如何将连续的、多声源混合的噪音进行有效的分离和定位,已经成为一个难题。
技术实现要素:
5.本发明要解决的技术问题是提供一种多边形区域内声源分离和定位方法,以解决背景技术中提到的问题。
6.为了达到上述目的,本发明采取以下技术方案:
7.一种多边形区域内声源分离和定位方法,包括如下步骤:
8.s1:构建一个多边形,每个顶点处设置一个朝向所述多边形区域的麦克风,每个麦克风朝向多边形的边延伸出一段隔声板;
9.s2:采用声源分离模型对每个麦克风收集到的声音信号进行声源分离;
10.s3:对于任意两个麦克风对应的独立声音信号,在进行归一化处理后,计算其之间的余弦相似性或皮尔逊相关系数,作为两个独立声音信号的相似度;
11.s4:将两两之间相似度均高于预设阈值的多个独立声音信号作为一组,每组独立声音信号内的独立声音信号分布在不同的麦克风;
12.通过机器学习的方式,调节s2中所用的声源分离模型中用到的参数,使得s4中每组独立声音信号内的平均相似度之和的倒数最小;
13.s5:对于每组独立声音信号,计算每两个麦克风接收到该组独立声音成分的交叉相关,取交叉相关的最大值点位置作为特征点,以确定该两个麦克风接收到该组独立声音
信号的时间延迟,将时间延迟乘以声速得到距离差;以该两个麦克风为双曲焦点,以距离差为双曲线距离差,绘制出一条双曲线;
14.s6:按照s5的方法,对于每组独立声音信号,两两配对麦克风绘制出多条双曲线,多条双曲线交点形成一个分布区域;
15.通过机器学习的方法,调节s5中的交叉相关方法中用到的参数,使得所述分布区域的面积达到最小;
16.s7:如果达到最小面积后的分布区域位于所述多边形内,且所述分布区域的面积小于预设的面积阈值,则判定该组独立声音信号测量有效,并利用最小二乘法获得所述分布区域内所有双曲线交点的中心点,作为该组独立声音信号的声源位置;
17.若所述分布区域部分或全部位于所述多边形外,或所述分布区域的面积大于预设的面积阈值,则判定该组独立声音信号测量无效。
18.在一些实施例中,所述s2中所用的声源分离模型为独立成分分析模型,即ica模型。ica模型的参数包括迭代次数、学习率和混合矩阵的初始值。
19.在一些实施例中,所述交叉相关方法的参数包括信号的采样频率、信号的窗长和窗函数。
20.利用交叉相关方法确定时间延迟的方法具体包括:
21.s5.1:为两个麦克风标号为i和j,获取其对应的独立声音信号xi(t)和xj(t);
22.s5.2:利用交叉相关公式计算信号xi(t)与xj(t)之间的交叉相关r
ij
(τ):
[0023][0024]
其中τ代表时间延迟;
[0025]
s5.3:找到r
ij
(τ)中的最大值点,记对应的自变量为τ
max
;
[0026]
s5.4:将τ
max
视为两个麦克风i和j接收到的独立声音信号的时间延迟。
[0027]
在一些实施例中,s5中的交叉相关计算还采用快速傅立叶变换fft加速其计算过程,具体步骤包括:
[0028]
s5.5:对xi(t)和xj(t)进行fft得到其对应的频谱xi(f)和xj(f),其中f表示频率,x表示表示频域中的复数值;
[0029]
s5.6:计算xi(f)与xj^(f)的点积,其中xj^(f)是xj(f)的共轭;
[0030]
s5.7:对s5.6得到的点积进行反傅立叶变换,得到r
ij
(τ);
[0031]
s5.8:按照s5.3和s5.4的步骤,确定时间延迟τ
max
。
[0032]
在一些实施例中,所隔声板背朝所述多边形区域的一侧面设置有隔音材料。
[0033]
在一些实施例中,多个所述麦克风构成多个紧密相连的多边形,每个麦克风位于多个多边形的一个顶点。
[0034]
在一些实施例中,所述多边形为三角形。
[0035]
本发明相对于现有技术的优点在于:
[0036]
城市声音往往由多个声源组成,例如车辆、人声、建筑工地等。本发明通过在多边形的顶点设置麦克风和应用声源分离模型,能够将这些混杂在一起的声音有效地区分开来。城市中的声音还是连续不断的,而不是断断续续,这对于声源测量技术中如何获取时间
差有所困难,本发明采用交叉相关方法可以获得该时间差,且结合双曲线交点可以获得对应声源位置,外加机器学习方法可以提高准确度。通过在多边形区域的每个顶点设置麦克风,本发明可以覆盖一个相对较大的区域,这意味着无需在每个位置都设置麦克风,从而大大降低了噪音监测的成本。通过设置多个多边形,即可在城市中的多个主要地区进行噪音检测,而不同的多边形间的麦克风还可以共用,从而降低使用成本。
附图说明
[0037]
图1是本发明方法的流程示意图。
具体实施方式
[0038]
下面结合附图对本发明的具体实施方式作描述。
[0039]
如图1所示为本发明总体流程图。
[0040]
本发明一种多边形区域内声源分离和定位方法,包括如下步骤:
[0041]
s1:构建一个多边形,每个顶点处设置一个朝向多边形区域的麦克风,每个麦克风朝向多边形的边延伸出一段隔声板;
[0042]
s2:采用声源分离模型对每个麦克风收集到的声音信号进行声源分离;
[0043]
s3:对于任意两个麦克风对应的独立声音信号,在进行归一化处理后,计算其之间的余弦相似性或皮尔逊相关系数,作为两个独立声音信号的相似度;
[0044]
s4:将两两之间相似度均高于预设阈值的多个独立声音信号作为一组,每组独立声音信号内的独立声音信号分布在不同的麦克风;
[0045]
通过机器学习的方式,调节s2中所用的声源分离模型中用到的参数,使得s4中每组独立声音信号内的平均相似度之和的倒数最小;
[0046]
s5:对于每组独立声音信号,计算每两个麦克风接收到该组独立声音成分的交叉相关,取交叉相关的最大值点位置作为特征点,以确定该两个麦克风接收到该组独立声音信号的时间延迟,将时间延迟乘以声速得到距离差;以该两个麦克风为双曲焦点,以距离差为双曲线距离差,绘制出一条双曲线;
[0047]
s6:按照s5的方法,对于每组独立声音信号,两两配对麦克风绘制出多条双曲线,多条双曲线交点形成一个分布区域;
[0048]
通过机器学习的方法,调节s5中的交叉相关方法中用到的参数,使得分布区域的面积达到最小;
[0049]
s7:如果达到最小面积后的分布区域位于多边形内,且分布区域的面积小于预设的面积阈值,则判定该组独立声音信号测量有效,并利用最小二乘法获得分布区域内所有双曲线交点的中心点,作为该组独立声音信号的声源位置;
[0050]
若分布区域部分或全部位于多边形外,或分布区域的面积大于预设的面积阈值,则判定该组独立声音信号测量无效。
[0051]
在一些实施例中,s2中所用的声源分离模型为ica模型。ica模型的参数包括迭代次数、学习率和混合矩阵的初始值。独立成分分析(ica)是一种线性特征变换技术,用于从多个观测数据中找到隐藏的独立信号或组件。它尤其适用于分离混合信号的源。
[0052]
在本发明中,可以具体包括:
[0053]
每个麦克风采集的声音信号首先经过adc (模拟到数字转换器) 进行采样和量化。使用带通滤波器来滤除不在目标频率范围内的噪声。接着初始化ica参数,包括为每个麦克风分配一个唯一的混合矩阵的初始值,这是ica模型需要的,因为它假设信号是由多个独立源通过混合矩阵混合得到的。学习率是一个小正数,用于控制权重更新的幅度。学习率太高可能导致模型不稳定,而太低则可能导致收敛过慢。
[0054]
为了防止无限迭代,本发明还可以设置一个最大迭代次数作为停止条件。
[0055]
接下来执行ica算法,包括:
[0056]
为了使ica算法更有效,先将数据进行白化处理,使其具有零均值和单位方差。在每次迭代中,根据ica的学习规则(通常是基于独立性的最大化)更新权重。比较连续迭代间的权重变化或模型的损失值,如果权重变化小于一个预设的阈值或达到最大迭代次数,则停止迭代。
[0057]
接下来使用训练好的ica模型和混合矩阵,将每个麦克风的信号反向映射回其独立的源信号。
[0058]
后续可以通过监听分离出的信号或使用其他评估标准(如信噪比)来评估分离效果。
[0059]
将分离出的独立信号保存为数字格式,以便后续分析或其他处理。
[0060]
在本发明中,还利用机器学习的方法,以s4中平均相似度之和的倒数为标签,调节上述参数,如学习率、混合矩阵的初始值或迭代次数,使得每组相似度平均值之和越高越好。
[0061]
在一些实施例中,交叉相关方法的参数包括信号的采样频率、信号的窗长和窗函数。
[0062]
利用交叉相关方法确定时间延迟的方法具体包括:
[0063]
s5.1:为两个麦克风标号为i和j,获取其对应的独立声音信号xi(t)和xj(t);
[0064]
s5.2:利用交叉相关公式计算信号xi(t)与xj(t)之间的交叉相关r
ij
(τ):
[0065][0066]
其中τ代表时间延迟;
[0067]
s5.3:找到r
ij
(τ)中的最大值点,记对应的自变量为τ
max
;
[0068]
s5.4:将τ
max
视为两个麦克风i和j接收到的独立声音信号的时间延迟。
[0069]
在一些实施例中,s5中的交叉相关计算还采用快速傅立叶变换fft加速其计算过程,具体步骤包括:
[0070]
s5.5:对xi(t)和xj(t)进行fft得到其对应的频谱xi(f)和xj(f),其中f表示频率,x表示表示频域中的复数值;
[0071]
s5.6:计算xi(f)与xj^(f)的点积,其中xj^(f)是xj(f)的共轭;
[0072]
s5.7:对s5.6得到的点积进行反傅立叶变换,得到r
ij
(τ);
[0073]
s5.8:按照s5.3和s5.4的步骤,确定时间延迟τ
max
。
[0074]
在一些实施例中,所隔声板背朝多边形区域的一侧面设置有隔音材料。
[0075]
在一些实施例中,多个麦克风构成多个紧密相连的多边形,每个麦克风位于多个
多边形的一个顶点。也就是说,我们可以把城市区域分割为多个多边形,其中,每个多边形的顶点设置麦克风,这样一来,就可以对于城市中的多个区域进行噪音监控和定位,以方便后续对于噪音的识别。
[0076]
在一些实施例中,多边形为三角形。
[0077]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
技术特征:
1.一种多边形区域内声源分离和定位方法,其特征在于,包括如下步骤:s1:构建一个多边形,每个顶点处设置一个朝向所述多边形区域的麦克风,每个麦克风朝向多边形的边延伸出一段隔声板;s2:采用声源分离模型对每个麦克风收集到的声音信号进行声源分离;s3:对于任意两个麦克风对应的独立声音信号,在进行归一化处理后,计算其之间的余弦相似性或皮尔逊相关系数,作为两个独立声音信号的相似度;s4:将两两之间相似度均高于预设阈值的多个独立声音信号作为一组,每组独立声音信号内的独立声音信号分布在不同的麦克风;通过机器学习的方式,调节s2中所用的声源分离模型中用到的参数,使得s4中每组独立声音信号内的平均相似度之和的倒数最小;s5:对于每组独立声音信号,计算每两个麦克风接收到该组独立声音成分的交叉相关,取交叉相关的最大值点位置作为特征点,以确定该两个麦克风接收到该组独立声音信号的时间延迟,将时间延迟乘以声速得到距离差;以该两个麦克风为双曲焦点,以距离差为双曲线距离差,绘制出一条双曲线;s6:按照s5的方法,对于每组独立声音信号,两两配对麦克风绘制出多条双曲线,多条双曲线交点形成一个分布区域;通过机器学习的方法,调节s5中的交叉相关方法中用到的参数,使得所述分布区域的面积达到最小;s7:如果达到最小面积后的分布区域位于所述多边形内,且所述分布区域的面积小于预设的面积阈值,则判定该组独立声音信号测量有效,并利用最小二乘法获得所述分布区域内所有双曲线交点的中心点,作为该组独立声音信号的声源位置;若所述分布区域部分或全部位于所述多边形外,或所述分布区域的面积大于预设的面积阈值,则判定该组独立声音信号测量无效。2.根据权利要求1所述多边形区域内声源分离和定位方法,其特征在于,所述s2中所用的声源分离模型为ica模型。3.根据权利要求2所述多边形区域内声源分离和定位方法,其特征在于,ica模型的参数包括迭代次数、学习率和混合矩阵的初始值。4.根据权利要求1所述多边形区域内声源分离和定位方法,其特征在于,所述交叉相关方法的参数包括信号的采样频率、信号的窗长和窗函数。5.根据权利要求1或4所述多边形区域内声源分离和定位方法,其特征在于,s5中,利用交叉相关方法确定时间延迟的方法具体包括:s5.1:为两个麦克风标号为i和j,获取其对应的独立声音信号x
i
(t)和x
j
(t);s5.2:利用交叉相关公式计算信号x
i
(t)与x
j
(t)之间的交叉相关r
ij
(τ):;其中τ代表时间延迟;s5.3:找到r
ij
(τ)中的最大值点,记对应的自变量为τ
max
;s5.4:将τ
max
视为两个麦克风i和j接收到的独立声音信号的时间延迟。
6.根据权利要求5所述多边形区域内声源分离和定位方法,其特征在于,s5中的交叉相关计算还采用快速傅立叶变换fft加速其计算过程,具体步骤包括:s5.5:对x
i
(t)和x
j
(t)进行fft得到其对应的频谱x
i
(f)和x
j
(f),其中f表示频率,x表示频域中的复数值;s5.6:计算x
i
(f)与x
j
^(f)的点积,其中x
j
^(f)是x
j
(f)的共轭;s5.7:对s5.6得到的点积进行反傅立叶变换,得到r
ij
(τ);s5.8:按照s5.3和s5.4的步骤,确定时间延迟τ
max
。7.根据权利要求1所述多边形区域内声源分离和定位方法,其特征在于,所隔声板背朝所述多边形区域的一侧面设置有隔音材料。8.根据权利要求1所述多边形区域内声源分离和定位方法,其特征在于,多个所述麦克风构成多个紧密相连的多边形,每个麦克风位于多个多边形的一个顶点。9.根据权利要求1或8所述多边形区域内声源分离和定位方法,其特征在于,所述多边形为三角形。
技术总结
本发明公开了一种多边形区域内声源分离和定位方法,涉及声源分离和定位领域,通过构建多边形并在每个顶点放置麦克风,该方法能够采集声音并利用声源分离模型进行分离。随后,利用余弦相似性或皮尔逊相关系数计算信号的相似度,并进行分组,并通过机器学习的方法优化声源分离。进一步的步骤包括计算交叉相关,绘制双曲线,通过机器学习方法优化分布区域的面积,并确定声源位置。本发明具备精确性高且成本效益显著的优点。成本效益显著的优点。成本效益显著的优点。
技术研发人员:刘君 李永 李静林
受保护的技术使用者:北京圣传创世科技发展有限公司
技术研发日:2023.09.01
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
