用于可变节距回声消除的方法和装置与流程

未命名 07-15 阅读:88 评论:0


1.本描述涉及一种用于回声消除的方法和设备。


背景技术:

2.在同时进行声音捕获和回放的上下文中,使用涉及声学回声消除(或下文中的“aec”)的处理是合适的。
3.如图1所示,设备项包括至少一个扬声器hp和捕获麦克风信号y(t)的至少一个麦克风mic。扬声器hp被供给信号x(t),该信号在由扬声器hp发射时被环境(可能的混响、拉森效应、或其他)变换,并且连同麦克风mic当前获取的有用信号s(t)一起被麦克风捕获。因此,麦克风信号y(t)由以下部分组成:
[0004]-有用信号s(t)(可能涉及来自对话、语音命令或其他的语音信号数据),以下也称为“感兴趣的信号s(t)”或“本地信号s”,具体取决于上下文,以及
[0005]-回声信号z(t),由包括在设备项中并且由一个或多个扬声器hp组成的声音回放系统发射。
[0006]
该回声信号与麦克风和回放系统之间的直接路径、以及信号x(t)在传播环境中的任何反射相关联。
[0007]
整个声学路径可以通过有限脉冲响应滤波器w来建模,该滤波器的长度取决于传播环境的特性,使得:
[0008]
z(t)=x(t)*w(t)
[0009]
从麦克风信号y(t)中去除回声信号z(t)的贡献的操作称为“声学回声消除”(或aec)。执行此操作的处理可以包括从声学路径的估计值中导出回声信号此操作被称为“自适应滤波”。通过从麦克风信号y(t)中减去估计的回声信号导出估计的有用信号如下所示:
[0010][0011]
自适应滤波通常基于麦克风信号和扬声器信号之间的相关性来执行,利用扬声器发射的信号x(t)和感兴趣的信号s(t)之间的统计独立性。在实践中,为了跟踪由滤波器w表示的声道的变化(并且为了方便起见,在下文中称为声学路径w),在短期期限内执行该处理是合适的。这些变化通常可以在说话的人穿过形成所述环境的房间时表现出来。
[0012]
这种短期处理的结果是,感兴趣的信号s(t)和扬声器信号x(t)之间的统计独立性在某些情况下可能不再保持,除了信号s(t)为零的简单情况之外。事实上,当在几十到几百毫秒(通常对应于数字信号的传统帧长度)的短时间窗口上计算时,这种独立性不再成立。
[0013]
在这些被称为“双重通话”的情况下,即当有用信号s(t)为非零时,其结果是声道估计值中的偏差,降低了回声消除。基于使用随机梯度的处理的不太复杂的解决方案,例如“归一化最小均方”(nlms)技术及其衍生物,对本地信号s(t)的存在非常敏感。在这些双重通话的情况下,如果滤波器继续自适应,它甚至可能发散,最终导致回声放大,这与期望的
效果相反。此外,为了有效,自适应滤波解决方案必须对双重通话情况具有鲁棒性,同时能够快速跟踪声学路径的变化。
[0014]
理想情况下,这种滤波应该只处理播放中的数据,即参考信号x(t)和麦克风信号y(t)。
[0015]
为了克服双重通话情况,某些已知的自适应滤波处理解决方案实现双重通话检测(dtd)系统。例如,在参考文献[@jung2005new]中描述了这种类型的系统,其公开细节在本说明书末尾的附录中给出。这样的系统在被识别为双重通话的时段期间禁用自适应。然而,在实践中,dtd会受到检测延迟的影响,这可能会导致回声。另一方面,在二进制判决的这种特定情况下,滤波器的自适应在双重通话时段期间被冻结,如果滤波器尚未完成收敛,这在实践中会分散注意力,从而导致可感知的残余回声。
[0016]
取而代之的是,已经提出了在声学路径的估计中导出自适应步长尺寸的其他方法。在已知的参考文献中,这种步长尺寸是连续的。与诸如dtd之类的二进制决策方案不同,这样的实现使得可能继续跟踪声学路径,包括在双重通话期间。这些类型的自适应通常由频带导出,如下所示:
[0017][0018]
其中δw是在估计的声道的每个时刻k和每个频率f处的更新。
[0019]
一方面,在频率下工作可能使收敛在所考虑的整个频率范围内更加均匀。另一方面,信号的谱稀疏性使得可能在一个频带中继续估计声道,同时在另一个频带冻结。某些方法,称为“可变步长尺寸”或vss,提出根据不同的标准调节自适应δw。
[0020]
已经尝试通过冻结被认为过于随机的迭代来平滑随机自适应,特别是为了避免由于双重通话的存在而导致的随机更新。
[0021]
也已经尝试直接测量本地语音存在率,其形式是本地信号的能量和回声信号的能量之间的比率,但是当该比率过高时,该自适应变得固定。由于方差的估计值噪声特别大,所以它们直接用于调节自适应步长使得这些方案在实践中无效:它们过多地冻结了自适应,减缓了收敛的速度,或者在双重通话期间不充分地限制失配。
[0022]
其他方法基于自适应步长尺寸的最优解,该最优解在最小回声的情况下保证估计滤波器的最小方差。这个标准被称为用于“最佳线性无偏估计值”的“blue”[@trump1998frequency]。根据该标准更新自适应滤波过程中的声学路径δw
(k)
允许限制与自适应滤波器在其解周围的变化(方差最小)相关的残余回声。然而,在实践中,blue表达式取决于信号s(t)的二阶统计值(更准确地说,取决于其统计自相关矩阵γs),这不仅是未知的,而且通常随着时间的推移而变化,就像通常语音等非稳定信号的情况一样[@van2007double]。因此,[@trump1998frequency]中提出的解决方案还不能完全令人满意。


技术实现要素:

[0023]
本发明改善了这种情况。
[0024]
提出了一种用于处理来自设备项的至少一个麦克风的信号y(t)的方法,所述设备
项进一步包括意欲被供给信号x(t)的至少一个扬声器,
[0025]
来自麦克风的所述信号y(t)的处理:
[0026]-目的至少是限制在设备项的环境中捕获扬声器发射的声音的麦克风所引起的回声效应,由扬声器发射的所述声音及其任何可能的声学反射沿着从扬声器到麦克风的声学路径w(t),
[0027]-并且包括,为了限制该回声效应,通过从来自麦克风的信号y(t)减去通过向供给扬声器的信号x(t)施加滤波器所给出的回声信号的估计x(t)*来确定有用信号s(t),所述滤波器可通过可变步长尺寸自适应,以便考虑所述声学路径w(t)随时间的变化,
[0028]
方法其中:
[0029]
*供给扬声器的信号x(t)是以信号样本随时间帧的连续形式获得的,并且
[0030]
*自适应滤波器是作为对该帧k的声学路径w的更新δw
(k)
的函数并通过应用满足为最小方差选定的标准的归一化λ、在样本的每一帧k处产生的,所述归一化λ是代表有用信号s(t)的统计期望的参数的函数。
[0031]
如下所述,这样的实现提供了一种声学回声消除解决方案,该解决方案特别是对双重通话情况是鲁棒的。
[0032]
在一个实施例中,上面提到的所选择的标准是“最佳线性无偏估计值”的“blue”类型。
[0033]
在有用信号s的矩阵表示的情况下,所述统计期望可以写成e{ssh}(sh指定矩阵s的共轭转置)。例如,在时域中,在简单标量表示的情况下,它可以取决于时间参数τ,并且可以写成e{s(t)s(t-τ)}。
[0034]
在频域中,所述统计期望可以由对应于功率谱密度的参数来表示。因此,在自适应滤波器例如在频率子带的域f中产生的实现中,其表达式可以是与有用信号s(f)的功率谱密度γs(f)对应的参数的函数。特别地,在频域中表示的所述归一化λ(f)本身是与有用信号s的功率谱密度γs对应的参数的函数。
[0035]
在这样的实施例中,所述归一化λ
(k)
被更精确地定义为有用信号s的功率谱密度的函数,并且还被定义为供给扬声器的信号x的功率谱密度的函数。
[0036]
在该实施例中,在其中f表示行索引(并且这里也是频率子带索引)并且b表示列索引的矩阵表示中,归一化λ
(k)
(f,b)可以由下式给出:
[0037]
其中μ∈[0,2[,并且其中γ是所选择的正系数(在实际实现的上下文中,这种选择可以是经验主义的)。
[0038]
有用信号s的功率谱密度本身可以估计为麦克风捕获的信号y的功率谱密度和回声与信号能量比的表示的函数。
[0039]
在该实施例中,在f表示行索引而b表示列索引的矩阵表示中,有用信号s的功率谱密度由下式给出:
[0040][0041]
其中a是选定的正极限(例如,在实践中“非常大”的选定正项,如10
10
),并且是针对先前帧k-1、在频率子带f中并且针对分区b评估的有用信号s的功率谱密度。
[0042]
回声与信号能量比的表示自身可以被估计为至少来自麦克风的信号y和意欲供给扬声器的信号x之间的功率谱间密度的函数。
[0043]
例如,在其中f表示行索引并且b表示列索引的矩阵表示中,回声与信号能量比的表示可以由下式给出:
[0044]
其中β是小于1的正遗忘因子,符号(k-1)表示针对前一帧(k-1)确定的表达式。
[0045]
在该表达式中,功率谱间密度可以由下式给出:
[0046][0047]
其中{α,δ,η,ξ}∈]0,1]。
[0048]
意欲供给扬声器x的信号和来自麦克风的信号y的功率谱密度,在其中x是矩阵并且y是向量的矩阵表示中,可以通过下式给出:
[0049][0050][0051]
其中α和η是大于0且小于1的遗忘因子。这里,矩阵(或向量)的平方范数,表示为|.|2,被定义为矩阵中每个元素的范数平方的矩阵
[0052]
在为自适应滤波器的估计提供优点的实施例中,后者可以由连续的分区来表示。因此,在这样的实施例中,滤波器w可以是有限脉冲响应类型,并且具有n个样本长。特别是,其被细分为个分区wb,每个分区具有l个样本。
[0053]
在这样的实施例中,人们可以估计矩阵该矩阵对应于分区wb的变换
域(例如,在前述频率子带中)中的表达式,使得w=[w1,...,wb],],并且表示变换域中的滤波器,其中wb=fwb,m≥l,其中f是域变换矩阵。
[0054]
人们将注意到,在此实施例中,所述列索引“b”可以对应于分区索引wb。然而,上面给出的具有行索引f和列索引b的矩阵表示可以应用于除了涉及滤波器的分区的情况之外的情况。作为直接的说明性示例,上面给出的公式在例如b=1的降级实施例中保持有效,因此不涉及分区。
[0055]
此外,对于意欲供给扬声器的信号x(t)的m个样本中的表示为的每个时间帧,代表意欲供给扬声器的信号并且对应于最后b个帧xb的变换形成矩阵使得x=[x1,...,xb],其中xb=fxb。对于来自麦克风的信号y(t)的时间帧最终形成向量
[0056]
该向量y可以被构造为使得:
[0057][0058]
按照该格式,对当前帧k的声学路径δw
(k)
的更新由的更新由给出,其中:
[0059]-表示哈达玛乘积,
[0060]-是由下式之一给出的矩阵:
[0061]
g=ffh和g=im,
[0062]-是表示上述归一化的矩阵,并且
[0063]-e
(k)
是根据帧k的信号x和y估计的先验误差。
[0064]
所述先验误差由下式给出:
[0065][0066]
在其中作为对声学路径δw
(k)
的更新的函数、从当前帧k到下一帧k+1更新自适应滤波器的实施例中,可以对于当前帧k估计该更新,并且对声学路径的更新通过以下类型的关系给出:w
(k+1)
=w
(k)
+δw
(k)

[0067]
该说明书还涉及一种计算机程序,包括用于在该程序由处理器执行时、实现以上方法的指令。
[0068]
它还涉及一种用于处理来自至少一个麦克风的信号y(t)的设备,包括被配置为执行如上定义的方法的处理器。
附图说明
[0069]
通过阅读下面的详细描述并分析附图,其他特征、细节和优点将变得清楚,其中:
[0070]
图1示出了根据一个实施例的其中可以实现本说明书的目的的设备项。
[0071]
图2示出了根据一个实施例的处理,以便传递上述有用信号。
[0072]
图3示出了根据一个实施例的处理,以便传递对上述声学路径的估计的更新。
[0073]
图4示出了根据一个实施例的用于实现本说明书的目的的装置。
具体实施方式
[0074]
下面的附图和描述大部分都包含一些本质上确定的元素。因此,它们不仅有助于更好地理解本公开,而且在应用时,它们也有助于其定义。
[0075]
本说明书在下文中提出了一种声学回声消除解决方案,该解决方案对双重通话情况是鲁棒的。它基于涉及自适应滤波的处理,例如nlms处理,通常连续应用于连续帧的每个帧。帧在这里被理解为指供给扬声器的信号x(t)的给定数量的连续样本,该信号当然被认为是数字的。
[0076]
在一个实施例中,用于自适应滤波的滤波器被分区(每个分区的长度可以与帧的长度相对应,也可以不对应),优选地在频域中(这里称为“分区块频域nlms”或“pbfd-nlms”的技术)。例如,在参考文献[@borrallo1992implementation]中介绍了这种类型的技术。
[0077]
这里更具体地说,该解决方案是基于blue最优步长尺寸的推导,但在不添加辅助信息的情况下,直接从参考和麦克风信号估计必要的统计数据。这使得可能在声学路径上没有误差预测模型或先验误差预测模型的情况下计算δw
(k)
,这可以是现有技术的参考文献中的情况,特别是[@gil2014frequency]。
[0078]
这样的实施例在没有除了由处理本身直接推导的辅助信息之外的辅助信息的情况下,保证了在收敛速度、收敛时的零偏差的意义上接近最优的收敛,以及在双重通话情况下不存在发散。
[0079]
当在频域中表达时,自适应滤波使得特别有可能独立于所涉及的频带来控制和归一化声学路径的更新。因此,除了降低复杂性外,该解决方案还得益于在所考虑的整个频率范围上更均匀的收敛。
[0080]
它经由分区的操作,与频域中的滤波相关联,也使得有可能在处理的每次迭代中估计声学路径w的时频表示w(k)。这使得有可能根据分区实现不同的自适应策略。它还使得在非常长的滤波器的情况下可以保证更好的收敛性。
[0081]
这样的处理允许导出优化双重通话情况下的行为和声道跟踪两者的步长尺寸。
[0082]
图2示出了自适应滤波解决方案的不同步骤。在自适应滤波处理的每一次迭代中,考虑信号x(t)和y(t)的l个新样本的帧,并产生的l个新样本。在步骤s1中,确定是否有必要初始化要考虑的声学路径(例如,在扬声器和另一方之间的会话开始时),在这种情况下,在步骤s2中进行声学路径的初始化。否则,在步骤s3中,直接开始声学回声消除aec处理。在步骤s4中,检索参考信号x(t)的时间帧,并且在所描述的示例中,在步骤s5中在频域(例如在频率子带的域中)中对其应用投影,以获得频率表示x(k)。对麦克风信号y(t)的每个时间帧执行类似的处理(步骤s6),以在步骤s7中获得频域中的投影y
(k)
。基于帧x(t)和y(t)(或者如本文所述,基于它们的频率表示),在步骤s8中应用回声消除处理,以便如下估计先验误差e
(k)

[0083]
下面通过根据“分区块”技术通过分区产生滤波器,来描述用于回声消除的自适应滤波的实施例。
[0084]
考虑到有限脉冲响应滤波器w(t)所建模的目标声学路径,所述滤波器w(t)是n个样本长的w,并且被细分为个分区我们可以估计矩阵该矩阵对应于分区wb的频率变换,使得
[0085]
w=[w1,...,wb],其中wb=fwb,m≥l。
[0086]
f是域变换矩阵,例如这里的冗余离散傅立叶变换(dft)矩阵,使得每个元素的特征为:在实践中,冗余是通过在时域中填充零来实现的。
[0087]
以同样的方式,我们认为参考信号x(t)的包括m个样本的时间帧,并且我们对应于最后b个帧xb的频率变换形成矩阵使得:
[0088]
x=[x1,...,xb],其中xb=fxb。
[0089]
通过进一步考虑麦克风信号y(t)的时间帧我们可以表示向量我们可以表示向量使得:
[0090][0091]
为了避免与在频域中执行的卷积运算相关联的问题,该处理基于重叠保存运算(ols)。这里,指数
·
(k)
反映了处理的第k次迭代。在初始化了w
(0)
、x
(0)
、y
(0)
和其他特性之后,可以通过计算先验误差来继续处理:
[0092][0093]
其中表示哈达玛乘积,并且(.)
*
表示矩阵或向量的共轭。
[0094]
如上所述,dft的冗余是借助于零填充来实现的,这是在先验误差的表达式中发现的,并且这有利地使得可能避免由于循环卷积而产生的伪影。
[0095]
该方法然后在步骤s9继续计算对声学路径的更新该方法然后在步骤s9继续计算对声学路径的更新如下:
[0096]
其中其中
[0097]
在更新是最优的(由于零填充)的实施例中,我们设置g=ffh(称为“约束”更新)。
[0098]
在更新是次优的实施例中,我们可以改为设置g=im(更新称为“非约束”)。这样的实现具有消耗更少资源的优点。
[0099]
步骤s10然后旨在计算w
(k+1)
,以便更新声学路径:
[0100]e(k+1)
=w
(k)
+δw
(k)

[0101]
并且在步骤s11中,在用w
(k)
对x
(k)
进行卷积之后,获得有用信号
并回到时域。
[0102]
图3详细说明了计算对声学路径w
(k)
的更新的步骤,特别是允许双重通话情况固有的鲁棒性的最优归一化项λ。
[0103]
为了使回声消除解决方案在上述情况下是鲁棒的,选择满足blue标准的谱归一化项λ
(k)
。这可以由于知道麦克风信号x(t)和本地信号s(t)的功率谱密度(psd)来实现。
[0104]
在参考文献[@van2007double]中,blue是以对本地信号的强假设为代价获得的,该本地信号必须接受自回归模型,被认为是语音,并使用误差预测方法。另一方面,[@trump1998frequency]通过仅通过误差信号e
(k)
在事后估计本地信号的psd来实现blue,这样做的代价是稳定性较低,并且在对本地信号(平稳有色噪声)有很强约束的情况下操作。
[0105]
下面解释的所提出的解决方案克服了上面使用的约束,这是由于dsp随时间的鲁棒估计。
[0106]
假设:
[0107]-(相应地,)用于每一频率和每一分区的x的(相应地,用于每一频率的y的)功率谱密度(psd)估计值
[0108]-麦克风信号和参考信号的谱间及其功率谱间密度
[0109]
每个频率和每个分区的本地信号s的功率谱密度被指定为
[0110]
最后,我们将矩阵表示为(esr表示“回声信号比”),该矩阵表示每个频带和每个分区的回声和本地信号的能量之比。在初始化个频带和每个分区的回声和本地信号的能量之比。在初始化和其他特性之后,处理执行以下操作:
[0111]-功率谱密度(psd)的估计:
[0112]
其中
[0113]
其中
[0114][0115]
其中{α,δ,η,ξ}∈]0,1]。
[0116]-瞬时回声信号比(esr)的估计:
[0117][0118]
其中β∈]0,1]。
[0119]-归一化λ
(k)
的估计:
[0120][0121]
然后,通过应用该说明书的含义内的方法,归一化参数为了满足blue标准,被表达为:
[0122]
其中μ∈[0,2[。
[0123]
归一化参数的该最后表达式涉及项其是用于每一帧k的、可最终作为要在该说明书的含义内估计的唯一参数(当然利用信号x(t))的回声信号比的估计值的函数。
[0124]
应该注意的是,否则,通过应用例如在[@borrallo1992implementation]中描述的现有技术的教导来实现pbfd-nlms的经典技术,滤波器的归一化参数将表示如下:
[0125]
其中μ∈[0,2[,而不涉及用于估计回声信号比的任何测量。
[0126]
现在,通过采取图3的步骤,第一步骤s20以测试开始,以确定是否初始化功率谱密度估计。如果是这样的情况,则在步骤s21中,初始化来自麦克风的信号y和参考信号x的各个谱密度。否则,在步骤s22中直接启动用于估计谱归一化因子λ的过程。在步骤s23中,检索麦克风信号的当前频率帧,并且在步骤s24中检索参考信号的当前频率帧,以便在步骤s25中估计上述谱间密度。然后,在步骤s26中,估计麦克风信号的功率谱密度,并且在步骤s27中,估计参考信号的功率谱密度,以便如上所述在步骤s28中从中推导出的瞬时回声信号比(esr)的估计。在步骤s29中从中推导出谱归一化因子λ
(k)
的估计,由此可以在步骤s30中从中确定对声学路径的更新:
[0127]
通过在时域中执行的自适应滤波来实现blue准则通常相当于求得解使得:
[0128][0129]
其中是微音信号向量,是微音信号向量,是扬声器信号的矩阵,并且是信号s的自相关矩阵。
[0130]
当前的回声消除方法是基于频域中的自适应滤波。[@trump1998frequency]中呈现的方法提出,通过在频域中查找声道解来实现blue标准的正规化版本,使得:
[0131][0132]
其中γs(resp.γ
x
)是信号s(相应地x)的功率谱密度的对角矩阵。
[0133]
然而,本地信号s是未知的。在实践中,如果没有其他信息或关于s的模型,则很难获得满足blue准则的估计器。
[0134]
如果本地信号s和参考信号x是去相关的,即e{xs
t
}=0(其中e{
·
}表示期望算子),则[@borrallo1992implementation]中描述的解决方案只能产生声道的无偏估计(从而满足blue准则)。在实践中,只有当信号s是白噪声时,才能满足这个条件。在所有其他情况下,为了达到无偏估计有必要在归一化因子λ
(k)
的分母上加上本地信号s方差的一小部分,即e{ssh}或其在频域中的功率谱密度(psd)(在上述方程中采取参数的形式)。
[0135]
由于表达式e{ssh}是未知的,因此这里提出的解决方案克服了上面使用的约束,这是由于功率谱密度随时间的鲁棒估计,特别是在上面阐述的分母中的出现的:γs、本地信号s的功率谱密度。
[0136]
如上所述的处理可以特别用于需要捕获声音并同时回放的情况。最常见的使用情况是免提电话(在远处说话的人听到他或她自己延迟的声音——回声——与另一方的声音混合在一起)、与语音助手的互动(来自对话系统的响应和/或语音助手上播放的音乐与用户发出的命令混合在一起,并且干扰语音识别)、对讲机、视频会议系统等。
[0137]
用于实现上述方法的装置在图4中表示,其也可以由图1中左侧的两个模块(应用于麦克风捕获的信号y(t)的自适应滤波和减法)来说明。参考图4,该装置通常可以包括用于接收从麦克风mic获取的信号y(t)的第一输入接口in1、以及用于接收要在扬声器hp上回放的信号(例如电信信号,例如语音或音乐信号)的第二输入接口in2。该装置包括处理器proc,该处理器proc能够与存储器mem协作,以便处理该音频信号,并经由包括在该装置中的第一输出接口out1传递旨在供给扬声器hp的信号x(t)。特别是存储器mem至少存储根据本说明书的一个方面的计算机程序的指令数据,在一个示例性实施例中,指令数据可由处理器proc读取以便执行上述处理,并且特别将其应用于来自麦克风的信号y(t)以便经由包括在装置中的第二输出接口out2递送有用信号s(t)。
[0138]
当然,这是示例性实施例,其中这里通常有用信号s(t)可以经由输出接口out2传输到例如远程方。在这种情况下,例如,接口out2可以连接到通信天线或电信网络net的路由器。输入接口in2从“外部”接收要通过扬声器播放的信号也是如此。
[0139]
例如,在诸如语音助手之类的装置中,当用户在助手对例如先前的命令做出响应的同时说出语音命令时,通常也可能处于双重通话的情况。在这种情况下,语音助手的至少一部分响应可以从存储器mem的内容本地发出,例如不必使用远程服务器和电信网络。此外,有用信号s(t)可以仅由处理器proc本地解释,以便响应来自用户的语音命令。因此,接口in2和out2可能不是必需的。
[0140]
被称为语音助手“双重通话”处理的处理的典型用例包括,例如,通过语音助手的扬声器听音乐,同时用户正在说出唤醒助手的命令(唤醒单词)。在这种情况下,为了能够正
确地检测实际说出的命令信号s(t),建议从在助手刚刚被放置的环境(具有其回响)中捕获的声音信号y(t)中消除播放的音乐x(t)*w(t)。
[0141]
当然,本发明不限于上述实施例,并且可以扩展到其他变体。
[0142]
例如,上面描述了实际的实施例,其中在频率子带的域中处理信号。然而,本发明也可以通过利用诸如期望e{ss
t
}之类的参数在时域中实现,该参数等效于频域中本地信号s的功率谱密度γs。
[0143]
因此,上述功率谱密度的估计可以在一种可能但非必要的实现方式中有效地执行。
[0144]
自适应滤波器分区也是如此,它也可以在子带域中工作,但这也不是必要的。
[0145]
此外,在图4中,已经示出了一种紧凑的设备项,该设备项包括回声消除装置(其因此可以由处理器proc、存储器mem、以及至少一个输入接口和至少一个输出接口来示出)、以及麦克风mic和扬声器hp。在变体实施例中,一方面装置以及另一方面一个或多个麦克风和一个或更多个扬声器可以位于不同的地点,通过例如电信网络或局域网(由家庭网关供电)或其他方式连接。
[0146]
附录:参考文献
[0147]
[@borrallo1992implementation]:borrallo,j.p.,&otero,m.g.(1992).on the implementation of a partitioned block frequency domain adaptive filter(pbfdaf)for long acoustic echo cancellation.signal processing,27(3),301-315.
[0148]
[@trump1998frequency]:trump,t.(1998,may).a frequency domain adaptive algorithm for colored measurement noise environment.in proceedings of the 1998ieee international conference on acoustics,speech and signal processing,icassp’98(cat.no.98ch36181)(vol.3,pp.1705-1708).ieee.
[0149]
[@jung2005new]:jung,h.k.,kim,n.s.,&kim,t.(2005).a new double-talk detector using echo path estimation.speech communication,45(1),41-48.
[0150]
[@van2007double]:van waterschoot,t.,rombouts,g.,verhoeve,p.,&moonen,m.(2007).double-talk-robust prediction error identification algorithms for acoustic echo cancellation.ieee transactions on signal processing,55(3),846-858.
[0151]
[@gil2014frequency]:gil-cacho,j.m.,van waterschoot,t.,moonen,m.,&jensen,s.h.(2014).a frequency-domain adaptive filter(fdaf)prediction error method(pem)framework for double-talk-robust acoustic echo cancellation.ieee/acm transactions on audio,speech,and language processing,22(12),2074-2086.

技术特征:
1.一种用于处理来自设备项的至少一个麦克风(mic)的信号y(t)的方法,所述设备项进一步包括意欲被供给信号x(t)的至少一个扬声器(hp),来自麦克风(mic)的所述信号y(t)的处理:-目的是至少限制在设备项的环境中捕获扬声器(hp)发出的声音的麦克风(mic)所引起的回声效应,由扬声器(hp)发出的所述声音及其任何声学反射沿着从扬声器(hp)到麦克风(mic)的声学路径w,-并且包括,为了限制该回声效应,通过从来自麦克风(mic)的信号y(t)减去通过向供给扬声器的信号x(t)施加滤波器所给出的回声信号的估计来确定有用信号s(t),所述滤波器可通过可变步长尺寸自适应,以便考虑所述声学路径w(t)随时间的变化,方法其中:*供给扬声器的所述信号x(t)是以信号样本随时间帧的连续形式获得的,并且*自适应滤波器是作为对该帧k的声学路径w(t)的更新δw
(k)
的函数并通过应用满足为最小方差选定的标准的归一化λ、在样本的每一帧k处产生的,所述归一化λ是代表有用信号s(t)的统计期望的参数的函数。2.根据权利要求1所述的方法,其中所选定的标准是用于“最佳线性无偏估计值”的“blue”类型。3.根据前述权利要求所述的方法,其中所述自适应滤波器是在频率子带的域f中产生的,并且所述归一化λ是与有用信号s的功率谱密度γ
s
对应的参数的函数。4.根据权利要求3所述的方法,其中所述归一化λ
(k)
被定义为以下的函数:-有用信号s的功率谱密度和-供给扬声器的信号x的功率谱密度5.根据权利要求4所述的方法,其中,在其中f表示行索引并且b表示列索引的矩阵表示中,所述归一化λ
(j)
(f,b)由下式给出:其中μ∈[0,2[,并且其中γ是选定的正系数。6.根据权利要求4和5之一所述的方法,其中,作为所述麦克风捕获的信号y的功率谱密度和所述回声与信号能量比的表示的函数,来估计有用信号s的功率谱密度7.根据权利要求6所述的方法,其中,在其中f表示行索引并且b表示列索引的矩阵表示中,有用信号s的功率谱密度由下式给出:
其中a是选定的正极限,并且是针对先前帧k-1、在频率子带中并且针对分区b估计的有用信号的功率谱密度。8.根据权利要求6和7之一所述的方法,其中,回声与信号能量比的表示被估计为至少来自麦克风的信号y和意欲供给扬声器的信号x之间的功率谱间密度的函数。9.根据权利要求8所述的方法,其中,在其中f表示行索引并且b表示列索引的矩阵表示中,回声与信号能量比的表示由下式给出:其中β是小于1的正遗忘因子,符号(k-1)表示针对前一帧(k-1)确定的表达式。10.根据权利要求9所述的方法,其中功率谱间密度由下式给出:其中{α,δ,η,ξ}∈]0,1]。11.根据权利要求9和10之一所述的方法,其中以下的功率谱密度:-意欲供给扬声器的信号,由矩阵x表示,以及-来自麦克风的信号,由向量y表示,分别由下式给出:以及其中α和η是大于0且小于1的遗忘因子。12.根据前述权利要求之一所述的方法,其中所述自适应滤波器是n个样本长的有限脉冲响应滤波器w,并且被细分为个分区w
b
,每个分区具有l个样本。13.根据权利要求12所述的方法,其中估计矩阵该矩阵对应于分区w
b
的变换域中的表达式,使得w=[w1,...,w
b
],并且表示变换域中的滤波器,其中w
b
=fw
b
,m≥l,其中f是域变换矩阵,并且其中,对于意欲供给扬声器的信号x(t)的m个样本中的表示为并且其中,对于意欲供给扬声器的信号x(t)的m个样本中的表示为的每个时
间帧,对应于最后b个帧x
b
的变换形成矩阵使得x=[x1,...,x
b
],其中x
b
=fx
b
,以及对于来自麦克风的信号y(t)的时间帧形成向量14.根据权利要求13所述的方法,其中所述向量y是这样的:15.根据权利要求13和14之一所述的方法,其中,对当前帧k的声学路径的更新δw
(k)
由下式给出其中:
‑“°”
表示哈达玛乘积,-是由下式之一给出的矩阵:g=ff
h
和g=i
m
,-是表示上述归一化的矩阵,并且-(k)
是根据帧k的信号x和y估计的先验误差。16.根据权利要求15所述的方法,其中所述先验误差由下式给出:17.根据前述权利要求之一所述的方法,其中,根据以下类型的关系:w
(k+1)
=w
(k)
+δw
(k)
,作为对当前帧k的声学路径的估计更新δw
(k)
的函数,从当前帧k到下一帧k+1更新所述自适应滤波器。18.一种计算机程序,包括用于在该程序由处理器执行时、实现根据权利要求1至17之一所述的方法的指令。19.一种用于处理来自至少一个麦克风(mic)的信号y(t)的设备,包括被配置为执行根据权利要求1至17之一所述的方法的处理器(proc)。

技术总结
来自进一步包括意欲被信号x(t)供电的至少一个扬声器(HP)的装置的麦克风(MIC)的信号y(t)的处理,目的是限制在该装置的环境中捕获扬声器(HP)发射的声音的麦克风(MIC)所引起的回声效应。由扬声器(HP)发射的所述声音及其任何声学反射沿着从扬声器(HP)到麦克风(MIC)的声学路径w。为了限制该回声效应,该处理包括通过从来自麦克风(MIC)的信号y(t)减去通过向扬声器电源信号x(t)施加滤波器所得到的回声信号的给定估计来确定有用信号s(t)。滤波器可通过可变节距自适应,以便考虑所述声学路径w(t)中随时间的变化。由于扬声器电源信号x(t)是以信号样本的帧的时间序列的形式获得的,因此根据对所述帧k的声学路径w的更新ΔW


技术研发人员:C
受保护的技术使用者:奥兰治
技术研发日:2021.09.27
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐