一种语音处理方法、系统及腰部治疗仪与流程
未命名
08-15
阅读:106
评论:0
1.本发明涉及语音识别技术领域,特别涉及一种语音处理方法、系统及腰部治疗仪。
背景技术:
2.现有的腰部治疗仪具有加热、低频及红外治疗功能,其中的加热功能包括5个档位,温度依次增加,用于适用不同人群的需求,低频脉冲治疗功能可分为刮痧模式、推拿模式、揉捏模式、捶打模式、按压模式等多个治疗模式,为了便利用户的使用操作,提高用户体验,在腰部治疗仪上引入智能语音识别技术模块,但是,在语音传输到腰部治疗仪的过程中常常会受到各种环境噪音的干扰和破坏,这不仅降低了语音可懂度,而且影响语音整体感知质量,导致识别模块不响应,或者响应错误,例如导致低频脉冲治疗模式运行错误,或者高档位加热治疗,给用户带来不适,上述这些情况,在一定程度上影响了用户体验。
技术实现要素:
3.现有的腰部治疗仪,在进行语音识别时,用户语音受到各种环境噪音的干扰和破坏,导致识别模块不响应,或者响应错误,影响用户体验。
4.针对上述问题,提出一种语音处理方法、系统及腰部治疗仪来解决上述技术问题,提高用户体验。
5.第一方面,一种语音处理方法,包括:步骤100、对输入的含噪语音信号经过加窗分帧进行傅里叶变换后,分别获取第一时频信号、第二时频信号;步骤200、利用区分函数对所述第一时频信号中含噪语音幅度谱及噪声幅度谱的相干性进行处理并获取重合幅度谱,利用所述重合幅度谱获取补偿函数,并根据所述补偿函数对所述第一时频信号进行相位补偿,获取第一增强语音幅度谱;步骤300、利用噪声功率阈值获取时频滤波函数并利用所述时频滤波函数对所述第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;步骤400、利用第一权值、第二权值分别对所述第一增强语音幅度谱、第二增强语音幅度谱进行加权;步骤500、对噪声类型进行判断,并根据所述噪声类型确定所述第一权值、第二权值的权值组合,将加权后的第一增强语音幅度谱、第二增强语音幅度谱进行求和,获取增强语音的去噪幅度谱;步骤600、对所述去噪幅度谱进行傅里叶逆变换,获取增强语音信号;其中,所述第一时频信号、第二时频信号为经过加窗分帧、傅里叶变换后获取的两路并行时频域含噪语音信号。
6.结合本发明所述的语音处理方法,第一种可能的实施方式中,所述步骤200包括:步骤210、对所述第一时频信号所有频点的信噪比进行筛选,获取大于规定阈值的信噪比及其频点;
步骤220、获取所述信噪比在所述频点的区分函数。
7.结合本发明第一种可能的实施方式,第二种可能的实施方式中,所述步骤200还包括:步骤230、计算所述第一时频信号的含噪语音幅度谱及噪声幅度谱;步骤240、利用所述区分函数、含噪语音幅度谱及噪声幅度谱获取所述第一时频信号的重合幅度谱。
8.结合本发明第二种可能的实施方式,第三种可能的实施方式中,所述步骤200还包括:步骤250、利用含噪语音幅度谱及噪声幅度谱获取伴随因子;步骤260、利用所述重合幅度谱及所述伴随因子获取所述补偿函数。
9.结合本发明所述的语音处理方法,第四种可能的实施方式中,所述步骤300包括:步骤310、确定所述第二时频信号每一时频单元的噪声功率阈值;步骤320、根据所述第二时频信号的含噪语音功率、噪声功率阈值及第三权值获取所述时频滤波函数。
10.结合本发明第四种可能的实施方式,第五种可能的实施方式中,所述步骤300还包括:步骤330、获取所述时频滤波函数中t时刻的所有连通区域;步骤340、将所述连通区域与规定阈值进行比较,若所述连通区域小于规定阈值,则删除该连通区域,以滤除噪声频点。
11.第二方面,一种语音处理系统,采用第一方面所述的方法对输入语音进行信号增强,其中,所述语音处理系统包括:第一变换单元;第一获取单元;第二获取单元;第三获取单元;第二变换单元;所述第一变换单元用于对输入的含噪语音信号经过加窗分帧进行傅里叶变换,分别获取第一时频信号、第二时频信号;所述第一获取单元用于利用区分函数对所述第一时频信号中含噪语音幅度谱及噪声幅度谱的相干性进行处理并获取重合幅度谱,利用所述重合幅度谱获取补偿函数,并根据所述补偿函数对所述第一时频信号进行相位补偿,获取第一增强语音幅度谱;所述第二获取单元用于利用噪声功率阈值获取时频滤波函数并利用所述时频滤波函数对所述第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;所述第三获取单元用于对噪声类型进行判断,并根据所述噪声类型确定所述第一权值、第二权值的权值组合,将加权后的第一增强语音幅度谱、第二增强语音幅度谱进行求和,获取增强语音的去噪幅度谱;所述第二变换单元用于对所述去噪幅度谱进行傅里叶逆变换,获取增强语音信号;其中,所述第一时频信号、第二时频信号为经过加窗分帧、傅里叶变换后获取的两
路并行时频域含噪语音信号。
12.第三方面,一种腰部治疗仪,包括第二方面所述的语音处理系统对用户语音进行信号增强,其中,还包括:识别系统;治疗系统;所述识别系统、治疗系统分别与所述语音处理系统电连接;所述识别系统用于对增强后的含噪语音进行识别,获取控制指令;所述治疗系统用于响应所述控制指令,对用户腰部进行治疗。
13.实施本发明所述的一种语音处理方法、系统及腰部治疗仪,通过对含噪语音信号进行双路傅里叶变换,然后利用对应的权值对相应的幅度谱进行加权,并根据噪声类型确定权值组合,提高了增强语音信号的环境适应能力,通过利用区分函数对第一时频信号进行相干性进行处理,降低了噪声幅度谱与语音幅度谱之间的混淆性,通过采用伴随因子构造补偿函数,并利用补偿函数进行相位补偿,提高了对第一时频信号相位补偿的补偿精度。通过利用噪声功率阈值及第三权值构造时频滤波函数进行时频滤波,有效减少了第二时频信号中的噪声干扰,提高了其噪声估计及第二增强语音幅度谱估计的准确性。
附图说明
14.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
15.图1为本发明语音处理方法步骤第一示意图;图2为本发明语音处理方法步骤第二示意图;图3为本发明语音处理方法步骤第三示意图;图4为本发明语音处理方法步骤第四示意图;图5为本发明语音处理方法步骤第五示意图;图6为本发明语音处理方法步骤第六示意图;图7为本发明语音处理系统模块连接示意图;图8为本发明腰部治疗仪模块连接示意图;附图中各数字所指代的部位名称为:10——语音处理系统、11——第一变换单元、12——第一获取单元、13——第二获取单元、14——第三获取单元、15——第二变换单元、20——识别系统、30——治疗系统。
具体实施方式
16.下面将结合发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的其他实施例,都属于本发明保护的范围。
17.现有的腰部治疗仪,在进行语音识别时,用户语音受到各种环境噪音的干扰和破
坏,导致识别模块不响应,或者响应错误,影响用户体验。
18.针对上述问题,提出一种语音处理方法、系统及腰部治疗仪来解决上述技术问题,提高用户体验。
实施例1
19.第一方面,一种语音处理方法,如图1,图1为本发明语音处理方法步骤第一示意图;包括:步骤100、对输入的含噪语音信号进行傅里叶变换,分别获取第一时频信号、第二时频信号。
20.在本实施例中,对输入的含噪语音信号进行加窗分帧后,保留时间信息,然后经过傅里叶变换后,将含噪语音信号从时域转换到时频域,获取的变换后的含噪语音信号也称之为时频信号,在本实施例中第一时频信号及第二时频信号,也即通过傅里叶变换获得两路并行的时频信号,然后分别对两路时频信号分别进行相位补偿、时频滤波获取两路幅度谱,然后在根据噪声类型确定相应权值组合,提高重构语音信号的环境适应能力。
21.步骤200、利用区分函数对第一时频信号中含噪语音幅度谱及噪声幅度谱的相干性进行处理并获取重合幅度谱,利用重合幅度谱获取补偿函数,并根据补偿函数对第一时频信号进行相位补偿,获取第一增强语音幅度谱。
22.优选地,如图2,图2为本发明语音处理方法步骤第二示意图;步骤200包括:步骤210、对第一时频信号所有频点的信噪比进行筛选,获取大于规定阈值的信噪比及其频点;步骤220、获取信噪比在频点的区分函数。
23.为了降低时频信号中的幅度谱相干性,利用式子(1)构造第n帧第h个频点的区分函数dn(h):(1)。
24.式子(1)中,为第n帧第h个频点的相干性处理函数,j表示分离因子,用于控制分离度。对局部相邻频带的信噪比进行筛选,低信噪比的频点主要以噪声信号为主,因此去除这些小于规定阈值的低信噪比的频点,避免以噪声为主的频带参与区分计算,高信噪比的频点则是以语音信号为主,因此,对大于规定阈值的高信噪比的频带中的目标语音信号的频谱成分进行进行区分,保证以语音为主的频带参与区分计算。当区分函数dn(h)越大,其值趋于1时,含噪语音幅度谱及噪声幅度谱之间的相干性越小,噪声信号与语音信号之间的干扰越小。反之,当dn(h)值趋于零时,二者之间的相干性越大,它们的相互干扰越大。
25.优选地,如图3,图3为本发明语音处理方法步骤第三示意图;步骤200还包括:步骤230、计算第一时频信号的含噪语音幅度谱及噪声幅度谱;步骤240、利用区分函数、含噪语音幅度谱及噪声幅度谱获取第一时频信号的重合幅度谱。
26.在本实施例中,为了提高噪声估计的准确性,利用式子(2)计算第一时频信号的重合幅度谱:
ꢀꢀ
(2)。
27.式子(2)中为增强语音幅度谱,为噪声幅度谱,[x]为整形函数,表示若x小于零,则返回零值,在本实施例中,重合幅度谱的取值范围为[0,1],在进行相位补偿时,作为补偿函数其中的一个调节参数控制相位补偿的程度。
[0028]
优选地,如图4,图4为本发明语音处理方法步骤第四示意图;步骤200还包括:步骤250、利用含噪语音幅度谱及噪声幅度谱获取伴随因子;步骤260、利用重合幅度谱及伴随因子获取补偿函数。
[0029]
在本实施例中,伴随因子作为第一时频信号的相位补偿的控制因子,随着噪声强度的变化而变化,对第一时频信号的相位补偿程度进行灵活控制,从而提高噪声估计的准确性,使得估计的噪声更加接近真实值,利用式子(3)可得伴随因子:(3)。
[0030]
式子(3)中m为常数,根据经验获得的补偿数值;由式子(2)和式子(3)可得补偿函数:(4)。
[0031]
式子(4)中为反对称函数。
[0032]
在本实施例中,补偿函数通过控制噪声与目标语音信号的共轭对称性,来增强目标语音,本实施例中的补偿函数中控制补偿程度的伴随因子,随着噪声功率的改变而改变,提高了噪声估计的准确性,从而更加精确地进行语音增强。
[0033]
因此,可得第一增强语音幅度谱为:(5)。
[0034]
式子(5)中为第一时频信号的含噪语音幅度谱。
[0035]
步骤300、利用噪声功率阈值获取时频滤波函数并利用时频滤波函数对第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;优选地,如图5,图5为本发明语音处理方法步骤第五示意图;步骤300包括:步骤310、确定第二时频信号每一时频单元的噪声功率阈值;步骤320、根据第二时频信号的含噪语音功率、噪声功率阈值及第三权值获取时频滤波函数。
[0036]
在时频信号的频谱图中,时频单元的语音能量以谐波形式存在,其能量较为显著,也即该时频单元的语音功率大于噪声功率,则将该时频单元的能量比例定义为1, 其他的情况,则以第三权值g来定义时频单元能量比例,第三权值g的值大于零小于1,因此,时频滤波函数可以为:(6)。
[0037]
式子(6)中,l为噪声幅度谱阈值,也即噪声功率阈值,为第二时频信号
的含噪语音幅度谱。
[0038]
优选地,如图6,图6为本发明语音处理方法步骤第六示意图;步骤300还包括:步骤330、获取时频滤波函数中t时刻的所有频点能量的连通区域;步骤340、将连通区域与规定阈值进行比较,若连通区域小于规定阈值,则删除该连通区域,以滤除噪声频点。
[0039]
语音集中区域,其能量较为显著,在时频滤波函数的时频图中连通区域分量较大,而噪声信号则表现为较小的连通区域分量,因此可以设定能量的连通区域大小阈值,可以依此阈值删除噪声的小区域的连通分量,降低干扰。
[0040]
在利用时频滤波函数进行滤波后,利用式子(6)可得第二增强语音幅度谱为:(7)。
[0041]
式子(7)中为第二时频信号。
[0042]
步骤400、利用第一权值、第二权值分别对第一增强语音幅度谱、第二增强语音幅度谱进行加权。
[0043]
步骤500、对噪声类型进行判断,并根据噪声类型确定第一权值、第二权值的权值组合,将加权后的第一增强语音幅度谱、第二增强语音幅度谱进行求和,获取增强语音的去噪幅度谱:(8)。
[0044]
其中,w1,w2分别为第一权值、第二权值,对当前输入语音的噪声类型进行判断,依此来确定对应该噪声类型的权值组合(w1,w2),由此获得的去噪幅度谱对该环境的适应度最高。
[0045]
步骤600、对去噪幅度谱进行傅里叶逆变换,获取增强语音信号。
[0046]
实验仿真为了进行性能评估,提取数据库中的20段不同说话人的语音作为实验数据,其中男女声语音各一半,语音信号的采样频率为8kz,噪声样本选取白噪声、f16噪声、工厂噪声、leopard四种噪声,将20条纯净语音同四种噪声按照4种不同信噪比进行混合,信噪比以为5db为间隔从-5到10选取。最终得到320条带噪语音作为测试样本。
[0047]
对比算法1:选取传统的基于负矩阵分解的语音增强算法。选取200段男声、200段女声,共400条语音进行训练' 通过训练得到模型的语音字典和噪声字典' 基向量个数设为100。
[0048]
对比算法2,对传统的基于负矩阵分解的语音增强算法进行相位补偿。
[0049]
参数设置:传统相位补偿函数的补偿因子为3.14,本技术公式1中的分离因子为0.3,式子3中的m为3.5,区分函数dn(h)的取值范围为[0,1]。
[0050]
在做对比实验时,选取负矩阵分解语音增强算法、负矩阵分解语音增强算法+相位补偿、本技术算法进行对比,选取两种评价指标:客观语音质量和分段信噪比,前者用来衡量语音增强效果,后者用来评估噪声抑制效果。
[0051]
表1 白噪声下各算法性能仿真结果
[0052]
表2 f16噪声下各算法性能仿真结果
[0053]
表3工厂噪声下各算法性能仿真结果
[0054]
表4 leopard噪声下各算法性能仿真结果
[0055]
结果分析表1-4分别为各算法在白噪声、f16噪声、工厂噪声、leopard四种噪声下的性能对比,从表中可以看出,本技术提出的算法性能优于负矩阵分解语音增强算法、负矩阵分解语音增强算法+相位补偿等传统相位补偿算法,信噪比为0时,客观语音质量提升了0.4-0.8 db,分段信噪比提升了0.45-1.2db。
实施例2
[0056]
第二方面,如图7,图7为本发明语音处理系统10模块连接示意图;一种语音增强系统10,采用第一方面的方法对输入语音进行信号增强,其中,语音增强系统10包括第一变换单元11、第一获取单元12、第二获取单元13、第三获取单元14、第二变换单元15;第一变换单元11用于对输入的含噪语音信号进行第一傅里叶变换及第二傅里叶变换,分别获取第一时频信号、第二时频信号;第一获取单元12用于利用区分函数对第一时频信号中含噪语音幅度谱及噪声幅度谱的相干性进行处理并获取重合幅度谱,利用重合幅度谱获取补偿函数,并根据补偿函数对第一时频信号进行相位补偿,获取第一增强语音幅度谱;第二获取单元13用于利用噪声功率阈值获取时频滤波函数并利用时频滤波函数对第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;第三获取单元14用于对噪声类型进行判断,并根据噪声类型确定第一权值、第二权值的权值组合,将加权后的第一增强语音幅度谱、第二增强语音幅度谱进行求和,获取增强语音的去噪幅度谱;第二变换单元15用于对去噪幅度谱进行傅里叶逆变换,获取增强语音信号。
实施例3
[0057]
第三方面,如图8,图8为本发明腰部治疗仪模块连接示意图;一种腰部治疗仪,包括第二方面的语音处理系统10对用户语音进行信号增强,其中,还包括识别系统及治疗系统;识别系统20、治疗系统30分别与语音增强系统10电连接;识别系统20用于对增强后的含噪语音进行识别,获取控制指令;治疗系统30用于响应控制指令,对用户腰部进行治疗。
[0058]
实施本发明的一种语音增强方法、系统及腰部治疗仪,通过对含噪语音信号进行双路傅里叶变换,然后利用对应的权值对相应的幅度谱进行加权,并根据噪声类型确定权值组合,提高了增强语音信号的环境适应能力,通过利用区分函数对第一时频信号进行相干性进行处理,降低了噪声幅度谱与语音幅度谱之间的混淆性,通过采用伴随因子构造补
偿函数,并利用补偿函数进行相位补偿,提高了对第一时频信号相位补偿的补偿精度。通过利用噪声功率阈值及第三权值构造时频滤波函数进行时频滤波,有效减少了第二时频信号中的噪声干扰,提高了其噪声估计及第二增强语音幅度谱估计的准确性。
[0059]
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种语音处理方法,其特征在于,包括:步骤100、对输入的含噪语音信号经过加窗分帧进行傅里叶变换后,分别获取第一时频信号、第二时频信号;步骤200、利用区分函数对所述第一时频信号中含噪语音幅度谱及噪声幅度谱的相干性进行处理并获取重合幅度谱,利用所述重合幅度谱获取补偿函数,并根据所述补偿函数对所述第一时频信号进行相位补偿,获取第一增强语音幅度谱;步骤300、利用噪声功率阈值获取时频滤波函数并利用所述时频滤波函数对所述第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;步骤400、利用第一权值、第二权值分别对所述第一增强语音幅度谱、第二增强语音幅度谱进行加权;步骤500、对噪声类型进行判断,并根据所述噪声类型确定所述第一权值、第二权值的权值组合,将加权后的第一增强语音幅度谱、第二增强语音幅度谱进行求和,获取增强语音的去噪幅度谱;步骤600、对所述去噪幅度谱进行傅里叶逆变换,获取增强语音信号;其中,所述第一时频信号、第二时频信号为经过加窗分帧、傅里叶变换后获取的两路并行时频域含噪语音信号。2.根据权利要求1所述的语音处理方法,其特征在于,所述步骤200包括:步骤210、对所述第一时频信号所有频点的信噪比进行筛选,获取大于规定阈值的信噪比及其频点;步骤220、获取所述信噪比在所述频点的区分函数。3.根据权利要求2所述的语音处理方法,其特征在于,所述步骤200还包括:步骤230、计算所述第一时频信号的含噪语音幅度谱及噪声幅度谱;步骤240、利用所述区分函数、含噪语音幅度谱及噪声幅度谱获取所述第一时频信号的重合幅度谱。4.根据权利要求3所述的语音处理方法,其特征在于,所述步骤200还包括:步骤250、利用含噪语音幅度谱及噪声幅度谱获取伴随因子;步骤260、利用所述重合幅度谱及所述伴随因子获取所述补偿函数。5.根据权利要求1所述的语音处理方法,其特征在于,所述步骤300包括:步骤310、确定所述第二时频信号每一时频单元的噪声功率阈值;步骤320、根据所述第二时频信号的含噪语音功率、噪声功率阈值及第三权值获取所述时频滤波函数。6.根据权利要求5所述的语音处理方法,其特征在于,所述步骤300还包括:步骤330、获取所述时频滤波函数中t时刻的所有连通区域;步骤340、将所述连通区域与规定阈值进行比较,若所述连通区域小于规定阈值,则删除该连通区域,以滤除噪声频点。7.一种语音处理系统,采用权利要求1-6任一所述的方法对输入语音进行信号增强,其特征在于,所述语音处理系统包括:第一变换单元;第一获取单元;
第二获取单元;第三获取单元;第二变换单元;所述第一变换单元用于对对输入的含噪语音信号经过加窗分帧进行傅里叶变换,分别获取第一时频信号、第二时频信号;所述第一获取单元用于利用区分函数对所述第一时频信号中含噪语音幅度谱及噪声幅度谱的相干性进行处理并获取重合幅度谱,利用所述重合幅度谱获取补偿函数,并根据所述补偿函数对所述第一时频信号进行相位补偿,获取第一增强语音幅度谱;所述第二获取单元用于利用噪声功率阈值获取时频滤波函数并利用所述时频滤波函数对所述第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;所述第三获取单元用于对噪声类型进行判断,并根据所述噪声类型确定所述第一权值、第二权值的权值组合,将加权后的第一增强语音幅度谱、第二增强语音幅度谱进行求和,获取增强语音的去噪幅度谱;所述第二变换单元用于对所述去噪幅度谱进行傅里叶逆变换,获取增强语音信号;其中,所述第一时频信号、第二时频信号为经过加窗分帧、傅里叶变换后获取的两路并行时频域含噪语音信号。8.一种腰部治疗仪,包括权利要求7所述的语音处理系统对用户语音进行信号增强,其特征在于,还包括:识别系统;治疗系统;所述识别系统、治疗系统分别与所述语音处理系统电连接;所述识别系统用于对增强后的含噪语音进行识别,获取控制指令;所述治疗系统用于响应所述控制指令,对用户腰部进行治疗。
技术总结
本发明公开了一种语音处理方法、系统及腰部治疗仪,方法包括步骤:对输入的含噪语音信号经过加窗分帧进行傅里叶变换后;利用重合幅度谱获取补偿函数,并根据补偿函数对第一时频信号进行相位补偿,获取第一增强语音幅度谱;利用时频滤波函数对第二时频信号进行频谱能量滤波,获取第二增强语音幅度谱;利用第一权值、第二权值分别对第一增强语音幅度谱、第二增强语音幅度谱进行加权;获取增强语音的去噪幅度谱;对去噪幅度谱进行傅里叶逆变换。实施本发明,提高了增强语音信号的环境适应能力,降低了噪声幅度谱与语音幅度谱之间的混淆性,通过采用伴随因子构造补偿函数,提高了补偿精度,提高了估计准确性。提高了估计准确性。提高了估计准确性。
技术研发人员:曾国军 曹江华 杨振
受保护的技术使用者:深圳攀高医疗电子有限公司
技术研发日:2023.07.14
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
