语音交互的方法、电子设备及可读存储介质与流程

未命名 10-10 阅读：144 评论：0

1.本技术涉及车联网技术领域，更具体地，涉及一种语音交互的方法、电子设备及计算机可读存储介质。

背景技术：

2.目前，部分车机都带有语音识别功能，主要功能逻辑为通过车载麦克风进行语音的收集，由语音引擎进行语音识别和语义识别的处理，再由语音引擎分发给车机本地或者车机云端执行命令；如“打开车窗”的操作为车机本地执行即可；如“我想听郭德纲的相声”则需车机云端执行。
3.但是，车机本地或车机云端只能操作一些车控或者车机支持的娱乐功能，限制了用户的使用体验。

技术实现要素：

4.本技术的一个目的在于提供一种语音交互的方法，上述方法适用于车载终端的语音功能与手持终端的语音功能之间的交互控制。
5.本技术的一个目的在于提供一种语音交互的方法，可提高用户在车机内使用语音功能的体验。
6.为实现上述目的，本技术获取车载终端上传的语音控制指令，基于仲裁的方式确定出语音控制指令的执行主体；以及将语音控制指令发送至相应的执行主体以使执行主体执行语音控制指令；其中，执行主体为车载终端或手持终端。以此方式，将具有较强降噪功能的车机语音识别功能与具有较强控制功能的手持语音识别功能结合起来，可以实现更多的语音功能，以大大增加用户的语音产品体验。
附图说明
7.通过阅读参照以下附图所作的对非限制性实施例的详细描述，本技术的其它特征、目的和优点将会变得更明显。其中：
8.图1是根据本技术实施方式的语音交互的方法100的流程图；
9.图2是根据本技术示例性实施方式的步骤s120的流程图；
10.图3是根据本技术示例性实施方式的步骤s130的流程图；
11.图4是根据本技术实施方式的语音交互的方法200的流程图；
12.图5是根据本技术第一实施方式的步骤s240的流程图；
13.图6是根据本技术第二实施方式的步骤s240的流程图；
14.图7是根据本技术第三实施方式的步骤s240的流程图；
15.图8是根据本技术实施方式的语音交互的方法的示例性应用场景示意图；
16.图9是根据本技术实施方式的语音交互的方法的示例性应用场景示意图；
17.图10是根据本技术实施方式的语音交互的方法的执行流程示意图；
18.图11是本技术的示例性实施方式的电子设备的结构示意图；以及
19.图12是本技术的示例性实施方式的电子设备的结构示意图。
具体实施方式
20.为了更好地理解本技术，将参考附图对本技术的各个方面做出更详细的说明。应理解，这些详细说明只是对本技术的示例性实施方式的描述，而非以任何方式限制本技术的范围。在说明书全文中，相同的附图标号指代相同的元件。表述“和/或”包括相关联的所列项目中的一个或多个的任何和全部组合。
21.应注意，在本说明书中，除非有相反的明确教导，否则第一、第二、第三等的表述仅用于将一个特征与另一个特征区域分开来，而不表示对特征的任何限制，尤其不表示任何的先后顺序。
22.还应理解的是，诸如“包括”、“包括有”、“具有”、“包含”和/或“包含有”等表述在本说明书中是开放性而非封闭性的表述，其表示存在所陈述的特征，但不排除一个或多个其它特征和/或它们的组合的存在。此外，当描述本技术的实施方式时，使用“可”表示“本技术的一个或多个实施方式”。并且，用语“示例性的”旨在指代示例或举例说明。
23.除非另外限定，否则本文中使用的所有措辞(包括工程术语和科技术语)均具有与本技术所属领域普通技术人员的通常理解相同的含义。还应理解的是，除非本技术中有明确的说明，否则在常用词典中定义的词语应被解释为具有与它们在相关技术的上下文中的含义一致的含义，而不应以理想化或过于形式化的意义解释。
24.需要说明的是，在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。另外，除非明确限定或与上下文相矛盾，否则本技术所记载的方法中包含的具体步骤不必限于所记载的顺序，而可以任意顺序执行或并行地执行。下面将参考附图并结合实施例来详细说明本技术。
25.可以理解，车辆的车机上配置有语音识别功能，但是语音识别功能只能操作一些车控或者车机支持的娱乐功能，限制了用户的使用体验。
26.可以理解，手机配置有语音识别功能，如苹果的siri语音、vivo的jovi语音、华为的小艺语音、oppo的breeno语音等。这些语音识别的主要功能逻辑为通过手机的麦克风进行语音的收集，再由手机系统进行解析，最后进行执行。
27.由于车机与手机的服务定位不同，因此，手机上配置的语音识别功能能够支持较多的功能。但是，当用户处于车机内时，由于车机所处的环境可能较为嘈杂，使得手机的语言识别效果不太好，这也降低了用户的使用体验。
28.基于此，本技术的实施方式提出了一种语音交互的方法。在该方案中，获取车载终端上传的语音控制指令；基于仲裁的方式确定出语音控制指令的执行主体；以及将语音控制指令发送至相应的执行主体以使执行主体执行语音控制指令；其中，执行主体为车载终端或手持终端。以此方式，将具有较强降噪功能的车机语音识别功能与具有较强控制功能的手持语音识别功能结合起来，可以实现更多的语音功能，以大大增加用户的语音产品体验。
29.在下文中，将结合附图更详细地描述本方案的具体示例。
30.图1示出了根据本技术实施方式的语音交互的方法100的流程图。如图1所示，语音
交互的方法100包括以下步骤：
31.s110、获取车载终端上传的语音控制指令；
32.s120、基于仲裁的方式确定出语音控制指令的执行主体，其中，执行主体为车载终端或手持终端；以及
33.s130、将语音控制指令发送至相应的执行主体以使执行主体执行语音控制指令。
34.应当理解的是，语音交互的方法100中所示的步骤不是排它性的，方法100还可以包括未示出的附加步骤和/或可以省略所示出的步骤，本技术的范围在此方面不受限制。下面参照图1至图3、图10详细描述步骤s110至步骤s130。
35.s110
36.在步骤s110中，获取车载终端上传的语音控制指令。
37.在一些实施方式中，车机上安装有抗噪性能较强的车载麦克风，用于使车机的语音功能适应于车机所处的嘈杂环境。
38.具体而言，车机内部声学环境比较恶劣，存在各种噪声的干扰和人机交互，需要对采集到的麦克风信号做处理，后续的语音唤醒以及语音指令才能有性能保证。
39.在一些实施方式中，通过回声消除算法和降噪算法对用户音频进行语音增强处理，以提高用户的有效音频信号，去除噪声干扰。回声消除指全面声学回声消除。声学回声是指设备自身扬声器播放的声音经不同路径一次或多次反射后进入麦克风所产生的回声集合，也可称为设备自噪声。用户通过语音同设备进行交互时，回声信号和干净的语音信号混合，这会恶化采集到的语音信号的信噪比，严重干扰后续语音唤醒以及语音指令的接收。因此通过回声消除算法模块，消除设备自噪声，以达到提升信噪比的目的。降噪算法实现为采用专为车载噪声特点设计的噪声跟踪算法，实时动态估计目前车内噪声特征，然后利用降噪算法把估计出的噪声抑制掉，达到增强用户语音的目的，最终提升在车载噪声环境下的语音系统性能。回声消除算法和降噪算法可以选用相关技术中常用的算法实现，本技术此处不再赘述。而且，本技术对用户音频进行语音增强处理也可采用其他算法，本技术对此不做限制。
40.当车机内的用户发出语音时，通过车载麦克风收集语音信息，并将语音信息的声音信号转换成电信号传送给车载终端。通过车载终端解析语音信息以获得与语音信息相关联的语音控制指令。
41.可选的，车载终端内置有语音引擎，语音引擎对语音信息进行语音识别和语义识别等流程后解析出语音信息中的语音控制指令，然后将语音控制指令发送至车机云端。
42.可选的，语音引擎布置在车机云端，车载终端将语音信息的电信号传输至车机云端，由布置在车机云端的语音引擎对语音信息进行语音识别和语义识别等流程后解析出语音信息中的语音控制指令。
43.例如，用户可通过唤醒词唤醒语音功能，当语音功能确定被唤醒后，用户可发出语音信息，例如“打开车窗”“调低空调温度2℃”“我想听相声/音乐/电台”等等。
44.s120
45.在步骤s120中，基于仲裁的方式确定出语音控制指令的执行主体，其中，执行主体为车载终端或手持终端。
46.由前述可知，现有的车机上的语音功能仅能实现较少的功能，例如车控、音乐、电
台等，限制了用户的使用体验。
47.本技术在接收到用户的语音控制指令后，基于仲裁的方式确定出该语音控制指令的执行主体为车载终端或是手持终端，如果是车载终端，将语音控制指令发送至车载终端，如果是手持终端，则将语音控制指令发送至手持终端。上述的手持终端可以是智能手机、智能ipad等。
48.在一些实施方式中，如图2所示，基于仲裁的方式确定出语音控制指令的执行主体的步骤包括：
49.s121、响应于语音控制指令中的语义，确定语音控制指令所属的技能类别；以及
50.s122、根据所确定的技能类别与车载终端或手持终端的对应关系，确定出语音控制指令的执行主体。
51.具体而言，如图10所示，车机云端部署有仲裁系统，通过上述仲裁系统可确定出语音控制指令的执行主体。仲裁系统中存储有技能类别与车载终端或者手持终端的对应关系。示例性的，技能类别包括本地车控技能、本地多媒体技能或手机技能中的任意一项。与此对应的，本地车控技能、本地多媒体技能的执行主体对应于车载终端，手机技能的执行主体对应于手持终端。
52.可选的，本地车控技能为控制车机的技能，例如“打开车窗”“增加/降低空调温度”等。本地多媒体技能为车载终端或者与车载终端互连的服务端能够执行的技能，例如“打开导航”“打开收音机”“天气预报”“新闻”“相声”等。手机技能为车载终端或者与车载终端互连的服务端不能执行的技能，例如“网易云音乐”“qq音乐”“爱奇艺视频”“火车票”“朋友圈”“打电话”等。可以理解的是，上述示例仅为本地车控技能、本地多媒体技能或手机技能的示例性说明，在具体实施过程中可按照车载终端和手持终端的实际配置情况而定。
53.在一些实施方式中，上述的对应关系可为系统默认设置，也可由用户自行根据需要进行设置。
54.至此，在步骤s121中，车机云端接收语音控制指令后，根据语音控制指令中的语义即可确定出该语音控制指令所属的技能类别，然后在步骤s122中根据所确定的技能类别与车载终端或手持终端的对应关系确定出上述语音控制指令的执行主体。
55.示例性的
56.当语音引擎识别出语音信息中的语音控制指令为“打开车窗”时，仲裁系统根据该语音控制指令的语义确定出该语音控制指令所属的技能类别为车控技能，然后，根据对应关系，确定上述语音控制指令对应的执行主体为车载终端。
57.当语音引擎识别出语音信息中的语音控制指令为“我想听郭德纲的相声”时，仲裁系统根据该语音控制指令的语义确定出该语音控制指令所属的技能类别为本地多媒体技能，然后，根据对应关系，确定上述语音控制指令对应的执行主体为车载终端。
58.当语音引擎识别出语音信息中的语音控制指令为“我想用网易云音乐收听周杰伦的歌”时，仲裁系统根据该语音控制指令的语义确定出该语音控制指令所属的技能类别为手机技能，然后，根据对应关系，确定上述语音控制指令对应的执行主体为手持终端。
59.当语音引擎识别出语音信息中的语音控制指令为“我想用爱奇艺视频看北京冬奥会的直播”时，仲裁系统根据该语音控制指令的语义确定出该语音控制指令所属的技能类别为手机技能，然后，根据对应关系，确定上述语音控制指令对应的执行主体为手持终端。
60.当语音引擎识别出语音信息中的语音控制指令为“帮我把最近的2张照片发送至朋友圈并配文：今天的天气真好呀”时，仲裁系统根据该语音控制指令的语义确定出该语音控制指令所属的技能类别为手机技能，然后，根据对应关系，确定上述语音控制指令对应的执行主体为手持终端。
61.s130
62.在步骤s130中，将语音控制指令发送至所确定出的执行主体以使执行主体执行语音控制指令。
63.可以理解的是，在步骤s120中基于仲裁的方式确定出语音控制指令的执行主体为车载终端或手持终端仅为执行主体类别的区分。
64.在步骤s130中将语音控制指令发送至相应的执行主体，该执行主体为与发出语音控制指令的用户相关联的车载终端或手持终端。
65.可以理解的是，由于用户处于车机内，因此，当在步骤s120中确定出的执行主体为车载终端中，应在步骤s130中将语音控制指令发送至在步骤s110中上传语音控制指令的车载终端，以使该车载终端执行语音控制指令。
66.但是，当在步骤s120中确定出的执行主体为手持终端中，由于车机内发出语音信息的用户不仅可以为驾驶员，还有可能是乘车人员，因此，需要将语音控制指令发送至与车载终端互连的手持终端中。然而，在一些场景中，与车载终端互连的手持终端不止一个，此时，还需确定出应将语音控制指令发送至哪一个手持终端中。
67.在一些实施方式中，在步骤s120中确定出执行主体为手持终端时，如图3所示，步骤s130中的将语音控制指令发送至所确定出的执行主体的步骤包括：
68.s131、确定发出语音控制指令的用户；以及
69.s132、将语音控制指令发送至用户的手持终端。
70.在一些实施方式中，步骤s131中，确定发出语音控制指令的用户，包括：基于声纹识别的方式确定发出语音控制指令的用户。
71.示例性的，可将不同用户的声纹信息预先录入车载终端中，并分别与用户的手持终端相绑定。因此，车载终端接收到语音信息中也必然携带了发出该语音信息的用户的声纹信息。车载终端在解析语音信息时可根据该语音信息中的声纹信息与系统中预先录入的声纹信息进行匹配，从而确定发出语音信息的用户，并将该用户的信息与语音控制指令一并发送至车机云端。因此，在步骤s131中确定发出语音控制指令的用户后，在步骤s132中将该语音控制指令发送至该用户的手持终端中。
72.在一些实施方式中，步骤s131中，确定发出语音控制指令的用户，包括：基于声源定位和人脸识别的方式确定发出语音控制指令的用户。
73.示例性的，可将不同用户的面部图像信息预先录入车载终端中，并分别与用户的手持终端相绑定。而且，车载麦克风具有声源定位的功能，且车机内安装有摄像头。因此，当车载麦克风收集语音信息时，可采用声源定位的方式定位到发出该语音信息的用户在车机内所处的位置，然后控制摄像头转向该用户的位置并获取该用户的图像。当车载终端通过车载麦克风接收到语音信息时还通过摄像头获取到发出语音信息的用户的面部图像。车载终端在解析语音信息时还可将摄像头所获取的面部图像与系统中预先录入的面部图像进行匹配，从而确定发出语音信息的用户，并将该用户的信息与语音控制指令一并发送至车
机云端。因此，在步骤s131中确定发出语音控制指令的用户后，在步骤s132中将该语音控制指令发送至该用户的手持终端中。
74.可以理解的是，步骤s132中将该语言控制指令发送至该用户手持终端指的是，车机云端将语音控制指令发送至手持终端的云端，手持终端的云端再根据相关的协议将语音控制指令发送至手持终端中。
75.手持终端接收语音控制指令的是手持终端的语音控制系统，语音控制系统根据语音控制指令中的语义控制手持终端中相应的应用程序运行。
76.图4示出了根据本技术实施方式的语音交互的方法200的流程图。如图4所示，语音交互的方法200包括以下步骤：
77.s210、获取车载终端上传的语音控制指令；
78.s220、基于仲裁的方式确定出语音控制指令的执行主体，其中，执行主体为车载终端或手持终端；
79.s230、将语音控制指令发送至相应的执行主体以使执行主体执行语音控制指令；以及
80.s240、手持终端的语音控制系统根据语音控制指令中的语义控制相应的应用程序运行。
81.其中，步骤s210至步骤s230可参照如图1至图3所示出的步骤s110至步骤s130，本技术此处不再赘述，以下参照图5至图7、图8至图10对步骤s240做详细介绍。
82.步骤s220中确定执行主体为手持终端，步骤s230中将语音控制指令发送至执行主体之后，在步骤s240中手持终端的语音控制系统根据语音控制指令中的语义控制手持终端中相应的应用程序运行。
83.示例性的，如果语音控制指令是播放类的命令，语音控制系统根据语音控制指令中的语义确定在应用程序中搜索的关键词，然后将相应的应用程序打开后，在搜索框内自动输入关键词进行搜索，并将按照搜索结果播放音乐或视频。如果语音控制指令是执行类的命令，语音控制系统根据语音控制指令中的语义打开应用程序，直接执行即可。
84.例如，语音控制指令为“我想听郭德纲的相声”时，所确定的关键词即可为“相声”和“郭德纲”。语音控制指令为“我想收听周杰伦的歌《龙卷风》”时，所确定的关键词即可为“周杰伦”“龙卷风”。语音控制指令为“我想看北京冬奥会的直播”时，所确定的关键词即可为“冬奥会”“直播”等。
85.在一些实施方式中，手持终端的语音控制系统根据语音控制指令中的语义控制相应的应用程序运行之后，本技术的语音交互方法还包括：确定手持终端与车载终端处于互连状态时，手持终端通过与车载终端的互连关系，将应用程序的处理内容映射至车载终端中。
86.如果语音控制指令时播放类的命令，那么，手持终端的app在播放相应的内容后，还可通过与车载终端的互连关系将播放内容映射至车载终端中。
87.示例性的，如果是音频类的播放内容，可通过蓝牙、usb或者wifi等互连通道将播放内容映射至车载终端，由车载终端的音频播放器播放上述内容。如果是视频类的播放内容，可通过usb或者wifi等互连通道将播放内容映射至车载终端，例如投屏，由车载终端的显示器显示上述播放内容。
88.为了更加清楚的说明本技术的技术方案，以下参照图8、图9和图10以实际应用场景为例进行详细叙述。
89.在第一应用场景中，如图8所示，当用户310唤醒车载语音功能并说出“打开车窗”时，车载终端320的语音引擎识别该语音信息后，发送至车机云端330。车机云端330的仲裁系统确定该语音控制指令所属的技能类别是本地车控技能，因此，发送该语音控制指令给车载终端320，车载终端320收到该语音控制指令后，控制车窗打开。
90.在第二应用场景中，如图8所示，当用户310唤醒车载语音功能并说出“我想听郭德纲的相声”时，车载终端320的语音引擎识别该语音信息后，发送至车机云端330。车机云端330的仲裁系统根据语音控制指令的语义确定该语音控制指令所属的技能类别是本地多媒体技能。因此，发送该语音控制指令给车载终端320，车载终端320收到该语音控制指令后，控制相应的应用程序运行，并根据相关的关键词搜索，并播放具体的音频数据。
91.在第三应用场景中，如图8所示，当用户310唤醒车载语音功能并说出“我想用网易云音乐收听周杰伦的歌《龙卷风》”时，车载终端320的语音引擎识别该语音信息后，发送至车机云端330。车机云端330的仲裁系统根据语音控制指令的语义确定该语音控制指令所属的技能类别是手机技能。因此，发送该语音控制指令给手持终端340，手持终端340收到该语音控制指令后，控制网易云音乐应用程序运行，并根据相关的关键词(周杰伦、龙卷风)搜索，并播放龙卷风的音频数据。并通过蓝牙通路，将音频数据传输至车载终端320，使声音在车机端播放出来。
92.在第四应用场景中，如图8所示，当用户310唤醒车载语音功能并说出“我想用爱奇艺视频看北京冬奥会的直播”时，车载终端320的语音引擎识别该语音信息后，发送至车机云端330，车机云端330的仲裁系统根据语音控制指令的语义确定该语音控制指令所属的技能类别是手机技能，因此，发送该语音控制指令给手持终端340，手持终端340收到该语音控制指令后，控制爱奇艺视频应用程序运行，并根据相关的关键词(冬奥会、直播)搜索，并播放冬奥会直播的视频数据。并通过投屏技术将视频内容投屏至车载终端320的显示屏上进行显示。
93.在第五应用场景中，如图8所示，当用户310唤醒车载语音功能并说出“帮我把最近的2张照片发送至朋友圈并配文：今天的天气真好呀”时，车载终端320的语音引擎识别该语音信息后，发送至车机云端330，车机云端330的仲裁系统根据语音控制指令的语义确定该语音控制指令所属的技能类别是手机技能，因此，发送该语音控制指令给手持终端340，手持终端340收到该语音控制指令后，调用微信接口，启动选择图片并发送朋友圈。完成以后，还可将处理结果通过usb或者wifi传递给车载终端320进行提示。
94.在第六应用场景中，如图9所示，车机内的用户包括驾驶员310-1和一位乘车人员310-2，两者的手持终端340-1、340-2均与车载终端具有互连记录，但是，当前时刻下与车载终端320wifi互连的手持终端340-1为驾驶员310-1所有。当乘车人员310-2唤醒车载语音功能并说出“我想用爱奇艺视频看北京冬奥会的直播”时，车载终端320的语音引擎识别该语音信息并根据声纹信息或图像信息确定发出语音控制指令的用户为乘车人员310-2后，将上述信息发送至车机云端330。车机云端330的仲裁系统根据语音控制指令的语义确定该语音控制指令所属的技能类别是手机技能，因此，发送该语音控制指令给乘车人员310-2的手持终端340-2，乘车人员310-2的手持终端340-2收到该语音控制指令后，控制爱奇艺视频应
用程序运行，并根据相关的关键词(冬奥会、直播)搜索，并播放冬奥会直播的视频数据。此时，由于与车载终端320wifi互连的手持终端为驾驶员310-1的手持终端340-1，因此，车载终端320的控制系统控制车载终端的通信模块与驾驶员310-1的手持终端340-1断开连接，并与乘车人员310-2的手持终端340-2wifi互连，并通过投屏技术将视频内容投屏至车载终端320的显示屏上进行显示。
95.在一些实施方式中，语音控制指令中的语义并不能直接地指向唯一的应用程序。例如，语音控制指令为“我想听音乐”，然而，手持终端中安装有多个音乐类的应用程序，例如，网易云音乐、qq音乐、酷狗音乐等。再例如，语音控制指令为“查询火车票”，然而，手持终端中安装有多个出行类的应用程序，例如，中国铁路12306、智行火车票、飞猪、携程等。在此场景下，需要确定出采用哪一个应用程序执行该语音控制指令。
96.在一些实施方式中，如图5所示，上述步骤s240包括：
97.s241、根据语音控制指令中的语义确定出能够执行该语音控制指令的多个应用程序；
98.s242、遍历多个应用程序，确定多个应用程序的会员开通状态；以及
99.s243、控制开通会员的应用程序执行语音控制指令。
100.上述方案，通过使用开通了会员服务的应用程序执行用户的指令，能够使用户获得很好的使用体验。
101.当在步骤s242中确定出开通会员服务的应用程序不止一个时，还可通过获取用户的使用痕迹的方式，确定出用户最近使用的应用程序，然后控制该应用程序执行语音控制指令。
102.在一些可替换的实施方式中，如图6所示，上述步骤s240包括：
103.s241’、根据语音控制指令中的语义确定出能够执行该语音控制指令的多个应用程序；
104.s242’、确定多个应用程序的优先级；以及
105.s243’、控制按照优先级顺序最高的应用程序执行语音控制指令。
106.上述方案，在步骤s242’中，可通过多个应用程序在应用商店中的评分高低确定出各个应用程序的优先级顺序，评分高的应用程序相应的优先级高，评分低的应用程序相应的优先级低。或者，用户可预先对同一类别的多个应用程序进行优先级的设定，然后在步骤s242’中根据预设的优先级确定出各个应用程序的优先级顺序。
107.在另外一些可替换的实施方式中，如图7所示，上述步骤s240包括：
108.s241”、根据语音控制指令中的语义确定出能够执行该语音控制指令的多个应用程序；
109.s242”、确定多个应用程序的使用频率；以及
110.s243”、控制按照使用频率最高的应用程序执行语音控制指令。
111.上述方案中，在步骤s242”中可通过各个应用程序的用电量确定用户对各个应用程序的使用频率，用电量较大，意味着该应用程序运行时间较长，用户使用的频率较高，反之亦然。
112.此外，基于上述语音交互的方法，本技术的实施方式还提供一种电子设备，例如，服务器、云端服务器等。
113.图11示出了本技术的第一示例性实施方式的电子设备的结构示意图。
114.如图11所示，电子设备包括：至少一个处理器701；以及与至少一个处理器701通信连接的存储器702；其中，存储器存储有可被至少一个处理器701执行的指令，指令被至少一个处理器701执行，以使至少一个处理器701能够执行上述实施方式提及的语音交互的方法。其中，电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本技术的实现。
115.图12示出了本技术的第二示例性实施方式的电子设备的结构示意图。
116.如图12所示，电子设备还可例如包括：i/o接口703、输入单元704、输出单元705、通信单元706、只读存储器(rom)707和随机存取存储器(ram)708。具体地，处理器701可根据存储在rom707中的计算机程序或者从存储器702加载到ram708中的计算机程序，来执行各种适当的动作和处理。在ram708中，还可存储电子设备操作所需的各种程序和数据。处理器701、rom707以及ram708通过总线709彼此相连。i/o接口(输入/输出接口)703也连接至总线709。
117.电子设备中的多个部件连接至i/o接口703，包括：输入单元704，例如键盘、鼠标等；输出单元705，例如各种类型的显示器、扬声器等；存储器702，例如磁盘、光盘等；以及通信单元706，例如网卡、调制解调器、无线通信收发机等。通信单元706允许电子设备通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
118.处理器701可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器701的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器701执行上文所描述的各个方法和处理，例如语音交互的方法。例如，在一些实施例中，语音交互的方法可被实现为计算机软件程序，其被有形地包含于计算机可读存储介质，例如存储器702。在一些实施例中，计算机程序的部分或者全部可以经由rom707和/或通信单元706而被载入和/或安装到电子设备上。当计算机程序加载到ram708并由处理器701执行时，可以执行上文描述的语音交互的方法的一个或多个步骤。备选地，在其他实施例中，处理器701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行语音交互的方法。
119.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
120.于实施本技术的方法的程序代码可以采用一个或多个编程语言的任何组合来编
写。上述程序代码可以封装成计算机程序产品。这些程序代码或计算机程序产品可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器701执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在计算机上执行、部分地在计算机上执行，作为独立软件包部分地在计算机上执行且部分地在远程计算机上执行或完全在远程计算机或服务器上执行。
121.电子设备的具体描述及有益效果，可以参考上述语音交互的方法的描述，不再赘述。
122.此外，这里需要指出的是：本技术另一方面还提供了一种计算机可读存储介质，且所述计算机可读存储介质中存储有前文提及的语音交互的方法所执行的计算机程序，且所述计算机程序包括程序指令，当所述处理器执行所述程序指令时，能够执行前文所述语音交互的方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本技术所涉及的计算机可读存储介质实施例中未披露的技术细节，请参照本技术方法实施例的描述。
123.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，程序可存储于一计算机可读存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，存储介质可为磁碟、光盘、只读存储记忆体(read-only memory，rom)或随机存储记忆体(random access memory，ram)等。
124.以上描述仅为本技术的实施方式以及对所运用技术原理的说明。本领域技术人员应当理解，本技术中所涉及的保护范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离技术构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

技术特征：
1.一种语音交互的方法，其特征在于，包括：获取车载终端上传的语音控制指令；基于仲裁的方式确定出所述语音控制指令的执行主体；以及将所述语音控制指令发送至相应的执行主体以使所述相应的执行主体执行所述语音控制指令；其中，所述相应的执行主体为所述车载终端或与所述车载终端互连的手持终端。2.根据权利要求1所述的方法，其中，基于仲裁的方式确定出所述语音控制指令的执行主体，包括：响应于所述语音控制指令中的语义，确定所述语音控制指令所属的技能类别；以及根据所确定的技能类别与车载终端或手持终端的对应关系，确定出所述语音控制指令的执行主体。3.根据权利要求2所述的方法，其中，所述技能类别包括本地车控技能、本地多媒体技能或手机技能中的任意一项。4.根据权利要求2或3所述的方法，其中，所述执行主体为手持终端；其中，将所述语音控制指令发送至相应的执行主体，包括：确定发出所述语音控制指令的用户；以及将所述语音控制指令发送至所述用户的手持终端。5.根据权利要求4所述的方法，其中，确定发出所述语音控制指令的用户，包括：基于声纹识别的方式确定发出所述语音控制指令的用户。6.根据权利要求4所述的方法，其中，确定发出所述语音控制指令的用户，包括：基于声源定位和人脸识别的方式确定发出所述语音控制指令的用户。7.根据权利要求4所述的方法，其中，将所述语音控制指令发送至所述执行主体之后，所述方法还包括：所述手持终端的语音控制系统根据所述语音控制指令中的语义控制相应的应用程序运行。8.根据权利要求7所述的方法，其中，所述手持终端中安装有能够执行同一语音控制指令的多个应用程序；其中，所述手持终端的语音控制系统根据所述语音控制指令中的语义控制相应的应用程序运行包括：根据所述语音控制指令中的语义确定出能够执行该语音控制指令的多个应用程序；遍历所述多个应用程序，确定所述多个应用程序的会员开通状态；以及控制开通会员的应用程序执行所述语音控制指令。9.根据权利要求7所述的方法，其中，所述手持终端中安装能够有执行同一语音控制指令的多个应用程序；其中，所述手持终端的语音控制系统根据所述语音控制指令中的语义控制相应的应用程序运行包括：根据所述语音控制指令中的语义确定出能够执行该语音控制指令的多个应用程序；确定所述多个应用程序的优先级；以及控制按照优先级顺序最高的应用程序执行所述语音控制指令。
10.根据权利要求7所述的方法，其中，所述手持终端中安装有能够执行同一语音控制指令的多个应用程序；其中，所述手持终端的语音控制系统根据所述语音控制指令中的语义控制相应的应用程序运行包括：根据所述语音控制指令中的语义确定出能够执行该语音控制指令的多个应用程序；确定所述多个应用程序的使用频率；以及控制按照使用频率最高的应用程序执行所述语音控制指令。11.根据权利要求7所述的方法，其中，所述手持终端的语音控制系统根据所述语音控制指令中的语义控制相应的应用程序运行之后，所述方法还包括：确定所述手持终端与所述车载终端处于互连状态时，所述手持终端通过与所述车载终端的互连关系，将所述应用程序的处理内容映射至所述车载终端中。12.一种电子设备，其特征在于，包括：处理器；以及存储器，与所述处理器通讯连接；其中，所述存储器存储有可被处理器执行的程序，当程序被所述处理器执行时，所述处理器能够执行根据如权利要求1-6任一所述的方法。13.一种可读存储介质，其特征在于，可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现根据如权利要求1-6任一所述的方法。

技术总结
本申请提供一种语音交互的方法、电子设备及可读存储介质。语音交互的方法包括：获取车载终端上传的语音控制指令，基于仲裁的方式确定出语音控制指令的执行主体；以及将语音控制指令发送至相应的执行主体以使执行主体执行语音控制指令；其中，执行主体为车载终端或手持终端。以此方式，将具有较强降噪功能的车机语音识别功能与具有较强控制功能的手持语音识别功能结合起来，可以实现更多的语音功能，以大大增加用户的语音产品体验。以大大增加用户的语音产品体验。以大大增加用户的语音产品体验。

技术研发人员：陈玮邢光亚
受保护的技术使用者：博泰车联网（南京）有限公司
技术研发日：2022.03.24
技术公布日：2023/10/7

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

语音交互的方法、电子设备及可读存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

语音交互的方法、电子设备及可读存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表