在导航会话期间检测和处理驾驶事件声音的制作方法
未命名
07-17
阅读:111
评论:0
1.本公开涉及检测驾驶事件声音,并且更具体地,涉及通过屏蔽(mask)由电子设备生成的假的驾驶事件声音的影响来防止驾驶员分散注意力。
背景技术:
2.这里提供的背景技术描述是为了一般地呈现本公开的情境。在本背景技术部分中描述的程度上,对于目前指明的发明人的工作,以及在提交时可能不符合现有技术的描述的各方面,既不明确也不隐含地被承认为是本公开的现有技术。
3.今天,在计算机、智能手机等,或者嵌入式设备等中执行的软件应用生成逐步导航指引。通常,用户指定起点和目的地,并且软件应用立即和/或当用户从起点行进到目的地时以音频格式显示和/或呈现指引。
4.在导航期间,对驾驶员可能会有许多注意力分散。一种类型的注意力分散可能是在车辆内播放驾驶相关的噪声(例如,紧急车辆汽笛声、汽车喇叭声、车辆碰撞等)。这些驾驶相关的噪声可能会欺骗驾驶员,使其认为这些噪声是来自外部源的真实噪声,而不是由车辆内设备生成的假的声音。结果,驾驶员可能会对驾驶相关的噪音做出反应,例如不必要地减速或靠边停车。
技术实现要素:
5.在一些实现方式中,在车辆内运行的地图应用可以识别来自车辆内或来自车辆周围区域的驾驶事件声音。例如,地图应用可以识别驾驶事件声音,同时呈现导航指引以辅助驾驶员从开始位置行进到目的地位置。驾驶事件声音可以是紧急车辆汽笛声、汽车喇叭声、车辆碰撞声等。
6.地图应用可以通过例如经由应用编程接口(api)与在客户端设备上执行的其他应用通信来识别驾驶事件声音。在客户端设备上执行的其他应用可以提供其他应用正在播放的音频内容的特性,诸如当前或即将到来的音频内容的音频流或描述音频内容的元数据(例如,音频内容的标题、音频内容的描述、音频内容中包括的术语、短语或声音、音频内容的长度、音频内容的语言等)。此外,地图应用可以与车辆内的其他设备(例如,车辆头部单元)通信,诸如经由短距通信链路。其他设备也可以向地图应用提供音频内容的特性。此外,地图应用可以通过将预定驾驶事件声音的音频指纹与周围区域中的周边音频进行比较来识别驾驶事件声音。
7.在任何情况下,当识别到驾驶事件声音时,地图应用可以确定该驾驶事件声音是真实的(即,驾驶事件声音是从车辆或从车辆外部的外部源(诸如另一车辆或紧急车辆)提供的,并且需要驾驶员的注意)还是假的(即,驾驶事件声音来自车辆内的电子设备并且不需要驾驶员的注意)。如果从车辆内的电子源,诸如在客户端设备或另一设备上执行的另一应用,识别出驾驶事件声音,则地图应用可以确定驾驶事件声音是假的。在其他实现方式中,地图应用可以通过将驾驶事件声音的特性应用于被训练来区分真实和假的驾驶事件声
音的机器学习模型来确定驾驶事件声音是真实的还是假的。驾驶事件声音的特性可以包括驾驶事件声音的音频特性以及在驾驶事件声音出现时车辆的环境特性,诸如可能导致车门警报的车门是否打开。
8.当地图应用识别出假的驾驶事件声音时,地图应用试图屏蔽驾驶事件声音对驾驶员的影响,以基本上防止驾驶员被驾驶事件声音分散注意力。例如,地图应用可以在客户端设备上显示通知,该通知指示驾驶事件声音是假的,并指令驾驶员忽略它。地图应用还可以播放具有类似指令的音频通知。附加地或替代地,地图应用可以防止播放该驾驶事件声音的至少一部分。例如,在驾驶事件声音期间,地图应用可以降低音频的音量或使音频静音。在其他实现方式中,例如,地图应用可以经由带通滤波器滤除驾驶事件声音期间的音频。
9.当地图应用识别真实的驾驶事件声音时,地图应用可以警告驾驶员该声音是真实的,使得驾驶员不会忽略该驾驶事件声音。例如,地图应用可以在客户端设备上显示指示驾驶事件声音是真实的通知,并指令驾驶员适当地做出响应。地图应用还可以播放具有类似指令的音频通知。
10.以这种方式,地图应用可以减少对驾驶员的注意力分散量,从而提高驾驶员安全性。这种注意力分散量的减少是通过过滤或屏蔽与驾驶事件相关的假的声音来实现的。如本文所公开的,这种过滤可以减少这种假的声音的音量,去除部分或全部这种假的声音,或者提供一个或多个通知来通知驾驶员该假的声音不是真实的。以这种方式,通过听不到假的声音或被通知该假的声音不是真实的,驾驶员不会进行反应并改变他们对车辆的控制(即,对声音进行反应)。这样,由于主动减少了假的驾驶声音对导航指令的影响,本文公开的地图应用极大地提高了安全性。地图应用还可以辅助驾驶员识别紧急车辆、车辆碰撞或车辆故障,并帮助驾驶员适当地做出响应。
11.本公开的技术的一个示例实施例是一种用于在导航会话期间识别驾驶事件声音的方法。该方法包括提供用于沿着路线从开始位置行进到目的地位置的一组导航指引。在到目的地位置的导航期间,该方法包括识别包括来自车辆内或车辆周围区域的驾驶事件声音的音频。响应于确定该音频包括驾驶事件声音,该方法包括确定该驾驶事件声音是否是假的。响应于确定该驾驶事件声音是假的,该方法包括向驾驶员呈现指示该驾驶事件声音是假的通知,或者屏蔽该驾驶事件声音以防止驾驶员听到该驾驶事件声音。
12.本公开的技术的另一示例实施例是一种用于识别驾驶事件声音的客户端设备。客户端设备包括一个或多个处理器,以及耦合到一个或多个处理器并在其上存储指令的非暂时性计算机可读存储器。当由一个或多个处理器执行时,该指令使得客户端设备识别包括来自车辆内或车辆周围区域的驾驶事件声音的音频。响应于确定该音频包括驾驶事件声音,该指令使得客户端设备确定驾驶事件声音是否是假的。响应于确定该驾驶事件声音是假的,该指令使得客户端设备向驾驶员呈现指示该驾驶事件声音是假的通知,或者屏蔽该驾驶事件声音以防止驾驶员听到该驾驶事件声音。
13.本公开的技术的又一示例实施例是其上存储指令的非暂时性计算机可读存储器。当由一个或多个处理器执行时,该指令使得一个或多个处理器识别包括来自车辆内或车辆周围区域的驾驶事件声音的音频。响应于确定该音频包括驾驶事件声音,该指令使得一个或多个处理器确定该驾驶事件声音是否是假的。响应于确定该驾驶事件声音是假的,该指令使得一个或多个处理器向驾驶员呈现指示该驾驶事件声音是假的通知,或者屏蔽该驾驶
事件声音以防止驾驶员听到该驾驶事件声音。
附图说明
14.图1图示了在其中本公开的技术可以用于检测驾驶事件声音的示例车辆;
15.图2是其中可以实现用于检测驾驶事件声音的技术的示例系统的框图;
16.图3是图示用于使用第一机器学习模型基于音频流的特性识别驾驶事件声音的过程的组合的框图和逻辑图;
17.图4是图示用于使用第二机器学习模型基于驾驶事件声音的特性来识别该驾驶事件声音是真实的还是假的过程的组合的框图和逻辑图;
18.图5a-5c是包括响应于检测到驾驶事件声音给驾驶员的通知的示例导航显示;
19.图6是可以在客户端设备中实现的用于在导航会话期间识别驾驶事件声音的示例方法的流程图。
具体实施方式
20.概述
21.一般而言,用于识别驾驶事件声音的技术可以在一个或若干个客户端设备、车辆头部单元、一个或若干个网络服务器或者包括这些设备的组合的系统中实现。然而,为了清楚起见,下面的示例主要集中于以下实施例:执行地图应用的客户端设备从在该客户端设备上执行的另一应用或者从通信地连接到该客户端设备的设备获得音频回放数据。客户端设备可以与在客户端设备上执行的其他应用(例如,经由api)通信,或者可以与客户端设备附近的其他设备通信(例如,短距通信链路),客户端设备附近的其他设备诸如为车辆头部单元或其他客户端设备。客户端设备还可以获得或计算该区域内的音频的周边音频指纹。在任何情况下,客户端设备确定来自音频回放数据或周边音频指纹的音频是否包括驾驶事件声音。更具体地,客户端设备可以将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定驾驶事件声音的音频指纹进行比较。当存在匹配时,客户端设备可以确定该音频包括驾驶事件声音。
22.在其他实现方式中,客户端设备可以应用周边音频或来自音频回放数据的音频流,包括来自周边音频或其他音频流的任何导出特征,诸如音频指纹,作为用于识别驾驶事件声音的经训练的机器学习模型的输入。更具体地,服务器设备可能已经通过使用一组音频流的音频特征以及驾驶事件声音是否对应于每个音频流的指示来训练机器学习模型,而生成了经训练的机器学习模型。音频流可被分类为包括驾驶事件声音或不包括驾驶事件声音。在一些实现方式中,音频流可以根据特定类型的驾驶事件声音进行分类,诸如紧急车辆汽笛声、车辆碰撞声、车辆故障警报或车辆喇叭鸣响。在任何情况下,服务器设备可以向客户端设备提供经训练的机器学习模型。客户端设备然后可以连续地或周期性地将周边音频特征或来自音频回放数据中包括的音频流的音频特征应用于经训练的机器学习模型,以识别驾驶事件声音。
23.当识别出驾驶事件声音时,客户端设备可以确定驾驶事件声音是真实的还是假的。如果从车辆内的源(诸如在客户端设备或另一设备上执行的另一应用)识别出驾驶事件声音,则客户端设备可以确定该驾驶事件声音是假的。在其他实现方式中,客户端设备可以
通过将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定的假的驾驶事件声音的音频指纹进行比较来确定该驾驶事件声音是假的。当存在匹配时,客户端设备可以确定该音频包括假的驾驶事件声音。客户端设备还可以将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定的真实的驾驶事件声音的音频指纹进行比较。当存在匹配时,客户端设备可以确定该音频包括真实的驾驶事件声音。在其他实现方式中,客户端设备可以通过将驾驶事件声音的特性应用于被训练来区分真实和假的驾驶事件声音的机器学习模型,来确定驾驶事件声音是真实的还是假的。服务器设备可能已经通过使用驾驶事件声音的特性和每个驾驶事件声音是真实的还是假的指示来训练机器学习模型,而生成了用于将驾驶事件声音分类为真实的或假的经训练的机器学习模型。每个驾驶事件声音的特性可以包括驾驶事件声音的音频特性以及在驾驶事件声音出现时车辆处的环境特性。在任何情况下,服务器设备可以向客户端设备提供经训练的机器学习模型。客户端设备然后可以将检测到的驾驶事件声音的特性作为输入应用于经训练的机器学习模型,以确定驾驶事件声音是真实的还是假的。
24.当客户端设备识别出假的驾驶事件声音时,客户端设备可以通知驾驶员该驾驶事件声音是假的,并且可以指令驾驶员忽略它。客户端设备还可以使音频静音、降低音频的音量或者从音频中过滤驾驶事件声音。当客户端设备识别出真实的驾驶事件声音时,客户端设备可以警告驾驶员该声音是真实的,使得驾驶员可以适当地响应。
25.在一些实现方式中,客户端设备在由地图应用提供的导航会话期间识别驾驶事件声音。例如,当诸如驾驶员之类的用户请求从开始位置到目的地位置的导航指引时,地图应用可以向导航数据服务器提供请求。导航数据服务器然后可以向客户端设备提供一组导航指引,该组导航指引可以由地图应用呈现。当地图应用向用户呈现该组导航指引时,客户端设备可以识别驾驶事件声音并屏蔽假的驾驶事件声音对驾驶员的影响。在其他实现方式中,无论是否存在活动的导航会话,只要客户端设备在车辆内,客户端设备就识别驾驶事件声音。客户端设备的用户可以请求地图应用在导航会话期间或用户在车辆内的任何时间识别驾驶事件声音。因此,有益的是,无论是否使用导航,本文公开的地图应用都可以提高驾驶安全性。
26.示例硬件和软件组件
27.参考图1,可以实现上述技术的示例环境1包括便携式设备10和具有头部单元14的车辆12。例如,便携式设备10可以是智能电话、平板计算机或车载导航系统。便携式设备10经由通信链路16与车辆12的头部单元14通信,通信链路16可以是有线的(例如,通用串行总线(usb))或无线的(例如,蓝牙、wi-fi直连)。便携式设备10还可以经由无线通信网络,诸如第四代或第三代蜂窝网络(分别为4g或3g),与各种内容提供商、服务器等通信。
28.头部单元14可以包括显示器18,用于呈现导航信息,诸如数字地图。在一些实现方式中,显示器18是触摸屏,并且包括用于输入文本输入的软件键盘,该文本输入可以包括目的地、起始点的名称或地址等。分别在头部单元14和方向盘上的硬件输入控件20和22可用于输入字母数字字符或执行用于请求导航指引的其他功能。例如,头部单元14还可以包括音频输入和输出组件,诸如麦克风24和扬声器26。扬声器26可以用于播放从便携式设备10发送的音频指令或音频通知。
29.图2中图示了其中可以实现驾驶事件声音检测系统的示例通信系统100。通信系统
100包括被配置为执行地理应用122的客户端设备10,地理应用122也可以被称为“地图应用122”。取决于实现方式,应用122可以显示交互式数字地图,请求和接收路线数据以提供包括音频导航指引的驾驶、步行或其他导航指引,提供各种地理定位内容等。客户端设备10可由用户(本文中也称为“驾驶员”)操作,在导航到各种位置的同时显示数字地图。通信系统100还包括车辆头部单元14,其可以经由诸如蓝牙、wi-fi直连等的短距通信链路与客户端设备10通信。此外,通信系统100可以包括客户端设备10附近的其他计算设备92。例如,当客户端设备10是驾驶员的智能电话时,其他计算设备92可以包括车辆12内的乘客的智能电话,或者驾驶员的平板计算机或可穿戴设备。
30.除了客户端设备10之外,通信系统100还包括服务器设备60,其被配置为向客户端设备10提供经训练的机器学习模型。服务器设备60可以通信地耦合到数据库80,在示例实现方式中,数据库80存储用于识别驾驶事件声音的第一机器学习模型。用作第一机器学习模型的训练输入的训练数据可以包括一组音频流的音频特征(即,每个音频流的特性,诸如频率、音高、音调、幅度等),以及每个音频流中是否包括驾驶事件声音的指示。音频流可被分类为包括驾驶事件声音或不包括驾驶事件声音。在一些实现方式中,音频流可以根据特定类型的驾驶事件声音进行分类,诸如紧急车辆汽笛声、车辆碰撞声、车辆故障警报或车辆喇叭鸣响。下面参考图3进一步详细描述训练数据。此外,数据库80可以存储用于确定驾驶事件声音是真实的还是假的第二机器学习模型。用作第二机器学习模型的训练输入的训练数据可以包括驾驶事件声音的特性以及每个驾驶事件声音是真实的还是假的指示。下面参考图4进一步详细描述训练数据。
31.更一般地,服务器设备60可以与存储任何类型的合适的地理空间信息或可以链接到地理情境的信息的一个或若干个数据库通信。例如,通信系统100还可以包括导航数据服务器34,其提供导航指引,诸如驾驶、步行、骑自行车或公共交通指引。此外,通信系统100可以包括地图数据服务器50,其向服务器设备60提供地图数据以生成地图显示。在通信系统100中操作的设备可以经由通信网络30互连。
32.在各种实现方式中,客户端设备10可以是智能手机或平板计算机。客户端设备10可以包括存储器120、一个或多个处理器(cpu)116、图形处理单元(gpu)112、包括麦克风和扬声器的i/o模块14、用户接口(ui)32以及包括全球定位服务(gps)模块的一个或若干个传感器19。存储器120可以是非暂时性存储器,并且可以包括一个或若干个合适的存储器模块,诸如随机存取存储器(ram)、只读存储器(rom)、闪存存储器、其他类型的持久存储器等。例如,i/o模块114可以是触摸屏。在各种实现方式中,客户端设备10可以包括比图2所图示更少的组件,或者相反,包括附加组件。在其他实施例中,客户端设备10可以是任何合适的便携式或非便携式计算设备。例如,客户端设备10可以是膝上型计算机、台式计算机、诸如智能手表或智能眼镜之类的可穿戴设备等。
33.存储器120存储操作系统(os)126,其可以是任何类型的合适的移动或通用操作系统。os 126可以包括允许应用检索传感器读数的应用编程接口(api)功能。例如,被配置为在计算设备10上执行的软件应用可以包括调用os 126api以用于检索客户端设备10在该时刻的当前位置的指令。api还可以返回api对估计有多确定的定量指示(例如,作为百分比)。
34.存储器120还存储地图应用122,其被配置为生成交互式数字地图和/或执行其他地理功能,如上所指示的。地图应用122可以接收包括音频导航指令的导航指令,并呈现导
航指令。地图应用122还可以显示驾驶、步行或交通指引,并且一般地提供与地理、地理定位、导航等相关的功能。附加地,地图应用122可以经由驾驶事件声音检测器134检测驾驶事件声音。驾驶事件声音检测器134还可以确定检测到的驾驶事件声音是真实的还是假的。如果检测到的驾驶事件声音是假的,则驾驶事件声音检测器134可以向驾驶员呈现通知,该通知指示该声音是假的和/或指令驾驶员忽略它。驾驶事件声音检测器134还可以或替代地在驾驶事件声音正被播放时降低播放驾驶事件声音的客户端设备或其他设备的音量或使其静音。更进一步,驾驶事件声音检测器134可以过滤音频流以防止音频流播放驾驶事件声音。如果检测到的驾驶事件声音是真实的,则驾驶事件声音检测器134可以向驾驶员呈现通知,该通知指示该声音是真实的和/或指令驾驶员做出适当的响应(例如,靠边停车、呼救、将车辆送去维修等)。
35.注意,尽管图2将地图应用122图示为独立应用,但是地图应用122的功能也可以以经由在客户端设备10上执行的网络浏览器可访问的在线服务的形式而提供,作为在客户端设备10上执行的另一软件应用的插件或扩展等。地图应用122通常可以以针对不同的相应操作系统的不同版本提供。例如,客户端设备10的制造商可以提供用于android
tm
平台的包括地图应用122的软件开发工具包(sdk)、用于ios
tm
平台的另一sdk等。
36.除了地图应用122之外,存储器120存储其他客户端应用132,诸如播放音频内容的音乐应用、视频应用、游戏应用、流传输应用、无线电应用、社交媒体应用等。这些应用132可以暴露用于与地图应用122通信的api。
37.在一些实现方式中,服务器设备60包括一个或多个处理器62和存储器64。存储器64可以是有形的非暂时性存储器,并且可以包括任何类型的合适的存储器模块,包括随机存取存储器(ram)、只读存储器(rom)、闪存存储器、其他类型的持久存储器等。存储器64存储可在处理器62上执行的指令,所述指令构成驾驶事件声音机器学习(ml)模型生成器68,其可以生成用于识别驾驶事件声音的第一机器学习模型和用于确定所识别的驾驶事件声音是真实的还是假的第二机器学习模型。
38.驾驶事件声音ml模型生成器68和驾驶事件声音检测器134可以作为驾驶事件声音检测系统的组件来操作。替代地,驾驶事件声音检测系统可以仅包括服务器侧组件,并且简单地向驾驶事件声音检测器134提供指令以呈现通知或调整音频。换句话说,这些实施例中的驾驶事件声音检测技术可以对驾驶事件声音检测器134透明地实现。作为另一种替代,驾驶事件声音ml模型生成器68的全部功能可以在驾驶事件声音检测器134中实现。
39.为简单起见,图2将服务器设备60仅图示为服务器的一个实例。然而,根据一些实现方式,服务器设备60包括一组一个或多个服务器设备,每个服务器设备配备有一个或多个处理器,并且能够独立于其他服务器设备进行操作。在这样的组中操作的服务器设备可以以分布式方式(其中在一个服务器设备上执行与处理请求相关联的一个操作,而在另一个服务器设备上执行与处理相同请求相关联的另一个操作)单独处理来自客户端设备10的请求(例如,基于可用性),或者根据任何其他合适的技术。出于该讨论的目的,术语“服务器设备”可以指单独的服务器设备或一组两个或更多个服务器设备。
40.在操作中,在客户端设备10中操作的驾驶事件声音检测器134接收数据并向服务器设备60和/或导航数据服务器34传送数据。因此,在一个示例中,客户端设备10可以向导航数据服务器34传送用于请求从开始位置到目的地的导航指引的通信。相应地,导航数据
服务器34可以生成一组导航指令,并将该组导航指令提供给客户端设备10。客户端设备10还可以向驾驶事件声音ml模型生成器68(在服务器设备60中实现)传送用于第一机器学习模型来识别驾驶事件声音以及用于第二机器学习模型来确定所识别的驾驶事件声音是真实的还是假的通信。
41.客户端设备10然后可以将音频特征应用于第一机器学习模型以检测驾驶事件声音,并且可以将检测到的驾驶事件声音的特性应用于第二机器学习模型以确定驾驶事件声音是真实的还是假的。
42.在一些实施例中,驾驶事件声音ml模型生成器68可以针对每种类型的驾驶事件声音生成单独的机器学习模型。例如,驾驶事件声音ml模型生成器68可以生成用于识别警笛声的一个机器学习模型、用于识别消防车汽笛声的另一个机器学习模型、用于识别救护车汽笛声的又一个机器学习模型、用于识别车辆鸣笛声的又一个机器学习模型、用于识别车辆碰撞声的又一个机器学习模型、用于识别车辆故障警报的又一个机器学习模型等。在其他实现方式中,驾驶事件声音ml模型生成器68可以生成针对每种类型的驾驶事件声音具有不同输出类别的单个机器学习模型。
43.图3示意性地图示了用于训练用于检测驾驶事件声音的第一机器学习模型310并将音频流的音频特征应用于第一机器学习模型310以检测音频流中的驾驶事件声音的示例过程。如上所述,服务器设备60中的驾驶事件声音ml模型生成器68可以生成第一机器学习模型310。第一机器学习模型310可以使用各种机器学习技术来生成,诸如回归分析(例如,逻辑回归、线性回归或多项式回归)、k-最近邻、决策树、随机森林、提升(例如,极端梯度提升)、神经网络(例如,卷积神经网络)、支持向量机、深度学习、强化学习、贝叶斯网络等。为了生成第一机器学习模型310,驾驶事件声音ml模型生成器68接收训练数据,该训练数据包括具有第一组音频特性304a(例如,音频特征)的第一音频流302a,以及第一音频流302a是否包括驾驶事件声音的第一指示306a。第一指示306a还可包括驾驶事件声音的类型(例如,紧急车辆汽笛声、车辆碰撞声、车辆故障警报或车辆喇叭鸣响)。训练数据还包括具有第二组音频特性304b的第二音频流302b,以及第二音频流302b是否包括驾驶事件声音的第二指示306b。此外,训练数据包括具有第三组音频特性304c的第三音频流302c,以及第三音频流302c是否包括驾驶事件声音的第三指示306c。此外,训练数据包括具有第n组音频特性304n的第n音频流302n,以及第n音频流302n是否包括驾驶事件声音的第n指示306n。
44.虽然示例训练数据包括四个音频流302a-302n,但这仅仅是为了便于说明的示例。训练数据可以包括任意数量的音频流和对应的音频特性以及该音频流是否包括驾驶事件声音的指示。
45.驾驶事件声音ml模型生成器68然后分析训练数据以生成用于检测驾驶事件声音的第一机器学习模型310。在一些实现方式中,驾驶事件声音ml模型生成器68为每种类型的驾驶事件声音生成单独的机器学习模型。虽然第一机器学习模型310被图示为线性回归模型,但是第一机器学习模型310可以是另一种类型的回归模型,诸如逻辑回归模型、决策树、神经网络、超平面或任何其他合适的机器学习模型。
46.例如,当机器学习技术是神经网络时,驾驶事件声音ml模型生成器68可以生成具有输入节点、中间或“隐藏”节点、边和输出节点的图。节点可以表示对音频特性执行的测试或功能,而边可以表示节点之间的连接。在一些实施例中,输出节点可以包括音频流是否包
括驾驶事件声音和/或驾驶事件声音的类型的指示。该指示可以是音频流包括驾驶事件声音的可能性和/或音频流包括特定类型的驾驶事件声音的可能性。
47.例如,神经网络可以包括表示音频特性的四个输入节点,每个节点连接到若干个隐藏节点。隐藏节点然后连接到指示音频流是否包括驾驶事件声音的输出节点。连接可以具有分配的权重,并且隐藏节点可以包括对音频特性执行的测试或功能。
48.在一些实施例中,隐藏节点可以连接到若干个输出节点,每个输出节点指示驾驶事件声音的类型。在这个示例中,四个输入节点可以包括音频流的频率、幅度、音高和音调。测试或功能可以应用于隐藏节点处的输入值。然后可以对测试或功能的结果进行加权和/或聚合,以确定音频流包括驾驶事件声音的可能性。当可能性高于阈值可能性时,神经网络可以确定音频流包括驾驶事件声音。
49.然而,这仅仅是用于检测驾驶事件声音的神经网络的输入和结果输出的一个示例。在其他示例中,任何数量的输入节点可以包括音频流的任何合适的音频特性。另外,任何数量的输出节点可以确定音频流包括驾驶事件声音的可能性或音频流包括特定类型的驾驶事件声音的可能性。
50.随着收集附加的训练数据,可以调整权重、节点和/或连接。以这种方式,不断地或周期性地更新机器学习模型。
51.在任何情况下,驾驶事件声音ml模型生成器68可以向客户端设备10提供第一机器学习模型310。然后,当驾驶事件声音检测器134获得音频流314时,诸如在导航会话期间,驾驶事件声音检测器134可以将音频流314的特性作为输入应用到第一机器学习模型310,以确定音频流314是否包括驾驶事件声音318。这种确定可以作为第一机器学习模型310的输出来提供。驾驶事件声音检测器134还可以使用第一机器学习模型310来确定驾驶事件声音318的类型,第一机器学习模型310可以提供这样的确定作为输出。例如,对于从在客户端设备10上执行的另一应用处的音频回放数据获得的第一音频流,第一机器学习模型310确定第一音频流包括驾驶事件声音。对于从通信地连接到客户端设备10的设备14、92处的音频回放数据获得的第二音频流,第一机器学习模型310确定第二音频流包括警笛声。对于从车辆12的区域内的周边音频获得的第三音频流,机器学习模型310确定第三音频流不包括驾驶事件声音。
52.如上所述,机器学习仅仅是用于检测驾驶事件声音的一种示例技术。在其他实现方式中,驾驶事件声音检测器134可以通过将预定驾驶事件声音的音频指纹与车辆12的区域内的周边音频或者来自在客户端设备10上执行的另一应用或者来自通信地连接到客户端设备10的设备14、92的音频回放数据的音频流进行比较来检测驾驶事件声音。当存在匹配时,驾驶事件声音检测器134可以确定音频包括驾驶事件声音。更具体地,驾驶事件声音检测器134可以从周边音频或音频流中提取指纹,识别周边音频或音频流指纹的特征,并且可以将周边音频或音频流指纹的特征与来自预定驾驶事件声音的音频指纹的特征进行比较。例如可以将频率、音高、音调、幅度等存储为音频指纹特征。然后可以将预定驾驶事件声音的这些音频指纹特征中的每一个与周边音频或音频流指纹的特征进行比较。
53.在一些实施例中,可以使用最近邻算法将预定驾驶事件声音的音频指纹特征与周边音频或音频流指纹的特征进行比较。最近邻算法可以识别与周边音频或音频流指纹的特征最接近的预定驾驶事件声音的音频指纹特征。驾驶事件声音检测器134然后可以在周边
音频或音频流指纹特征与预定驾驶事件声音之一的音频指纹特征匹配或具有与预定驾驶事件声音之一的音频指纹特征的超过阈值量的相似性时,确定周边音频或音频流包括驾驶事件声音。驾驶事件声音检测器134还可以确定周边音频或音频流包括预定驾驶事件声音中的特定类型的驾驶事件声音,该特定类型的驾驶事件声音与周边音频或音频流指纹匹配或具有与周边音频或音频流指纹的超过阈值量的相似性。
54.在其他实现方式中,驾驶事件声音检测器134可以基于元数据来检测驾驶事件声音,该元数据描述来自在客户端设备10上执行的另一应用或者来自通信地连接到客户端设备10的设备14、92的音频内容。该元数据可以指示音频内容包括驾驶事件声音、驾驶事件声音的类型和/或驾驶事件声音将在何时播放。
55.当检测到驾驶事件声音时,驾驶事件声音检测器134可以确定驾驶事件声音是真实的还是假的。图4示意性地图示了用于训练用于识别驾驶事件声音是真实的还是假的第二机器学习模型410并且将检测到的驾驶事件声音的特性应用于第二机器学习模型410以确定检测到的驾驶事件声音是真实的还是假的示例过程。如上所述,服务器设备60中的驾驶事件声音ml模型生成器68可以生成第二机器学习模型410。可以使用各种机器学习技术来生成第二机器学习模型410,各种机器学习技术诸如为回归分析(例如,逻辑回归、线性回归或多项式回归)、k-最近邻、决策树、随机森林、提升(例如,极端梯度提升)、神经网络(例如,卷积神经网络)、支持向量机、深度学习、强化学习、贝叶斯网络等。为了生成第二机器学习模型410,驾驶事件声音ml模型生成器68接收训练数据,该训练数据包括具有第一组驾驶事件声音特性404a的第一驾驶事件声音402a,以及第一驾驶事件声音402a是真实的还是假的第一指示406a。
56.驾驶事件声音特性可以包括驾驶事件声音的音频特性以及在驾驶事件声音出现时车辆12处的环境特性。驾驶事件声音的音频特性可以包括频率、音高、音调、幅度、波长等。在一些实现方式中,驾驶事件声音的音频特性可以包括频率随时间的变化或波长随时间的变化,这可以指示多普勒效应。多普勒效应可以指示驾驶事件声音是真实的,并且来自相对于车辆12移动的外部源。环境特性可包括来自车辆12的传感器数据,诸如来自车辆12内的相机、轮胎压力传感器、车门传感器、安全带传感器、加速度计、陀螺仪、定位传感器等的传感器数据。附加地,驾驶事件声音特性可以包括驾驶事件声音的类型的指示,诸如警笛声、消防车汽笛声、救护车汽笛声、车辆鸣笛声、车辆碰撞声、车辆故障警报等。此外,驾驶事件声音特性可包括媒体内容特性,诸如乘客是否正在车辆12中玩电子游戏、正在玩的电子游戏的类型、电子游戏的名称、车辆12内是否正在播放收音机、当前正在播放的歌曲或内容的名称等。可以从元数据中确定媒体内容特性,该元数据由在客户端设备10上执行的另一个应用132经由api或者由另一个设备92经由短距通信链路提供。
57.训练数据还包括具有第二组驾驶事件声音特性404b的第二驾驶事件声音402b,以及第二驾驶事件声音402b是真实的还是假的第二指示406b。此外,训练数据包括具有第三组驾驶事件声音特性404c的第三驾驶事件声音402c,以及第三驾驶事件声音402c是真实的还是假的第三指示406c。此外,训练数据包括具有第n组驾驶事件声音特性404n的第n驾驶事件声音402n,以及第n驾驶事件声音402n是真实的还是假的第n指示406n。
58.虽然示例训练数据包括四个驾驶事件声音402a-402n,但这仅仅是为了便于说明的示例。训练数据可以包括任意数量的驾驶事件声音和对应的驾驶事件声音特性以及驾驶
事件声音是真实的还是假的指示。
59.驾驶事件声音ml模型生成器68然后分析训练数据以生成第二机器学习模型410,该第二机器学习模型410用于确定驾驶事件声音是真实的还是假的。在一些实现方式中,驾驶事件声音ml模型生成器68为每种类型的驾驶事件声音生成单独的机器学习模型。虽然第二机器学习模型410被图示为线性回归模型,但是第二机器学习模型410可以是另一种类型的回归模型,诸如逻辑回归模型、决策树、神经网络、超平面或任何其他合适的机器学习模型。
60.在任何情况下,驾驶事件声音ml模型生成器68可以向客户端设备10提供第二机器学习模型410。然后,当驾驶事件声音检测器134在诸如导航会话期间检测到驾驶事件声音414时,驾驶事件声音检测器134可以将驾驶事件声音414的特性作为输入应用到第二机器学习模型410,以确定驾驶事件声音414是真实的还是假的418。可以作为第二机器学习模型410的输出来提供这种确定。
61.如上所述,机器学习仅仅是用于确定驾驶事件声音是真实的还是假的一种示例技术。在其他实现方式中,如果驾驶事件声音的源是在客户端设备10或另一设备14、92上执行的应用,则驾驶事件声音检测器134可以确定该驾驶事件声音是假的。在其他实现方式中,驾驶事件声音检测器134可以通过确定驾驶事件声音的地理源并将该地理源与车辆12的当前位置进行比较来确定驾驶事件声音是假的。例如,不同国家的紧急车辆汽笛声可能具有不同的音频特性。驾驶事件声音检测器134可以将驾驶事件声音的音频特性与不同国家的紧急车辆汽笛声的音频特性进行比较,以确定驾驶事件声音的来源的区域。如果驾驶事件声音的来源的区域不同于车辆12的当前位置,则驾驶事件声音检测器134可以确定驾驶事件声音是假的。在其他实现方式中,驾驶事件声音检测器134可以基于驾驶事件声音的频率随时间的变化来确定驾驶事件声音是假的。如果驾驶事件声音的频率不随时间变化超过指示多普勒频移的阈值量,则驾驶事件声音检测器134可以确定驾驶事件声音的源没有相对于车辆12移动,因此驾驶事件声音是假的。在其他实现方式中,驾驶事件声音检测器134可以通过将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定的假的驾驶事件声音的音频指纹进行比较来确定驾驶事件声音是假的。当存在匹配时,驾驶事件声音检测器134可以确定该音频包括假的驾驶事件声音。驾驶事件声音检测器134还可以将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定的真实的驾驶事件声音的音频指纹进行比较。当存在匹配时,驾驶事件声音检测器134可以确定该音频包括真实的驾驶事件声音。
62.当检测到驾驶事件声音并确定该驾驶事件声音是真实的还是假的时,驾驶事件声音检测器134可以向驾驶员提供指示该驾驶事件声音是真实的还是假的通知。该通知可以呈现在客户端设备10的显示器上,或者可以是经由客户端设备10或车辆头部单元14的扬声器呈现的音频通知。图5a-5c图示了示例导航显示500-560,其包括响应于检测到驾驶事件声音而给驾驶员的通知。如图5a的示例导航显示500所示,视觉通知510可以作为导航显示500内的横幅呈现。视觉通知510通过声明“汽车喇叭声是媒体流的一部分”来指示驾驶事件声音是假的。在一些实现方式中,视觉通知510可以进一步提供忽略驾驶事件声音的指令。除了视觉通知510之外或者作为视觉通知510的替代,客户端设备10可以经由扬声器呈现音频通知512,指示汽车喇叭声是媒体流的一部分。
63.在其他实现方式中,驾驶事件声音检测器134可以使用耳标(earcon)向驾驶员通知驾驶事件声音是假的。耳标是一种简短、独特的声音,代表特定的事件,诸如电子邮件消息的到达。图5b图示了包括耳标形式的音频通知532的示例导航显示530。耳标可以是特定的声音,诸如哔哔声、长哔哔声或一组哔哔声,向驾驶员发出驾驶事件声音是假的信号。可以生成耳标,使得它不同于驾驶事件声音,使得驾驶员不会将耳标误认为是驾驶事件声音的延续。
64.图5c图示了当驾驶事件声音是真实的时呈现的另一示例导航显示560。在这种场景下,驾驶事件声音检测器134可以向驾驶员提供视觉通知570,指示驾驶事件声音是真实的,并指令驾驶员警惕由驾驶事件声音指示的紧急车辆。视觉通知570可以作为导航显示560内的横幅来呈现。在一些实现方式中,视觉通知570可以进一步提供关于如何对真实的驾驶事件声音进行响应的指令,诸如靠边停车。除了视觉通知570之外或者作为视觉通知570的替代,客户端设备10可以经由扬声器呈现音频通知572,指示驾驶员应当警惕紧急车辆。应当理解,可以提供任何类型的视觉通知570作为驾驶事件声音是真实的确认。
65.用于识别驾驶事件声音的示例方法
66.图6图示了用于在导航会话期间识别驾驶事件声音的示例方法600的流程图。该方法可以以存储在计算机可读存储器上并且可以在车辆12内的客户端设备10的一个或多个处理器处执行的一组指令实现。例如,该方法可以由驾驶事件声音检测器134和/或地图应用122来实现。
67.在框602,提供从开始位置到目的地位置的一组导航指令。例如,当诸如驾驶员之类的用户请求从开始位置到目的地位置的导航指引时,地图应用122可以向导航数据服务器34提供请求。导航数据服务器34然后可以向客户端设备10提供一组导航指引,该组导航指引可以由地图应用122呈现。
68.然后在框604,驾驶事件声音检测器134可以识别车辆12内的或周围的包括驾驶事件声音的音频。更具体地,驾驶事件声音检测器134可以通过与在客户端设备10上执行的其他应用132(例如,经由api)或者客户端设备10附近的其他设备(例如,短距通信链路)(诸如车辆头部单元14或者其他客户端设备92)通信,来获得音频回放数据。驾驶事件声音检测器134可以从音频回放数据获得音频流。驾驶事件声音检测器134还可以经由例如麦克风捕获该区域内的音频的周边音频指纹。驾驶事件声音检测器134然后可以将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定驾驶事件声音的音频指纹进行比较。当存在匹配时,驾驶事件声音检测器134可以确定该音频包括驾驶事件声音。在其他实现方式中,驾驶事件声音检测器134可以将周边音频特征或来自音频流的音频特征应用于用于识别驾驶事件声音的经训练的机器学习模型,诸如图3所示的第一机器学习模型310。
69.响应于识别出车辆12内的或周围的包括驾驶事件声音的音频,驾驶事件声音检测器134可以确定驾驶事件声音是真实的还是假的(框606)。更具体地,驾驶事件声音检测器134可以识别驾驶事件声音的特性,诸如音频特性、驾驶事件声音出现时车辆12处的环境特性、驾驶事件声音的类型等。驾驶事件声音检测器134可以将驾驶事件声音的特性应用于用于确定驾驶事件声音是真实的还是假的经训练的机器学习模型,诸如图4所示的第二机器学习模型410。
70.在其他实现方式中,如果驾驶事件声音的源是在客户端设备10或另一设备14、92
上执行的应用,则驾驶事件声音检测器134可以确定驾驶事件声音是假的。在其他实现方式中,驾驶事件声音检测器134可以通过确定驾驶事件声音的地理源并将该地理源与车辆12的当前位置进行比较来确定驾驶事件声音是假的。如果驾驶事件声音的来源的区域不同于车辆12的当前位置,则驾驶事件声音检测器134可以确定驾驶事件声音是假的。在其他实现方式中,驾驶事件声音检测器134可以基于驾驶事件声音的频率随时间的变化来确定驾驶事件声音是假的。如果驾驶事件声音的频率不随时间变化超过指示多普勒频移的阈值量,则驾驶事件声音检测器134可以确定驾驶事件声音的源没有相对于车辆12移动,因此驾驶事件声音是假的。
71.在其他实现方式中,驾驶事件声音检测器134可以通过将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定的假的驾驶事件声音的音频指纹进行比较来确定驾驶事件声音是假的。当存在匹配时,驾驶事件声音检测器134可以确定该音频包括假的驾驶事件声音。驾驶事件声音检测器134还可以将周边音频指纹或来自音频回放数据中包括的音频流的音频指纹与预定的真实的驾驶事件声音的音频指纹进行比较。当存在匹配时,驾驶事件声音检测器134可以确定该音频包括真实的驾驶事件声音。
72.如果驾驶事件声音是真实的,则驾驶事件声音检测器134可以警告驾驶员对驾驶事件声音做出响应(框610),或者可以以其他方式确认驾驶事件声音是真实的。例如,驾驶事件声音检测器134可以向驾驶员提供视觉或音频通知,诸如如图5c所示的通知570、572,指示驾驶事件声音是真实的。该通知还可以指令驾驶员适当地对驾驶事件声音进行响应,或者可以提供关于如何对驾驶事件声音进行响应的明确指令,诸如靠边停车、减速、呼救、将车辆送去维修等。
73.另一方面,如果驾驶事件声音是假的,则驾驶事件声音检测器134向驾驶员呈现通知或屏蔽驾驶事件声音,以基本上防止驾驶员听到驾驶事件声音和不必要地分散注意力(框612)。驾驶事件声音检测器134可以向驾驶员提供视觉或音频通知,诸如如图5a所示的通知510、512,指示驾驶事件声音是假的。该通知还可以指令驾驶员忽略驾驶事件声音。
74.驾驶事件声音检测器134可以通过在驾驶事件声音期间使音频的音量静音或降低音频的音量来屏蔽驾驶事件声音。例如,当驾驶事件声音由在客户端设备10上执行的应用132提供时,驾驶事件声音检测器134可以经由api与应用132通信,以指令应用132在驾驶事件声音期间降低音频的音量或使音频的音量静音。当驾驶事件声音由通信地耦合到客户端设备10的另一个设备14、92提供时,驾驶事件声音检测器134可以经由短距通信链路与该另一个设备14、92通信,以向该另一个设备14、92传送请求,以在驾驶事件声音期间降低音频的音量或使音频的音量静音。
75.在一些实现方式中,驾驶事件声音检测器134在播放驾驶事件声音之前前瞻性地确定使音量静音或降低音量。例如,当在已经被播放之前通过描述音频内容的元数据识别出假的驾驶事件声音时,驾驶事件声音检测器134可能能够前瞻性地确定使假的驾驶事件声音的音量静音或降低假的驾驶事件声音的音量。有益的是,这防止了驾驶员听到假的驾驶事件声音的任何部分。在其他实现方式中,驾驶事件声音检测器134在播放驾驶事件声音时确定使驾驶事件声音的音量静音或降低驾驶事件声音的音量,以防止驾驶员听到驾驶事件声音的至少一部分。
76.在其他实现方式中,驾驶事件声音检测器134可以通过从音频流中过滤驾驶事件
声音来屏蔽驾驶事件声音。更具体地,驾驶事件声音检测器134可以使得向音频流提供滤波器,诸如用于过滤驾驶事件声音的带通滤波器或机器学习模型。驾驶事件声音检测器134可以向在客户端设备10上执行的另一应用132或者通信地耦合到客户端设备10的另一设备14、92提供滤波器,以从音频流中过滤驾驶事件声音。
77.在一些实现方式中,驾驶事件声音检测器134在播放驾驶事件声音之前前瞻性地执行过滤。例如,当在已经被播放之前通过描述音频内容的元数据识别出假的驾驶事件声音时,驾驶事件声音检测器134可能能够前瞻性地过滤假的驾驶事件声音。在其他实现方式中,驾驶事件声音检测器134在播放驾驶事件声音时执行过滤,以过滤驾驶事件声音的至少一部分。
78.在又一实现方式中,驾驶事件声音检测器134可以通过经由客户端设备10的扬声器发出噪声消除声音或者使车辆12内的扬声器发出噪声消除声音来破坏性地干扰驾驶事件声音并抑制或去除驾驶事件声音,从而屏蔽驾驶事件声音。噪声消除声音可以具有与驾驶事件声音相同或相似的幅度/频率,以及与驾驶事件声音的相位相反的相位。
79.驾驶事件声音检测器134可以基于包括驾驶事件声音的音频流的特性来确定驾驶事件声音的幅度和相位。在其他实现方式中,驾驶事件声音检测器134可以基于特定类型的驾驶事件声音(例如,救护车汽笛声)的一组预定特性来确定驾驶事件声音的幅度和相位。
80.然后驾驶事件声音检测器134可以通过生成具有与驾驶事件声音相同或相似的幅度并且与驾驶事件声音的相位相反的相位的音频信号来生成噪声消除声音。驾驶事件声音检测器134然后可以经由客户端设备10的扬声器播放噪声消除声音,或者将噪声消除声音的指示传送到车辆头部单元14,以经由车辆12内的扬声器26播放噪声消除声音。
81.附加考虑
82.以下附加考虑适用于前述讨论。在整个说明书中,多个实例可以实现被描述为单个实例的组件、操作或结构。尽管一个或多个方法的各个操作被图示和描述为分离的操作,但是各个操作中的一个或多个可以同时执行,并且不要求操作以所示的顺序执行。在示例配置中作为分离的组件呈现的结构和功能可以被实现为组合的结构或组件。类似地,呈现为单个组件的结构和功能可以实现为分离的组件。这些和其他变化、修改、添加和改进都落在本公开主题的范围内。
83.此外,在此将某些实施例描述为包括逻辑或多个组件、模块或机制。模块可以构成软件模块(例如,存储在机器可读介质上的代码)或硬件模块。硬件模块是能够执行某些操作的有形单元,并且可以以某些方式配置或布置。在示例实施例中,一个或多个计算机系统(例如,独立的、客户端或服务器计算机系统)或计算机系统的一个或多个硬件模块(例如,处理器或一组处理器)可以由软件(例如,应用或应用部分)配置为运行以执行本文所述的某些操作的硬件模块。
84.在各种实施例中,硬件模块以可以机械或电子方式实现。例如,硬件模块可以包括被永久配置(例如,作为专用处理器,诸如现场可编程门阵列(fpga)或专用集成电路(asic))以执行某些操作的专用电路或逻辑。硬件模块还可以包括由软件临时配置来执行某些操作的可编程逻辑或电路(例如,通用处理器或其他可编程处理器内涵盖的)。将理解,以机械方式、在专用和永久配置的电路中、或在临时配置的电路(例如,由软件配置)中实现硬件模块的决定可以由成本和时间考虑来驱动。
85.因此,术语“硬件”应被理解为涵盖有形实体,即物理构造的、永久配置的(例如,硬连线的)或临时配置的(例如,编程的)以某种方式操作或执行这里描述的某些操作的实体。如这里使用的“硬件实现的模块”指的是硬件模块。考虑其中硬件模块被临时配置(例如,编程)的实施例,每个硬件模块不需要在任何一个时刻被配置或实例化。例如,在硬件模块包括使用软件配置的通用处理器的情况下,通用处理器可以在不同时间被配置为各自不同的硬件模块。软件可以相应地配置处理器,例如,在一个时刻构成特定的硬件模块,并且在不同的时刻构成不同的硬件模块。
86.硬件模块可以向其他硬件提供信息,也可以从其他硬件接收信息。相应地,所描述的硬件模块可以被认为是通信耦合的。在多个这样的硬件模块同时存在的情况下,可以通过连接硬件模块的信号传输(例如,通过适当的电路和总线)来实现通信。在多个硬件模块在不同时间被配置或实例化的实施例中,这种硬件模块之间的通信可以例如通过在多个硬件模块具有访问权限的存储器结构中存储和检索信息来实现。例如,一个硬件模块可以执行操作并将该操作的输出存储在其通信地耦合的存储器设备中。然后,另一个硬件模块可以在稍后的时间访问存储器设备,以检索和处理所存储的输出。硬件模块还可以发起与输入或输出设备的通信,并且可以对资源(例如,信息集合)进行操作。
87.方法600可以包括有形计算机可执行指令形式的一个或多个功能块、模块、各个功能或例程,这些有形计算机可执行指令存储在非暂时性计算机可读存储介质中,并使用计算设备(例如,服务器设备、个人计算机、智能电话、平板计算机、智能手表、移动计算设备或其他客户端设备,如本文所述)的处理器来执行。可以包括方法600作为示例环境的任何后端服务器(例如,如在此所述的,地图数据服务器、导航服务器或任何其他类型的服务器计算设备)、客户端设备模块的一部分,或者例如作为这种环境外部的模块的一部分。尽管为了便于解释,可以参考其他附图来描述附图,但是方法600可以与其他对象和用户界面一起使用。此外,尽管以上解释描述了由特定设备(诸如服务器设备60或客户端设备10)执行方法600的步骤,但是仅仅是为了说明的目的这样做。方法600的框可以由一个或多个设备或环境的其他部分来执行。
88.这里描述的示例方法的各种操作可以至少部分地由一个或多个处理器来执行,这些处理器被临时配置(例如,通过软件)或永久配置来执行相关操作。无论是临时配置还是永久配置,这些处理器都可以构成处理器实现的模块,其操作来执行一个或多个操作或功能。在一些示例实施例中,这里提到的模块可以包括处理器实现的模块。
89.类似地,本文描述的方法或例程可以至少部分由处理器实现。例如,方法的至少一些操作可以由一个或多个处理器或处理器实现的硬件模块来执行。某些操作的执行可以分布在一个或多个处理器中,不仅驻留在单个机器中,而且部署在多个机器上。在一些示例实施例中,一个或多个处理器可以位于单个位置(例如,在家庭环境、办公室环境中或作为服务器群),而在其他实施例中,处理器可以分布在多个位置。
90.该一个或多个处理器还可以操作来支持在“云计算”环境中或作为saas的相关操作的执行。例如,如上所指示的,至少一些操作可以由一组计算机(作为包括处理器的机器的示例)来执行,这些操作可以经由网络(例如,互联网)以及经由一个或多个适当的接口(例如,api)来访问。
91.此外,仅为了说明的目的,附图描绘了示例环境的一些实施例。本领域的技术人员
将从下面的讨论中容易地认识到,在不脱离这里描述的原理的情况下,可以采用这里图示的结构和方法的替代实施例。
92.在阅读本公开后,本领域技术人员将会理解,通过这里公开的原理,用于识别驾驶事件声音的另外的替代结构和功能设计。因此,尽管已经图示和描述了特定的实施例和应用,但是应当理解,所公开的实施例不限于这里公开的精确构造和组件。在不脱离所附权利要求中限定的精神和范围的情况下,可以对这里公开的方法和装置的布置、操作和细节进行各种修改、改变和变化,这对本领域技术人员来说将是明显的。
技术特征:
1.一种用于在导航会话期间识别驾驶事件声音的方法,该方法包括:由车辆中的一个或多个处理器提供用于沿着路线从开始位置行进到目的地位置的一组导航指引;在到该目的地位置的导航期间:由所述一个或多个处理器识别包括来自该车辆内或该车辆周围区域的驾驶事件声音的音频;响应于确定该音频包括所述驾驶事件声音,由所述一个或多个处理器确定所述驾驶事件声音是否是假的;和响应于确定所述驾驶事件声音是假的:由所述一个或多个处理器向驾驶员呈现指示所述驾驶事件声音是假的通知,或者屏蔽所述驾驶事件声音以防止所述驾驶员听到所述驾驶事件声音。2.根据权利要求1所述的方法,其中,识别包括驾驶事件声音的音频包括:由所述一个或多个处理器从在客户端设备上执行的应用获得音频回放数据;由所述一个或多个处理器从通信地耦合到所述客户端设备的设备获得音频回放数据;或者由所述一个或多个处理器获得周边音频。3.根据权利要求2所述的方法,还包括:由所述一个或多个处理器将来自所述应用或所述设备的所述音频回放数据或在所述周边音频中包括的音频指纹与预定驾驶事件声音的一个或多个音频指纹进行比较。4.根据权利要求2所述的方法,还包括:使用(i)一组音频流和(ii)对应于该组音频流中的至少一些音频流的驾驶事件声音的指示来训练机器学习模型;和由所述一个或多个处理器将来自所述应用或所述设备的所述音频回放数据或所述周边音频应用到所述机器学习模型,以确定所述音频是否包括驾驶事件声音。5.根据权利要求2至4中任一项所述的方法,其中,确定所述驾驶事件声音是否是假的包括:响应于确定在来自所述应用或所述设备的所述音频回放数据中包括所述驾驶事件声音,由所述一个或多个处理器确定所述驾驶事件声音是假的。6.根据权利要求2至4中任一项所述的方法,其中,确定所述驾驶事件声音是否是假的包括:使用(i)对应于驾驶事件声音的一组音频流,并且对于该组音频流中的每个音频流,(ii)所述驾驶事件声音是来自真实源还是假的源的指示,来训练机器学习模型;和由所述一个或多个处理器将来自所述应用或所述设备的所述音频回放数据或所述周边音频应用于所述机器学习模型,以确定所述音频中的驾驶事件声音是否是假的。7.根据权利要求2至4中任一项所述的方法,其中,确定所述驾驶事件声音是否是假的包括:由所述一个或多个处理器确定所述驾驶事件声音的地理源;由所述一个或多个处理器将所述驾驶事件声音的所述地理源与所述车辆的当前位置进行比较;和
当所述驾驶事件声音的所述地理源不同于所述车辆的所述当前位置时,由所述一个或多个处理器确定所述驾驶事件声音是假的。8.根据前述权利要求中任一项所述的方法,其中,屏蔽所述驾驶事件声音包括:由所述一个或多个处理器从来自所述应用或所述设备的所述音频回放数据中过滤所述驾驶事件声音。9.根据前述权利要求中任一项所述的方法,其中,所述驾驶事件声音包括以下中的至少一个:紧急车辆汽笛声、车辆碰撞声、车辆故障警报,或车辆喇叭鸣响。10.一种用于识别驾驶事件声音的客户端设备,该客户端设备包括:一个或多个处理器;和耦合到所述一个或多个处理器并在其上存储指令的非暂时性计算机可读存储器,当所述指令由所述一个或多个处理器执行时,使得所述客户端设备:识别包括来自车辆内或该车辆周围区域的驾驶事件声音的音频;响应于确定该音频包括所述驾驶事件声音,确定所述驾驶事件声音是否是假的;和响应于确定所述驾驶事件声音是假的:向驾驶员呈现指示所述驾驶事件声音是假的通知,或者屏蔽所述驾驶事件声音以防止所述驾驶员听到所述驾驶事件声音。11.根据权利要求10所述的客户端设备,其中,为了识别包括驾驶事件声音的音频,所述指令使得所述客户端设备:从在所述客户端设备上执行的应用获得音频回放数据;从通信地耦合到所述客户端设备的设备获得音频回放数据;或者获得周边音频。12.根据权利要求11所述的客户端设备,其中,所述指令还使得所述客户端设备:将来自所述应用或所述设备的所述音频回放数据或在所述周边音频中包括的音频指纹与预定驾驶事件声音的一个或多个音频指纹进行比较。13.根据权利要求11所述的客户端设备,其中,所述指令还使得所述客户端设备:将来自所述应用或所述设备的所述音频回放数据或所述周边音频应用于经训练的机器学习模型,所述经训练的机器学习模型被训练以确定音频是否包括驾驶事件声音,已经使用训练数据对所述经训练的机器学习进行了训练,所述训练数据包括(i)一组音频流,以及(ii)对应于该组音频流中的至少一些音频流的驾驶事件声音的指示。14.根据权利要求11至13中任一项所述的客户端设备,其中,为了确定所述驾驶事件声音是否是假的,所述指令使得所述客户端设备:响应于确定在来自所述应用或所述设备的所述音频回放数据中包括所述驾驶事件声音,确定所述驾驶事件声音是假的。15.根据权利要求11至13中任一项所述的客户端设备,为了确定所述驾驶事件声音是否是假的,所述指令使得所述客户端设备:将来自所述应用或所述设备的所述音频回放数据或所述周边音频应用于经训练的机器学习模型,所述经训练的机器学习模型被训练以确定音频中的驾驶事件声音是来自真实源还是假的源,已经使用训练数据对所述经训练的机器学习进行了训练,所述训练数据包括(i)对应于驾驶事件声音的一组音频流,并且对于该组音频流中的每个音频流,(ii)所述
驾驶事件声音是来自真实源还是假的源的指示。16.根据权利要求11至13中任一项所述的客户端设备,其中,为了确定所述驾驶事件声音是否是假的,所述指令使得所述客户端设备:确定所述驾驶事件声音的地理源;将所述驾驶事件声音的所述地理源与所述车辆的当前位置进行比较;和当所述驾驶事件声音的所述地理源不同于所述车辆的所述当前位置时,确定所述驾驶事件声音是假的。17.一种耦合到一个或多个处理器并在其上存储指令的非暂时性计算机可读存储器,当所述指令由所述一个或多个处理器执行时,使得所述一个或多个处理器:识别包括来自车辆内或该车辆周围区域的驾驶事件声音的音频;响应于确定该音频包括所述驾驶事件声音,确定所述驾驶事件声音是否是假的;和响应于确定所述驾驶事件声音是假的:向驾驶员呈现指示所述驾驶事件声音是假的通知,或者屏蔽所述驾驶事件声音以防止所述驾驶员听到所述驾驶事件声音。18.根据权利要求17所述的非暂时性计算机可读存储器,其中,为了识别包括驾驶事件声音的音频,所述指令使得所述一个或多个处理器:从在所述客户端设备上执行的应用获得音频回放数据;从通信地耦合到所述客户端设备的设备获得音频回放数据;或者获得周边音频。19.根据权利要求18所述的非暂时性计算机可读存储器,其中,所述指令还使得所述一个或多个处理器:将来自所述应用或所述设备的所述音频回放数据或在所述周边音频中包括的音频指纹与预定驾驶事件声音的一个或多个音频指纹进行比较。20.根据权利要求18所述的非暂时性计算机可读存储器,其中,所述指令还使得所述一个或多个处理器:将来自所述应用或所述设备的所述音频回放数据或所述周边音频应用于经训练的机器学习模型,所述经训练的机器学习模型被训练以确定音频是否包括驾驶事件声音,已经使用训练数据对所述经训练的机器学习进行了训练,所述训练数据包括(i)一组音频流,以及(ii)对应于该组音频流中的至少一些音频流的驾驶事件声音的指示。
技术总结
为了在导航期间识别驾驶事件声音,车辆中的客户端设备提供用于沿着路线从开始位置行进到目的地位置的一组导航指引。在到目的地位置的导航期间,客户端设备识别包括来自车辆内或车辆周围区域的驾驶事件声音的音频。响应于确定该音频包括驾驶事件声音,客户端设备确定驾驶事件声音是否是假的。响应于确定驾驶事件声音是假的,客户端设备向驾驶员呈现指示该驾驶事件声音是假的通知,或者屏蔽该驾驶事件声音以防止驾驶员听到该驾驶事件声音。音以防止驾驶员听到该驾驶事件声音。音以防止驾驶员听到该驾驶事件声音。
技术研发人员:M
受保护的技术使用者:谷歌有限责任公司
技术研发日:2020.11.18
技术公布日:2023/7/6
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
