一种关键词提取方法与电子设备与流程

未命名 07-14 阅读:118 评论:0


1.本技术涉及终端技术领域,尤其涉及一种关键词提取方法与电子设备。


背景技术:

2.随着信息技术的发展,各种远程会议数量日益增加。一般,企业会制作会议记录存档以供查阅。会议记录中可以记录会议主题、重点内容等关键信息。通常情况下,会议记录是由秘书或参会人员记录。但是,秘书或参数人员可能无法准确的定位会议主题或会议重要信息,这样会影响会议记录的准确性,而且人工记录的效率低。


技术实现要素:

3.本技术的目的在于提供了一种关键词提取方法与电子设备,用于提升会议中关键信息的提取效率和准确性。
4.第一方面,提供一种关键词提取方法,包括:获取第一信息,所述第一信息中包括第一行为信息、第一角色信息、第一语音信息和第一文本信息中的至少一种,其中,所述第一行为信息为第一视频中所包含的用户对视频内容的操作行为,所述第一角色信息包括所述第一视频中信息提出者的角色信息,所述第一语音信息包括所述第一视频中的语音信息;所述第一文本信息包括所述第一视频中的文字信息;根据所述第一信息,提取所述第一视频中的关键词。
5.本技术中,电子设备可以自动根据用户对第一视频的第一行为信息,和/或,第一视频中信息提出者的第一角色信息,和/或,第一视频中的第一语音信息,和/或第一视频的第一文本信息,提取第一视频中的关键词,无需秘书或参数人员人为提取和记录会议主题或会议重要信息等,从而可以有助于提升关键词的提取效率和准确性。
6.以会议场景为例,第一视频中包括参会人员所讲解的文档内容,参会人员在讲解时可能会在文档内容上作标记、比如文字下划横线、圈中某个词汇等操作行为。被标记的内容有可能是会议重点,所以电子设备根据第一行为信息提取关键词,这种方式提取的关键词比较准确。或者,对于重点内容,参见人员在讲解时,可能会重读(比如阅读语气较重)或强调(比如阅读多次),所以,电子设备根据第一语音信息提取关键词,这种方式所提取的关键词较为准确。或者,会议中有比较重要的角色人物提出了词语,这些词语被认为是准确性较高的词语,所以电子设备根据第一角色信息提取的关键词,通过这种方式提取的关键词较为准确。
7.下文以分三种情况进行说明。
8.情况一,所述第一信息中包括第一行为信息时,所述根据所述第一信息,提取所述第一视频中的关键词,包括:根据所述第一行为信息,确定所述第一视频中的目标区域,所述目标区域为所述第一行为信息所针对的区域;提取所述目标区域中的关键词。也就是说,电子设备在用户行为所针对的区域内进行关键词提取。这样,不需要在整张图像上作关键词识别,缩小了识别区域的范围,提升了关键词识别效率,而且用户行为所针对的区域内往
往包含了用户重点讲解的内容,所以对用户行为所针对的区域作关键词识别,准确性较高。
9.情况一中,根据所述第一行为信息确定所述第一视频中的目标区域,可以通过下述方式一和方式二来具体实现。
10.方式一,确定预设时长内鼠标光标位置处于第一区域内,且所述第一区域的面积小于预设面积;确定所述第一区域为所述目标区域。
11.一般,用户讲解哪部分内容时,会将鼠标光标指向这部分内容,如果鼠标光标长时间停留在一个区域内,说明用户对这个区域内的内容讲解时间较长,可能是重点内容。因此,电子设备确定鼠标光标位置处于第一区域内时,认为第一区域是目标区域,就可以识别目标区域内的关键词。
12.在一种可能的设计中,确定预设时长内鼠标光标位置处于第一区域内,包括:记录预设时长内的多个鼠标光标位置;确定所述多个鼠标光标位置的第一外接多边形为所述第一区域。这种方式定位出的第一区域较为准确,在该第一区域内识别关键词的准确性较高。
13.在一种可能的设计中,确定预设时长内鼠标光标位置处于第一区域内,包括:记录所述预设时长内的n个鼠标光标位置,所述n为正整数;确定所述n个鼠标光标位置的第一外接多边形和第二外接多边形;其中,所述第一外接多边形的面积小于第一阈值,所述第二外接多边形的面积小于第二阈值,且所述第一外接多边形和所述第二外接多边形内的鼠标光标位置没有重叠;在所述第一外接多边形与所述第二外接多边形之间的距离小于预设距离的情况下,确定第一区域,所述第一区域为包括所述第一外接多边形和所述第二外接多边形在内的第三外接多边形。这种方式定位出的第一区域范围比较大,能够包含更多的信息,在该第一区域内识别关键词的准确性较高。
14.方式二,确定所述第一视频中第一图像上被用户标记的区域;所述第一图像是所述第一视频中任一张图像;确定所述被用户标记的区域为所述目标区域。
15.方式二区别于方式一:方式一识别鼠标光标的停留区域,适用于用户使用光标指示的场景,即光标移动不会留下标记或痕迹;方式二识别被用户标记的区域,适用于用户使用光标标记的场景,即光标移动会留下标记或痕迹,比如,画圈、下横线,高亮、加粗等等留下痕迹的行为。可以理解的是,用户讲解哪部分内容时,对于重点内容,会使用画圈、划线等方式标记。因此,电子设备确定图像上被用户标记的区域为目标区域,识别目标区域内的关键词。
16.示例性的,所述标记包括但不限于划线、画圈、文本加粗、文本高亮、文本背景色填充中的至少一种。
17.情况二,所述第一信息中包括第一语音信息时,根据所述第一信息,提取所述第一视频中的关键词,包括:确定所述第一视频对应的文本信息;根据所述第一语音信息,确定所述文本信息中被用户重读或强调的词语为关键词。
18.一般,用户讲解哪部分内容时,会对重点讲解内容重读(比如阅读语气较重)或强调(比如阅读多次),或者,使用加重语音讲解。因此,电子设备根据第一语音信息,确定被用户重读或强调的词语为关键词。这种方式结合语音信息识别关键词较为准确。
19.情况三,所述第一信息中包括第一角色信息时,根据所述第一信息,提取所述第一视频中的关键词,包括:确定所述第一视频对应的文本信息;根据所述第一角色信息,确定所述文本信息中的词语的提出者;所述第一角色信息中包括所述第一视频中每个信息的提
出者;确定所述提出者的角色权重;根据所述词语的提出者的角色权重,确定所述词语是否为关键词。
20.情况三中,根据所述词语的提出者的角色权重,确定所述词语是否为关键词,可以通过下述方式一和方式二来具体实现。
21.方式一,若所述角色权重大于预设权重,确定所述提出者所提出的词语为关键词。
22.假设第一视频对应的文本信息中包括词语a和词语b,其中,词语a的提出者为提出者a,词语b的提出者为提出者b。电子设备确定提出者a的角色权重和提出者b的角色权重。如果提出者a的角色权重大于预设权重,提出者b的角色权重小于预设权重,那么确定词语a所提出的词语为关键词。这种方式可以将角色权重较高的用户(比如,职位较高的用户)提出的词语作为关键词,准确性较高。
23.方式二,使用关键词识别算法识别所述词语是关键词的第一概率;根据所述词语的提出者的角色权重和所述词语的第一概率,计算所述词语是关键词的第二概率;根据所述第二概率,确定所述词语是否为关键词。这种方式结合词语提出者的角色权重和词语的初始分数(即第一概率)确定关键词,比较准确。
24.一种可能的设计中,所述确定提出者的角色权重,包括:根据所述提出者的职位,确定所述提出者的角色权重;和/或,根据所述词语与所述提出者之间的关联性,确定所述提出者的角色权重;和/或,根据用户设置操作,确定所述提出者的角色权重。比如,职位较高的人对应的角色权重较大。再比如,提出者与词语之间的关联性越强,则提出者的角色权重越高。其中,提出者与词语之间的关联性可以是提出者的岗位和/或岗位负责事项与词语的关联性,比如,提出者a的岗位是运维,负责事项包括网络维护、网络故障等等,如果提取出一个词语是维护,那么该词语与该提出者a的相关性较强。当然,提出者的角色权重也可以是自定义的,总之,本技术可以将角色权重较高的用户提出的词语作为关键词,准确性较高。
25.示例性的,所述第一行为信息包括但不限于为用户对所述第一视频中的信息的光标指示和/或标记。需要说明的是,此处所列举的几种操作是对用户标记的举例,还可以是其它的标记,本技术不一一举例。
26.示例性的,所述第一角色信息包括但不限于为所述第一视频中信息的提出者的名称和/或职位等。
27.情况四,所述第一信息中包括第一文本信息时,根据所述第一信息,提取所述第一视频中的关键词,包括:使用关键词识别算法确定所述第一文本信息中的关键词,其中,所述关键词识别算法比如ocr技术、tf-idf算法等。示例性的,电子设备可以使用ocr技术识别所述范围内的图像上的文本信息,在使用ocr识别文本得到分词后,直接该分词作为关键词;或者用户从这些分词中手动选择关键词。或者,得到分词后,基于预设关键词库确定关键词,所述预设关键词库可以是出厂时默认配置好的,或者用户自定义的。或者,还可以使用利用tf-idf算法识别关键词,比如,使用tf-idf算法计算词语在文本信息中的得分,得分大于预设得分的词语,确定为关键词。总之,电子设备通过文本信息确定关键词的方式有多种,本技术不一一举例。
28.上述情况一至情况四可以单独使用或者任意两个或两个以上可以结合使用。比如,通过情况四的方式根据第一文本信息初步识别出关键词,然后使用情况二在初步提出
的关键词中确定位于目标区域(根据第一行为信息确定的目标区域)内的关键词,或者,使用情况三在初步提出的关键词中确定重读或强调(根据第一语音信息确定)的关键词,或者,使用情况三在初步提出的关键词中基于关键词提出者的角色权重(基于第一角色信息确定的)确定最终关键词。
29.第二方面,还提供一种电子设备,包括处理器,存储器,以及,一个或多个程序;其中,所述一个或多个程序被存储在所述存储器中,所述一个或多个程序包括指令,当所述指令被所述处理器执行时,使得所述电子设备执行如上述第一方面中任一可能设计所提供的方法步骤。
30.第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如上述第一方面中任一可能设计所提供的方法。
31.第四方面,提供一种计算机程序产品,包括计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如上述第一方面中任一可能设计所提供的方法。
32.第五方面、提供一种电子设备上的图形用户界面,所述电子设备具有显示屏、存储器、以及处理器,所述处理器用于执行存储在所述存储器中的一个或多个计算机程序,所述图形用户界面包括所述电子设备执行上述第一方面中任一可能设计所提供的方法时显示的图形用户界面。
33.第六方面,本技术实施例还提供一种芯片系统,所述芯片系统包括至少一个处理器,所述至少一个处理器与电子设备中的存储器耦合,用于调用存储器中存储的计算机程序或指令并执行,使得本技术实施例第一方面中任一可能设计所提供的技术方案被执行,本技术实施例中“耦合”是指两个部件彼此直接或间接地结合。
34.上述第二方面至第六方面中任一方面中的任一可能设计所能达到的有益效果,请参见第一方面中任一可能设计可以达到的有益效果,这里不重复赘述。
附图说明
35.图1为本技术一实施例提供的应用场景的示意图;
36.图2至图3为本技术一实施例提供的关键词提取方法的示意图;
37.图4至图8为本技术一实施例提供的关键词提取装置的示意图;
38.图9为本技术一实施例提供的电子设备的结构示意图;
39.图10为本技术一实施例提供的关键词提取方法的流程示意图;
40.图11为本技术一实施例提供的关键词提取方法的另一种流程示意图;
41.图12a至图12c为本技术一实施例提供的目标区域的示意图;
42.图13为本技术一实施例提供的关键词提取方法的另一种流程示意图;
43.图14为本技术一实施例提供的关键词提取方法的又一种流程示意图;
44.图15为本技术一实施例提供的用户标记区域的示意图;
45.图16至图17为本技术一实施例提供的关键词提取方法的又一种流程示意图;
46.图18为本技术一实施例提供的用户词典的示意图;
47.图19为本技术一实施例提供的角色权重的示意图;
48.图20为本技术一实施例提供的电子设备的示意图。
具体实施方式
49.以下,对本技术实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
50.本技术实施例涉及的至少一个,包括一个或者多个;其中,多个是指大于或者等于两个。另外,需要理解的是,在本说明书的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为明示或暗示相对重要性,也不能理解为明示或暗示顺序。比如,第一对象和第二对象并不代表二者的重要程度或者代表二者的顺序,仅仅是为了区分描述。在本技术实施例中,“和/或”,仅仅是描述关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
51.在本技术实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连接”应做广义理解,例如,“连接”可以是可拆卸地连接,也可以是不可拆卸地连接;可以是直接连接,也可以通过中间媒介间接连接。本技术实施例中所提到的方位用语,例如,“上”、“下”、“左”、“右”、“内”、“外”等,仅是参考附图的方向,因此,使用的方位用语是为了更好、更清楚地说明及理解本技术实施例,而不是指示或暗指所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本技术实施例的限制。“多个”是指至少两个。
52.在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本说明书的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
53.图1为本技术实施例提供的一种应用场景的示意图。该应用场景以会议场景为例,如图1所示,会议场景中包括参会人员1、参会人员2、参见人员3和参与人员4。以参会人员1正在进行会议讲解为例,如图1,参会人员1将电子设备100上的内容投屏到电子设备200上展示。其中,电子设备100以笔记本电脑为例,电子设备100以投影设备为例。电子设备100投屏到电子设备200的方式有多种,包括但不限定于镜像投屏和非镜像投屏。
54.在参见人员1会议讲解过程中,会议记录人员可以对参会人员1的讲解内容进行录制,得到第一视频。其中,参会人员1的讲解内容包括参会人员1通过电子设备200所展示的内容。示例性的,第一视频可以通过如下至少一种方式获取:
55.方式a,第一视频可以是图1中电子设备100录制得到的。以电子设备100使用镜像投屏向电子设备200投屏为例,即电子设备100显示屏上所显示内容与投屏到电子设备200上的内容一致,所以电子设备100可以使用录屏功能录制本机显示屏的显示内容,即得到电子设备200上的显示内容。
56.方式b,第一视频可以是电子设备200录制得到的视频。比如,电子设备200具有录屏功能,可以对本机显示内容进行录制。这种对会议录制的方式较为便捷,比如参见人员1使用电子设备100讲解完毕之后,电子设备200对参会人员1的讲解内容录制完毕;之后,参会人员3使用电子设备300投屏到电子设备200进行会议讲解,电子设备200可以继续对参见人员3的讲解内容进行录制。
57.方式c,第一视频可以是会议场地中的监控摄像头(图1中未示出)录制的。比如会议场景中的监控摄像头可以对会议场景进行录制,其中包括电子设备200显示屏上显示的内容。
58.以上是第一视频的几种获取方式的举例,应理解,还可以有其它方式获取第一视频,比如,会议场景中部署有专门用于录制电子设备200的显示屏的设备,该设备所采集的视频即第一视频。
59.需要说明的是,图1是以现场会议为例,本技术还可以适用于线上会议,即无需参会人员集中在会议室,可以通过电子设备远程会议。或者,本技术实施例还可以适用于其它应用场景,比如教学场景(包括现场教学、线上教学)等。
60.在一些实施例中,第一视频可以存档以便查询。或者,为了方便查阅,会议记录人员可以为第一视频定义会议主题、会议简要等能够描述此次会议的信息,查阅者通过这些信息可以知道第一视频的讲解内容。
61.然而,会议记录人员为第一视频定义的会议主题、会议简介等信息准确度较低,因为会议记录人员可能不是与会议讲解内容相关的专业人员,无法准确的定义会议主题、会议简介等。而且,会议记录人员手动定义会议主题、会议简介等效率较低,人力成本大。
62.为了提升效率,一种解决方案是提取第一视频中的关键词,并基于关键词生成会议主题、会议简介等信息,无需手动添加,提升效率。其中,提取关键词的方案有多种,比如,包括如下方案中的至少一种:
63.第一种解决方案,请参见图2所示,提取关键词的流程包括:s21,录制得到第一视频。s22,提取第一视频中的关键帧图像。关键帧图像可以是第一视频中的一帧或多帧图像。s23,获取关键帧图像中的文本行图像。文本行图像是指关键帧图像中包含文本信息(文字、符号等)的图像块。s24,识别文本行图像中包含的所有文字字符。s25,根据预设的关键词库,从所有文字字符中提取关键词。预设的关键词库中存储有文字字符等对应的关键词。s26,输出关键词。这种方案中,通过识别第一视频中关键帧图像上的文本信息,得到关键词,这种方式识别出的关键词准确性较低,因为图像上的文本信息较多,识别出的所有文本信息都会被认为是关键词。
64.第二种解决方案,请参见图3,提取关键词的流程包括:s31,录制得到第一视频。s32、获取第一视频中的多模态数据,多模态数据包括图像、音频以及文本。s33、分别提取图像、音频以及文本对应的情感特征矩阵。其中,情感特征矩阵可以理解为形容词-名词对所表达的情感。s34、分别提取图像、音频以及文本对应的内容特征矩阵。内容特征矩阵可以是单词等。s35、获取情感特征矩阵、内容特征矩阵与预设关键词的匹配分数。s36、根据匹配分数确定关键词。s37、输出关键词。这种方案通过情感特征(比如形容词)以及内容特征提取出关键词,所提取的关键词不够准确,因为文本信息中有可能包含很多个用于表达情感特征的形容词-名词对,会对关键词的识别造成干扰,降低关键词识别的准确性。
65.第三种解决方案,利用机器学习算法提取第一视频中的关键词。比如,引入注意力机制,提取第一视频的图像帧中关键词的特征,然后采用损失函数来训练得到模型。其中,提取第一视频中的图像帧中的关键词特征所使用的方式为,对图像帧进行文本识别,即识别图像帧上包含的文本信息。其中,提取关键词的特征可以是用户预先设置好的特征。得到模型之后,在模型预测阶段,对第一视频的图像帧进行关键词检测得到一个关键词集合,该
关键词集合中包括多个词,所述多个词是关键词的概率较高。这种方案中提取的关键词不准确,因为训练模型时,使用的关键词特征是用户事先定义好的,模型只能基于事先定义好的特征识别关键词,不具有所述特征的词不会被识别为关键词,但是在会议场景中有些词汇不具有所述特征,但却是用户重点讲解的内容,如果使用这种方案将不会被识别为关键词。而且,在关键词识别时,利用纯文本识别的方式提取关键词,不够全面,准确性较低,比如,不利于图像信息的识别。
66.由此可见,以上的解决方案都无法准确的提取到第一视频中的关键词,如果提取的关键词不准确,那么无法得到准确的会议主题、会议简介等信息,查阅者查阅时无法准确找到对应的视频。
67.本技术实施例提供一种关键词提取方法,该方法中,电子设备可以根据第一视频中包含的用户操作行为、第一视频中信息提出者的角色信息、第一视频录制现场的语音信息、第一视频中包含的文本信息中的至少一种,提取第一视频中的关键词。这种方式提取的关键词较为准确。
68.下面介绍本技术实施例的设备。
69.在一些实施例中,本技术实施例提供的关键词提取方法可以由会议终端执行。所述会议终端可以是图1场景中的电子设备100、电子设备200或电子设备300。示例性的,请参见图4,为会议终端的一种结构示意图。会议终端中包括信息采集模块、用户行为提取模块、文本内容识别模块、关键词提取模块。可选的,还可以包括关键词提取结果优化模块。其中,信息采集模块用于采集信息,所述信息包括用户操作信息,比如鼠标位置信息、键盘操作信息、触摸笔触摸信息等等。用户行为提取模块用于根据信息采集模块所采集的用户操作信息确定用户行为。比如,根据鼠标位置信息识别用户行为是画圈、长按或批注等行为;再例如,根据键盘操作信息识别用户行为是批注或修改等行为。文本内容识别模块用于识别第一视频中的文本信息。关键词提取模块用于根据用户行为信息和/或角色信息提取关键词(具体实现过程将在后文介绍)。关键词提取结果优化模块用于对关键词提取模块所提取的关键词进行优化,比如关键词提取模块所提取出的关键词有多个,关键词结果优化模块可以对这多个关键词进行排序、删除或者从中选择一个最终关键词等等,具体的实现过程将在后文介绍。
70.在另一些实施例中,本技术实施例提供的关键词提取方法还可以由会议终端和会议后台处理单元完成。其中,会议终端可以是图1中的电子设备100、电子设备200或电子设备300。会议后台处理单元可以是服务器或云端。示例性的,请参见图5,会议终端包括信息采集模块、网络收发模块。其中,网络收发模块用于向会议后台处理单元发送采集到的信息。会议后处理单元包括网络收发模块、用户行为提取模块、文本内容识别模块、关键词提取模块。其中,网络收发模块用于接收会议终端的信息。可选的,会议后处理单元中还可以包括关键词提取结果优化模块。其中,信息采集模块、用户行为提取模块、文本内容识别模块、关键词提取模块、关键词提取结果优化模块的功能请参见上述图4的描述说明,不重复赘述。
71.在另一些实施例中,本技术实施例提供的关键词提取方法还可以由投屏客户端、会议终端和会议后台处理单元完成。示例性的,投屏客户端可以是图1中的电子设备100或电子设备300,会议终端可以是图1中的电子设备200。会议后台处理单元可以是服务器或云
端。示例性的,请参见图6,投屏客户端中包括信息采集模块、网络收发模块。会议终端中包括网络收发模块。会议后处理单元包括网络收发模块、用户行为提取模块、文本内容识别模块、关键词提取模块。可选的,会议后处理单元中还可以包括关键词提取结果优化模块。可以理解的是,图6中也可以不包含投屏客户端,即会议终端采集信息并直接向会议后台处理单元发送采集到的信息(即图5的架构)。或者,图6中也可以不包含会议终端,即投屏客户端采集信息并直接向会议后台处理单元发送采集的信息。
72.为了方便描述,下文中以图4所示的结构为例。
73.在一些实施例中,图4中用户行为提取模块的结构请参见图7所示,用户行为提取模块中包括视频图像提取模块、鼠标位置提取模块、鼠标信息分析模块、区域图像提取模块,还包括用户标记分析模块。用户行为提取模块有两种方式提取用户行为。一种方式由视频图像提取模块、鼠标位置提取模块、鼠标信息分析模块、区域图像提取模块这四个模块实现。另一种方式由视频图像提取模块、用户标记分析模块、区域图像提取模块这三个模块实现。第一种方式中,视频图像提取模块用于提取第一视频中的图像。鼠标位置提取模块用于确定鼠标位置信息。鼠标信息分析模块用于分析预设时长内鼠标位置是否在处于一定范围内。区域图像提取模块用于确定预设时长内鼠标位置处于一定范围内时,提取用户鼠标所述范围内的图像块。关于第一种方式的详细说明请参见后文中的实施例一或实施例二。第二种方式中,视频图像提取模块用于提取第一视频中的图像。用户标记分析模块用于确定提取出的图像上用户标记的区域,比如画圈的区域、画横线的区域等。区域图像提取模块用于提取所述用户标记区域内的图像块。关于第一种方式的详细说明请参见后文中的实施例三。
74.在一些实施例中,图4中关键词提取模块的结构请参见图8所示,关键词提取模块中包括自动提取模块和手动提取模块。其中,手动提取模块用于用户手动的提取关键词。比如,可以展示用户界面((user interface,ui)界面,ui界面中显示文本内容识别模块所识别出的文本,用户在该ui界面中选择关键词。自动提取模块有四种方式实现自动提取关键词。
75.方式一,自动提取模块根据用户行为提取模块所提取的用户行为进行关键词提取。比如,对鼠标停留区域内进行关键词识别,或者,对用户标记区域内进行关键词识别。这种方式缩小了关键词提取范围,所提取的关键词比较准确。方式一的具体实现过程请参见后文中的实施例一至实施例三。
76.方式二,自动提取模块根据会议语音提取关键词。比如,如图8,自动提取模块中包括语音情感分析模块、文本分析模块以及自动语音识别(automatic speech recognition,asr)模块。其中,文本分析模块用于识别第一视频中的文本信息。语音情感分析模块用于分析语音情感,比如用户重读或强调的词语。asr模块用于将会议语音转换为文本信息。方式二具体可以包括方式a、方式b和方式c,方式a,根据文本分析模块所识别出的第一视频的文本信息、以及语音情感分析模块得到的语音情感,提取关键词,比如所述文本信息被重读或强调的词语为关键词。方式b,根据文本分析模块所识别出的第一视频的文本信息(称为文本信息1)、以及asr模块得到的文本信息(称为文本信息2),提取关键词,比如文本信息1中包含单词,且该单词在文本信息2中多次出现,则确定该单词为关键词。方式c,结合文本分析模块所识别出的第一视频的文本信息、语音情感分析模块得到的语音情感、以及asr模块
得到的文本信息,提取关键词。方式c可以理解为方式a和方式b的结合,准确性更高。其中方式二的具体实现过程请参见后文中的实施例四。
77.方式三,自动提取模块根据角色信息提取关键词。比如,自动提取模块先初步提取第一视频中的关键词或者会议语音中的关键词,然后根据关键词提出者的角色信息确定最终关键词。方式三的具体实现过程将在后文实施例五中介绍。
78.需要说明的是,以上方式一至方式三可以单独实施或者结合实施,本技术不限定。
79.图9示出了电子设备的结构示意图。所述电子设备可以是笔记本电脑、平板电脑、手机等便捷式电子设备。比如,图1中的电子设备100。如图10所示,电子设备可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,usb)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,sim)卡接口195等。其中传感器模块180可以包括压力传感器180a,陀螺仪传感器180b,气压传感器180c,磁传感器180d,加速度传感器180e,距离传感器180f,接近光传感器180g,指纹传感器180h,温度传感器180j,触摸传感器180k,环境光传感器180l,骨传导传感器180m等。
80.处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu),图像信号处理器(image signal processor,isp),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,dsp),基带处理器,和/或神经网络处理器(neural-network processing unit,npu)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。其中,控制器可以是电子设备的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
81.usb接口130是符合usb标准规范的接口,具体可以是mini usb接口,micro usb接口,usb type c接口等。usb接口130可以用于连接充电器为电子设备充电,也可以用于电子设备与外围设备之间传输数据。充电管理模块140用于从充电器接收充电输入。电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,外部存储器,显示屏194,摄像头193,和无线通信模块160等供电。
82.电子设备的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。电子设备中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
83.移动通信模块150可以提供应用在电子设备上的包括2g/3g/4g/5g等无线通信的
解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,lna)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
84.无线通信模块160可以提供应用在电子设备上的包括无线局域网(wireless local area networks,wlan)(如无线保真(wireless fidelity,wi-fi)网络),蓝牙(bluetooth,bt),全球导航卫星系统(global navigation satellite system,gnss),调频(frequency modulation,fm),近距离无线通信技术(near field communication,nfc),红外技术(infrared,ir)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
85.在一些实施例中,电子设备的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,gsm),通用分组无线服务(general packet radio service,gprs),码分多址接入(code division multiple access,cdma),宽带码分多址(wideband code division multiple access,wcdma),时分码分多址(time-division code division multiple access,td-scdma),长期演进(long term evolution,lte),bt,gnss,wlan,nfc,fm,和/或ir技术等。所述gnss可以包括全球卫星定位系统(global positioning system,gps),全球导航卫星系统(global navigation satellite system,glonass),北斗卫星导航系统(beidou navigation satellite system,bds),准天顶卫星系统(quasi-zenith satellite system,qzss)和/或星基增强系统(satellite based augmentation systems,sbas)。
86.显示屏194用于显示应用的显示界面等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,lcd),有机发光二极管(organic light-emitting diode,oled),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode的,amoled),柔性发光二极管(flex light-emitting diode,fled),miniled,microled,micro-oled,量子点发光二极管(quantum dot light emitting diodes,qled)等。在一些实施例中,电子设备可以包括1个或n个显示屏194,n为大于1的正整数。
87.电子设备100可以通过isp,摄像头193,视频编解码器,gpu,显示屏194以及应用处理器等实现拍摄功能。
88.isp用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给isp处理,转化为肉眼可见的图像。isp还可以对图像的噪点,亮度,肤色进行算法优化。isp还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,isp可以设置在摄像头193中。
89.摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元
件。感光元件可以是电荷耦合器件(charge coupled device,ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给isp转换成数字图像信号。isp将数字图像信号输出到dsp加工处理。dsp将数字图像信号转换成标准的rgb,yuv等格式的图像信号。在一些实施例中,电子设备可以包括1个或n个摄像头193,n为大于1的正整数。
90.内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器110通过运行存储在内部存储器121的指令,从而执行电子设备的各种功能应用以及数据处理。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,以及至少一个应用程序(例如爱奇艺应用,微信应用等)的软件代码等。存储数据区可存储电子设备使用过程中所产生的数据(例如图像、视频等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,ufs)等。
91.外部存储器接口120可以用于连接外部存储卡,例如micro sd卡,实现扩展电子设备的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将图片,视频等文件保存在外部存储卡中。
92.电子设备可以通过音频模块170,扬声器170a,受话器170b,麦克风170c,耳机接口170d,以及应用处理器等实现音频功能。例如音乐播放,录音等。
93.压力传感器180a用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180a可以设置于显示屏194。陀螺仪传感器180b可以用于确定电子设备的运动姿态。在一些实施例中,可以通过陀螺仪传感器180b确定电子设备围绕三个轴(即,x,y和z轴)的角速度。
94.陀螺仪传感器180b可以用于拍摄防抖。气压传感器180c用于测量气压。在一些实施例中,电子设备通过气压传感器180c测得的气压值计算海拔高度,辅助定位和导航。磁传感器180d包括霍尔传感器。电子设备可以利用磁传感器180d检测翻盖皮套的开合。在一些实施例中,当电子设备是翻盖机时,电子设备可以根据磁传感器180d检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。加速度传感器180e可检测电子设备在各个方向上(一般为三轴)加速度的大小。当电子设备静止时可检测出重力的大小及方向。还可以用于识别电子设备姿态,应用于横竖屏切换,计步器等应用。
95.距离传感器180f,用于测量距离。电子设备可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备可以利用距离传感器180f测距以实现快速对焦。接近光传感器180g可以包括例如发光二极管(led)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备通过发光二极管向外发射红外光。电子设备使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备附近有物体。当检测到不充分的反射光时,电子设备可以确定电子设备附近没有物体。电子设备可以利用接近光传感器180g检测用户手持电子设备贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180g也可用于皮套模式,口袋模式自动解锁与锁屏。
96.环境光传感器180l用于感知环境光亮度。电子设备可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180l也可用于拍照时自动调节白平衡。环境光传感
器180l还可以与接近光传感器180g配合,检测电子设备是否在口袋里,以防误触。指纹传感器180h用于采集指纹。电子设备可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
97.温度传感器180j用于检测温度。在一些实施例中,电子设备利用温度传感器180j检测的温度,执行温度处理策略。例如,当温度传感器180j上报的温度超过阈值,电子设备执行降低位于温度传感器180j附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备对电池142加热,以避免低温导致电子设备异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备对电池142的输出电压执行升压,以避免低温导致的异常关机。
98.触摸传感器180k,也称“触控面板”。触摸传感器180k可以设置于显示屏194,由触摸传感器180k与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180k用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180k也可以设置于电子设备的表面,与显示屏194所处的位置不同。
99.骨传导传感器180m可以获取振动信号。在一些实施例中,骨传导传感器180m可以获取人体声部振动骨块的振动信号。骨传导传感器180m也可以接触人体脉搏,接收血压跳动信号。
100.按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备可以接收按键输入,产生与电子设备的用户设置以及功能控制有关的键信号输入。马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。sim卡接口195用于连接sim卡。sim卡可以通过插入sim卡接口195,或从sim卡接口195拔出,实现和电子设备的接触和分离。
101.可以理解的是,图9所示的部件并不构成对电子设备100的具体限定。本发明实施例中的电子设备可以包括比图9中更多或更少的部件。此外,图9中的部件之间的组合/连接关系也是可以调整修改的。
102.下面结合附图对本技术的关键词提取方法作详细介绍。
103.图10为本技术一实施例提供的关键词提取方法的流程示意图。如图10所示,所述流程包括:
104.s1,电子设备获取第一信息。第一信息中包括第一行为信息、第一角色信息、第一语音信息和第一文本信息中的至少一种。其中,第一行为信息为第一视频中所包含的用户操作行为,第一角色信息包括第一视频中信息提出者的信息,第一语音信息包括第一视频中的语音,第一文本信息为第一视频中所包含的文本信息。
105.可选的,电子设备还可以执行步骤:获取第一视频。其中,第一视频的获取方式有多种,请参见前文中的方式a至方式c。在一些实施例中,电子设备获取第一视频的步骤可以在s1之前或同时执行。比如,如下应用场景一和应用场景二,其中,应用场景一中第一视频的获取步骤与s1同时执行,应用场景二中第一视频的获取步骤在s1之前执行。
106.应用场景一,会议正在进行的场景,以图1为例,电子设备100正向电子设备200投
屏中,参会人员1使用电子设备100讲解内容。以电子设备100在投屏过程中实时录屏为例,即,第一视频还在实时录制中。此时,参会人员1可能会使用输入设备(比如,鼠标、键盘等)在电子设备100的投屏内容上进行操作(比如圈中某个词语等),那么电子设备100可以记录参会人员1对投屏内容的操作行为,即第一行为信息。即,第一视频和第一行为信息同步获取。
107.应用场景二,会议已结束的场景。以图1为例,在会议结束之后,会议记录人员获取到第一视频之后,可以对第一视频内的信息进行操作,比如标记、批注、修改等。也就是说,这种场景下,s1可在获取第一视频之后执行。
108.示例性的,第一行为信息包括对第一视频中信息的指示、标记、修改、添加、批注等等行为。其中,指示可以包括鼠标光标长时间停留在某个区域内或者鼠标选中某个内容,比如用户讲解某内容时,通常情况下会将鼠标光标指示在该内容所在区域内或者使用鼠标光标选中该内容。标记包括对信息画圈、信息字体加粗、信息字体高亮、信息字体背景颜色填充等任何的用于标记信息的方式。以图1为例,第一行为信息包括参会人员1在讲解过程中将重点内容(比如,预计产量)圈出的行为。
109.示例性的,第一语音信息即第一视频中包括的语音。可以理解的是,以图1为例,在会议录制过程中,不一定只有讲解人即参会人员1说话,其它参会人员与可以发表言论,所以,第一语音信息中可以包括会议场地中所有声音信息,即可以包括各个参会人员的语音信息。
110.示例性的,第一角色信息包括第一视频中信息的提出者。第一视频中包括语音信息和视频信息。第一角色信息可以是视频信息的提出者,和/或语音信息的提出者。应理解,以图1为例,第一视频中视频信息的提供者是参会人员1(即,是参会人员1制作的ppt讲解),第一视频中语音信息的提出者可以包括参会人员1,也可以包括其它参会人员。因此,第一视频中,第一角色信息可以有多个。其中,第一视频中视频信息的提出者有多种方式确定,比如用于录制第一视频的设备的使用者。以图1为例,电子设备100录屏得到第一视频,电子设备100的使用者为参会人员1,那么第一视频中视频信息的提供者为参会人员1。其中,电子设备100的使用者可以是电子设备100当前登录的账号(比如,企业内每个用户需要登录账号才能使用电子设备100或才能控制电子设备100投屏到电子设备200)。再例如,在会议开始前,参会人员1可以以自己的会议账号创建线上会议,在会议开始后,各个参会人员以自己的会议账号加入到会议中。第一视频中视频信息的提出者可以是创建线上会议的账号。语音信息的提出者的确定方式有多种,比如,会议记录人员会记录会议纪要,会议纪要中包括会议中哪些人说过哪些词,电子设备可以通过会议纪要确定语音信息提出者。再比如,线上会议中,每个参会人员的发言都可以被记录,得到每个参会人员的语录,通过参会人员的语音确定语音信息的提出者。
111.s2,电子设备根据第一信息,提取第一视频中的关键词。
112.示例性的,s2的实现方式有多种,包括但不限定于如下至少一种。
113.方式一,当第一信息包括第一行为信息时,电子设备根据第一行为信息,确定第一视频中的目标区域,其中目标区域为第一行为信息所针对的区域;电子设备再确定目标区域内的关键词。
114.其中,目标区域可以是根据鼠标光标位置、键盘输入操作、触摸屏触摸操作中的至
少一种确定。以鼠标光标位置为例,例如,电子设备获取鼠标光标位置信息,确定预设时长内鼠标光标位置处于一定范围内,且该一定范围的面积小于预设面积,则确定该范围对应的区域为目标区域。具体实现过程请参见后文中的实施例一或实施例二。再例如,电子设备从第一视频中提取图像,确定图像上用户所标注的区域为目标区域,用户所标注的区域包括画横线的区域、画圈的区域等等。具体实现过程请参见后文中的实施例三。
115.方式二,当第一信息包括第一语音信息时,电子设备确定第一视频对应的文本信息,根据第一语音信息,确定文本信息中重读或强调的词语为关键词。
116.其中,第一视频对应的文本信息包括第一视频中视频信息中包含的文本信息,和/或,第一视频中语音信息对应的文本信息。其中,语音信息对应的文本信息可以理解为将语音信息转换为文字信息,比如可以使用asr技术可以将语音信息转换为文字信息。
117.可以理解的是,用户讲解内容的过程中,对于重点内容往往会强调多次,或者加重语气读。因此,电子设备可以获取第一视频中的文本信息,根据第一语音信息的情感特征(比如重读或强调)确定所述文本信息中的关键词。再例如,电子设备可以先初步提取第一视频中的关键词,比如使用光学字符识别(optical character recognition,ocr)初步提取,然后根据第一语音信息,确定初步提取出的关键词中重读或强调的关键词为最终关键词。方式二的具体实现过程将在后文实施例四中介绍。
118.方式三,所述第一信息中包括第一角色信息时,电子设备确定第一视频对应的文本信息,根据第一角色信息,确定文本信息中的词语的提出者,所述第一角色信息中包括所述第一视频中每个信息的提出者;根据词语的提出者的角色权重,确定所述词语是否为关键词。
119.其中,第一视频对应的文本信息包括第一视频中的视频信息中包含的文本信息,和/或,第一视频中语音信息对应的文本信息。其中,语音信息对应的文本信息可以理解为将语音信息转换为文字信息,比如可以使用asr技术可以将语音信息转换为文字信息。
120.示例性的,第一视频对应的文本信息中包括各种词语,不同词语的提出者可能不同。不同提出者的角色权重值也可能不同,电子设备可以将角色权重大于预设权重值的提出者提出的词语作为关键词。提出者的角色权重可以是默认设置好的,或者企业自定义的,或者与提出者的职位相关,比如可以是职位越高则权重越大。再例如,电子设备可以先初步提取第一视频中的关键词,比如使用ocr技术初步提取,然后根据第一角色信息,确定初步提取出的关键词中角色权重大于预设权重的提出者提出的关键词为最终关键词。方式三的具体实现过程将在后文实施例五中介绍。
121.以上的方式一至方式三可以分别单独使用,也可以结合使用。
122.以方式一与方式二结合为例,可以先使用方式一后使用方式二,或者,先使用方式二后使用方式一。以先使用方式一后使用方式二为例,包括:情况1,先使用方式一即根据第一行为信息,确定第一视频中的目标区域,之后使用方式二即根据第一语音信息确定目标区域的文本信息中被内被重读或强调的词语为关键词。情况2,先使用方式一即根据第一行为信息,确定第一视频中的目标区域并初步识别目标区域内的关键词,之后使用方式二即根据第一语音信息在初步识别出的关键词中进一步作关键词识别。
123.以方式一与方式三结合为例,可以先使用方式一后使用方式三,或者,先使用方式三后使用方式一。以先使用方式一后使用方式三为例,包括:情况3,先使用方式一即根据第
一行为信息,确定第一视频中的目标区域,之后使用方式三即根据第一角色信息确定目标区域内的文本信息的提出者,并基于提出者的角色权重确定关键词。情况4,先使用方式一即根据第一行为信息,确定第一视频中的目标区域并初步识别目标区域内的关键词,之后使用方式三即根据第一角色信息确定初步识别出的关键词的提出者,并基于提出者的角色权重确定关键词。
124.以方式一、方式二与方式三结合为例,比如先使用方式一即根据第一行为信息,确定第一视频中的目标区域并初步识别目标区域内的关键词,之后使用方式二即根据第一语音信息在初步识别出的关键词中再进行一次关键词识别,然后使用方式三即根据第一角色信息在使用方式二所识别出的关键词中再进行一次关键词识别;当然,方式一、方式二和方式三的执行顺序可以任意调整,在此不一一举例。
125.实施例一
126.本实施例一对第一信息包括第一行为信息的情况进行详细说明,即对图10中s2的方式一(当第一信息包括第一行为信息时,电子设备根据第一行为信息,确定第一视频中的目标区域,电子设备确定目标区域内的关键词)进行说明。以第一行为信息包括鼠标光标指示行为为例,当第一信息包括第一行为信息时,根据第一行为信息,确定第一视频中的目标区域,确定目标区域内的关键词,可以包括:确定预设时长内鼠标光标位置处于第一区域内,且第一区域的面积小于预设面积,则确定第一区域为目标区域,然后确定目标区域内的关键词。
127.具体地,请参见图11,为本实施例一的流程示意图。如图11,所述流程包括:
128.s1101,电子设备正在录屏。
129.以图1为例,s1101中的电子设备可以是电子设备100,电子设备100录屏以得到第一视频。应理解,电子设备正在录屏中,即第一视频正在录制过程中。
130.s1102,电子设备从系统获取鼠标光标位置。
131.继续以图1为例,在电子设备100连接有鼠标的情况下,用户在讲解过程中可以使用鼠标光标进行指示、标记等操作行为。比如,鼠标位置移动时,向电子设备的操作系统发送输入事件,该输入事件中包括鼠标位置信息,电子设备的操作系统获取到鼠标位置信息将其映射为显示屏上的光标位置,实现对显示屏上显示内容的控制。因此,电子设备可以从操作系统中获取到鼠标光标位置。
132.需要说明的是,实施例一可以适用于应用场景一(即会议正在进行中的场景),因为,电子设备在录屏中,就可以获取到第一行为信息(即鼠标光标位置),然后根据第一行为信息提取关键词。
133.s1103,电子设备判断预设时长内鼠标光标位置是否处于第一区域内,且第一区域的面积小于预设面积。如果是,执行s1104。
134.示例性的,s1103包括如下方式d至方式e中的至少一种。
135.方式d,在预设时长内,电子设备检测到多个鼠标光标位置,确定所述多个鼠标光标位置的第一外接多边形(比如正方形或长方形),如果第一外接多边形的面积小于预设面积,则确定预设时长内鼠标光标位置处于第一区域内,所述第一区域为所述第一外接多边形所围区域。示例性的,所述预设面积可以根据实际情况调整,比如,电子设备的显示屏较小时,可以设置预设面积小一些,电子设备的显示屏较大时,可以设置预设面积大一些,具
体的调整方式本技术不限定。
136.示例性的,请参见图12a,预设时长内电子设备检测到多个鼠标光标位置,图中用黑点表示。电子设备确定多个黑点的外接长方形即图中的方框。方框中最靠近上边缘的点为点1,坐标为(x1,y1);最靠近下边缘的点为点2,坐标为(x2,y2);最靠近左边缘的点为点3,坐标为(x3,y3);最靠近右边缘的点为点4,坐标为(x4,y4)。因此,方框的横坐标范围为x3到x4,纵坐标范围是y2到y1,所以,方框的面积为(x4-x3)*(y2-y1)。如果方框的面积小于预设面积,则确定预设时长内鼠标光标位置处于第一区域内,那么方框所围区域可以作为目标区域进行关键词识别。
137.方式e,在预设时长内,电子设备使用方式d确定出两个或两个以上的第一外接多边形,以两个第一外接多边形为例,如果这两个第一外接多边形之间的距离小于预设距离,确定包含这两个第一外接多边形在内的第二外接多边形。如果第二外接多边形的面积小于预设面积,则确定预设时长内鼠标光标位置处于第一区域内,第一区域即为所述第二外接多边形所围区域。
138.示例性的,请参见图12b,电子设备使用方式d确定两个第一外接长方形,即区域1和区域2。其中,区域1的中心点c1(图中未示出)的位置为(xc1,yc1);其中,xc1=x3+(x4

x3)/2;yc1=y2+(y1

y2)/2。区域2的中心点c2(图中未示出)的坐标位置为(xc2,yc2);其中,xc2=x7+(x8

x7)/2;yc2=y6+(y5

y6)/2。那么,中心点c1与中心点c2之间的距离d为如果距离d小于预设距离,则确定区域1和区域2的第二外接多边形,比如图12c中的区域3。如果区域3的面积小于阈值2,确定预设时长内鼠标光标位置处于一定范围内,所述范围即区域3所围范围。那么区域3可以作为目标区域进行关键词识别。通过方式e所确定的目标区域面积较大,提升关键词识别的准确性。
139.s1104,电子设备提取第一区域内的图像。
140.s1105,电子设备对第一区域内的图像进行文本识别。
141.示例性的,电子设备可以使用ocr技术识别所述范围内的图像上的文本信息。
142.s1106,电子设备提取关键词。
143.比如,在使用ocr识别文本得到分词后,直接该分词作为关键词;或者用户从这些分词中手动选择关键词。或者,得到分词后,基于预设关键词库确定关键词,所述预设关键词库可以是出厂时默认配置好的,或者用户自定义的。或者,还可以使用利用tf-idf算法识别关键词,比如,使用tf-idf算法计算词语在文本信息中的得分,得分大于预设得分的词语,确定为关键词。总之,电子设备通过文本信息确定关键词的方式有多种,本技术不一一举例。
144.或者,电子设备还可以使用后文中实施例四(基于第一语音信息提取关键词)或实施例五(基于第一角色信息提取关键词)的方式提取关键词。
145.实施例二
146.本实施例二对第一信息包括第一行为信息的情况进行详细说明,即对图10中s2的方式一(当第一信息包括第一行为信息时,电子设备根据第一行为信息,确定第一视频中的目标区域,电子设备确定目标区域内的关键词)进行说明。与实施例一不同的是,实施例一适用于应用场景一,即会议正在进行中的场景,实施例二适用于应用场景二,即会议结束后的场景。
147.由于会议已结束,所以无法从系统获取鼠标光标位置,所以本实施例二可以通过对第一视频的图像识别技术确定鼠标光标位置。因此,实施例一和实施例二也可以理解为获取鼠标光标位置的两种不同方式,实施例一是从操作系统获取,较为准确,实施例二是通过图像识别来确定图像上鼠标光标位置。
148.如图13,为本实施例二的流程示意图。如图13,所述流程包括:
149.s1301,电子设备获取第一视频。
150.s1302,电子设备提取第一视频中的第一图像。其中,第一图像可以是第一视频中任一帧图像。
151.s1303,电子设备识别第一图像中是否存在鼠标光标。
152.示例性的,s1303中,电子设备可以使用图像识别技术识别第一图像上是否存在鼠标光标。所述图像识别技术可以是现有的识别技术,本技术不限定。
153.s1304,电子设备记录鼠标光标位置。
154.s1305,电子设备判断第一图像的相邻帧图像上是否存在鼠标光标。
155.其中,第一图像的相邻帧可以是一帧或多帧,比如第一图像是第5帧,相邻帧可以包括第2帧、第3帧、第4帧,第6帧、第7帧等,可以是位于第一图像前后的预设帧数的图像。
156.s1306,电子设备确定相邻帧图像上鼠标光标位置与第一图像上鼠标光标位置是否处于第一区域内,第一区域的面积小于预设面积。
157.在一些实施例中,电子设备可以记录下第一图像上鼠标光标位置,以及相邻帧图像上鼠标光标位置。然后,使用实施例一中的方式d或方式e判断鼠标光标位置是否处于第一区域内,具体实现过程参见前文实施例一,在此不重复赘述。
158.s1307,电子设备提取第一区域内的图像。
159.s1308,电子设备对第一区域内的图像进行文本识别。
160.示例性的,电子设备可以使用ocr技术识别所述范围内的图像上的文本信息。
161.s1309,电子设备提取关键词。
162.比如,在使用ocr识别文本得到分词后,直接该分词作为关键词;或者用户从这些分词中手动选择关键词。或者,得到分词后,基于预设关键词库确定关键词,所述预设关键词库可以是出厂时默认配置好的,或者用户自定义的。或者,还可以使用利用tf-idf算法识别关键词,比如,使用tf-idf算法计算词语在文本信息中的得分,得分大于预设得分的词语,确定为关键词。总之,电子设备通过文本信息确定关键词的方式有多种,本技术不一一举例。
163.或者,电子设备还可以使用后文中实施例四(基于第一语音信息提取关键词)或实施例五(基于第一角色信息提取关键词)的方式提取关键词。
164.实施例三
165.本实施例三对第一信息包括第一行为信息的情况进行详细说明,即对图10中s2的方式一(当第一信息包括第一行为信息时,电子设备根据第一行为信息,确定第一视频中的目标区域,电子设备确定目标区域内的关键词)进行说明。以第一行为信息包括用户标记行为为例,当第一信息包括第一行为信息时,根据第一行为信息,确定第一视频中的目标区域,确定目标区域内的关键词,可以包括:确定第一视频中第一图像上被用户标记的区域;第一图像可以是第一视频中任一张或多张图像;确定被用户标记的区域为目标区域,然后
确定目标区域内的关键词。与实施例一和实施例二的区别在于,实施例一和实施例二中以第一行为信息是光标指示行为为例,实施例三以第一行为信息是用户标记行为为例。其中,光标指示行为可以理解为光标移动不留下标记或痕迹;用户标记行为可以理解为光标移动留下标记或痕迹,比如,画圈、下横线,高亮、加粗等等留下痕迹的行为。
166.如图14,为本实施例三的流程示意图。如图14,所述流程包括:
167.s1401,电子设备获取第一视频。
168.s1402,电子设备提取第一视频中的第一图像。
169.其中,第一图像可以是第一视频中任一帧或多帧图像。
170.s1403,电子设备判断第一图像中是否存在用户标注。
171.示例性的,用户标注包括划线(比如文字下的横线)、画圈、文本加粗、文本高亮、文本背景色填充、修改、批注中的至少一种。
172.s1404,电子设备确定用户标注区域。
173.示例性的,请参见图15,为第一视频中第一图像的示意图。第一图像上包括文字信息和图片信息。电子设备检测到第一图像上存在横线1501,则以横线1501为底边、以预设高度(比如100像素)为高度确定长方形区域,即用户标注区域。再比如,电子设备检测到第一图像上存在圈1502,则记录圈1502周围的四个点,然后确定四个点的外接长方形,该外接长方形为用户标注区域。
174.s1405,电子设备提取用户标注区域内的图像。
175.s1406,电子设备对提取的图像进行文本识别。
176.示例性的,电子设备可以使用ocr技术识别所述范围内的图像上的文本信息。
177.s1407,电子设备提取关键词。
178.比如,在使用ocr识别文本得到分词后,直接该分词作为关键词;或者用户从这些分词中手动选择关键词。或者,得到分词后,基于预设关键词库确定关键词,所述预设关键词库可以是出厂时默认配置好的,或者用户自定义的。或者,还可以使用利用tf-idf算法识别关键词,比如,使用tf-idf算法计算词语在文本信息中的得分,得分大于预设得分的词语,确定为关键词。总之,电子设备通过文本信息确定关键词的方式有多种,本技术不一一举例。
179.或者,电子设备还可以使用后文中实施例四(基于第一语音信息提取关键词)或实施例五(基于第一角色信息提取关键词)的方式提取关键词。
180.实施例四
181.本实施例四对第一信息包括第一语音信息的情况进行详细说明,即对图10中s2的方式二(当第一信息包括第一语音信息时,电子设备确定第一视频对应的文本信息,根据第一语音信息,确定文本信息中重读或强调的词语为关键词)进行说明。
182.如图16,为本实施例四的流程示意图。如图16,所述流程包括:
183.s1601,电子设备获取第一视频对应的文本信息。
184.示例性的,第一视频对应的文本信息包括第一视频中视频信息对应的文本信息,和/或,第一视频中语音信息对应的文本信息。语音信息对应的文本信息可以是将语音转换为文字得到的文本信息,比如使用asr技术转换。或者,电子设备也可以只获取目标区域内的文本信息,所述目标区域可以是实施例一、实施例二或实施例三的方式确定出的目标区
域。
185.示例性的,电子设备可以使用ocr技术识别图像上的文本信息。
186.s1602,电子设备确定文本信息中的关键词。
187.比如,在使用ocr识别文本得到分词后,直接该分词作为关键词;或者用户从这些分词中手动选择关键词。或者,得到分词后,基于预设关键词库确定关键词,所述预设关键词库可以是出厂时默认配置好的,或者用户自定义的。或者,还可以使用利用tf-idf算法识别关键词,比如,使用tf-idf算法计算词语在文本信息中的得分,将得分大于预设得分的词语确定为关键词。总之,电子设备通过文本信息确定关键词的方式有多种,本技术不一一举例。
188.需要说明的是,s1602可以执行或不执行,如果s1602执行,则电子设备先初步的识别一次关键词,然后基于第一语音信息,在初步识别出的关键词中进一步确定关键词。如果s1602不执行,则电子设备直接根据第一语音信息,在基于第一视频对应的文本信息中选择强调或重读的词语为关键词。
189.s1603,电子设备根据第一语音信息,判断关键词是否被强调或重读。
190.可以理解的是,用户讲解内容的过程中,对于重点内容往往会强调多次,或者加重语气读。因此,电子设备可以根据第一语音信息的情感特征(比如重读或强调)判断词语是否为关键词。如果是,则执行s1604。
191.s1604,根据s1603的判断结果输出关键词。
192.实施例五
193.本实施例五对第一信息包括第一角色信息的情况进行详细说明,即对图10中s2的方式三(当第一信息中包括第一角色信息时,电子设备确定第一视频对应的文本信息,根据第一角色信息,确定文本信息中的词语的提出者,第一角色信息中包括第一视频中每个信息的提出者;根据词语的提出者的角色权重,确定所述词语是否为关键词)进行说明。
194.如图17,为本实施例五的流程示意图。如图17,所述流程包括:
195.s1701,电子设备获取第一视频对应的文本信息。
196.s1702,电子设备识别文本信息中的词语。
197.其中,s1701至s1701的实现原理与s1601至s1602的实现原理相同,不重复赘述。
198.s1703,电子设备确定词语的提出者。
199.如前文所述,词语提出者的确定方式有多种,比如会议记录人员会记录会议纪要,会议纪要中包括会议中哪些人说过哪些词,电子设备可以通过会议纪要确定词语提出者。再比如,线上会议中,每个参会人员的发言都可以被记录,得到每个参会人员的语录,通过参会人员的语录确定词语提出者。
200.可以理解的是,一个词语可能有一个或多个提出者。比如,会议中多个参见人员均提到过词语a。
201.s1704,电子设备判断词语是否处于该提出者的个人词库中。如果是,执行s1705。
202.在一些实施例中,企业内员工具有个人词库,个人词库中存储该员工提出过的所有词语。比如,一个员工参加过某会议,提出词语a,则词语a被记录在该员工的个人词库中。当然,个人词库中的词语也可以是该员工手动添加的。示例性的,请参见图18,角色1的个人词典可以是自动累计的(比如,曾参加过的会议的参与者提到的词语均被记录到个人词典
中),或者也可以是手动添加到,或者,还可以是将角色2的个人词典中的词语自动或手动添加到角色1的个人词典中。比如,角色1的管理岗位,角色2是被管理岗位,那么角色2的个人词典中的词语可以添加到角色1的个人词典中,或者在角色2授权的情况下,角色2的个人词典中的词语可以添加到角色1的个人词典中。
203.在一些情况中,会议中有参会人员a和参见人员b均提到了词语a,这样,s1703会确定出词语a的提出者包括参见人员a和参见人员b,但是词语a并不在该参会人员b的个人词库中,而在参考人员a的个人词库中,所以通过s1704可以过滤掉参考人员b。
204.需要说明的是,s1704可以不执行,所以图中使用虚线表示。
205.s1705,电子设备根据词语提出者的角色权重,确定词语是否为关键词。如果是,执行s1706。
206.可以理解的是,在s1705之前,还可以包括步骤:确定提出者的角色权重。其中,确定提出者角色权重的方式包括但不限定于方式1至方式3中的任一种。方式1,根据提出者的职位,确定提出者的角色权重。提出者的角色与提出者的职位有关,职位越高则权重越大。方式2,根据关键词(s1702提取的关键词)与提出者之间的关联性,确定提出者的角色权重。比如,提出者与词语之间的关联性越强,则该提出者的角色权重越高。其中,提出者与词语之间的关联性可以是提出者的岗位和/或岗位负责事项与词语的关联性。比如,s1702提取的关键词a,假设关键词a是“维修”。s1703确定关键词a的提出者包括提出者a和提出者b。其中,提出者a的岗位是运维,负责事项包括网络维护、网络故障等等,提出者b的岗位是人事管理,负责事项包括人事调动等。那么关键词a与提出者a的相关性强,则提出者a的角色权重大,而关键词b与提出者a的相关性弱,则提出者b的角色权重小。方式3,根据用户设置操作,确定提出者的角色权重。即角色权重还可以是人工设置的。示例性的,请参见图19.,为一个显示界面的示意图,该显示界面中包括每个角色对应的默认权重,以及输入框,用于调整角色的权重。
207.另一种方式为,使用关键词识别算法识别词语是关键词的第一概率;根据词语的提出者的角色权重和第一概率,计算词语是关键词的第二概率;根据所述第二概率,确定所述词语是否为关键词。应理解,概率还可以替换为分数等。
208.为了方便描述以分数为例,也就是说,对于一个词语,确定该词语是关键词的初始分数(即第一概率),确定该词语提出者的角色权重,然后使用初始分数和提出者的角色权重确定该词语的最终分数(即第二概率)。示例性的,词语最终分数满足:
209.词语最终分数=a*词语初始分数+b*提出者角色权重
210.其中,中a、b为系数,可预先设置好。词语初始得分可以是使用tf-idf算法计算词语在文本信息中的得分。需要说明的是,公式中的“提出者角色权重”可以有多种情况,如果关键词的提出者只有一个,那么“提出者角色权重”为该提出者的角色权重。如果关键词的提出者有多个,那么“提出者角色权重”可以是多个提出者对应的多个角色权重相加后的值,或相乘后的值,或者取最大或最小的角色权重作为“提出者角色权重”。
211.示例性的,请参见下表1:为关键词得分的示例;
212.表1
213.关键词关键词初始得分提出者的角色权重关键词得分关键词a0.8项目经理1.51.2
关键词b0.7总经理21.4关键词c0.6普通员工10.6
214.s1706,电子设备输出关键词。
215.可以理解的是,最终关键词可以是一个关键词或多个关键词。
216.示例性的,电子设备确定得分最高的关键词为最终关键词,比如上述表1中,关键词得分最高为1.4,那么确定关键词b为最终关键词。或者,电子设备确定得分高于预设得分的关键词为最终关键词。比如,预设分数为0.7,那么表1中关键词a和关键词b作为最终关键词。又或者,电子设备根据关键词的得分对关键词进行排序,比如,上述表1中的关键词的最终排序为关键词b、关键词a、关键词c。电子设备可以输出排序结果。
217.基于相同的构思,图20所示为本技术提供的一种电子设备2000。该电子设备2000可以是前文中的电子设备比如会议终端。如图20所示,电子设备2000可以包括:一个或多个处理器2001;一个或多个存储器2002;通信接口2003,以及一个或多个计算机程序2004,上述各器件可以通过一个或多个通信总线2005连接。其中该一个或多个计算机程序2004被存储在上述存储器2002中并被配置为被该一个或多个处理器2001执行,该一个或多个计算机程序2004包括指令,上述指令可以用于执行如上面相应实施例中电子设备的相关步骤。通信接口2003用于实现与其他设备的通信,比如通信接口可以是收发器。
218.上述本技术提供的实施例中,从电子设备作为执行主体的角度对本技术实施例提供的方法进行了介绍。为了实现上述本技术实施例提供的方法中的各功能,电子设备可以包括硬件结构和/或软件模块,以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行,取决于技术方案的特定应用和设计约束条件。
219.以上实施例中所用,根据上下文,术语“当

时”或“当

后”可以被解释为意思是“如果
…”
或“在

后”或“响应于确定
…”
或“响应于检测到
…”
。类似地,根据上下文,短语“在确定

时”或“如果检测到(所陈述的条件或事件)”可以被解释为意思是“如果确定
…”
或“响应于确定
…”
或“在检测到(所陈述的条件或事件)时”或“响应于检测到(所陈述的条件或事件)”。另外,在上述实施例中,使用诸如第一、第二之类的关系术语来区份一个实体和另一个实体,而并不限制这些实体之间的任何实际的关系和顺序。
220.在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
221.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机
指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。在不冲突的情况下,以上各实施例的方案都可以组合使用。
222.需要指出的是,本专利申请文件的一部分包含受著作权保护的内容。除了对专利局的专利文件或记录的专利文档内容制作副本以外,著作权人保留著作权。

技术特征:
1.一种关键词提取方法,其特征在于,包括:获取第一信息,所述第一信息中包括第一行为信息、第一角色信息、第一语音信息和第一文本信息中的至少一种,其中,所述第一行为信息为第一视频中所包含的用户对视频内容的操作行为,所述第一角色信息包括所述第一视频中信息提出者的角色信息,所述第一语音信息为所述第一视频中所包含的语音,所述第一文本信息包括所述第一视频中的文本信息;根据所述第一信息,提取所述第一视频中的关键词。2.根据权利要求1所述的方法,其特征在于,所述第一信息中包括第一行为信息时,根据所述第一信息,提取所述第一视频中的关键词,包括:根据所述第一行为信息,确定所述第一视频中的目标区域,所述目标区域为所述第一行为信息所针对的区域;提取所述目标区域中的关键词。3.根据权利要求2所述的方法,其特征在于,根据所述第一行为信息,确定所述第一视频中的目标区域,包括:确定预设时长内鼠标光标位置处于第一区域内,且所述第一区域满足长大于第一阈值,宽大于第二阈值,面积小于预设面积中的至少一个条件时,确定所述第一区域为所述目标区域。4.根据权利要求3所述的方法,其特征在于,确定预设时长内鼠标光标位置处于第一区域内,包括:记录预设时长内的多个鼠标光标位置;确定所述多个鼠标光标位置的第一外接多边形为所述第一区域。5.根据权利要求3所述的方法,其特征在于,确定预设时长内鼠标光标位置处于第一区域内,包括:记录预设时长内的n个鼠标光标位置,所述n为正整数;确定所述n个鼠标光标位置的第一外接多边形和第二外接多边形;其中,所述第一外接多边形的面积小于第一阈值,所述第二外接多边形的面积小于第二阈值,且所述第一外接多边形和所述第二外接多边形内的鼠标光标位置没有重叠;在所述多个第一外接多边形与所述第二外接多边形之间的距离小于预设距离的情况下,确定第一区域,所述第一区域为包括所述第一外接多边形和所述第二外接多边形在内的第三外接多边形。6.根据权利要求2所述的方法,其特征在于,根据所述第一行为信息,确定所述第一视频中的目标区域,包括:确定所述第一视频中的第一图像上被用户标记的区域;所述第一图像是所述第一视频中的任一张图像;确定所述被用户标记的区域为所述目标区域。7.根据权利要求6所述的方法,其特征在于,所述标记包括划线、画圈、文本加粗、文本高亮、文本背景色填充、修改、批注中的至少一种。8.根据权利要求1所述的方法,其特征在于,所述第一信息中包括第一语音信息时,根据所述第一信息,提取所述第一视频中的关键词,包括:
确定所述第一视频对应的文本信息;根据所述第一语音信息,确定所述文本信息中重读或强调的词语为关键词。9.根据权利要求1所述的方法,其特征在于,所述第一信息中包括第一角色信息时,根据所述第一信息,提取所述第一视频中的关键词,包括:确定所述第一视频对应的文本信息;根据所述第一角色信息,确定所述文本信息中的词语的提出者;所述第一角色信息中包括所述第一视频中每个信息的提出者;根据所述词语的提出者的角色权重,确定所述词语是否为关键词。10.根据权利要求9所述的方法,其特征在于,根据所述词语的提出者的角色权重,确定所述词语是否为关键词,包括:若所述角色权重大于预设权重,确定所述提出者所提出的词语为关键词。11.根据权利要求9所述的方法,其特征在于,所述方法还包括:使用关键词识别算法识别所述词语是关键词的第一概率;所述根据所述词语的提出者的角色权重,确定所述词语是否为关键词,包括:根据所述词语的提出者的角色权重和所述词语的第一概率,计算所述词语是关键词的第二概率;根据所述第二概率,确定所述词语是否为关键词。12.根据权利要求9-11任一所述的方法,其特征在于,根据所述词语的提出者的角色权重,确定所述词语是否为关键词之前,所述方法还包括:根据所述提出者的职位,确定所述提出者的角色权重;和/或,根据所述词语与所述提出者之间的关联性,确定所述提出者的角色权重;和/或,根据用户设置操作,确定所述提出者的角色权重。13.根据权利要求1-12任一所述的方法,其特征在于,所述第一行为信息包括用户对所述第一视频中的信息的光标指示和/或标记。14.根据权利要求1-13任一所述的方法,其特征在于,所述第一角色信息包括所述第一视频中信息的提出者的名称和/或职位。15.一种电子设备,其特征在于,包括:一个或多个处理器,存储器,以及,一个或多个程序;其中,所述一个或多个程序被存储在所述存储器中,所述一个或多个程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行如权利要求1至14中任意一项所述的方法。16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至14中任意一项所述的方法。17.一种芯片系统,其特征在于,包括至少一个处理器,所述至少一个处理器与存储器耦合,用于执行所述存储器中存储的程序或指令,使得如权利要求1至14中任意一项所述的方法被执行。

技术总结
一种关键词提取方法与电子设备。其中,电子设备获取第一信息,所述第一信息中包括第一行为信息、第一角色信息、第一语音信息和第一文本信息中的至少一种,其中,所述第一行为信息包括用户对第一视频中信息的操作行为,所述第一角色信息包括所述第一视频中信息提出者的角色信息,所述第一语音信息为所述第一视频中所包含的语音;根据所述第一信息,提取所述第一视频中的关键词。通过这种方式,有助于提升关键词的提取效率和准确度。升关键词的提取效率和准确度。升关键词的提取效率和准确度。


技术研发人员:张鹏 赵宏 白云悦
受保护的技术使用者:华为技术有限公司
技术研发日:2021.12.31
技术公布日:2023/7/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐