一种页面交互方法、装置、设备及存储介质与流程
未命名
07-27
阅读:108
评论:0
1.本发明属于信息处理技术领域,具体涉及一种页面交互方法、装置、设备及存储介质。
背景技术:
2.在电脑或移动终端上的信息展示页面是承载相应展示内容的信息载体。在电脑上,用户使用鼠标点击及键盘输入的方式实现页面的交互,而在移动终端上,如具有触摸屏的智能手机和平板电脑等,用户用手指接触触摸屏,通过相应的手势操作可以触发终端执行页面交互的操作。通过使用鼠标点击及键盘输入的方式进行页面交互,还需要单独的外设,交互效率低。使用手指触摸的方式进行页面交互容易出现误触、误操作的情况。这两种方式都需要用手操作实现,交互控制方式单一且不够便利,同时,实现页面交互的交互触发控制逻辑也都是固定的,应用灵活性较差。
技术实现要素:
3.本发明的目的是提供一种页面交互方法、装置、设备及存储介质,用以解决现有技术中存在的上述问题。
4.为了实现上述目的,本发明采用以下技术方案:
5.第一方面,提供一种页面交互方法,包括:
6.获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;
7.对事件触发信息进行音频信号解析,得到相应的语音信息;
8.对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;
9.根据语义识别结果确定对应的配置规则编号;
10.将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;
11.根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;
12.根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。
13.在一个可能的设计中,所述对事件触发信息进行音频信号解析,得到相应的语音信息,包括:从事件触发信息中提取音频信号,并对音频信号进行音频解码处理,得到解码后的语音信息。
14.在一个可能的设计中,所述对语音信息进行声纹验证,包括:提取语音信息的声纹特征,并将声纹特征输入训练好的基于深度学习的声纹识别模型进行声纹识别,得到声纹识别结果参数,根据声纹识别结果参数判定声纹验证是否通过。
15.在一个可能的设计中,所述对语音信息进行语义识别,包括:将语音信息输入训练好的基于深度学习的语义识别模型进行语义识别,得到语义识别结果。
16.在一个可能的设计中,所述根据语义识别结果确定对应的配置规则编号,包括:
17.从语义识别结果中找到目标关键词,并提取目标关键词之后的规则关键词组;
18.将提取的规则关键词组导入预置的配置规则编号表中进行匹配检索,找到规则关键词组所对应的配置规则编号。
19.在一个可能的设计中,所述编号转换模型包括十六进制编码转换模型。
20.在一个可能的设计中,所述根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示,包括:
21.根据交互控制指令确定窗口大小信息、窗口位置信息以及展示效果信息;
22.根据窗口大小信息和窗口位置信息在当前页面构建相应的交互展示窗口;
23.执行交互控制指令,通过超链接方式调取目标页面内容;
24.根据展示效果信息将调取的目标页面内容在当前页面的交互展示窗口进行相应效果的交互展示。
25.第二方面,提供一种页面交互装置,包括获取单元、解析单元、识别单元、确定单元、编码单元、匹配单元和执行单元,其中:
26.获取单元,用于获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;
27.解析单元,用于对事件触发信息进行音频信号解析,得到相应的语音信息;
28.识别单元,用于对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;
29.确定单元,用于根据语义识别结果确定对应的配置规则编号;
30.编码单元,用于将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;
31.匹配单元,用于根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;
32.执行单元,用于根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。
33.第三方面,提供一种页面交互设备,包括:
34.存储器,用于存储指令;
35.处理器,用于读取所述存储器中存储的指令,并根据指令执行上述第一方面中任意一种所述的方法。
36.第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行第一方面中任意一种所述的方法。同时,还提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行第一方面中任意一种所述的方法。
37.有益效果:本发明通过获取事件触发信息来进行音频信号解析,得到相应的语音信息进行声纹验证,以保证后续页面交互触发的安全性;通过对语音信息进行语义识别,得到语义识别结果来确定配置规则编号,然后进行相应的编码处理,得到交互编号,再根据交互编号从配置好的交互组件中匹配调取交互控制指令,最后根据交互控制指令在当前页面构建交互展示窗口交互展示目标页面内容,可以实现交互触发规则和交互控制指令的灵活配置,便于根据自定义交互控制逻辑进行高效的页面内容交互展示。本发明可以实现语音
化的交互事件触发及页面交互控制,且页面交互控制逻辑可灵活配置,可以有效提升页面交互控制的多样性和便利性。
附图说明
38.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
39.图1为本发明实施例中方法的步骤示意图;
40.图2为本发明实施例中装置的构成示意图;
41.图3为本发明实施例中设备的构成示意图。
具体实施方式
42.在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。
43.应当理解,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在实施例中的具体含义。
44.在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出装置,以避免用不必要的细节来使得示例不清楚。在其他实施例中,可以不以非必要的细节来示出众所周知的过程、结构和技术,以避免使得实施例不清楚。
45.实施例1:
46.本实施例提供一种页面交互方法,可应用于相应的信息终端,如图1所示,方法包括以下步骤:
47.s1.获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号。
48.具体实施时,终端需要先获取对于当前页面的事件触发信息,事件触发信息包括音频信号,所述音频信号可通过终端上的相应拾音器采集用户的语音信息后通过相应的编码工具进行音频编码后得到。
49.s2.对事件触发信息进行音频信号解析,得到相应的语音信息。
50.具体实施时,终端获取到包含音频信号的事件触发信息后,进行音频信号的解析处理,解析处理的过程包括:从事件触发信息中提取音频信号,并对音频信号进行音频解码处理,得到解码后的语音信息。
51.s3.对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果。
52.具体实施时,在解析得到用户的语音信息后,终端需要对语音信息进行声纹验证,
以判定是否为用户本人的触发语音信息,声纹验证过程包括:提取语音信息的声纹特征,并将声纹特征输入训练好的基于深度学习的声纹识别模型进行声纹识别,得到声纹识别结果参数,根据声纹识别结果参数判定声纹验证是否通过。基于深度学习的声纹识别模型可采用d-vector、x-vector、resnet或ecapa-tdnn等声纹识别模型,然后经过相应的语音样本训练得到。
53.在声纹验证通过后,终端再对语音信息进行语义识别,语义识别过程包括:将语音信息输入训练好的基于深度学习的语义识别模型进行语义识别,得到语义识别结果。基于深度学习的语义识别模型可采用卷积神经网络模型、长短期记忆人工神经网络模型或马尔可夫模型等经过相应语料库的语义样本训练得到。通过基于深度学习的语义识别模型输出的语义识别结果即为文本信息。
54.s4.根据语义识别结果确定对应的配置规则编号。
55.具体实施时,在得到语义识别结果后,终端需要根据语义识别结果确定对应的配置规则编号,包括:从语义识别结果中找到目标关键词,并提取目标关键词之后的规则关键词组;然后将提取的规则关键词组导入预置的配置规则编号表中进行匹配检索,找到规则关键词组所对应的配置规则编号。示例性地,语义识别结果为“开始执行a页面内容调取操作”,目标关键词为“执行”,语义识别结果中“执行”后的关键词组为“a页面内容调取操作”,该关键词组在配置规则编号表中对应的配置规则编号为10,以此类推。所述配置规则编号表可根据实际需求进行自定义配置,以提高交互事件触发的便利性。
56.s5.将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号。
57.具体实施时,在得到配置规则编号后,终端即可将配置规则编号导入预置的编号转换模型进行编码处理,得到相应的交互编号。示例性地,所述编号转换模型可以为十六进制转换算法模型。通过编号转换模型的编码处理,可以使自定义的配置规则编号映射到相应终端可识别的交互编号,保证自定义规则与终端执行逻辑的兼容对接。
58.s6.根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令。
59.具体实施时,终端得到交互编号后,即根据交互编号从交互组件中匹配调取相应的交互控制指令。所述交互组件为预先编辑好的组件,包含若干自定义的交互控制指令,各交互控制指令均关联对应唯一的交互编号,交互组件的内容可根据实际需求进行自定义配置设定。
60.s7.根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。
61.具体实施时,在匹配得到相应的交互控制指令后,终端根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示,过程包括:根据交互控制指令确定窗口大小信息、窗口位置信息以及展示效果信息;再根据窗口大小信息和窗口位置信息在当前页面构建相应的交互展示窗口;然后执行交互控制指令,通过超链接方式调取目标页面内容;最后根据展示效果信息将调取的目标页面内容在当前页面的交互展示窗口进行相应效果的交互展示。通过本实施例的方法可以实现语音化的交互事件触发及页面交互控制,且页面交互控制逻辑可灵活配置,可以有效提升页面交互控制的多样性和便利性。
62.实施例2:
63.本实施例提供一种页面交互装置,如图2所示,包括获取单元、解析单元、识别单元、确定单元、编码单元、匹配单元和执行单元,其中:
64.获取单元,用于获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;
65.解析单元,用于对事件触发信息进行音频信号解析,得到相应的语音信息;
66.识别单元,用于对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;
67.确定单元,用于根据语义识别结果确定对应的配置规则编号;
68.编码单元,用于将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;
69.匹配单元,用于根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;
70.执行单元,用于根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。
71.实施例3:
72.本实施例提供一种页面交互设备,如图3所示,在硬件层面,包括:
73.数据接口,用于建立处理器与数据源的数据对接;
74.存储器,用于存储指令;
75.处理器,用于读取所述存储器中存储的指令,并根据指令执行实施例1中的页面交互方法:s1.获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;s2.对事件触发信息进行音频信号解析,得到相应的语音信息;s3.对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;s4.根据语义识别结果确定对应的配置规则编号;s5.将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;s6.根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;s7.根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。
76.可选地,该设备还包括内部总线,处理器与存储器和数据接口可以通过内部总线相互连接,该内部总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。
77.所述存储器可以但不限于包括随机存取存储器(random access memory,ram)、只读存储器(read only memory,rom)、闪存(flash memory)、先进先出存储器(first input first output,fifo)和/或先进后出存储器(first in last out,filo)等。所述处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
78.实施例4:
79.本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行实施例1中的页面交互方法:s1.获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;s2.对事件触发信息进行音频信号解析,得到相应的语音信息;s3.对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;s4.根据语义识别结果确定对应的配置规则编号;s5.将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;s6.根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;s7.根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。其中,所述计算机可读存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(memory stick)等,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。
80.本实施例还提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行实施例1中的页面交互方法:s1.获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;s2.对事件触发信息进行音频信号解析,得到相应的语音信息;s3.对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;s4.根据语义识别结果确定对应的配置规则编号;s5.将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;s6.根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;s7.根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。其中,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。
81.最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种页面交互方法,其特征在于,包括:获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;对事件触发信息进行音频信号解析,得到相应的语音信息;对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;根据语义识别结果确定对应的配置规则编号;将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。2.根据权利要求1所述的一种页面交互方法,其特征在于,所述对事件触发信息进行音频信号解析,得到相应的语音信息,包括:从事件触发信息中提取音频信号,并对音频信号进行音频解码处理,得到解码后的语音信息。3.根据权利要求1所述的一种页面交互方法,其特征在于,所述对语音信息进行声纹验证,包括:提取语音信息的声纹特征,并将声纹特征输入训练好的基于深度学习的声纹识别模型进行声纹识别,得到声纹识别结果参数,根据声纹识别结果参数判定声纹验证是否通过。4.根据权利要求1所述的一种页面交互方法,其特征在于,所述对语音信息进行语义识别,包括:将语音信息输入训练好的基于深度学习的语义识别模型进行语义识别,得到语义识别结果。5.根据权利要求1所述的一种页面交互方法,其特征在于,所述根据语义识别结果确定对应的配置规则编号,包括:从语义识别结果中找到目标关键词,并提取目标关键词之后的规则关键词组;将提取的规则关键词组导入预置的配置规则编号表中进行匹配检索,找到规则关键词组所对应的配置规则编号。6.根据权利要求1所述的一种页面交互方法,其特征在于,所述编号转换模型包括十六进制编码转换模型。7.根据权利要求1所述的一种页面交互方法,其特征在于,所述根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示,包括:根据交互控制指令确定窗口大小信息、窗口位置信息以及展示效果信息;根据窗口大小信息和窗口位置信息在当前页面构建相应的交互展示窗口;执行交互控制指令,通过超链接方式调取目标页面内容;根据展示效果信息将调取的目标页面内容在当前页面的交互展示窗口进行相应效果的交互展示。8.一种页面交互装置,其特征在于,包括获取单元、解析单元、识别单元、确定单元、编码单元、匹配单元和执行单元,其中:获取单元,用于获取针对当前页面的事件触发信息,所述事件触发信息包括音频信号;解析单元,用于对事件触发信息进行音频信号解析,得到相应的语音信息;
识别单元,用于对语音信息进行声纹验证,并在声纹验证通过后对语音信息进行语义识别,得到语义识别结果;确定单元,用于根据语义识别结果确定对应的配置规则编号;编码单元,用于将配置规则编号导入预置的编号转换模型进行编码处理,得到交互编号;匹配单元,用于根据交互编号从预先编辑的交互组件中匹配调取相应的交互控制指令;执行单元,用于根据交互控制指令在当前页面构建交互展示窗口,并执行交互控制指令调取目标页面内容在当前页面的交互展示窗口进行交互展示。9.一种页面交互设备,其特征在于,包括:存储器,用于存储指令;处理器,用于读取所述存储器中存储的指令,并根据指令执行权利要求1-7任意一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行权利要求1-7任意一项所述的方法。
技术总结
本发明公开了一种页面交互方法、装置、设备及存储介质,通过获取事件触发信息来进行音频信号解析,得到相应的语音信息进行声纹验证,以保证后续页面交互触发的安全性;通过对语音信息进行语义识别,得到语义识别结果来确定配置规则编号,然后进行相应的编码处理,得到交互编号,再根据交互编号从配置好的交互组件中匹配调取交互控制指令,最后根据交互控制指令在当前页面构建交互展示窗口交互展示目标页面内容,可以实现交互触发规则和交互控制指令的灵活配置,便于根据自定义交互控制逻辑进行高效的页面内容交互展示。本发明可以实现语音化的交互事件触发及页面交互控制,可以提升页面交互控制的多样性和便利性。升页面交互控制的多样性和便利性。升页面交互控制的多样性和便利性。
技术研发人员:邝启康 张誉
受保护的技术使用者:湖北坤盈数字科技有限公司
技术研发日:2023.03.17
技术公布日:2023/7/25
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
