数据处理方法、设备及介质与流程

未命名 07-23 阅读:102 评论:0


1.本技术涉及视频直播技术领域,尤其涉及一种数据处理方法、一种数据处理设备、以及一种计算机可读存储介质。


背景技术:

2.随着互联网技术的快速发展,互联网直播也越来越受到广大用户的喜爱,且几乎所有的互联网直播平台都提供弹幕互动功能,即用户可以在观看视频直播、语音直播或游戏直播等的同时发送弹幕信息,并可以将弹幕信息显示在互联网直播平台的直播界面中,以提升用户的参与感。然而,现有弹幕信息的输入方式较单一,灵活性较低。


技术实现要素:

3.本技术实施例提供了一种数据处理方法以及相关装置,能够提升输入弹幕信息的灵活性。
4.第一方面,本技术实施例提供了一种数据处理方法,该方法包括:
5.显示语音输入界面,语音输入界面包括第一语音输入方式及第二语音输入方式;
6.若响应第一语音输入方式,则显示第一界面,第一界面包括多个音频数据;
7.接收针对第一音频数据的操作,第一音频数据为多个音频数据中的任一音频数据;
8.响应针对第一音频数据的操作,输出包含第一音频数据的弹幕信息;
9.若响应第二语音输入方式,则生成第二界面,第二界面包括第一按键和第二按键;
10.在检测到针对第一按键的操作,且操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息,第二文字数据是第二音频数据对应的文字数据,第二音频数据是以第二语音输入方式输入的任一音频数据。
11.结合第一方面,在一种可选的实施方式中,输出包含第二文字数据的弹幕信息,包括:
12.在第二文字数据生成后,显示第三界面,第三界面包括弹幕类型;弹幕类型包括语音类型,文本类型,以及语音加文本类型;
13.当检测到针对文本类型的操作时,输出包含第二文字数据的弹幕信息;
14.当检测到针对语音类型的操作时,输出包含第二音频数据的弹幕信息;
15.当检测到针对语音加文本类型的操作时,输出包含第二文字数据以及第二音频数据的弹幕信息。
16.结合第一方面,在一种可选的实施方式中,该方法还包括:
17.检测到针对弹幕信息中的第二音频数据的操作时,降低背景音频数据的播放音量,且播放第二音频数据;
18.结合第一方面,在一种可选的实施方式中,第三界面还包括文本框,文本框用于显示生成的文字数据,该方法还包括:
19.当检测到针对文本框的操作时,文本框进入编辑状态;该进入编辑状态的文本框支持对第二文字数据的更新。
20.结合第一方面,在一种可选的实施方式中,第二界面还包括操作提示信息,操作提示信息用于提示触发生成第二文字数据的用户操作。
21.结合第一方面,在一种可选的实施方式中,在显示第一界面之后,该方法还包括:响应针对第一音频数据的操作,显示并播放第一音频数据。
22.结合第一方面,在一种可选的实施方式中,响应针对第一音频数据的操作,输出包含第一音频数据的弹幕信息,包括:
23.响应针对第一音频数据的操作,生成第一文字数据;第一文字数据是第一音频数据对应的文字数据;
24.输出包含第一音频数据以及第一文字数据的弹幕信息。
25.结合第一方面,在一种可选的实施方式中,输出包含第一音频数据以及第一文字数据的弹幕信息,包括:
26.在第一文字数据生成时,显示第三界面;
27.当检测到针对语音加文本类型的操作时,输出包含第一音频数据以及第一文字数据的弹幕信息。
28.第二方面,本技术实施例提供了一种数据处理装置,该装置包括:
29.显示单元,用于显示语音输入界面,该语音输入界面包括第一语音输入方式及第二语音输入方式;
30.若响应第一语音输入方式,则该显示单元还用于显示第一界面,该第一界面包括多个音频数据;
31.接收单元,用于接收针对第一音频数据的操作,该第一音频数据为多个音频数据中的任一音频数据;
32.输出单元,用于响应针对第一音频数据的操作,输出包含第一音频数据的弹幕信息;
33.若响应第二语音输入方式,则生成单元用于生成第二界面,该第二界面包括第一按键和第二按键;
34.输出单元,还用于在检测到针对第一按键的操作,且该操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息,该第二文字数据是第二音频数据对应的文字数据,该第二音频数据是以第二语音输入方式输入的任一音频数据。
35.第三方面,本技术实施例提供了一种数据处理设备,该数据处理设备包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行第一方面所述的数据处理方法。
36.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现上述第一方面所述的方法。
37.第五方面,本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程
序产品或计算机程序包括程序指令,该程序指令被存储在计算机可读存储介质中。数据处理设备的处理器从计算机可读存储介质读取该程序指令,处理器执行该程序指令,使得该数据处理设备执行上述第一方面所述的数据处理方法。
38.可见,本技术实施例中,数据处理设备可显示包括多种语音输入方式的语音输入界面,不同的语音输入方式分别用于以不同的输入方式输入音频数据。例如,显示的语音输入界面可包括第一语音输入方式以及第二语音输入方式,第一语音输入方式输入音频数据的方式与第二语音输入方式输入音频数据的方式不同,数据处理设备可支持用户以多种语音输入方式输入音频数据,有效增强语音输入的灵活性,提升用户体验。同时,数据处理设备不仅可以输出包含第一音频数据(即以第一语音输入方式输入的音频数据)的弹幕信息,还可以输出包含第二音频数据(即以第二语音输入方式输入的音频数据)对应的第二文字数据的弹幕信息,数据处理设备可支持输出多种弹幕类型的弹幕信息,可以有效提升弹幕信息的灵活性,提升用户体验。
附图说明
39.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
40.图1是本技术实施例提供的一种数据处理系统的系统架构示意图;
41.图2是本技术实施例提供的一种直播界面的示意图;
42.图3是本技术实施例提供的一种数据处理方法的流程示意图;
43.图4a-图4b是本技术实施例提供的一种界面示意图;
44.图5是本技术实施例提供的另一种界面示意图;
45.图6a-图6c是本技术实施例提供的再一种界面示意图;
46.图7a-图7c是本技术实施例提供的再一种界面示意图;
47.图8是本技术实施例提供的另一种数据处理方法的流程示意图;
48.图9是本技术实施例提供的再一种界面示意图;
49.图10a-图10b是本技术实施例提供的再一种界面示意图;
50.图11a-图11d是本技术实施例提供的再一种界面示意图;
51.图12a-图12c是本技术实施例提供的再一种界面示意图;
52.图13是本技术实施例提供的再一种数据处理方法的流程示意图;
53.图14是本技术实施例提供的再一种界面示意图;
54.图15是本技术实施例提供的再一种界面示意图;
55.图16是本技术实施例提供的再一种数据处理装置的结构示意图;
56.图17是本技术实施例提供的一种数据处理设备的结构示意图。
具体实施方式
57.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于
本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
58.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
59.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
60.本技术实施例通过采用上述所提及的人工智能技术提出了一种数据处理方法。在该方法中,数据处理设备可显示包括第一语音输入方式及第二语音输入方式的语音输入界面;若响应第一语音输入方式,则显示包括多个音频数据的第一界面,在接收到针对第一界面内第一音频数据的操作时,可输出包含第一音频数据的弹幕信息;若响应第二语音输入方式,则生成包括第一按键和第二按键的第二界面,在检测到针对第一按键的操作且该操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息,该第二文字数据是第二音频数据对应的文字数据,该第二音频数据是以第二语音输入方式输入的任一音频数据。数据处理设备可显示包括多种语音输入方式的语音输入界面,可支持用户以多种语音输入方式输入音频数据,有效增强语音输入的灵活性,提升用户体验。同时,数据处理设备还可支持输出多种弹幕类型的弹幕信息,可以有效提升弹幕信息的灵活性,提升用户体验。
61.为了更好地理解本技术实施例公开的一种数据处理方法,本技术实施例结合图2给出一种示例性的数据处理场景。请参阅图1,图1是本技术实施例提供的一种数据处理系统的架构示意图。如图1所示,该系统架构可以包括主播终端110、用户终端120和服务器130。可选的,主播终端110和用户终端120可以为具备网络通信、多媒体输入功能的电脑、手机、平板电脑等设备,在此不做具体限定。服务器130可以是物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
62.其中,主播终端110是指主播直播所使用的终端设备,用户终端120为用户观看直播所使用的终端设备。主播终端110可以通过与服务器130之间的无线连接,上传视频流至服务器130。在服务器130获取到用户终端120发送的直播观看请求时,向用户终端120推送与直播观看请求对应的视频流。在用户观看直播时服务器130也可以获取到用户终端120发送的弹幕信息,服务器130接收到弹幕信息之后会将弹幕信息反馈到用户终端120和主播终端110,用户和主播都可以看到对应的弹幕信息。需要说明,本技术实施例的用户终端120也可以称为数据处理设备。
63.可选的,数据处理设备输出的弹幕信息可包括不同的弹幕类型,例如,如图2所示,
数据处理设备120输出的弹幕信息可包括:弹幕类型为语音类型的弹幕信息201,弹幕类型为文本类型的弹幕信息202,弹幕类型为语音加文本类型的弹幕信息203。
64.下面详细阐述本技术实施例的数据处理方法。如图3所示,图3示出了一种数据处理方法的流程示意图。该数据处理方法可以由图1所示的用户设备120来执行。如图3所示,该数据处理方法包括s301-s306:
65.s301:显示语音输入界面,该语音输入界面包括第一语音输入方式及第二语音输入方式。
66.具体实现时,语音输入界面可包括多种语音输入方式,不同语音输入方式分别用于以不同的输入方式输入音频数据。本技术实施例以多种语音输入方式包括第一语音输入方式和第二语音输入方式为例进行阐述。
67.可选的,该语音输入界面可以占用显示屏的部分或全部。需要说明,该语音输入界面可以为客户端界面或者网页界面。例如,该语音输入界面可以为直播平台的弹幕输入界面。
68.请参见图4a,图4a是本技术实施例提供的一种语音输入界面的界面示意图。如图4a所示,界面400为语音输入界面,该语音输入界面400可包括多种语音输入入口。例如,语音输入界面400可包括语音输入入口401和语音输入入口402,用户可通过该语音输入入口401以第一语音输入方式输入音频数据,和/或通过语音输入入口402以第二语音输入方式输入音频数据。
69.可选的,用户通过语音输入界面输入了音频数据之后,可能想要更好地观看直播界面,希望直播界面中的内容不被遮挡,则需要隐藏语音输入界面400。示例性地,用户可通过点击语音输入界面400中的界面隐藏控件403隐藏语音输入界面400。数据处理设备响应于检测到的用户点击界面隐藏控件403的用户操作,数据处理设备可隐藏语音输入界面400。需要说明,本技术实施例隐藏语音输入界面400的操作仅仅为示例,不应限定。
70.在一种可能的实施方式中,数据处理设备在隐藏语音输入界面400之后,还可以提示用户有语音输入界面400被隐藏。这里,数据处理设备可在显示屏上显示图形标识(例如提示条、小窗口图标、箭头等)、文字等提示用户该语音输入界面400被隐藏,如图4b中所示的图形标识404可用于提示用户该语音输入界面400被隐藏。
71.一种可选的实施方式中,数据处理设备在检测到针对语音输入方式的触发操作时,显示语音输入界面。例如,当启用直播功能时,数据处理设备确定检测到针对语音输入方式的触发操作,可显示语音输入界面。又例如,当启用直播功能时,数据处理设备可显示文本输入界面,该文本输入界面包括语音界面入口。在检测到针对语音界面入口的操作时,数据处理设备确定检测到针对语音输入方式的触发操作,可显示语音输入界面。如图5所示,图5是本技术实施例提供的一种文本输入界面的界面示意图。界面500为文本输入界面,该文本输入界面500可包括语音界面入口501,在检测到针对语音界面入口的操作(如点击操作)时,数据处理设备确定检测到针对语音输入方式的触发操作,可显示语音输入界面400。需要说明,文本输入界面也可以被隐藏,不再赘述。
72.s302:若响应第一语音输入方式,则显示第一界面,第一界面包括多个音频数据。
73.请参见图6a,图6a是本技术实施例提供的一种第一界面的界面示意图。如图6a所示,界面600为第一界面,该第一界面600可包括多个音频数据。例如,第一界面600包括音频
数据601、音频数据602以及音频数据603。
74.一种可选的实施方式中,步骤s302可以是在接收到针对语音输入入口401的操作时执行的。该操作包括但不限于点击操作、双击操作、长按操作或滑动操作中的一种或多种,不做限定。
75.s303:接收针对第一音频数据的操作,该第一音频数据为多个音频数据中的任一音频数据。
76.可选的,该操作包括但不限于点击操作、双击操作、长按操作或滑动操作中的一种或多种操作,不做限定。
77.在一种可选的实施方式中,每个音频数据存在对应的选择项,针对音频数据的操作为针对音频数据的选择项的选择操作。例如,如图6b所示,音频数据601存在对应的选择项601-1,音频数据602存在对应的选择项602-1,以及音频数据603存在对应的选择项603-1。例如,当接收到针对第一音频数据601对应的选择项601-1的选择操作时,确定接收到针对第一音频数据601的操作。
78.s304:响应针对第一音频数据的操作,输出包含第一音频数据的弹幕信息。
79.例如,如图6c所示,当接收到针对音频数据601的操作时,音频数据601可被作为弹幕信息输出,即输出包含音频数据601的弹幕信息610。
80.s305:若响应第二语音输入方式,则生成第二界面,该第二界面包括第一按键和第二按键。
81.请参见图7a,图7a是本技术实施例提供的一种第二界面的界面示意图。如图7a所示,界面700为第二界面,该第二界面700包括第一按键701和第二按键702。其中,第一按键701用于触发数据处理设备调用麦克风采集第二音频数据。第二按键702用于触发将采集到的第二音频数据转换为第二文字数据。需要说明,在其他的实施方式中,第一按键701和第二按键702还可能为其他具有相同功能的界面控件,例如第一按键701为第一卡片,第二按键702为第二卡片,不做限定。
82.一种可选的实施方式中,步骤s305可以是在接收到针对语音输入入口402的操作时执行的。该操作包括但不限于点击操作、双击操作、长按操作或滑动操作中的一种或多种,不做限定。
83.s306:在检测到针对第一按键的操作,且该操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息,该第二文字数据是第二音频数据对应的文字数据,该第二音频数据是以第二语音输入方式输入的任一音频数据。
84.请参见图7b,图7b是本技术实施例提供的另一种第二界面的界面示意图。如图7b所示,在检测到针对第一按键701的操作,且该操作从第一按键701移动到第二按键702时,生成第二文字数据“你好呀”,并输出包含第二文字数据的弹幕信息,如图7c所示的弹幕信息710。
85.可选的,第二文字数据可以是基于语音识别技术对第二音频数据进行处理得到的。语音识别技术是一种将人类语音转换为计算机可识别的数字信号的技术。也就是说,可以将音频数据转换为数字信号,然后再通过计算机算法识别处音频数据中的文字数据。通常来说,语音识别流程可包括但不限于以下几个步骤中的一个或多个:(1)采集音频数据,即通过麦克风等设备采集音频数据,并将音频数据转换为数字信息。(2)预处理,即对采集
到的音频数据进行预处理,包括但不限于去除噪声、增强音频数据中的语音内容等。(3)特征提取,即将预处理的音频数据转换为一系列的特征向量,用于后续的语音识别。(4)语音识别,即通过计算机算法对特征向量进行分析和处理,得到音频数据对应的文字数据。
86.可见,在本技术实施例中,数据处理设备可显示包括多种语音输入方式的语音输入界面,不同的语音输入方式分别用于以不同的输入方式输入音频数据。例如,显示的语音输入界面可包括第一语音输入方式以及第二语音输入方式,第一语音输入方式输入音频数据的方式与第二语音输入方式输入音频数据的方式不同,数据处理设备可支持用户以多种语音输入方式输入音频数据,有效增强语音输入的灵活性,提升用户体验。同时,数据处理设备不仅可以输出包含第一音频数据(即以第一语音输入方式输入的音频数据)的弹幕信息,还可以输出包含第二音频数据(即以第二语音输入方式输入的音频数据)对应的第二文字数据的弹幕信息,数据处理设备可支持输出多种弹幕类型的弹幕信息,可以有效提升弹幕信息的灵活性,提升用户体验。
87.请参见图8,图8示出了另一种数据处理方法的流程示意图。图8所述的数据处理方法与图3所述的数据处理方法相比,图8所述的数据处理方法不仅可以输出包含第二文字数据的弹幕信息,还可输出包含第二音频数据的弹幕信息。如图8所示,该数据处理方法可以包括但不限于s801-s805:
88.s801:显示语音输入界面,该语音输入界面包括第一语音输入方式及第二语音输入方式。
89.关于步骤s801的阐述请参见图3的相关实施例,不再赘述。
90.s802:若响应第二语音输入方式,则生成第二界面,第二界面包括第一按键和第二按键。
91.可选的,第二界面700还可包括操作提示信息,该操作提示信息用于提示触发生成第二文字数据的操作。如图9所示,该第二界面700不仅包括第一按键701和第二按键702,还包括操作提示信息703。
92.可选的,第二界面内的操作提示信息可以是数据处理设备在检测到针对第一按键和/或第二按键的操作时显示的。例如,当数据处理设备检测到用户长按第一按键的的时长达到1秒时,在第二界面内显示该操作提示信息。又例如,当数据处理设备检测到用户点击第一按键时,在第二界面内显示该操作提示信息。
93.s803:在检测到针对第一按键的操作,且操作从第一按键移动到第二按键时,生成第二文字数据。
94.可选的,针对第一按键的操作包括长按操作。具体的,当检测到针对第一按键的按压操作,且按压时长达到预设时长时,数据处理设备调用麦克风采集第二音频数据。需要说明,该预设时长可为任意值,如1秒,不做限制。
95.可选的,针对第一按键的操作包括两次点击操作。具体的,当检测到针对第一按键的第一次点击操作时,数据处理设备开始调用麦克风采集音频数据,当检测到针对第一按键的第二次点击操作时,数据处理设备结束调用麦克风采集音频数据。那么,数据处理设备可响应两次点击操作采集到第二音频数据。
96.可选的,第二音频数据的采集时间可处于预设时间区间内。例如,该预设时间区间可为1秒至10分钟,即第二音频数据至少包括1秒的音频数据,最多包括10分钟的音频数据。
97.s804:在第二文字数据生成后,显示第三界面,该第三界面包括弹幕类型;该弹幕类型包括语音类型,文本类型,以及语音加文本类型。
98.其中,弹幕类型用于指示输出的弹幕信息所包括的数据类型。例如,当弹幕类型为语音类型时,输出的弹幕信息包括音频数据,当弹幕类型为文本类型时,输出的弹幕信息包括文字数据,当弹幕类型为语音加文本类型时,输出的弹幕信息包括音频数据以及对应的文字数据。
99.s805:当检测到针对文本类型的操作时,输出包含第二文字数据的弹幕信息;当检测到针对语音类型的操作时,输出包含第二音频数据的弹幕信息;当检测到针对语音加文本类型的操作时,输出包含第二文字数据以及第二音频数据的弹幕信息。
100.请参见图10a,图10a是本技术实施例提供的一种第三界面的界面示意图。如图10a所示,界面1000为第三界面,该第三界面1000可包括弹幕类型。例如,该弹幕类型包括语音类型1001,文本类型1002,以及语音加文本类型1003。
101.如图10b所示,当检测到针对文本类型1002的操作时,输出包含第二文字数据的弹幕信息,如图10b中的(a)所示;当检测到针对语音类型1001的操作时,输出包含第二音频数据的弹幕信息,如图10b中的(b)所示;当检测到针对语音加文本类型1003的操作时,输出包含第二文字数据以及第二音频数据的弹幕信息,如图10b中的(c)所示。
102.在另一种可选的实施方式中,弹幕类型可存在对应的选择项,针对弹幕类型的操作为针对弹幕类型的选择项的选择操作。也就是说,当检测到针对语音类型的选择项的选择操作时,确定检测到针对语音类型的操作;当检测到针对文本类型的选择项的选择操作时,确定检测到针对文本类型的操作;当检测到针对语音加文本类型的选择项的选择操作时,确定检测到针对语音加文本类型的操作。
103.下面结合图11a至图11c界面示意图详细阐述。
104.请参见图11a至图11c,图11a至图11c是本技术实施例提供的另一种第三界面的界面示意图。如图11a至图11c所示,界面1100为第三界面,该第三界面1100可包括选择项1101,选择项1102以及选择项1103。当检测到针对选择项1101的选择操作时,确定检测到针对语音类型的操作,如图11a所示。当检测到针对针对选择项1102的选择操作时,确定检测到针对文本类型的操作,如图11b所示。当检测到针对选择项1102以及选择项1103的选择操作时,确定检测到针对语音加文本类型的操作,如图11c所示。
105.可选的,选择项1103可以是默认处于选择状态的,如图11d所示。有利于终端设备优先输出语音加文本类型的弹幕信息,用户体验更好。
106.需要说明,若用户需要通过数据处理设备输出文字数据,则用户可以手动取消针对选择项1103的选择操作。
107.在一种可选的实施方式中,该第三界面还包括文本框,该文本框用于显示生成的文字数据。示例性的,如图12a所示,界面1000为第三界面,第三界面1000还包括文本框1004,文本框1004内显示有生成的第二文字数据“你好呀”。
108.可选的,在文本框内显示生成的第二文字数据之后,该方法还包括:当检测到针对文本框的操作时,该文本框进入编辑状态;该进入编辑状态的文本框支持对第二文字数据的更新。需要说明,针对文本框的操作包括但不限于点击操作、滑动操作、或长按操作中的一种或多种。
109.示例性的,如图12b所示,当检测到针对文本框1004的点击操作时,文本框1004进入编辑状态,该进入编辑状态的文本框内显示的第二文字数据支持更新,例如,将文本框1004内显示的生成的第二文字数据“你好呀”更新为“你们好呀”。可见,在本实施方式中,可以更新生成的第二文字数据,有利于对转换错误的文字数据进行校准,可以有效提升文字数据的准确性。
110.可选的,该文本框还可以用于显示生成的部分第二文字数据。示例性的,如图12c所示,当文本框1004内显示有生成的部分第二文字数据“你
…”
。可见,在本实施方式中,数据处理设备可以及时显示出已生成的部分文字数据,以使得用户可以及时查看到音频数据对应的文字数据,有效改善用户体验。
111.在一种可选的实施方式中,数据处理设备在执行了步骤s805之后,该方法还可包括:在检测到针对弹幕信息中的第二音频数据的操作时,降低背景音频数据的播放音量,且播放第二音频数据。例如,当检测到针对弹幕信息的点击操作时,逐渐降低背景音频数据的播放音量;在背景音频数据的播放音量小于预设阈值时,播放弹幕信息中的第二音频数据,第二音频数据的播放音量在达到预设阈值之前随播放时间逐渐增强。需要说明,该预设阈值可以是根据经验或业务需求设定的,不做限定。可见,由于背景音频数据的播放音量是逐渐降低的,且第二音频数据的播放音量是逐渐增强的,数据处理设备可以更自然的从背景音频数据过渡到第二音频数据,用户体验更好。
112.可见,在本技术实施例中,当用户以第二语音输入方式输入了第二音频数据时,当检测到针对文本类型的操作时,输出包含第二音频数据对应的第二文字数据的弹幕信息;当检测到针对语音类型的操作时,输出包含第二音频数据的弹幕信息;当检测到针对语音加文本类型的操作时,输出包含第二音频数据以及对应的第二文字数据的弹幕信息,弹幕类型不同时输出的弹幕信息不同,可以有效提升弹幕信息的灵活性。同时,弹幕类型是基于用户的操作确定的,输出的弹幕信息更加符合用户需求。
113.请参见图13,图13示出了再一种数据处理方法的流程示意图。图13所述的数据处理方法与图3所述的数据处理方法相比,图13所述的数据处理方法不仅可以输出包含第一音频数据的弹幕信息,还可输出包含第一文字数据的弹幕信息。如图13所示,该数据处理方法可以包括但不限于s1301-s1306:
114.s1301:显示语音输入界面,该语音输入界面包括第一语音输入方式及第二语音输入方式。
115.需要说明,关于步骤s1301的相关阐述请参见步骤s301,不再赘述。
116.s1302:若响应第一语音输入方式,则显示第一界面,该第一界面包括多个音频数据。
117.一种可选的实施方式中,该方法在执行步骤s1302之后,还包括:响应针对第一音频数据的操作,显示并播放第一音频数据。如图14所示,数据处理设备响应针对第一音频数据的播放操作,由第一界面跳转显示第四界面1400;该第四界面1400可显示有第一音频数据以及对应的音频播放控件1401,该音频播放控件1401用于播放该第一音频数据。
118.需要说明,该操作可以包括但不限于双击操作、点击操作、长按操作、滑动操作中的一种或多种。
119.s1303:接收针对第一音频数据的操作,该第一音频数据为多个音频数据中的任一
音频数据。
120.需要说明,关于步骤s1303的阐述请参见步骤s303的相关阐述,不再赘述。
121.s1304:响应针对第一音频数据的操作,生成第一文字数据,该第一文字数据是第一音频数据对应的文字数据。
122.例如,如图15所示,当接收到针对音频数据601的操作时,可生成音频数据601对应的文字数据“今天要加班”。
123.s1305:在第一文字数据生成后,显示第三界面,该第三界面包括弹幕类型;该弹幕类型包括语音类型,文本类型,以及语音加文本类型。
124.s1306:当检测到针对文本类型的操作时,输出包含第一文字数据的弹幕信息;当检测到针对语音类型的操作时,输出包含第一音频数据的弹幕信息;当检测到针对语音加文本类型的操作时,输出包含第一文字数据以及第一音频数据的弹幕信息。
125.关于步骤s1305至步骤s1306的阐述请参见步骤s803至步骤s804的相关实施例,不再赘述。
126.可见,在本技术实施例中,当用户以第一语音输入方式输入了第一音频数据时,当检测到针对文本类型的操作时,输出包含第一音频数据对应的第一文字数据的弹幕信息;当检测到针对语音类型的操作时,输出包含第一音频数据的弹幕信息;当检测到针对语音加文本类型的操作时,输出包含第一音频数据以及对应的第一文字数据的弹幕信息,弹幕类型不同时输出的弹幕信息不同,可以有效提升弹幕信息的灵活性。同时,弹幕类型是基于用户的操作确定的,输出的弹幕信息更加符合用户需求。
127.基于上述数据处理方法实施例的描述,本技术实施例还公开了一种数据处理装置,所述数据处理装置可以是运行于上述所提及的数据处理设备中的一个计算机程序(包括程序指令)。该数据处理装置可以执行图3,图8或图13所示的方法。请参见图16,所述数据处理装置可以运行如下单元:
128.显示单元1601,用于显示语音输入界面,该语音输入界面包括第一语音输入方式及第二语音输入方式;
129.若响应第一语音输入方式,则该显示单元1601还用于显示第一界面,该第一界面包括多个音频数据;
130.接收单元1602,用于接收针对第一音频数据的操作,该第一音频数据为多个音频数据中的任一音频数据;
131.输出单元1603,用于响应针对第一音频数据的操作,输出包含第一音频数据的弹幕信息;
132.若响应第二语音输入方式,则生成单元1604用于生成第二界面,该第二界面包括第一按键和第二按键;
133.输出单元1603,还用于在检测到针对第一按键的操作,且该操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息,该第二文字数据是第二音频数据对应的文字数据,该第二音频数据是以第二语音输入方式输入的任一音频数据。
134.在一种可选的实施方式中,输出单元1603用于输出包含第二文字数据的弹幕信息,包括:
135.在第二文字数据生成后,显示第三界面,该第三界面包括弹幕类型;该弹幕类型包括语音类型,文本类型,以及语音加文本类型;
136.当检测到针对文本类型的操作时,输出包含第二文字数据的弹幕信息;
137.当检测到针对语音类型的操作时,输出包含第二音频数据的弹幕信息;
138.当检测到针对语音加文本类型的操作时,输出包含第二文字数据以及第二音频数据的弹幕信息。
139.在一种可选的实施方式中,输出单元1603还用于:
140.检测到针对弹幕信息中的第二音频数据的操作时,降低背景音频数据的播放音量,且播放第二音频数据。
141.在一种可选的实施方式中,第三界面还包括文本框,文本框用于显示生成的文字数据,输出单元1603还用于:当检测到针对文本框的操作时,该文本框进入编辑状态;该进入编辑状态的文本框支持对第二文字数据的更新。
142.在一种可选的实施方式中,第二界面还包括操作提示信息,所述操作提示信息用于提示触发生成第二文字数据的用户操作。
143.在一种可选的实施方式中,显示单元1601还用于:响应针对第一音频数据的操作,显示并播放第一音频数据。
144.在一种可选的实施方式中,响应针对所述第一音频数据的操作,输出单元1603用于输出包含第一音频数据的弹幕信息,包括:
145.响应针对第一音频数据的操作,生成第一文字数据;该第一文字数据是第一音频数据对应的文字数据;
146.输出包含第一音频数据以及第一文字数据的弹幕信息。
147.在一种可选的实施方式中,输出单元1603用于输出包含第一音频数据以及第一文字数据的弹幕信息,包括:
148.在第一文字数据生成时,显示第三界面;
149.当检测到针对语音加文本类型的操作时,输出包含第一音频数据以及第一文字数据的弹幕信息。
150.根据本技术的一个实施例,图3,图8或图13所示的方法所涉及的各个步骤均可以是由图16所示的数据处理装置中的各个单元执行的。
151.根据本技术的另一个实施例,图16所示的数据处理装置中的各个单元可以分别或者全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本技术实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以是由多个单元来实现,或者多个单元的功能由一个单元实现。在本技术的其他实施例中,基于数据处理装置也可以包括其他单元,在实际应用中,这些功能也可以由其他单元协助实现,并且可以由多个单元协作实现。
152.根据本技术的另一个实施例,可以通过包括中央处理单元(central processing unit,cpu),随机存取存储介质(ram)、只读存储介质(rom)等处理元件和存储元件。例如计算机的通用计算设备上运行能够执行如图3,图8或图13中所示的相应方法所涉及的各步骤的计算机程序(包括程序指令),来构造如图16所示的数据处理装置,以及来实现本技术实
施例的数据处理方法。所述的计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述数据处理设备中,并在其中运行。
153.可见,在本技术实施例中,数据处理装置可显示包括多种语音输入方式的语音输入界面,不同的语音输入方式分别用于以不同的输入方式输入音频数据。例如,显示的语音输入界面可包括第一语音输入方式以及第二语音输入方式,第一语音输入方式输入音频数据的方式与第二语音输入方式输入音频数据的方式不同,数据处理装置可支持用户以多种语音输入方式输入音频数据,有效增强语音输入的灵活性,提升用户体验。同时,数据处理装置不仅可以输出包含第一音频数据(即以第一语音输入方式输入的音频数据)的弹幕信息,还可以输出包含第二音频数据(即以第二语音输入方式输入的音频数据)对应的第二文字数据的弹幕信息,数据处理装置可支持输出多种弹幕类型的弹幕信息,可以有效提升弹幕信息的灵活性,提升用户体验。
154.基于上述数据处理方法实施例的描述,本技术实施例还公开了一种数据处理设备。请参见图17,该数据处理设备至少包括处理器1701、输入接口1702、输出接口1703以及计算机存储介质1704可通过总线或其他方式连接。
155.所述计算机存储介质1704是数据处理设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质1704既可以包括数据处理设备的内置存储介质,当然也可以包括数据处理设备支持的扩展存储介质。计算机存储介质1704提供存储空间,该存储空间存储了数据处理设备的操作系统。并且,在该存储空间中还存放了适于被处理器1701加载并执行的一条或多条指令,这些指令可以是一个或一个以上的计算机程序(包括程序指令)。需要说明的是,此处的计算机存储介质可以是高速ram存储器;可选的,还可以是至少一个远离前述处理器的计算机存储介质、所述处理器可以称为中央处理单元(central processing unit,cpu),是计算机设备的核心以及控制中心,适于被实现一条或多条指令,具体加载并执行一条或多条指令从而实现相应的方法流程或功能。
156.在一个实施例中,可由处理器1701加载并执行计算机存储介质1704中存放的一条或多条指令,以实现执行如图3,图8或图13中所示的相应方法所涉及的各步骤,具体实现中,计算机存储介质1704中的一条或多条指令由处理器1701加载并执行以下步骤:
157.显示语音输入界面,该语音输入界面包括第一语音输入方式及第二语音输入方式;
158.若响应第一语音输入方式,则显示第一界面,该第一界面包括多个音频数据;
159.接收针对第一音频数据的操作,该第一音频数据为多个音频数据中的任一音频数据;
160.响应针对第一音频数据的操作,输出包含第一音频数据的弹幕信息;
161.若响应第二语音输入方式,则生成第二界面,该第二界面包括第一按键和第二按键;
162.在检测到针对第一按键的操作,且该操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息,该第二文字数据是第二音频数据对应的文字数据,该第二音频数据是以第二语音输入方式输入的任一音频数据。
163.在一种可选的实施方式中,处理器1701用于输出包含第二文字数据的弹幕信息,包括:
164.在第二文字数据生成后,显示第三界面,该第三界面包括弹幕类型;该弹幕类型包括语音类型,文本类型,以及语音加文本类型;
165.当检测到针对文本类型的操作时,输出包含第二文字数据的弹幕信息;
166.当检测到针对语音类型的操作时,输出包含第二音频数据的弹幕信息;
167.当检测到针对语音加文本类型的操作时,输出包含第二文字数据以及第二音频数据的弹幕信息。
168.在一种可选的实施方式中,处理器1701还用于:
169.检测到针对弹幕信息中的第二音频数据的操作时,降低背景音频数据的播放音量,且播放第二音频数据。
170.在一种可选的实施方式中,第三界面还包括文本框,文本框用于显示生成的文字数据,处理器1701还用于:当检测到针对文本框的操作时,该文本框进入编辑状态;该进入编辑状态的文本框支持对第二文字数据的更新。
171.在一种可选的实施方式中,第二界面还包括操作提示信息,所述操作提示信息用于提示触发生成第二文字数据的用户操作。
172.在一种可选的实施方式中,处理器1701还用于:响应针对第一音频数据的操作,显示并播放第一音频数据。
173.在一种可选的实施方式中,响应针对所述第一音频数据的操作,处理器1701用于输出包含第一音频数据的弹幕信息,包括:
174.响应针对第一音频数据的操作,生成第一文字数据;该第一文字数据是第一音频数据对应的文字数据;
175.输出包含第一音频数据以及第一文字数据的弹幕信息。
176.在一种可选的实施方式中,处理器1701用于输出包含第一音频数据以及第一文字数据的弹幕信息,包括:
177.在第一文字数据生成时,显示第三界面;
178.当检测到针对语音加文本类型的操作时,输出包含第一音频数据以及第一文字数据的弹幕信息。
179.可见,在本技术实施例中,数据处理设备可显示包括多种语音输入方式的语音输入界面,不同的语音输入方式分别用于以不同的输入方式输入音频数据。例如,显示的语音输入界面可包括第一语音输入方式以及第二语音输入方式,第一语音输入方式输入音频数据的方式与第二语音输入方式输入音频数据的方式不同,数据处理设备可支持用户以多种语音输入方式输入音频数据,有效增强语音输入的灵活性,提升用户体验。同时,数据处理设备不仅可以输出包含第一音频数据(即以第一语音输入方式输入的音频数据)的弹幕信息,还可以输出包含第二音频数据(即以第二语音输入方式输入的音频数据)对应的第二文字数据的弹幕信息,数据处理设备可支持输出多种弹幕类型的弹幕信息,可以有效提升弹幕信息的灵活性,提升用户体验。
180.需要说明的是,本技术实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序指令,该程序指令存储在计算机可读存储介质中。数据处理设备的处理器从计算机可读存储介质读取该程序指令,处理器执行该程序指令,使得该数据处理设备执行上述数据处理方法实施例图3,图8或图13中所执行的步骤。
181.以上所揭露的仅为本技术一种较佳实施例而已,当然不能以此来限定本技术之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本技术权利要求所作的等同变化,仍属于申请所涵盖的范围。

技术特征:
1.一种数据处理方法,其特征在于,所述方法包括:显示语音输入界面,所述语音输入界面包括第一语音输入方式及第二语音输入方式;若响应所述第一语音输入方式,则显示第一界面,所述第一界面包括多个音频数据;接收针对第一音频数据的操作,所述第一音频数据为所述多个音频数据中的任一音频数据;响应针对所述第一音频数据的操作,输出包含所述第一音频数据的弹幕信息;若响应所述第二语音输入方式,则生成第二界面,所述第二界面包括第一按键和第二按键;在检测到针对所述第一按键的操作,且所述操作从所述第一按键移动到所述第二按键时,生成第二文字数据,并输出包含所述第二文字数据的弹幕信息,所述第二文字数据是第二音频数据对应的文字数据,所述第二音频数据是以所述第二语音输入方式输入的任一音频数据。2.如权利要求1所述的方法,其特征在于,所述输出包含所述第二文字数据的弹幕信息,包括:在所述第二文字数据生成后,显示第三界面,所述第三界面包括弹幕类型;所述弹幕类型包括语音类型,文本类型,以及语音加文本类型;当检测到针对文本类型的操作时,输出包含所述第二文字数据的弹幕信息;当检测到针对语音类型的操作时,输出包含所述第二音频数据的弹幕信息;当检测到针对语音加文本类型的操作时,输出包含所述第二文字数据以及所述第二音频数据的弹幕信息。3.如权利要求2所述的方法,其特征在于,所述方法还包括:检测到针对所述弹幕信息中的所述第二音频数据的操作时,降低背景音频数据的播放音量,且播放所述第二音频数据。4.如权利要求2或3所述的方法,其特征在于,所述第三界面还包括文本框,所述文本框用于显示所述生成的文字数据,所述方法还包括:当检测到针对所述文本框的操作时,所述文本框进入编辑状态;所述进入编辑状态的文本框支持对所述第二文字数据的更新。5.如权利要求1-3任一项所述的方法,其特征在于,所述第二界面还包括操作提示信息,所述操作提示信息用于提示触发生成所述第二文字数据的用户操作。6.如权利要求1所述的方法,其特征在于,在所述显示第一界面之后,所述方法还包括:响应针对所述第一音频数据的操作,显示并播放所述第一音频数据。7.如权利要求1或6所述的方法,其特征在于,所述响应针对所述第一音频数据的操作,输出包含所述第一音频数据的弹幕信息,包括:响应针对所述第一音频数据的操作,生成第一文字数据;所述第一文字数据是所述第一音频数据对应的文字数据;输出包含所述第一音频数据以及所述第一文字数据的弹幕信息。8.如权利要求7所述的方法,其特征在于,输出包含所述第一音频数据以及所述第一文字数据的弹幕信息,包括:在所述第一文字数据生成后,显示第三界面;
当检测到针对语音加文本类型的操作时,输出包含所述第一音频数据以及所述第一文字数据的弹幕信息。9.一种数据处理设备,其特征在于,所述数据处理设备包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1至8任一项所述的数据处理方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被执行时以实现如权利要求1至8任一项所述的数据处理方法。

技术总结
本申请实施例提供了一种数据处理方法、设备及介质。在该方法中,数据处理设备可显示包括多种语音输入方式的语音输入界面;若响应第一语音输入方式,则显示包括多个音频数据的第一界面,在接收到针对第一界面内第一音频数据的操作时,可输出包含第一音频数据的弹幕信息;若响应第二语音输入方式,则生成包括第一按键和第二按键的第二界面,在检测到针对第一按键的操作且该操作从第一按键移动到第二按键时,生成第二文字数据,并输出包含第二文字数据的弹幕信息。可支持用户以多种语音输入方式输入音频数据,增强语音输入的灵活性,提升用户体验。同时,还可支持输出多种弹幕类型的弹幕信息,提升弹幕信息的灵活性。提升弹幕信息的灵活性。提升弹幕信息的灵活性。


技术研发人员:于斯宇
受保护的技术使用者:腾讯音乐娱乐科技(深圳)有限公司
技术研发日:2023.04.27
技术公布日:2023/7/22
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐