视频通话方法、装置、计算机可读介质及电子设备与流程
未命名
10-09
阅读:100
评论:0
1.本技术属于人工智能技术领域,具体涉及一种视频通话方法、视频通话装置、计算机可读介质以及电子设备。
背景技术:
2.随着视频通话的逐渐广泛,除了手机、pad端,目前电视端都可以接入摄像头进行视频通话,但是一些场景,比如形象未整理好、想保持一点神秘感等原因不想人脸入境,或者整个人不想入境,在视频通话中就会屏蔽摄像头,这样就会造成通话体验不佳。其次随着视频通话的普及,其主要功能是作为通话工具,但是随着用户群体的年轻化,在趣味性上,目前的视频通话技术还有欠缺。
技术实现要素:
3.本技术的目的在于提供一种视频通话方法、视频通话装置、计算机可读介质以及电子设备,能够克服相关技术中存在的视频通话趣味性和互动性差的问题。
4.本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。
5.根据本技术实施例的一方面,提供一种视频通话方法,该方法包括:响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面;响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像;在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是所有视频通话方中至少一方所使用的终端设备。
6.根据本技术实施例的另一方面,提供一种视频通话方法,该方法包括:响应对卡通仿真控件的触发操作,在视频通话终端设备的显示界面中显示卡通形象选择界面;响应对所述卡通形象选择界面中目标卡通形象控件的触发操作,在包含待卡通化对象的图像所在的显示区域显示具有目标卡通形象的动画图像;响应对非卡通仿真控件的触发操作,在所述显示界面中显示对应的信息选择界面;响应对所述信息选择界面中目标信息控件的触发操作,在待处理图像所在显示区域显示目标动画图像,所述目标动画图像是根据所述目标信息控件对应的目标信息对所述待处理图像进行处理生成的。
7.根据本技术实施例的另一方面,提供一种视频通话装置,该装置包括:调用模块,用于响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面;获取模块,用于响应对所述信息选择界面中第二控件的触发操作以获取目标信息和触发时间戳,并根据所述触发时间戳获取待处理图像;处理模块,用于基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像;显示模块,用于在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是所有视频通话方中至少一方所使用的终端
设备。
8.根据本技术实施例的另一方面,提供一种视频通话装置,该装置包括:第一处理模块,用于响应对卡通仿真控件的触发操作,在视频通话终端设备的显示界面中显示一卡通形象选择界面;第二处理模块,用于响应对所述卡通形象选择界面中目标卡通形象控件的触发操作,在待卡通化对象的显示区域显示具有所述目标卡通形象的第一动画图像,并且所述目标卡通形象的表情与所述待卡通化对象的表情相同;第三处理模块,用于响应对非卡通仿真控件的触发操作,在所述显示界面中显示对应的信息选择界面;第四处理模块,用于响应对所述信息选择界面中目标信息控件的触发操作,在待处理图像所在显示区域显示目标动画图像,所述目标动画图像是根据所述目标信息控件对应的目标信息对所述待处理图像进行处理生成的。
9.根据本技术实施例的另一方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的视频通话方法。
10.根据本技术实施例的另一方面,提供一种电子设备,该电子设备包括:存储器和处理器,该存储器存储有计算机程序,该处理器执行该计算机程序时实现如以上技术方案中的视频通话方法。
11.根据本技术实施例的另一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的视频通话方法。
12.在本技术实施例提供的技术方案中,通过响应视频参与方对目标显示区域中第一控件的触发操作,调用对应的动画模块,并在界面中展示与动画模块对应的信息选择界面,接着响应对信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;然后基于动画模块和目标信息对待处理图像执行目标操作,以获取与待处理图像对应的动画图像;最后将动画图像发送至视频通话终端设备,以在视频通话终端设备的显示界面中显示动画图像。本技术一方面能够简化对图像进行动画处理的流程,为用户提供更多的可选动画效果;另一方面能够提高视频通话时的趣味性和互动性;再一方面能够提高产品的用户粘度和用户体验。
13.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
14.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
15.图1示意性地示出了应用本技术技术方案的示例性系统架构框图。
16.图2示意性地示出了本技术中视频通话方法的步骤流程示意图。
17.图3示意性地示出了本技术中第一控件的界面示意图。
18.图4a-4c示意性地示出了本技术中信息选择界面的界面示意图。
19.图5示意性地示出了本技术中基于卡通仿真模块获取动画图像的流程示意图。
20.图6示意性地示出了本技术中基于图像动态变化模块获取动画图像的流程示意图。
21.图7示意性地示出了本技术中根据语音指令生成动画图像的交互流程图。
22.图8示意性地示出了本技术中基于美图模块生成动画图像的交互流程图。
23.图9a-9d示意性地示出了本技术中采用仿真卡通形象进行视频通话的界面示意图。
24.图10a-10d示意性地示出了本技术中采用仿真卡通形象进行视频通话的界面示意图。
25.图11a-11d示意性地示出了视频通话界面中的人物图像添加动作的界面示意图。
26.图12a-12e示意性地示出了本技术中对视频通话界面中的人物进行美化的界面示意图。
27.图13示意性地示出了本技术中动画互动的流程示意图。
28.图14示意性地示出了本技术中视频通话装置的结构框图。
29.图15示意性示出了适于用来实现本技术实施例的电子设备的计算机系统结构框图。
具体实施方式
30.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
31.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本技术的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本技术的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本技术的各方面。
32.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
33.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
34.图1示意性地示出了应用本技术技术方案的示例性系统架构框图。
35.如图1所示,系统架构100可以包括终端设备110、网络120和服务器130。终端设备110例如可以包括智能手机、平板电脑、笔记本电脑、智能电视、车载终端等各种电子设备,进一步地,终端设备110还可以是其它包含显示屏幕及语音收录和传输装置的电子设备。服务器130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。网络120可以是能够在终端设备110和服务器130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路或者无线通信链路。
36.根据实现需要,本技术实施例中的系统架构可以具有任意数目的终端设备、网络和服务器。例如,服务器130可以是由多个服务器设备组成的服务器群组。另外,本技术实施例提供的技术方案可以应用于终端设备110,也可以应用于服务器130,或者可以由终端设备110和服务器130共同实施,本技术对此不做特殊限定。
37.在本技术的一些实施例中,用户通过终端设备110中所安装的视频聊天应用发起视频通话,在与其它用户建立视频通话后,可以通过对界面中的控件进行触发操作以对视频图像中的对象进行动画处理。在本技术的实施例中,对视频图像中的对象进行动画处理可以分为三类,第一类是采用卡通形象进行真人表情仿真,第二类是对视频图像进行动态变化,第三类是对视频图像中的对象进行美化。用户对界面中的控件进行触发操作后,可以通过网络120将该触发操作对应的指令发送至服务器130,服务器130接收到指令后可以执行相应的数据处理,以获取对应的动画图像。在获取动画图像后,服务器130可以将该动画图像分发至视频通话终端设备110,并在视频通话终端设备110的显示界面中显示该动画图像,也可以将该动画图像发送至所有视频通话方中任意一方所使用的视频通话终端设备,并显示。以上述三类动画处理为例,当动画处理是采用卡通形象进行真人表情仿真时,获取与视频图像中的对象具有相同表情的目标卡通形象动画后,可以采用目标卡通形象动画覆盖视频通话界面中的包含待卡通化对象的图像进行视频通话;当动画处理是对视频图像进行动态变化时,在获取与选定的视频通话界面中的对象对应的具有用户选择的动作类型的动画图像后,可以在显示界面中显示该具有所选动作类型的动画图像;当动画处理是对视频通话界面中的包含待美化对象的图像进行美化时,在获取美化后的动画图像后,可以在视频通话界面中显示该动画图像。
38.在本技术的一些实施例中,采用卡通形象进行真人表情仿真时,用户可以在建立视频通话前触发卡通仿真模块并选定目标卡通形象,当建立视频通话后,服务器130可以获取终端设备110实时采集的用户在视频聊天界面中的图像,然后从图像中提取用户的表情信息,并根据所提取的表情信息匹配得到具有该表情信息的目标卡通形象动画,最后以该目标卡通形象动画替代用户本人在视频聊天界面中进行显示。
39.在本技术的一些实施例中,为了提高视频通话过程中的图像动画处理效率,还可以通过终端设备110执行动画处理的全部流程或部分流程,例如在终端设备110本地存储具有不同表情的卡通形象动画,在获取视频图像中对象的表情后,可以直接从本地获取对应的卡通形象动画进行展示;也可以在终端设备110中搭建图像处理模型,以在接收到动作指令后,采用图像处理模型对待处理图像进行处理以获取具有指定的动作类型的动画图像,并进行展示;还可以在用户选择美化功能后,将用户选择的包含待美化对象的图像保存在本地,并在用户完成对所选择的包含待美化对象的图像进行美化处理后,将美化后的图像展示在显示界面中,或者将美化后的图像发送至服务器130,以便服务器130分发至视频通话终端设备进行展示。
40.在本技术的一些实施例中,终端设备110或者服务器130中设置的表情识别模型、图像处理模型是基于人工智能技术进行表情识别、图像处理的机器学习模型。
41.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解
智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
42.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
43.计算机视觉技术(computer vision,cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像信息标注、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术。
44.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
45.下面结合具体实施方式对本技术提供的视频通话方法、视频通话装置、计算机可读介质以及电子设备等技术方案做出详细说明。
46.图2示意性示出了本技术一个实施例中的视频通话方法的步骤流程示意图,该视频通话方法可以由服务器执行,也可以由终端设备执行,还可以由终端设备和服务器共同执行,该终端设备和服务器可以是图1中所示的终端设备110和服务器130,接下来,以该方法由终端设备执行为例进行说明。如图2所示,本技术实施例中的视频通话方法主要可以包括如下的步骤s210至步骤s240。
47.步骤s210:响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面;
48.步骤s220:响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;
49.步骤s230:基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像;
50.步骤s240:在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是视频通话方中至少一方所使用的终端设备。
51.在本技术实施例提供的视频通话方法中,通过响应视频参与方对界面中第一控件的触发操作,调用对应的动画模块,并在界面中展示与动画模块对应的信息选择界面,接着响应对信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;然后基于动画模块和目标信息对待处理图像执行目标操作,以获取与待处理图像对应的动画图像;最后在视频通话方中至少一方所使用的终端设备的显示界面中显示该动画图像。本技术一方面
能够简化对图像进行动画处理的流程,为用户提供更多的可选动画效果;另一方面能够提高视频通话时的趣味性和互动性;再一方面能够提高产品的用户粘度和用户体验。
52.下面对视频通话方法的各个方法步骤的具体实现方式进行详细说明。
53.在步骤s210中,响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面。
54.在本技术的一个实施例中,视频通话发起方登陆即时通讯应用程序,选择想要建立视频通话的视频通话接收方,在与视频通话接收方的聊天界面中,通过对视频通话控件进行触发操作,以向视频通话接收方发送视频通话请求,当视频通话接收方接受该视频通话请求后,视频通话发起方和视频通话接收方之间建立通信连接,可以进行视频通话,在视频通话的过程中,视频通话发起方和视频通话接收方均可以看到对方的表情、动作,还可以听到对方的语音。
55.在进入视频聊天界面之后,视频通话发起方或者视频通话接收方均可以触发视频通话界面中的不同控件以实现不同的动画互动功能。为了使本技术的技术方案更清楚,接下来以视频通话发起方在视频通话过程中进行动画互动为例对本技术的技术方案进行说明。
56.在本技术的一个实施例中,在视频通话界面中,显示有视频通话发起方和视频通话接收方的图像,在视频通话发起方和视频通话接收方的图像显示区域中均设置有三个可实现不同功能的第一控件,不同显示区域的第一控件所能实现的功能相同,但是针对的对象不同。通过对不同显示区域中的第一控件进行触发操作,以调用对应的动画模块,实现相应的动画互动。
57.图3示出了第一控件的界面示意图,如图3所示,在视频通话发起方的人像图像的下方显示有三个第一控件,分别是卡通仿真控件、动作控件和美图控件,当对卡通仿真控件进行触发操作时,后台响应该触发操作,调用与卡通仿真控件对应的卡通仿真模块;当对动作控件进行触发操作时,后台响应该触发操作,调用与动作控件对应的图像动态变化模块;当对美图控件进行触发操作时,后台响应该触发操作,调用与美图控件对应的美图模块。在本技术的实施例中,选择对不同对象的视频图像显示区域中的第一控件进行触发操作,一方面可以调用对应的动画模块,另一方面可以确定动画互动所对应的对象,例如视频通话发起方对一视频通话接收方的图像显示区域内的动作控件进行触发操作,那么就可以将视频通话接收方的图像作为待处理图像进行动画处理,以获取具有动画效果的图像。
58.在本技术的一个实施例中,可以对卡通仿真控件、动作控件和美图控件中的至少一个控件进行触发操作,以实现对应的动画互动,通过一种或多种类型的动画互动,能够提高视频通话的互动性和趣味性。
59.对于图3中的视频通话界面,在该视频通话界面中,会显示视频通话发起方和所有的视频通话接收方的人物图像,这些人物图像可以矩阵或其它的形式排列。在另一些实施例中,比如两人之间的视频通话,可以将对方的人物图像以大图的形式展现在显示界面中,而本人的人物图像则会以小图的形式展现,比如可以展现在显示界面的顶角或底角处,通过对本人的人物图像进行点击可以将小图切换为大图,而将对方的人物图像切换为小图。对于这种情况,用户若是想要对本人的图像进行动画处理时,可以将小图切换为大图,然后对相应的第一控件进行触发操作,以实现相应的动画处理,用户若是想要对对方的图像进
行动画处理时,可以对大图中的第一控件进行触发操作,以实现相应的动画处理。在另一些实施例中,可以将对方的人物图像展现在显示界面中,而本人的人物图像则不显示。本技术实施例不限制各人物图像的展现方式。
60.在本技术的一个实施例中,第一控件设置为隐藏状态,当视频通话发起方或视频通话接收方对视频通话界面中任一对象的图像进行点击等触发操作后,第一控件从隐藏状态转为显示状态。
61.在本技术的一个实施例中,当调用对应第一控件的动画模块后,视频通话终端设备的显示界面切换为信息选择界面,图4a-4c示出了信息选择界面的界面示意图,如图4a所示,当调用卡通仿真模块后,在显示界面中显示有卡通形象选择界面,在该卡通形象选择界面中,视频通话发起方可以选择喜欢的卡通形象对所选定的对象图像中的人脸及人体进行替换;当调用图像动态变化模块后,视频通话终端设备的显示界面切换为动作选择界面,该动作选择界面中包含人脸动作和全局通用性动作两类,如图4b所示,其中人脸动作是针对人脸进行动画处理,例如捏脸、嘟嘴、眨眼等等,全局通用性动作是对图像全局进行动画处理,例如撒花、爱心、发送生日蛋糕等等;当调用美图模块后,视频通话终端设备的显示界面切换为美图对象选择界面,视频通话发起方可以在美图对象选择界面中选择想要进行美化的对象,如图4c所示,界面中显示有视频参与方a、视频参与方b
…
,视频通话发起方可以从中选择想要进行美化的对象。
62.在不同的信息选择界面,视频通话发起方可以根据实际需要选择所需的卡通形象、动作类型以及美图对象,并对对应的第二控件进行触发操作,以向服务器端发送相应的目标信息。
63.在本技术的一个实施例中,目标显示区域还可以是非对象显示区域,在对第一控件进行触发操作之前,可以在显示界面中选定待动画处理的目标对象,然后再对第一控件进行触发操作以调用动画模块,并基于动画模块对目标对象的图像进行动画处理。
64.在步骤s220中,响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像。
65.在本技术的一个实施例中,对于不同的信息选择界面,获取的目标信息不同。基于图4a-4c所示的信息选择界面,当信息选择界面为卡通形象选择界面时,响应对卡通形象选择界面中的第二控件的触发操作,以获取与第二控件对应的目标卡通形象;当信息选择界面为动作选择界面时,响应对动作选择界面中的第二控件的触发操作,以获取与第二控件对应的目标动作;当信息选择界面为美图对象选择界面时,响应对美图对象选择界面中第二控件的触发操作,以获取与第二控件对应的待美化对象。
66.在本技术的一个实施例中,在选定目标信息的同时,还需要获取视频通话界面中的待处理图像,以便基于动画模块和目标信息对所获取的待处理图像进行动画处理,得到处理后的动画图像,并将视频通话界面中的对象图像替换为该动画图像,提高视频通话的趣味性和互动性。
67.在获取待处理图像时,可以在响应对第二控件的触发操作后,获取视频通话界面中与所选定的对象对应的图像作为待处理图像;进一步地,可以根据触发第二控件的时间戳获取待处理图像,具体而言,首先可以保存视频通话发起方触发第二控件时的触发时间戳,然后根据该触发时间戳获取视频通话界面中与所选定的待卡通化对象对应的图像作为
待处理图像,例如视频通话发起方本人不想出镜,那么可以在视频通话发起方选定目标卡通形象并保存触发时间戳后,根据该触发时间戳实时获取视频通话过程中与视频通话发起方对应的图像作为待处理图像,然后采用所选择的目标卡通形象对应的动画进行替换;或者视频通话发起方想给视频通话接收方发送生日祝福,那么可以根据触发全局通用性动作的触发时间戳获取视频通话过程中与视频通话接收方对应的图像作为待处理图像,然后在待处理图像的显示区域生成通用性动画,比如显示生日蛋糕等等;又或者视频通话发起方想对视频通话接收方的图像进行美图,那么可以在确定待美化对象后,根据选定待美化对象的时间戳获取与待美化对象对应的图像进行美化。
68.值得说明的是,当第一控件所处的目标显示区域为视频通话发送方或视频通话接收方的图像所在的显示区域时,则认为该目标显示区域对应的对象为选定的动画处理对象,在调用美图模块时,对美图对象选择界面中第二控件进行触发操作,以获取与第二控件对应的待美化对象,则是为了对初始选定的待美化对象进行确认,当然在对第二控件进行触发获取待美化对象时,也可以选择与初始选定的待美化对象不同的对象,也就是说,美图模块针对的对象以触发的第二控件所对应的对象为准。
69.在步骤s230中,基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像。
70.在本技术的一个实施例中,在获取目标信息和待处理图像之后,便可以基于动画模块和目标信息对待处理图像执行目标操作,以获取与待处理图像对应的动画图像。动画模块的类型不同,目标操作的方式也不同,具体为:
71.(1)动画模块为卡通仿真模块
72.图5示出了基于卡通仿真模块获取动画图像的流程示意图,如图5所示,在步骤s501中,基于所述卡通仿真模块对所述待处理图像中的所述目标对象进行人脸检测,并对人脸检测后的所述待处理图像进行预处理,以获取增强图像;在步骤s502中,将所述增强图像输入至表情识别模型,通过所述表情识别模型对所述增强图像进行特征提取,并根据所提取的特征进行表情预测,以获取与所述增强图像对应的表情信息;在步骤s503中,根据所述表情信息和所述目标卡通形象从卡通形象动画集中确定目标卡通形象动画;在步骤s504中,将所述待处理图像中的所述目标对象替换为所述目标卡通形象动画,以获取与所述待处理图像对应的动画图像。
73.其中,步骤s501中的人脸检测可以通过人脸检测算法或者神经网络模型实现,在对待处理图像进行人脸检测后,可以对待处理图像进行预处理,具体地,可以对待处理图像进行高斯滤波、图像去噪以及图像增强,以获取增强图像;步骤s502中的表情识别模型为提前训练得到的收敛的表情识别模型,在将增强图像输入表情识别模型后,表情识别模型对增强图像进行特征提取,并根据所提取的特征对增强图像中的人物表情进行预测,以获取表情信息;步骤s503中,在获取表情信息后,可以根据表情信息在所存储的卡通形象动画集中获取具有该表情信息的目标卡通形象动画。
74.在本技术的一个实施例中,卡通形象动画集包括多组对应不同卡通形象的子卡通形象动画集,且各组子卡通形象动画集中的卡通形象具有不同表情,在获取目标卡通形象动画时,首先将目标卡通形象与卡通形象动画集中包含的各个卡通形象进行比对,以获取与目标卡通形象对应的子卡通形象动画集;然后将表情信息与子卡通形象动画集中的表情
进行对比,以获取具有该表情信息的卡通形象动画,并作为目标卡通形象动画。例如,待处理图像中的人脸表情为微笑,那么可以获取微笑的目标卡通形象的动画作为目标卡通形象动画;待处理图像中的人脸表情为哭泣,那么可以获取哭泣的目标卡通形象的动画作为目标卡通形象动画。
75.在本技术的一个实施例中,为了获取收敛的表情识别模型,需要采集大量的表情图像样本,并通过所采集的表情图像样本对表情识别模型进行训练。在本技术的实施例中,表情图像样本采用jaffe表情数据库中的表情图像,jaffe表情数据库是一个开放的人脸表情图像数据库,包括ka、kl、km、kr、mk、na、nm、tm、uy、ym共10个不同的日本女性,每个人有an、di、fe、ha、ne、sa、su共7种不同表情的人脸图像,分别为愤怒、厌恶、害怕、快来、无表情、悲哀、惊讶,每种表情有3、4张样本图像,总共213张表情图像,原始图像的像素为256
×
256。
76.在获取表情数据库后,首先对表情数据库中的表情图像进行人脸检测,然后对人脸检测后的表情图像进行预处理,以获取与表情图像对应的增强表情图像;接着将增强表情图像输入至待训练表情识别模型,通过待训练表情识别模型对增强表情图像进行特征提取,并根据所提取的特征进行表情预测,以获取与增强表情图像对应的预测表情信息;然后根据预测表情信息与表情图像对应的标记表情信息确定表情预测误差;最后根据表情预测误差对待训练表情识别模型的参数进行调整,直至表情预测误差达到最小,以获取收敛的表情识别模型。其中,对表情图像进行人脸检测和预处理的方法与上述实施例中对待处理图像进行人脸检测和预处理的方法相同。
77.与此同时,还需要对支持的卡通形象设计具有不同表情的卡通形象动画,例如支持机器猫、加菲猫等,那么需要对这些卡通形象的相应表情进行对应的表情动画设计,比如笑的动画效果,难过的动画效果,然后根据设计好的各个卡通形象对应的卡通形象动画形成子卡通形象动画集,并根据各子卡通形象动画集形成卡通形象动画集,该卡通形象动画集可以存储于服务器端。当用户在卡通形象选择界面中选定目标卡通形象后,可以从卡通形象动画集中获取与目标卡通形象对应的子卡通形象动画集,在获取用户的表情信息后,再根据表情信息从子卡通形象动画集中获取对应的目标卡通形象动画。进一步地,在选定目标卡通形象后,可以将与该目标卡通形象对应的子卡通形象动画集发送至视频通话终端设备,在识别得到待处理图像中的表情信息后,可以将表情信息反馈至视频通话终端设备,并在视频通话终端设备将表情信息与子卡通形象动画集中的表情进行对比,以获取目标卡通形象动画。
78.(2)动画模块为图像动态变化模块
79.图6示出了基于图像动态变化模块获取动画图像的流程示意图,如图6所示,在步骤s601中,将所述待处理图像输入至所述图像动态变化模块中的图像处理模型,通过所述图像处理模型对所述目标对象进行特征提取,以获取特征参数值;在步骤s602中,根据所述目标动作类型确定目标映射规则,并根据目标映射规则对所述特征参数值进行映射以获取骨骼变动值;在步骤s603中,根据所述骨骼变动值对所述目标对象进行渲染,以获取具有所述目标动作类型的动画图像。
80.其中,步骤s601中的图像处理模型具体可以是一个深度神经网络,该深度神经网络根据输入的待处理图像所对应的点阵模型进行特征提取,进而输出待处理图像中对象的特征参数值,具体而言,当待处理图像为视频通话界面中的人脸图像时,其输入层可以读入
人脸图像生成的点阵模型,并通过输出层输出若干个人脸的特征参数值;步骤s602中,在获取人脸的特征参数值后,需要将其映射为人脸模型所绑定的骨骼变动值,这是因为人体可以视为一个刚体,在制作动画时,需要根据人体的骨骼参数进行渲染,因此需要将人脸的特征参数值映射为骨骼变动值,再根据骨骼变动值进行动画制作形成具有指定动作的动画图像。值得说明的是,对于不同的动作类型,将特征参数值映射为骨骼变动值的映射规则也不同,因此在映射之前,需要根据目标动作类型确定目标映射规则,再根据目标映射规则将特征参数值映射得到骨骼变动值,最后根据骨骼变动值对人脸图像中的人脸进行渲染,得到具有目标动作类型的动画图像,例如目标动作类型为捏脸,那么渲染得到的动画图像为具有捏脸效果的人脸图像。
81.在本技术的一个实施例中,在获取动作指令时,除了可以通过用户对动作选择界面中的动作类型进行触控选择,还可以通过语音下发动作指令。图7示出了根据语音指令生成动画图像的交互流程图,如图7所示,在步骤s701中,视频通话终端设备在接收到视频通话发起方对动作控件的触发操作后,接收视频通话发起方的语音信息;在步骤s702中,将语音信息发送至服务器;在步骤s703中,通过服务器对语音信息进行识别,以获取动作指令和动作对象;在步骤s704中,将动作指令与图像动态变化模块支持的动作类型进行对比;在步骤s705中,当动作类型中存在动作指令时,获取并保存与动作对象对应的视频图像;在步骤s706中,将视频图像输入至图像动态变化模块中的图像处理模型,通过所述图像处理模型对所述视频图像中的对象特征进行提取,以获取特征参数值;在步骤s707中,根据动作类型确定目标映射规则,并根据目标映射规则对特征参数值进行映射以获取骨骼变动值;在步骤s708中,根据骨骼变动值对视频图像中的对象进行渲染,以获取与动作指令对应的动画图像。
82.其中,步骤s703中获取动作指令和动作对象可以通过语音识别模型对语音信息进行处理实现,该语音识别模型包括依次连接的自动语音识别子模型(automatic speech recognition,简称asr)和自然语言分析子模型(natural language processing,简称nlp),通过语音识别模型对语音信息进行识别分析,既可获取其中的动作指令和动作对象,例如,视频通话发起方触发动作控件后说“小可爱嘟嘟嘴”,那么通过分析可以确定动作指令为“嘟嘴”,动作对象为“小可爱”,该动作对象可以根据即时通讯软件中用户的命名或者别名来匹配确定,接着便可以获取“小可爱”的视频通话图像作为待处理图像,然后调用深度神经网络对待处理图像进行特征提取以及映射以获取骨骼变动值,最后根据骨骼变动值进行渲染得到小可爱的嘟嘴图像,并将原视频通话界面中小可爱的图像替换为小可爱的嘟嘴图像。
83.进一步地,在步骤s701中,在接收语音信息的同时可以保存接收语音信息的时间戳,并在步骤s702中将语音信息发送至服务器时,也将时间戳发送至服务器,在步骤s705中,当动作类型中存在动作指令时,根据语音信息对应的时间戳获取并保存与动作对象对应的视频图像,用于后续的动画处理。
84.在本技术的一个实施例中,无论是用户手动选择动作类型还是通过语音下发动作指令,在获取动作类型后,可以先对动作类型进行识别,判断该动作类型是局部动作还是全局通用性动作,然后再根据判断结果确定是否调用深度神经网络,当动作类型为局部动作时,调用深度神经网络对待处理图像中的对象进行处理,以生成具有局部动作的动画图像;
当动作类型为全局通用性动作时,则不需调用深度神经网络,直接在待处理图像的全局生成对应的动画效果。
85.(3)动画模块为美图模块
86.在本技术的一个实施例中,图8示出了基于美图模块生成动画图像的交互流程图,如图8所示,在步骤s801中,视频通话终端设备响应视频通话发起方对美图控件的触发操作,并获取所选定的待美化对象;在步骤s802中,获取包含待美化对象的图像作为待处理图像;在步骤s803中,对待处理图像中的待美化对象进行人脸检测,以获取人脸的位置坐标;在步骤s804中,视频通话界面跳转至美图界面,并在美图界面中显示待处理图像;在步骤s805中,获取并保存美图处理后的动画图像;例如用户对“美白”、“美瞳”、“对比度”等功能控件进行触发操作,以对待处理图像中的人脸区域进行美白、对眼部进行美瞳、对整个图像的对比度进行调节,以形成动画图像。
87.进一步地,在步骤s801中获取待美化对象的同时可以获取对应的时间戳,并在步骤s802中根据该时间戳获取包含待美化对象的图像作为待处理图像,用于后续的美图处理。
88.在本技术的一个实施例中,为了提高美图效率,在获取待处理图像后,可以将其保存在本地,当视频通话界面切换为美图界面时,待处理图像同步显示于美图界面中。
89.在步骤s240中,在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是所有视频通话方中至少一方所使用的终端设备。
90.在本技术的一个实施例中,在采用卡通仿真模块、动作模块、美图模块对待处理图像进行处理生成动画图像后,可以将动画图像显示在视频通话终端设备的显示界面中,并且显示动画图像的视频通话终端设备可以是所有参与视频通话的视频通话方中至少一方所使用的终端设备,例如两人通话视频时,可以只在对方所使用的视频通话终端设备中显示本人图像经过卡通仿真处理后生成的动画图像,也可以在双方使用的视频通话终端设备中均显示该动画图像;当多于两人参与视频通话时,可以只在任意一个视频通话参与方所使用的终端设备中显示动画图像,也可以在多个或者所有的视频通话终端设备中显示动画图像。当通过触发某一视频通话终端设备生成动画图像,并想将该动画图像也显示于其它视频通话终端设备的显示界面中时,可以将动画图像分发至其它各视频通话终端设备,以在其它各视频通话终端设备的显示界面中显示该动画图像,实现视频通话的动画互动,提高视频通话的趣味性和互动性。
91.相应地,图7所示的交互流程图中还包括:在步骤s709中,将动画图像返回至视频通话终端设备。图8所示的交互流程图还包括:在步骤s806中,将动画图像上传至服务器;在步骤s807中,服务器将美化后的动画图像发送至视频通话终端设备,以在视频通话终端设备的显示界面中显示该动画图像。
92.为了使本技术的技术方案更清楚,接下来以视频通话发起方在视频通话过程中进行动画互动的界面图进行说明。
93.图9a-9d示出了采用仿真卡通形象进行视频通话的界面示意图,如图9a所示,视频通话发起方在视频通话界面点击本人的图像,在图像的左下角出现三个控件,分别为卡通仿真控件、动作控件和美图控件;然后点击卡通仿真控件,界面切换到卡通形象选择界面,如图9b所示,在卡通形象选择界面有机器猫、加菲猫、柯南等卡通形象选项;在卡通形象左
侧设置有选择框,视频通话发起方可以点击位于目标卡通形象左侧的选择框选定目标卡通形象,如图9c所示;选定目标卡通形象后,实时获取视频通话发起方的视频通话图像,并对视频通话图像进行表情识别,以获取表情信息,同时根据表情信息在目标卡通形象对应的子卡通形象动画集中确定目标卡通形象动画,然后将目标卡通形象动画视频通话终端设备进行展示,以实现对视频通话发起方的视频通话图像进行替换,如图9d所示,视频通话界面中对应视频通话发起方头部的位置显示有微笑的加菲猫。
94.在本技术的一个实施例中,视频通话发起方还可以在发起视频通话时选择是否采用卡通形象进行视频通话,选定后再进行视频通话。
95.图10a-10d示出了采用仿真卡通形象进行视频通话的界面示意图,如图10a所示,视频通话发起方点击“视频通话”后,显示界面显示对话框“是否使用卡通形象?”,视频通话发起方确定选择卡通形象后,显示界面跳转至卡通形象选择界面,如图10b所示;视频通话发起方可以点击与卡通形象对应的选择框或者卡通形象的文字选定目标卡通形象,如图10c所示;接着与其它视频通话终端设备进行连接,建立视频通话,在视频通话的过程中,实时获取视频通话界面中与视频通话发起方本人对应的图像,获取该图像中的表情信息,以及根据表情信息在目标卡通形象对应的子卡通形象动画集中确定目标卡通形象动画,然后将目标卡通形象动画显示于视频通话终端设备的显示界面中,如图10d所示。
96.图11a-11d示出了对视频通话界面中的人物图像添加动作的界面示意图,如图11a所示,视频通话的任意一方,比如视频通话发起方,可以在视频通话界面点击想要添加动作的人物图像,在该人物图像的左下角出现三个控件,分别为卡通仿真控件、动作控件和美图控件;视频通话发起方点击动作控件,界面切换到动作选择界面,如图11b所示,在动作选择界面中显示有两个动作选项,人脸动作和全局通用性动作,并且在人脸动作和全局通用性动作的右侧设置有下拉箭头,通过点击人脸动作对应的下拉箭头可以展开支持的人脸动作类型,例如捏脸、嘟嘴、皱眉等,通过点击全局通用性动作对应的下拉箭头可以展开支持的全局通用性动作,例如发送生日蛋糕、爱心、礼花等等,如图11c所示;用户根据实际需要选择所需的动作,例如选择发送生日蛋糕,那么在该人物图像的整个图像范围内弹出蛋糕的动画,如图11d所示。
97.图12a-12e示出了对视频通话界面中的人物进行美化的界面示意图,如图12a所示,视频通话发起方在视频通话界面点击想要进行美化的人物图像,在该人物图像的左下角出现三个控件,分别为卡通仿真控件、动作控件和美图控件;视频通话发起方点击美图控件,界面切换为美图对象选择界面,如图12b所示,在美图对象选择界面中选择待美化对象后,获取待美化对象的图像,界面切换到美图界面,在美图界面中同时出现待美化对象的图像,如图12c所示;视频通话发起方可以采用美图界面中的美图工具对待美化对象进行美化,例如给图像中的人物戴墨镜以及头部装饰品,如图12d所示;在完成美图后,采用美图后的人物图像替换原人物图像进行视频通话,如图12e所示。上述各实施例中,以视频通话发起方为例对视频通话过程中的动画互动进行了说明,当然还可以是视频通话接收方在视频通话过程中进行动画互动,当动画模块为卡通仿真模块时,视频通话接收方可以在接收到视频通话请求时选择是否以卡通形象出镜,也可以在进行视频通话的过程中选择卡通形象出镜;当动画模块为动作模块时,视频通话接收方可以选择想要添加动作的对象,并基于动作模块对想要添加动作的对象的图像进行处理,以获取对应的动画图像;当动画模块为美
图模块时,同样可以选择想要美化的对象,并基于美图模块对想要美化对象的图像进行美化处理,以获取对应的动画图像,并在显示界面中显示该动画图像。进一步地,还可以将动画图像保存上传,并通过服务器端发送至所有的视频通话终端设备进行显示,也可以只发送至视频通话接收方的视频通话终端设备进行显示。
98.在本技术的一个实施例中,视频通话方中的任意一方可以从卡通仿真模块、图像动态变化模块、美图模块三个动画模块中选择至少一种动画模块进行动画互动,上述实施例中描述了选择其中任意一种动画模块进行动画互动,相应地,还可以选择其中任意两种动画模块,或者三种动画模块进行动画互动。
99.图13示出了动画互动的流程示意图,如图13所示,在步骤s1310中,响应对卡通仿真控件的触发操作,在视频通话终端设备的显示界面中显示卡通形象选择界面;在步骤s1320中,响应对所述卡通形象选择界面中目标卡通形象控件的触发操作,在包含待卡通化对象的图像所在的显示区域显示具有目标卡通形象的动画图像;在步骤s1330中,响应对非卡通仿真控件的触发操作,在所述显示界面中显示对应的信息选择界面;在步骤s1340中,响应对所述信息选择界面中目标信息控件的触发操作,在待处理图像所在显示区域显示目标动画图像,所述目标动画图像是根据所述目标信息控件对应的目标信息对所述待处理图像进行处理生成的。
100.步骤s1330中的非卡通仿真控件包括动作控件和美图控件,当非卡通仿真控件是动作控件时,信息选择界面为动作选择界面,通过响应对动作选择界面中目标动作类型控件的触发操作,在包含待处理对象的图像所在的显示区域显示目标动画图像,该目标动画图像是根据目标动作类型对包含待处理对象的图像进行处理生成的。当非卡通仿真控件是美图控件时,信息选择界面为美图对象选择界面,通过响应对美图对象选择界面中待美化对象控件的触发操作,在包含待美化对象的图像所在的显示区域显示目标动画图像,该目标动画图像是对包含待美化对象的图像进行美化所生成的图像。
101.通过上述步骤,可以实现既采用卡通形象进行动画互动又可以采用动态图像或者美图图像实现动画互动,当然作为本技术实施例的一个实施方式,还可以同时采用动态图像和美图图像实现视频通话中的动画互动。采用卡通形象和非卡通形象(如动态图像或者美图图像)进行动画互动的先后顺序也不限定,即上述步骤s1310-s1320和s1330-s1340的顺序不受限制。
102.进一步地,当先采用卡通形象和动态图像进行动画互动时,还可以进一步采用美图模块增强动画互动效果,相应地,当先采用卡通形象和美图图像进行动画互动时,还可以进一步采用图像动态变化模块增强动画互动效果,可以进一步提高视频通话过程中的趣味性。
103.其中,采用卡通仿真模块、图像动态变化模块、美图模块对包含待卡通化对象的图像、包含待处理对象的图像和包含待美化对象的图像进行处理的流程与上述实施例中对待处理图像的处理流程相同,在此不再赘述。
104.本技术中的视频通话方法是通过响应视频参与方对界面中第一控件的触发操作,调用对应的动画模块,并在界面中展示与动画模块对应的信息选择界面,接着响应对信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;然后基于动画模块和目标信息对待处理图像执行目标操作,以获取与待处理图像对应的动画图像;最后在视频通话
参与方中的至少一方所使用的视频通话终端设备的显示界面中显示动画图像。本技术一方面能够简化对图像进行动画处理的流程,为用户提供更多的可选动画效果;另一方面能够提高视频通话时的趣味性和互动性;再一方面能够提高产品的用户粘度和用户体验。
105.应当注意,尽管在附图中以特定顺序描述了本技术中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
106.以下介绍本技术的装置实施例,可以用于执行本技术上述实施例中的视频通话方法。图14示意性地示出了本技术实施例提供的视频通话装置的结构框图。如图14所示,视频通话装置1400包括:调用模块1410、获取模块1420、处理模块1430和显示模块1440,具体地:
107.调用模块1410,用于响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面;获取模块1420,用于响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;处理模块1430,用于基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像;显示模块1440,用于在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是所有视频通话方中至少一方所使用的终端设备。
108.在本技术的一些实施例中,所述第一控件包括卡通仿真控件、动作控件和美图控件;基于以上技术方案,所述调用模块1410配置为实现如下至少一种:响应对所述目标显示区域中的所述卡通仿真控件的触发操作,调用与所述卡通仿真控件对应的卡通仿真模块;响应对所述目标显示区域中的所述动作控件的触发操作,调用与所述动作控件对应的图像动态变化模块;响应对所述目标显示区域中的所述美图控件的触发操作,调用与所述美图控件对应的美图模块。
109.在本技术的一些实施例中,所述动画模块为卡通仿真模块,所述信息选择界面为卡通形象选择界面;基于以上技术方案,获取模块1420配置为:响应对所述卡通形象选择界面中的第二控件的触发操作,以获取与所述第二控件对应的目标卡通形象;获取包含待卡通化对象的图像,作为所述待处理图像。
110.在本技术的一些实施例中,基于以上技术方案,所述处理模块1430配置为:基于所述卡通仿真模块对所述待处理图像进行人脸检测,并对人脸检测后的所述待处理图像进行预处理,以获取增强图像;将所述增强图像输入至表情识别模型,通过所述表情识别模型对所述增强图像进行特征提取,并根据所提取的特征进行表情预测,以获取与所述增强图像对应的表情信息;根据所述表情信息和所述目标卡通形象从卡通形象动画集中确定目标卡通形象动画;将所述待处理图像中的对象替换为所述目标卡通形象动画,以获取与所述待处理图像对应的动画图像。
111.在本技术的一些实施例中,所述卡通形象动画集包括多组对应不同卡通形象的子卡通形象动画集,且各组所述子卡通形象动画集中的卡通形象具有不同表情;基于以上技术方案,根据所述表情信息和所述目标卡通形象从卡通形象动画集中确定目标卡通形象动画,配置为:将所述目标卡通形象与所述卡通形象动画集中包含的各所述卡通形象进行比对,以获取与所述目标卡通形象对应的子卡通形象动画集;将所述表情信息与所述子卡通
形象动画集中的表情进行对比,以获取具有所述表情信息的卡通形象动画,并作为所述目标卡通形象动画。
112.在本技术的一些实施例中,基于以上技术方案,所述视频通话装置还包括:样本获取模块,用于获取表情数据库,对所述表情数据库中的表情图像进行人脸检测,并对人脸检测后的所述表情图像进行预处理,以获取与所述表情图像对应的增强表情图像;预测模块,用于将所述增强表情图像输入至待训练表情识别模型,通过所述待训练表情识别模型对所述增强表情图像进行特征提取,并根据所提取的特征进行表情预测,以获取与所述增强表情图像对应的预测表情信息;误差计算模块,用于根据所述预测表情信息和与所述表情图像对应的标记表情信息确定表情预测误差;训练模块,用于根据所述表情预测误差对所述待训练表情识别模型的参数进行调整,直至所述表情预测误差达到最小,以获取所述表情识别模型。
113.在本技术的一些实施例中,所述动画模块为图像动态变化模块,所述信息选择界面为动作选择界面;基于以上技术方案,获取模块1420配置为:响应对所述动作选择界面中的第二控件的触发操作,以获取与所述第二控件对应的目标动作类型;获取包含待处理对象的图像,作为所述待处理图像。
114.在本技术的一些实施例中,基于以上技术方案,处理模块1430配置为:将所述待处理图像输入至所述图像动态变化模块中的图像处理模型,通过所述图像处理模型对所述待处理图像进行特征提取,以获取特征参数值;根据所述目标动作类型确定目标映射规则,并根据目标映射规则对所述特征参数值进行映射以获取骨骼变动值;根据所述骨骼变动值对所述目标对象进行渲染,以获取具有所述目标动作类型的动画图像。
115.在本技术的一些实施例中,所述动画模块为图像动态变化模块;基于以上技术方案,所述视频通话装置1400还包括:语音识别模块,用于获取语音信息,对所述语音信息进行识别以获取动作指令和动作对象;对比模块,用于将所述动作指令与所述图像动态变化模块支持的动作类型进行对比;图像获取单元,用于当所述动作类型中存在所述动作指令时,根据所述语音信息对应的时间戳获取并保存与所述动作对象对应的视频图像;模型处理模块,用于将所述视频图像输入至所述图像动态变化模块中的图像处理模型,通过所述图像处理模型对所述视频图像中的对象特征进行提取,以获取特征参数值;映射模块,用于根据所述动作类型确定目标映射规则,并根据目标映射规则对所述特征参数值进行映射以获取骨骼变动值;渲染模块,用于根据所述骨骼变动值对所述视频图像中的对象进行渲染,以获取与所述动作指令对应的动画图像。
116.在本技术的一些实施例中,基于以上技术方案,语音识别模块配置为:将所述语音信息输入至语音识别模型,通过所述语音识别模型对所述语音信息进行处理,以获取所述动作指令;其中,所述语音识别模型包括依次连接的自动语音识别子模型和自然语言分析子模型。
117.在本技术的一些实施例中,所述动画模块为美图模块,所述信息选择界面为美图对象选择界面;基于以上技术方案,所述获取模块1420配置为:响应对所述美图对象选择界面中第二控件的触发操作,以获取与所述第二控件对应的待美化对象;获取包含所述待美化对象的图像,作为所述待处理图像。
118.在本技术的一些实施例中,基于以上技术方案,所述处理模块1430配置为:对所述
待处理图像中的待美化对象进行人脸检测,以获取人脸位置坐标,并根据所述人脸位置坐标对所述待美化对象的脸部进行分区;接收对分区后的所述待处理图像进行美化生成的美化图像,并将所述美化图像作为所述动画图像。
119.本技术实施例还提供了一种视频通话装置,该视频通话装置包括:第一处理模块、第二处理模块、第三处理模块和第四处理模块,具体地:
120.第一处理模块,用于响应对卡通仿真控件的触发操作,在视频通话终端设备的显示界面中显示一卡通形象选择界面;第二处理模块,用于响应对所述卡通形象选择界面中目标卡通形象控件的触发操作,在待卡通化对象的显示区域显示具有所述目标卡通形象的第一动画图像;第三处理模块,用于响应对非卡通仿真控件的触发操作,在所述显示界面中显示对应的信息选择界面;第四处理模块,用于响应对所述信息选择界面中目标信息控件的触发操作,在待处理图像所在显示区域显示目标动画图像,所述目标动画图像是根据所述目标信息控件对应的目标信息对所述待处理图像进行处理生成的。
121.在本技术的一些实施例中,所述非卡通仿真控件为动作控件,所述信息选择界面为动作选择界面;基于以上技术方案,所述第四处理模块配置为:响应对所述动作选择界面中目标动作类型控件的触发操作,在包含待处理对象的图像所在的显示区域显示所述目标动画图像,所述目标动画图像是根据所述目标动作类型对所述包含待处理对象的图像进行处理生成的。
122.在本技术的一些实施例中,所述非卡通仿真控件为美图控件,所述信息选择界面为美图对象选择界面;基于以上技术方案,所述第四处理模块包括:显示单元,用于响应对所述美图对象选择界面中待美化对象控件的触发操作,在包含所述待美化对象的图像所在的显示区域显示所述目标动画图像,所述目标动画图像是对包含所述待美化对象的图像进行美化所生成的图像。
123.在本技术的一些实施例中,基于以上技术方案,所述显示单元配置为:响应对所述美图对象选择界面中待美化对象控件的触发操作,在所述显示屏幕中显示美图界面,所述美图界面包含所述待美化对象的图像;对所述美图界面中的美图控件进行触发操作,以对所述待美化对象的待美化部位进行美化,生成所述目标动画图像,并在包含所述待美化对象的图像所在的显示区域显示所述目标动画图像。
124.本技术各实施例中提供的视频通话装置的具体细节已经在对应的方法实施例中进行了详细的描述,此处不再赘述。
125.图15示意性地示出了用于实现本技术实施例的电子设备的计算机系统结构框图,该电子设备可以是如图1中所示的终端设备110或者服务器130。
126.需要说明的是,图15示出的电子设备的计算机系统1500仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
127.如图15所示,计算机系统1500包括中央处理器1501(central processing unit,cpu),其可以根据存储在只读存储器1502(read-only memory,rom)中的程序或者从储存部分1508加载到随机访问存储器1503(random access memory,ram)中的程序而执行各种适当的动作和处理。在随机访问存储器1503中,还存储有系统操作所需的各种程序和数据。中央处理器1501、在只读存储器1502以及随机访问存储器1503通过总线1504彼此相连。输入/输出接口1505(input/output接口,即i/o接口)也连接至总线1504。
128.在一些实施例中,以下部件连接至输入/输出接口1505:包括键盘、鼠标等的输入部分1506;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1507;包括硬盘等的储存部分1508;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分1509。通信部分1509经由诸如因特网的网络执行通信处理。驱动器1510也根据需要连接至输入/输出接口1505。可拆卸介质1511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1510上,以便于从其上读出的计算机程序根据需要被安装入储存部分1508。
129.特别地,根据本技术的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1509从网络上被下载和安装,和/或从可拆卸介质1511被安装。在该计算机程序被中央处理器1501执行时,执行本技术的系统中限定的各种功能。
130.需要说明的是,本技术实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
131.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
132.应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多
模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
133.通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本技术实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台电子设备执行根据本技术实施方式的方法。
134.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。
135.应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。
技术特征:
1.一种视频通话方法,其特征在于,包括:响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面;响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像;在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是所有视频通话方中至少一方所使用的终端设备。2.根据权利要求1所述的方法,其特征在于,所述第一控件包括卡通仿真控件、动作控件和美图控件;所述响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,包括如下至少一种:响应对所述目标显示区域中的所述卡通仿真控件的触发操作,调用与所述卡通仿真控件对应的卡通仿真模块;响应对所述目标显示区域中的所述动作控件的触发操作,调用与所述动作控件对应的图像动态变化模块;响应对所述目标显示区域中的所述美图控件的触发操作,调用与所述美图控件对应的美图模块。3.根据权利要求1或2所述的方法,其特征在于,所述动画模块为卡通仿真模块,所述信息选择界面为卡通形象选择界面;所述响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像,包括:响应对所述卡通形象选择界面中的第二控件的触发操作,以获取与所述第二控件对应的目标卡通形象;获取包含待卡通化对象的图像,作为所述待处理图像。4.根据权利要求3所述的方法,其特征在于,所述基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像,包括:基于所述卡通仿真模块对所述待处理图像中的所述目标对象进行人脸检测,并对人脸检测后的所述待处理图像进行预处理,以获取增强图像;将所述增强图像输入至表情识别模型,通过所述表情识别模型对所述增强图像进行特征提取,并根据所提取的特征进行表情预测,以获取与所述增强图像对应的表情信息;根据所述表情信息和所述目标卡通形象从卡通形象动画集中确定目标卡通形象动画;将所述待处理图像中的所述目标对象替换为所述目标卡通形象动画,以获取与所述待处理图像对应的动画图像。5.根据权利要求4所述的方法,其特征在于,所述卡通形象动画集包括多组对应不同卡通形象的子卡通形象动画集,且各组所述子卡通形象动画集中的卡通形象具有不同表情;所述根据所述表情信息和所述目标卡通形象从卡通形象动画集中确定目标卡通形象动画,包括:将所述目标卡通形象与所述卡通形象动画集中包含的各所述卡通形象进行比对,以获
取与所述目标卡通形象对应的子卡通形象动画集;将所述表情信息与所述子卡通形象动画集中的表情进行对比,以获取具有所述表情信息的卡通形象动画,并作为所述目标卡通形象动画。6.根据权利要求4所述的方法,其特征在于,在将所述增强图像输入至表情识别模型之前,所述方法还包括:获取表情数据库,对所述表情数据库中的表情图像进行人脸检测,并对人脸检测后的所述表情图像进行预处理,以获取与所述表情图像对应的增强表情图像;将所述增强表情图像输入至待训练表情识别模型,通过所述待训练表情识别模型对所述增强表情图像进行特征提取,并根据所提取的特征进行表情预测,以获取与所述增强表情图像对应的预测表情信息;根据所述预测表情信息和与所述表情图像对应的标记表情信息确定表情预测误差;根据所述表情预测误差对所述待训练表情识别模型的参数进行调整,直至所述表情预测误差达到最小,以获取所述表情识别模型。7.根据权利要求1或2所述的方法,其特征在于,所述动画模块为图像动态变化模块,所述信息选择界面为动作选择界面;所述响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像,包括:响应对所述动作选择界面中的第二控件的触发操作,以获取与所述第二控件对应的目标动作类型;获取包含待处理对象的图像,作为所述待处理图像。8.根据权利要求7所述的方法,其特征在于,所述基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像,包括:将所述待处理图像输入至所述图像动态变化模块中的图像处理模型,通过所述图像处理模型对所述待处理图像进行特征提取,以获取特征参数值;根据所述目标动作类型确定目标映射规则,并根据目标映射规则对所述特征参数值进行映射以获取骨骼变动值;根据所述骨骼变动值对所述目标对象进行渲染,以获取具有所述目标动作类型的动画图像。9.根据权利要求1所述的方法,其特征在于,所述动画模块为图像动态变化模块;在调用与所述第一控件对应的动画模块之后,所述方法还包括:获取语音信息,对所述语音信息进行识别以获取动作指令和动作对象;将所述动作指令与所述图像动态变化模块支持的动作类型进行对比;当所述动作类型中存在所述动作指令时,根据所述语音信息对应的时间戳获取并保存与所述动作对象对应的视频图像;将所述视频图像输入至所述图像动态变化模块中的图像处理模型,通过所述图像处理模型对所述视频图像中的对象特征进行提取,以获取特征参数值;根据所述动作类型确定目标映射规则,并根据目标映射规则对所述特征参数值进行映射以获取骨骼变动值;根据所述骨骼变动值对所述视频图像中的对象进行渲染,以获取与所述动作指令对应
的动画图像。10.根据权利要求9所述的方法,其特征在于,所述对所述语音信息进行识别以获取动作指令,包括:将所述语音信息输入至语音识别模型,通过所述语音识别模型对所述语音信息进行处理,以获取所述动作指令;其中,所述语音识别模型包括依次连接的自动语音识别子模型和自然语言分析子模型。11.根据权利要求1或2所述的方法,其特征在于,所述动画模块为美图模块,所述信息选择界面为美图对象选择界面;所述响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像,包括:响应对所述美图对象选择界面中第二控件的触发操作,以获取与所述第二控件对应的待美化对象;获取包含所述待美化对象的图像,作为所述待处理图像。12.根据权利要求11所述的方法,其特征在于,所述基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像,包括:对所述待处理图像中的待美化对象进行人脸检测,以获取人脸位置坐标,并根据所述人脸位置坐标对所述待美化对象的脸部进行分区;接收对分区后的所述待处理图像进行美化生成的美化图像,并将所述美化图像作为所述动画图像。13.一种视频通话方法,其特征在于,包括:响应对卡通仿真控件的触发操作,在视频通话终端设备的显示界面中显示卡通形象选择界面;响应对所述卡通形象选择界面中目标卡通形象控件的触发操作,在包含待卡通化对象的图像所在的显示区域显示具有目标卡通形象的动画图像;响应对非卡通仿真控件的触发操作,在所述显示界面中显示对应的信息选择界面;响应对所述信息选择界面中目标信息控件的触发操作,在待处理图像所在显示区域显示目标动画图像,所述目标动画图像是根据所述目标信息控件对应的目标信息对所述待处理图像进行处理生成的。14.根据权利要求13所述的方法,其特征在于,所述非卡通仿真控件为动作控件,所述信息选择界面为动作选择界面;所述响应对所述信息选择界面中目标信息的触发操作,在待处理图像所在显示区域显示目标动画图像,包括:响应对所述动作选择界面中目标动作类型控件的触发操作,在包含待处理对象的图像所在的显示区域显示所述目标动画图像,所述目标动画图像是根据所述目标动作类型对所述包含待处理对象的图像进行处理生成的。15.根据权利要求13所述的方法,其特征在于,所述非卡通仿真控件为美图控件,所述信息选择界面为美图对象选择界面;所述响应对所述信息选择界面中目标信息的触发操作,在待处理图像所在显示区域显
示目标动画图像,包括:响应对所述美图对象选择界面中待美化对象控件的触发操作,在包含所述待美化对象的图像所在的显示区域显示所述目标动画图像,所述目标动画图像是对包含所述待美化对象的图像进行美化所生成的图像。16.根据权利要求15所述的方法,其特征在于,所述响应对所述美图对象选择界面中待美化对象控件的触发操作,在包含所述待美化对象的图像所在的显示区域显示所述目标动画图像,包括:响应对所述美图对象选择界面中待美化对象控件的触发操作,在所述显示屏幕中显示美图界面,所述美图界面包含所述待美化对象的图像;对所述美图界面中的美图控件进行触发操作,以对所述待美化对象的待美化部位进行美化,生成所述目标动画图像,并在包含所述待美化对象的图像所在的显示区域显示所述目标动画图像。17.一种视频通话装置,其特征在于,包括:调用模块,用于响应对目标显示区域中第一控件的触发操作,调用与所述第一控件对应的动画模块,并展示与所述动画模块对应的信息选择界面;获取模块,用于响应对所述信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;处理模块,用于基于所述动画模块和所述目标信息对所述待处理图像执行目标操作,以获取与所述待处理图像对应的动画图像;显示模块,用于在视频通话终端设备的显示界面中显示所述动画图像,所述视频通话终端设备是所有视频通话方中至少一方所使用的终端设备。18.一种视频通话装置,其特征在于,包括:第一处理模块,用于响应对卡通仿真控件的触发操作,在视频通话终端设备的显示界面中显示卡通形象选择界面;第二处理模块,用于响应对所述卡通形象选择界面中目标卡通形象控件的触发操作,在包含待卡通化对象的图像所在的显示区域显示具有目标卡通形象的动画图像;第三处理模块,用于响应对非卡通仿真控件的触发操作,在所述显示界面中显示对应的信息选择界面;第四处理模块,用于响应对所述信息选择界面中目标信息控件的触发操作,在待处理图像所在显示区域显示目标动画图像,所述目标动画图像是根据所述目标信息控件对应的目标信息对所述待处理图像进行处理生成的。19.一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至16中任意一项所述的视频通话方法。20.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至16中任意一项所述的视频通话方法。
技术总结
本申请属于人工智能技术领域,具体涉及一种视频通话方法、装置、计算机可读介质及电子设备。该方法包括:响应对目标显示区域中第一控件的触发操作,调用与第一控件对应的动画模块,并展示与动画模块对应的信息选择界面;响应对信息选择界面中第二控件的触发操作以获取目标信息和待处理图像;基于动画模块和所述目标信息对待处理图像执行目标操作,以获取与待处理图像对应的动画图像;在视频通话终端设备的显示界面中显示动画图像,视频通话终端设备是所有视频通话方中至少一方所使用的终端设备。本申请能够简化对图像进行动画处理的流程,为用户提供更多的可选动画效果,提高视频通话时的趣味性和互动性,并且提高产品的用户体验和用户粘度。体验和用户粘度。体验和用户粘度。
技术研发人员:陈姿
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.03.25
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
