一种人工智能视频处理装置
未命名
08-02
阅读:141
评论:0
1.本发明涉及视频处理技术领域,具体涉及一种人工智能视频处理装置。
背景技术:
2.人工智能技术也被称作为ai技术。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术,人工智能领域包括机器人、语言识别、图像识别、自然语言处理和专家系统等。从诞生以来,人工智能理论和技术变得越来越成熟,其应用的行业也变得越来越广。由此可见,未来的人工智能领域的科技产品将会是人类智慧的「容器」。人工智能将会对人的意识、思维等相关信息进行模拟。人工智能本质上不是人的智能,但它可以像人一样思考,甚至能够超过人类的智商。
3.在信息技术飞速发展的背景之下,人工智能技术逐步融入人们的日常生产和生活中,同时也发挥出了越来越重要的作用,尽管现阶段人工智能属于「用人工智能」的范畴,离不开人类主体自行运行。借助人工智能能够有效减轻人们的工作强度和工作压力,也有效提升了相关工作人员的工作效率,但是在影像数据流中,影像数据将会频繁进出中央处理器与内存之间,且依序处理整张画面后,才能再处理下一张画面,将造成中央处理器忙碌与内存带宽使用效益下降。
技术实现要素:
4.为克服现有技术所存在的缺陷,现提供一种人工智能视频处理装置,以解决影像数据将会频繁进出中央处理器与内存之间,且依序处理整张画面后,才能再处理下一张画面,将造成中央处理器忙碌与内存带宽使用效益下降的问题。
5.一种人工智能视频处理装置,所述装置包括预处理模块,所述预处理模块网络连接有编码模块、传输模块以及解码模块,所述编码模块、传输模块以及解码模块共同网络连接有后处理模块,所述后处理模块网络连接有播放模块;
6.所述编码模块包括智能编码处理器以及存储单元,所述智能编码处理器以及存储单元之间电性连接;
7.所述解码模块设置有视频数据接收接口,所述视频数据接收接口电性连接显示设备;
8.所述智能编码处理器通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动;
9.所述后处理模块用于将视频数据转换为色彩空间,并对图像尺寸进行缩放;
10.所述后处理模块电性连接有中央处理器,所述中央处理器电性连接有数据库。
11.优选的,所述数据库通过中央处理器接收的动作判断结果,然后输出对应的反馈信号,进而提供自动的数据变化的全面监控。
12.优选的,所述智能编码处理器电性连接有动态编码器,所述动态编码器的编码时间与码率正相关。
13.优选的,所述动态编码器使用不变码率abr。
14.优选的,所述编码模块从存储单元提取预处理后的视频数据,并对预处理后的视频数据进行处理,并将处理结果输出至显示设备。
15.优选的,所述播放模块还可以进行精准的广告投放,在解码模块解码后,数据库发送原始视频流,然后再发送后期合成物体的定位方法和图像数据,以便播放模块按照需求进行动态合成。
16.优选的,所述后处理模块可以对人脸进行搜索比对,快速检测并定位人脸,返回高精度的人脸框坐标、轮廓关键点以及三维坐标。
17.优选的,所述后处理模块还包括对视频影像资料的修复,可以借助人工智能技术修复老旧视频,使其画面变得更加流畅和清晰。
18.优选的,所述后处理模块还可以进行字幕提取,针对视频内容中的同期声音配上相应的字幕。
19.优选的,所述智能编码处理器能够实现智能视频的编目和解锁,从而使其根据视频内容的具体需求自主识别,并且把主体要素和视频内容进行有效关联。
20.本发明的有益效果在于:
21.1、可以将视频数据的预处理过程从处理器分离出来,从而降低中央处理器的负载,并提升存储介质的带宽使用率,提高视频数据处理效率,缩短运算时间。
22.2、可以借助视频字幕进行同期声字幕处理,从而帮助人们更好的理解视频解说中的内容。
23.3、可以借助人脸识别、文字识别、语音识别和场景识别等功能,在文献中查证不同的文字内容和信息内容,使其能够快速定位到相应的片段中,实现相关信息的有效链接。这可以把各个视频进行关联和调度,能够缩减人工查询时间,达到提升视频质量的目的。
附图说明
24.图1为本发明的流程框图;
25.图2为本发明的使用方法流程图;
26.图3为本发明的中央处理器的内部示意图。
具体实施方式
27.以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
28.参照图1,一种人工智能视频处理装置,装置包括预处理模块,预处理模块网络连接有编码模块、传输模块以及解码模块,编码模块、传输模块以及解码模块共同网络连接有后处理模块,后处理模块网络连接有播放模块,编码模块包括智能编码处理器以及存储单元,智能编码处理器以及存储单元之间电性连接,解码模块设置有视频数据接收接口,视频数据接收接口电性连接显示设备,智能编码处理器通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动,使用动态参数配置来编码,
保证编码的实时性和限定码率下最好的图像质量,后处理模块用于将视频数据转换为色彩空间,并对图像尺寸进行缩放,用于去除噪声的图像去噪模块,后处理模块电性连接有中央处理器,中央处理器电性连接有数据库。
29.作为一种较佳的实施方式,数据库通过中央处理器接收的动作判断结果,然后输出对应的反馈信号,进而提供自动的数据变化的全面监控。
30.作为一种较佳的实施方式,智能编码处理器电性连接有动态编码器,动态编码器的编码时间与码率正相关,在码率暴涨的同时,编码时间也剧烈延长,动态编码器在低延时需求强烈的直播应用,会造成严重的卡顿,动态编码器使用不变码率abr。
31.作为一种较佳的实施方式,编码模块从存储单元提取预处理后的视频数据,并对预处理后的视频数据进行处理,并将处理结果输出至显示设备。
32.作为一种较佳的实施方式,播放模块还可以进行精准的广告投放,在解码模块解码后,数据库发送原始视频流,然后再发送后期合成物体的定位方法和图像数据,以便播放模块按照需求进行动态合成,一种是在编码前合成到视频里面,这个过程跟编码关系不大。但是直接合成到视频之后,所有的观众看到的内容就都一样。
33.精准的广告投放,就只有在播放端解码后合成。要做到这点,服务器不仅要发送原始视频流,还要发送后期合成物体的定位方法和图像数据,以便客户端按照需求进行动态合成。首先,自动植入的广告跟前贴片比起来优势很明显,可以植入的广告数量非常巨大,效果也更自然,用户也不会产生明显的反感。其次,个性化精准投放,又进一步扩大了广告投放的总容量和效率,除了字幕、广告外,还可以提供水印、静态或动态logo等功能。
34.作为一种较佳的实施方式,后处理模块可以对人脸进行搜索比对,快速检测并定位人脸,返回高精度的人脸框坐标、轮廓关键点以及三维坐标,实现企业、商业、住宅等多种场景的刷脸进门等功能,提升安全性、效率和用户体验用。
35.作为一种较佳的实施方式,后处理模块还包括对视频影像资料的修复,主要是补足帧率,由于老旧视频在拍摄过程中受到相关条件的影响,因此通常情况下都会带有卡顿、闪烁等问题,可以借助人工智能技术修复老旧视频,使其画面变得更加流畅和清晰。
36.作为一种较佳的实施方式,后处理模块还可以进行字幕提取,针对视频内容中的同期声音配上相应的字幕。通常情况下,该做法都会应用到会议和采访中,工作人员在录制视频时所采用的是远景拍摄方法,而由于外部杂音过大,无法把整个演讲内容同步录入视频介绍中。在这种情况下,我们可以借助视频字幕进行同期声字幕处理,从而帮助人们更好的理解视频解说中的内容。传统形式下的视频编辑工作是借助人们所听到的文字进行翻译,并且还需要针对字幕的同步时间和同步语速、音调进行调节,此时翻译内容极易出现一些误差和错误。
37.作为一种较佳的实施方式,智能编码处理器能够实现智能视频的编目和解锁,从而使其根据视频内容的具体需求自主识别,并且把主体要素和视频内容进行有效关联。例如,可以借助人脸识别、文字识别、语音识别和场景识别等功能,在文献中查证不同的文字内容和信息内容,使其能够快速定位到相应的片段中,实现相关信息的有效链接。这可以把各个视频进行关联和调度,能够缩减人工查询时间,达到提升视频质量的目的。
38.本发明使用时,可以实现企业、商业、住宅等多种场景的刷脸进门等功能,提升安全性、效率和用户体验用在补帧率时,由于老旧视频在拍摄过程中受到相关条件的影响,因
此通常情况下都会带有卡顿、闪烁等问题,可以借助人工智能技术修复老旧视频,使其画面变得更加流畅和清晰,字幕提取可以针对视频内容中的同期声音配上相应的字幕。通常情况下,该做法都会应用到会议和采访中,工作人员在录制视频时所采用的是远景拍摄方法,而由于外部杂音过大,无法把整个演讲内容同步录入视频介绍中。在这种情况下,我们可以借助视频字幕进行同期声字幕处理,从而帮助人们更好的理解视频解说中的内容。传统形式下的视频编辑工作是借助人们所听到的文字进行翻译,并且还需要针对字幕的同步时间和同步语速、音调进行调节,此时翻译内容极易出现一些误差和错误,智能编码处理器能够实现智能视频的编目和解锁,从而使其根据视频内容的具体需求自主识别,并且把主体要素和视频内容进行有效关联。例如,可以借助人脸识别、文字识别、语音识别和场景识别等功能,在文献中查证不同的文字内容和信息内容,使其能够快速定位到相应的片段中,实现相关信息的有效链接。这可以把各个视频进行关联和调度,能够缩减人工查询时间,达到提升视频质量的目的。
39.以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为保护范围。
技术特征:
1.一种人工智能视频处理装置,其特征在于:所述装置包括预处理模块,所述预处理模块网络连接有编码模块、传输模块以及解码模块,所述编码模块、传输模块以及解码模块共同网络连接有后处理模块,所述后处理模块网络连接有播放模块;所述编码模块包括智能编码处理器以及存储单元,所述智能编码处理器以及存储单元之间电性连接;所述解码模块设置有视频数据接收接口,所述视频数据接收接口电性连接显示设备;所述智能编码处理器通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动;所述后处理模块用于将视频数据转换为色彩空间,并对图像尺寸进行缩放;所述后处理模块电性连接有中央处理器,所述中央处理器电性连接有数据库。2.根据权利要求1所述的一种人工智能视频处理装置,其特征在于:所述数据库通过中央处理器接收的动作判断结果,然后输出对应的反馈信号,进而提供自动的数据变化的全面监控。3.根据权利要求1所述的一种人工智能视频处理装置,其特征在于:所述智能编码处理器电性连接有动态编码器,所述动态编码器的编码时间与码率正相关。4.根据权利要求3所述的一种人工智能视频处理装置,其特征在于:所述动态编码器使用不变码率abr。5.根据权利要求1所述的一种人工智能视频处理装置,其特征在于:所述编码模块从存储单元提取预处理后的视频数据,并对预处理后的视频数据进行处理,并将处理结果输出至显示设备。6.根据权利要求5所述的一种人工智能视频处理装置,其特征在于:所述播放模块还可以进行精准的广告投放,在解码模块解码后,数据库发送原始视频流,然后再发送后期合成物体的定位方法和图像数据,以便播放模块按照需求进行动态合成。7.根据权利要求6所述的一种人工智能视频处理装置,其特征在于:所述后处理模块可以对人脸进行搜索比对,快速检测并定位人脸,返回高精度的人脸框坐标、轮廓关键点以及三维坐标。8.根据权利要求7所述的一种人工智能视频处理装置,其特征在于:所述后处理模块还包括对视频影像资料的修复,可以借助人工智能技术修复老旧视频,使其画面变得更加流畅和清晰。9.根据权利要求8所述的一种人工智能视频处理装置,其特征在于:所述后处理模块还可以进行字幕提取,针对视频内容中的同期声音配上相应的字幕。10.根据权利要求1所述的一种人工智能视频处理装置,其特征在于:所述智能编码处理器能够实现智能视频的编目和解锁,从而使其根据视频内容的具体需求自主识别,并且把主体要素和视频内容进行有效关联。
技术总结
本发明提供了一种人工智能视频处理装置,所述装置包括预处理模块,所述预处理模块网络连接有编码模块、传输模块以及解码模块,所述编码模块、传输模块以及解码模块共同网络连接有后处理模块,所述后处理模块网络连接有播放模块,所述编码模块包括智能编码处理器以及存储单元,所述智能编码处理器以及存储单元之间电性连接,所述解码模块设置有视频数据接收接口,所述视频数据接收接口电性连接显示设备,所述智能编码处理器通过监督学习将常见视频编码卡顿场景分类并快速识别,提前预判视频场景的编码复杂度和码率抖动,所述后处理模块用于将视频数据转换为色彩空间,本发明可以借助视频字幕进行同期声字幕处理,从而帮助人们更好的理解视频解说中的内容。好的理解视频解说中的内容。
技术研发人员:陈芳 刘仲博 张利伟 纳芳 刘怡琳 刘昱彤
受保护的技术使用者:宁夏职业技术学院(宁夏开放大学)
技术研发日:2023.03.29
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
