数字视频水印方法和装置、设备及存储介质

未命名 07-27 阅读:104 评论:0


1.本技术涉及人工智能技术领域,尤其涉及一种数字视频水印方法和装置、设备及存储介质。


背景技术:

2.数字水印是一种在信息隐藏研究领域的重要技术,数字水印方法是将特定意义的水印信息以肉眼不可见的方式嵌入到图像、视频、音频和文档等数字产品中。在相关技术中,数字视频水印分为两大类:一类是通过人工设计视频图像特征来进行水印嵌入的传统方法,另一类是通过深度神经网络来学习视频图像特征来进行水印嵌入的深度学习方法。研究人员精心设计水印的嵌入和提取方法,通常能在特定的视频噪声上鲁棒性表现出色,但是难以同时抵抗多种视频噪声。若通过深度神经网络学习图像特征,由于视频的数据量远远大于图片,训练用于数字视频水印的深度神经网络所需的计算资源也是远超数字图片水印。因此,基于深度学习的数字视频水印方法相对于基于深度学习的数字图片水印方法发展缓慢。因此,亟待一种能够抵抗噪声且能够基于深度学习的数字图片水印方法直接在数字视频水印方法中使用的数字视频水印方法。


技术实现要素:

3.本技术实施例的主要目的在于提出一种数字视频水印方法和装置、设备及存储介质,旨在构建高不可见性、高鲁棒性和抵抗噪声的数字视频水印网络,以提高水印植入的视频质量和水印解码的鲁棒性。
4.为实现上述目的,本技术实施例的第一方面提出了一种数字视频水印方法,所述方法包括:
5.获取原始视频数据和原始水印信息;其中,所述原始视频数据包括:通道维度信息和时间维度信息;
6.将所述原始视频数据的所述通道维度信息和所述时间维度信息进行合并处理,得到训练视频数据;
7.将所述训练视频数据和所述原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据;其中,所述原始数字视频水印网络通过对数字图片神经网络的数据通道数修改得到;
8.将预设的噪声数据增加至所述原始水印视频数据,得到噪声水印视频数据;其中,所述噪声数据从预设的噪声数据库随机选取;
9.将所述噪声水印视频数据输入至所述原始数字视频水印网络进行解码处理,得到预测水印信息;
10.根据所述训练视频数据、所述原始水印视频数据、所述预测水印信息和所述原始水印信息进行损失计算,得到目标损失数据;
11.根据所述目标损失数据对所述原始数字视频水印网络进行参数调整,得到目标数
字视频水印网络;
12.获取目标视频数据,将所述目标视频数据输入至所述目标数字视频水印网络进行水印植入,得到目标水印视频数据。
13.在一些实施例,在所述获取目标视频数据,将所述目标视频数据输入至所述目标数字视频水印网络进行水印植入,得到目标水印视频数据之后,所述方法还包括:
14.获取待处理水印视频数据;
15.将所述待处理水印视频数据输入至所述目标数字视频水印网络进行解码处理,得到目标水印信息。
16.在一些实施例,所述原始数字视频水印网络包括:编码器和解码器;
17.所述将所述训练视频数据和所述原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据,包括:
18.将所述训练视频数据和所述原始水印信息输入至所述编码器进行编码处理,得到所述原始水印视频数据;
19.所述将所述噪声水印视频数据输入至所述原始数字视频水印网络进行解码处理,得到预测水印信息,包括:
20.将所述噪声水印视频数据输入至所述解码器进行解码处理,得到所述预测水印信息。
21.在一些实施例,所述将预设的噪声数据增加至所述原始水印视频数据,得到噪声水印视频数据,包括:
22.获取所述噪声数据的噪声信息;
23.若所述噪声信息表征为非h264噪声,将所述噪声数据加入所述原始水印视频数据,得到所述噪声水印视频数据;
24.若所述噪声信息表征为h264噪声,根据预设的前向攻击模拟层和所述噪声数据,或者根据所述训练视频数据对所述原始水印视频数据进行噪声加入,得到所述噪声水印视频数据。
25.在一些实施例,所述若所述噪声信息表征为h264噪声,根据预设的前向攻击模拟层和所述噪声数据,或者根据所述训练视频数据对所述原始水印视频数据进行噪声加入,得到所述噪声水印视频数据,包括:
26.若所述噪声信息表征为h264噪声,根据所述训练视频数据进行噪声模拟,得到模拟噪声数据,并将所述模拟噪声数据输入至所述原始水印视频数据,得到所述噪声水印视频数据;
27.或者,
28.若所述噪声信息表征为h264噪声,将所述噪声数据输入至所述原始水印视频数据得到噪声水印视频数据,根据所述前向攻击模拟层对所述原始水印视频数据和所述训练视频数据进行差值计算,得到视频数据差值,将所述视频数据差值设置为不参与所述原始数字视频水印网络训练过程梯度的反向传播,并将所述视频数据差值加入至所述原始水印视频数据,得到所述噪声水印视频数据。
29.在一些实施例,所述若所述噪声信息表征为h264噪声,根据所述训练视频数据进行噪声模拟,得到模拟噪声数据,并将所述模拟噪声数据输入至所述原始水印视频数据,得
到所述噪声水印视频数据,包括:
30.若所述噪声信息表征为h264噪声,对所述训练视频数据进行离散余弦变换处理,得到初步视频频域信息;
31.将所述初步视频频域信息中预设频域区域以外的信息设置为零,得到候选视频频域信息;其中,所述预设频域区域为左上角区域;
32.对所述候选视频频域信息进行离散余弦反变换处理,得到所述模拟噪声数据;
33.将所述模拟噪声数据输入至所述原始水印视频数据,得到所述噪声水印视频数据。
34.在一些实施例,所述根据所述训练视频数据、所述原始水印视频数据、所述预测水印信息和所述原始水印信息进行损失计算,得到目标损失数据,包括:
35.对所述训练视频数据和所述原始水印视频数据进行均方误差计算,得到视频损失数据;
36.对所述预测水印信息和所述原始水印信息进行均方误差计算,得到水印损失数据。
37.为实现上述目的,本技术实施例的第二方面提出了一种数字视频水印装置,所述装置包括:
38.数据获取模块,用于获取原始视频数据和原始水印信息;其中,所述原始视频数据包括:通道维度信息和时间维度信息;
39.维度合并模块,用于将所述原始视频数据的所述通道维度信息和所述时间维度信息进行合并处理,得到训练视频数据;
40.编码模块,用于将所述训练视频数据和所述原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据;其中,所述原始数字视频水印网络通过对数字图片神经网络的数据通道数修改得到;
41.噪声添加模块,用于将预设的噪声数据增加至所述原始水印视频数据,得到噪声水印视频数据;其中,所述噪声数据从预设的噪声数据库随机选取;
42.解码模块,用于将所述噪声水印视频数据输入至所述原始数字视频水印网络进行解码处理,得到预测水印信息;
43.损失计算模块,用于根据所述训练视频数据、所述原始水印视频数据、所述预测水印信息和所述原始水印信息进行损失计算,得到目标损失数据;
44.参数调整模块,用于根据所述目标损失数据对所述原始数字视频水印网络进行参数调整,得到目标数字视频水印网络;
45.水印植入模块,用于获取目标视频数据,将所述目标视频数据输入至所述目标数字视频水印网络进行水印植入,得到目标水印视频数据训练视频数据训练视频数据训练视频数据。
46.为实现上述目的,本技术实施例的第三方面提出了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。
47.为实现上述目的,本技术实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一
方面所述的方法。
48.本技术提出的数字视频水印方法和装置、设备及存储介质,其将视频数据的通道维度信息和时间维度信息合并以将视频数据降到图片维度,且数字视频水印网络通过对数字图片水印网络修改数据通道数得到,所以数字视频水印网络可以处理降了维度的视频数据,以实现将一个基于深度学习的数字图片水印方法应用于数字视频水印。然后在视频数据中加入噪声数据后再对水印视频数据解码,以构建能够处理带有噪声水印视频数据的数字视频水印网络。因此,本技术所构建的数字视频水印网络在保证数字视频水印网络所需的计算资源和原本数字图片水印方法相似的同时,取得了高不可见性和高鲁棒性。
附图说明
49.图1是本技术实施例提供的数字视频水印方法的流程图;
50.图2是本技术另一实施例提供的数字视频水印方法的流程图;
51.图3是图1中的步骤s104的流程图;
52.图4是图3中的步骤s303的流程图;
53.图5是图4中的步骤s401的流程图;
54.图6是图1中的步骤s107的流程图;
55.图7是本技术另一实施例提供的数字视频水印方法的流程图;
56.图8是本技术实施例提供的数字视频水印装置的结构示意图;
57.图9是本技术实施例提供的电子设备的硬件结构示意图。
具体实施方式
58.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
59.需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
60.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
61.首先,对本技术中涉及的若干名词进行解析:
62.人工智能(artificial intelligence,ai):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
63.数字水印(digital watermark):数字水印一种应用计算机算法嵌入载体文件的保护信息。数字水印技术,是一种基于内容的、非密码机制的计算机信息隐藏技术。数字水印是将一些标识信息(即数字水印)直接嵌入数字载体当中(包括多媒体、文档、软件等)或是间接表示(修改特定区域的结构),且不影响原载体的使用价值,也不容易被探知和再次修改。但可以被生产方识别和辨认。通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是保护信息安全、实现防伪溯源、版权保护的有效办法,是信息隐藏技术研究领域的重要分支和研究方向。
64.h264:h264是一种高性能的视频编解码技术,同时也是mpeg-4第十部分,是由itu-t视频编码专家组(vceg),和iso/iec动态图像专家组(mpeg)联合组成的联合视频组(jvt,joint video team)提出的高度压缩数字视频编解码器标准。
65.离散余弦变换(discrete cosine transform,dct):离散余弦变换是与傅里叶变换相关的一种变换,类似于离散傅里叶变换,但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数),在有些变形里面需要将输入或者输出的位置移动半个单位(dct有8种标准类型,其中4种是常见的)。
66.峰值信噪比(peak s igna l-to-noi se rat io,psnr):表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围,峰值信噪比常用对数分贝单位来表示。在数字视频水印中,原始视频数据和水印视频数据之间的峰值信噪比用作水印视频数据的质量测量。psnr越高,水印视频数据的质量就越好。
67.数字水印是一种在信息隐藏研究领域的重要技术,数字水印将具有特定意义的水印信息以肉眼不可见的方式嵌入在图像、视频、音频、文档等数字产品中,通过对水印信息的提取和还原,以证明作品拥有者对其作品的所有权,并作为鉴别非法侵权的证据,从而成为版权保护和数字多媒体产品防伪的有效手段。
68.目前,大部分的水印研究和论文都集中在图像研究上,因为图像是最常见的媒体产品。随着计算机和互联网技术的发展,视频在当前通信世界中的占比越来越大,被广泛应用于新闻、短视频和在线视频网站中。但是由于视频处理工具的不断进步,数字视频内容容易被侵权,数字视频使用肆意复制和传播的问题也日益严重。为了保护和声明视频的所有权,人们提出了多种解决方法,数字视频水印是其中一种重要的技术手段。其中,数字视频水印的流程主要分为两个部分:水印嵌入过程和水印提取过程。在水印嵌入过程中,原始视频通过数字视频水印方法将水印信息嵌入到视频中,包含水印信息和视频为水印视频。在水印提取过程中,数字视频水印方法负责将水印视频的水印信息提取出来,可用于视频所有权的声明和保护。评判数字视频水印性能的指标有水印容量,不可见性和鲁棒性。水印容量是数字视频水印方法能嵌入到视频中的水印信息大小,不可见性是指肉眼是否可以察觉视频中水印的存在,一般通过比较原始视频和水印视频之间的差别来量化不可见性。鲁棒性为数字视频水印方法抵抗各种常见视频噪声的能力,即水印视频在加入视频噪声后水印信息是否还能正常从水印视频中被提取出来。在数字视频水印中,更加关注不可见性和鲁棒性上面的性能。相关技术中,数字视频水印可大致分为两大类:一类是通过人工设计视频图像特征来进行水印嵌入的传统方法,另一类是通过深度神经网络来学习视频图像特征来
进行水印嵌入的深度学习方法。传统方法大多是在视频中的特殊区域上通过特定的算法修改视频像素信息来进行水印嵌入,需要研究人员精心设计水印的嵌入和提取方法,通常能在特定的视频噪声上鲁棒性表现出色,但是难以同时抵抗多种视频噪声。深度学习方法将深度神经网络应用于数字视频水印,通过在训练中加入各种视频噪声来提高水印方法的鲁棒性,从而能够同时抵抗多种视频噪声。但是由于视频的数据量远远大于图片,训练用于数字视频水印的深度神经网络所需的计算资源也是远超数字图片水印。因此,基于深度学习的数字视频水印方法相对于基于深度学习的数字图片水印方法发展缓慢。
69.基于此,本技术合并原始视频数据中的通道维度信息和时间维度信息得到训练视频数据,且将数字图片水印网络修改原本通道数以得到原始数字视频水印网络,所以原始数字视频水印网络可以处理训练视频数据,以实现基于深度学习的数字图片水印方法应用于数字视频水印。同时将噪声加入到原始水印视频数据后再通过原始数字视频水印网络解码得到预测水印信息,以根据训练视频数据、原始水印视频数据、原始水印信息和预测水印信息的目标损失数据来分析原始数字视频水印网络解码水印的鲁棒性和生成始水印视频的质量,以根据目标损失数据对原始水印网络进行调整以得到目标水印网络,以构建解码水印鲁棒性更优且生成水印视频质量更优的目标水印视频网络,以实现基于目标水印网络对原始视频数据添加水印,生成视频质量更优的水印视频。
70.本技术实施例提供的数字视频水印方法和装置、设备及存储介质,具体通过如下实施例进行说明,首先描述本技术实施例中的数字视频水印方法。
71.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
72.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
73.本技术实施例提供的数字视频水印方法,涉及人工智能技术领域。本技术实施例提供的数字视频水印方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现数字视频水印方法的应用等,但并不局限于以上形式。
74.本技术可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例
程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
75.需要说明的是,在本技术的各个具体实施方式中,当涉及到需要根据用户信息、用户行为数据、用户视频数据,用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时,都会先获得用户的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关国家和地区的相关法律法规和标准。此外,当本技术实施例需要获取用户的敏感个人信息时,会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意,在明确获得用户的单独许可或者单独同意之后,再获取用于使本技术实施例能够正常运行的必要的用户相关数据。
76.图1是本技术实施例提供的数字视频水印方法的一个可选的流程图,图1中的方法可以包括但不限于包括步骤s101至步骤s108。
77.步骤s101,获取原始视频数据和原始水印信息;其中,原始视频数据包括:通道维度信息和时间维度信息;
78.步骤s102,将原始视频数据的通道维度信息和时间维度信息进行合并处理,得到训练视频数据;
79.步骤s103,将训练视频数据和原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据;其中,原始数字视频水印网络通过对数字图片神经网络的数据通道数修改得到;
80.步骤s104,将预设的噪声数据增加至原始水印视频数据,得到噪声水印视频数据;其中,噪声数据从预设的噪声数据库随机选取;
81.步骤s105,将噪声水印视频数据输入至原始数字视频水印网络进行解码处理,得到预测水印信息;
82.步骤s106,根据训练视频数据、原始水印视频数据、预测水印信息和原始水印信息进行损失计算,得到目标损失数据;
83.步骤s107,根据目标损失数据对原始数字视频水印网络进行参数调整,得到目标数字视频水印网络;
84.步骤s108,获取目标视频数据,将目标视频数据输入至目标数字视频水印网络进行水印植入,得到目标水印视频数据。
85.申请实施例所示意的步骤s101至步骤s108,通过获取原始视频数据后,先将原始视频数据的通道维度信息和时间维度信息合并得到训练视频数据,以将五维的视频数据变成四维的图像数据,所以原始数字视频水印网络能够处理四维的训练视频数据,然后将训练视频数据和原始水印信息输入至原始数字视频水印网络进行编码处理得到原始水印视频数据,再添加噪声数据在原始水印视频数据上得到噪声水印视频数据。通过原始数字视频水印网络对噪声水印视频数据解码得到预测水印信息,然后基于原始水印视频数据、训练视频数据、预测水印信息和原始水印信息计算目标损失数据,以根据目标损失数据确定原始数字视频水印网络的水印鲁棒性和水印视频的质量,然后根据目标损失数据对原始数字视频水印网络进行参数调整,直至目标损失数据收敛得到目标数字视频水印网络,以构建具备水印鲁棒性和水印视频质量更优的目标数字视频水印网络,进而通过目标数字视频
水印网络将原始视频数据生成目标水印视频数据,以得到质量更优的目标水印视频数据。因此,提前将数字图片水印网络修改数据通道数得到原始数字视频水印网络,再将视频数据的通道维度信息和时间维度信息合并以将视频数据的维度降到图片维度,那么训练视频数据就可以基于深度学习的原始数字视频水印网络处理,以实现将一个基于深度学习的数字图片水印方法应用于数字视频水印。在视频数据中加入噪声数据后再对水印视频数据解码,构建能够处理带有噪声水印视频数据的目标数字视频水印网络。因此,本技术构建的目标数字视频水印网络在保证目标数字视频水印网络所需的计算资源和原本数字图片水印方法相似的同时,取得了高不可见性和高鲁棒性。
86.在一些实施例的步骤s101中,可以从预设的视频数据库中提取出原始视频数据,且原始数据视频都是未添加水印的视频数据。也可以通过其他方式实时接收来自终端上传的原始视频数据,对原始视频数据的获取不限于此。例如,若数字视频水印方法应用于短视频软件,为了保证视频创作者的权益,当视频创作者将原始视频数据上传后经过短视频软件的后台进行内容审核,审核通过后将原始视频数据和创作者的身份标识信息一起存储预设的视频数据库中,然后在进行数字视频水印过程中按照时间先后顺序从视频数据库中提取出原始视频数据,以对原始视频数据增加水印信息。
87.需要说明的是,原始水印信息根据预设的视频数据库中提取的创作者的身份标识信息生成,且每一原始视频数据对应的身份标识信息是唯一的,以根据唯一的身份标识信息生成原始水印信息。其中,原始水印信息的水印类别包括以下至少一种:文字、图片、字母、图标,且对水印类别不做具体限制。
88.需要说明的是,原始视频数据包括:通道维度信息、时间维度信息、批量大小维度信息、视频帧高度信息、视频帧宽度信息。通过原始视频数据的五个维度以确定原始视频数据的批量大小、视频通道数量、视频帧数量、视频帧的高和宽。
89.在一些实施例的步骤s102中,为了训练目标数字视频水印网络能够添加水印信息准确,将训练视频数据构建成训练数据集,且构建1000个ki net ics训练数据集对原始数字视频水印网络进行训练,并通过1000个ki net ics的测试数据集来评估原始数字视频水印网络,且测试数据集包括原始数字视频水印网络输出的原始水印视频数据和预测水印信息。其中,整个原始数字视频水印网络的训练通过pytorch实现的,运行在nvi d ia-a100上。为了突显本技术构建目标数字视频水印网络的效果,所选用的训练视频数据的尺寸大小为8
×
128
×
128,原始水印信息的长度为96和64比特,且原始水印信息随机从预设的视频数据库采样出的身份标识信息生成。
90.由于原始视频数据包含了五个维度,但原始数字视频水印网络仅能够处理四维的图片数据。因此,需要将五个维度的原始视频数据进行降维处理,以便于原始数字视频水印网络处理。在一些实施例的步骤s102中,通过将视频的通道维度信息和时间维度信息合并得到四维的训练视频数据,以使数字图片水印神经网络的原始数字视频水印网络能够处理训练视频数据。例如,若通道维度信息为c,时间维度信息为l,批量大小维度信息为b,视频帧高度信息为h,视频帧宽度信息为w,那么原始视频数据为五个维度分别为(b,c,l,h,w),将原始视频数据变成四个维度后对应的维度为(b,c
×
l,h,w),也即变成原始数字视频水印网络可以处理的图像数据,实现基于深度学习的数字图片水印方法应用于数字视频水印。在步骤s103之前,需要将基于深度学习的数字图片水印方法应用于数字视频水印,所以需
要将数字图片水印网络修改为原始数字视频水印网络,通过调整数字图片水印网络的数据通道数,以将原本的数据通道数c改为c*l,且c为视频数据的通道维度信息,通常为rgb三通道,l为视频数据的帧数,也即视频数据的时间维度信息。因此,通过在数字图片水印网络上构建原始数字视频水印网络,以实现将深度学习的数字图片水印方法应用于数字视频水印上。
91.在一些实施例中,请参照图2,原始数字视频水印网络包括:编码器和解码器;步骤s103可以包括但不限于包括步骤s201:
92.步骤s201,将训练视频数据和原始水印信息输入至编码器进行编码处理,得到原始水印视频数据。
93.完成训练视频数据构建之后,也即确定了原始数字视频水印网络可以处理四维的训练视频数据,在一些实施例的步骤s201中,将训练视频数据输入至原始数字视频水印网络,通过原始数字视频水印网络的编码器将原始水印信息和训练视频数据进行编码处理得到原始水印视频数据,以实现水印自动植入。
94.具体地,水印的嵌入过程,目的是把原始水印信息嵌入进训练视频数据中,得到原始水印视频数据。其中,所生成的原始水印视频数据需要和原始视频数据尽可能的相同,即水印方法的不可见性,且衡量原始数字视频水印网络能够实现水印方法不可见性的量化指标为psnr值。
95.需要说明的是,训练原始数字视频水印网络之前,需要将数字图片水印网络的编码器中的第一个二维卷积层的输入通道数和最后一个二维卷积层的输出通道数从c改为c*l即可,以构建能够处理四维的训练视频数据的编码器。因此,实现基于深度学习的数字图片水印方法应用到数字视频水印。
96.请参阅图3,在一些实施例中,步骤s104可以包括但不限于包括步骤s301至步骤s303:
97.步骤s301,获取噪声数据的噪声信息;
98.步骤s302,若噪声信息表征为非h264噪声,将噪声数据加入原始水印视频数据,得到噪声水印视频数据;
99.步骤s303,若噪声信息表征为h264噪声,根据预设的前向攻击模拟层和噪声数据,或者根据训练视频数据对原始水印视频数据进行噪声加入,得到噪声水印视频数据。
100.在一些实施例的步骤s301中,由于h264噪声是不可微,若带有h264噪声的噪声水印视频数据导致神经网络的原始数字视频水印网络在学习中无法传递梯度,导致原始数字视频水印网络无法学习,因此在将噪声数据添加至原始水印视频数据时,需要获取噪声数据的噪声信息,并根据噪声信息判断噪声数据是否为h264噪声,且h264噪声是高级视频压缩编码所产生的噪声,以根据噪声信息确定噪声数据加入到训练视频数据的方式。
101.需要说明的是,h264是最常用的视频压缩编码格式,可以通过crf参数来调节压缩率,crf值的范围为0~51,crf值越大,压缩率越大。在本实施例采用的crf值为22。
102.在一些实施例的步骤s302中,若噪声信息表征为非h264噪声,直接将噪声数据加入原始水印视频数据,得到噪声水印视频数据,以构建可以让原始数字视频水印网络处理的噪声水印视频数据。
103.需要说明的是,若噪声信息表征为非h264噪声,那么噪声信息可以是以下任意一
种:高斯噪声、高斯过滤器、视频帧交换、视频帧平均、裁剪攻击、调色攻击。
104.高斯白噪声(gauss ian noi se,gn):可通过标准差来调节高斯噪声强度。在本实施例采用的高斯噪声标准差为0.04。
105.高斯过滤器(gauss ian fi lter,gf):视频数据加入高斯模糊效果,可通过方差来调节高斯过滤器强度,在本实施例采用的高斯过滤器方差为2。
106.视频帧交换(frame swap,fs):以概率p将当前视频帧替换为视频中的其他帧。在本实施例采用的概率p为50%。
107.视频帧平均(frame average,fa):将当前帧替换为当前帧与前后两帧的平均值。
108.视频帧还原(frame drop,fd):以概率p将水印视频中的视频帧替换为原始视频中的对应视频帧。本实施例采用的概率p为50%。
109.裁剪攻击(crop):裁剪视频帧,只保留p比率的像素值。本实施例采用的p为40%。
110.调色攻击(hue):调色攻击改变视频色调,改变的范围为-0.5~0.5,我们在实验中使用随机采样选取改变的数值。
111.在一些实施例的步骤s303中,若噪声信息表征为h264噪声,若直接加入h264噪声至原始水印视频数据无法训练原始数字视频水印网络。所以通过前向攻击模拟层和噪声数据对预测水印数据进行噪声加入,或者根据训练视频数据对原始水印视频数据进行噪声加入得到噪声水印视频数据,以不采用直接加入h264噪声的方式增加噪声至原始水印视频数据,减少因为h264噪声影响原始数字视频水印网络的学习影响。
112.在本技术实施例所示意的步骤s301至步骤s303,通过判断噪声信息是否为h264噪声后,采用不同的方式在原始水印视频数据中增加水印信息,以减少因为h264噪声影响原始数字视频水印网络的学习。
113.请参阅图4,在一些实施例中,步骤s303可以包括步骤s401,或者步骤s402:
114.步骤s401,若噪声信息表征为h264噪声,根据训练视频数据进行噪声模拟,得到模拟噪声数据,并将模拟噪声数据输入至原始水印视频数据,得到噪声水印视频数据;
115.步骤s402,若噪声信息表征为h264噪声,将噪声数据输入至原始水印视频数据得到噪声水印视频数据,根据前向攻击模拟层对原始水印视频数据和训练视频数据进行差值计算,得到视频数据差值,将视频数据差值设置为不参与原始数字视频水印网络训练过程梯度的反向传播,并将视频数据差值加入至原始水印视频数据,得到噪声水印视频数据。
116.在一些实施例的步骤s401和步骤s402,若噪声信息为h264噪声,通过根据训练视频数据进行噪声模拟以得到模拟噪声数据,再将模拟噪声数据添加至原始水印视频数据得到噪声水印视频数据。或者,通过前向攻击模拟层将原始水印视频数据和训练视频数据之间的视频数据差值,且将视频数据差值设置为不参与原始数字视频水印网络训练过程梯度的反向传播,再将视频数据差值加入到原始水印视频数据得到噪声水印视频数据。因此,模拟h264噪声或者通过前向攻击模拟层来代替真实h264噪声使得噪声变得可微,不影响原始数字视频水印网络的训练。在h264噪声这一不可微噪声上,因为我们针对这一噪声提出了专门的训练方法,使得原始数字视频水印网络能够更好地学习到h264的特点。
117.请参阅图5,在一些实施例,步骤s401包括但不限于包括步骤s501至步骤s504:
118.步骤s501,若噪声信息表征为h264噪声,对训练视频数据进行离散余弦变换处理,得到初步视频频域信息;
119.步骤s502,将初步视频频域信息中预设频域区域以外的信息设置为零,得到候选视频频域信息;其中,预设频域区域为左上角区域;
120.步骤s503,对候选视频频域信息进行离散余弦反变换处理,得到模拟噪声数据;
121.步骤s504,将模拟噪声数据输入至原始水印视频数据,得到噪声水印视频数据。
122.在本技术实施例所示意的步骤s501至步骤s504,通过对训练视频数据进行离散余弦变换处理得到初步视频域信息,并将初步视频域信息除了左上角区域以外的信息置为0得到候选视频域信息,然后再对候选视频域信息进行离散余弦反变换得到模拟噪声数据,且模拟噪声数据为视频数据,再将模拟噪声数据添加至原始水印视频数据得到噪声水印视频数据。因此,通过模拟噪声数据的方式替代将真实的h264噪声加入到原始水印视频数据,以构建让原始数字视频水印网络能够学习的噪声水印视频数据。
123.在一些实施例中,请参照图2,步骤s105可以包括但不限于包括步骤s202,
124.步骤s202,将噪声水印视频数据输入至解码器进行解码处理,得到预测水印信息。
125.为了进一步判断数字视频水印网络中解码器是否能够从带有噪声的视频数据中提取出水印信息,将预设的噪声数据加入到原始水印视频数据中以得到噪声水印视频数据。构建噪声水印视频数据之后,在步骤s202中,将带有噪声的噪声水印视频数据输入至原始数字视频水印网络的解码器进行解码处理,以得到预测水印信息,通过预测水印信息和原始水印信息即可判断出原始数字视频水印网络对带有噪声的视频数据是否可以准确分解出水印信息,以判断原始数字视频水印网络对带有噪声的视频数据解码的鲁棒性。
126.具体地,水印的提取过程,目的是把原始水印信息从噪声水印视频数据中提出出来,得到预测水印信息。其中,本技术的目标是预测水印信息和原始水印信息尽可能的相同,但是因为水印视频数据在被提取出原始水印信息前已经被加入了噪声数据,所以我们的方法要能够抵抗各种噪声数据,即水印方法的鲁棒性。其中,对于原始视频水印网络量化指标为各个噪声下的准确率。
127.需要说明的是,在构建原始数字视频水印网络之前,也需要构建能够处理四维的视频数据的解码器,需要修改解码器中的第一个二维卷积层的输入通道数从c改成c*l即可。
128.在一些实施例的步骤s106中,通过原始数字视频水印网络完成水印植入和水印分解之后,需要判断原始数字视频水印网络的准确性,通过将训练视频数据、原始水印视频数据、预测水印信息和原始水印信息进行损失计算得到目标损失数据,以根据目标损失数据判断原始数字视频水印网络植入水印和提取水印的准确率。
129.请参阅图6,在一些实施例中,步骤s106可以包括但不限于包括步骤s601至步骤s602:
130.步骤s601,对训练视频数据和噪声水印视频数据进行均方误差计算,得到视频损失数据;
131.步骤s602,对目标水印信息和原始水印信息进行均方误差计算,得到水印损失数据。
132.需要说明的是,视频水印评估目标主要有两个,一个是从预测水印信息和原始水印信息尽可能相同,另外一个则是水印视频数据和训练视频数据尽可能相同,因此需要计算训练视频数据和原始水印视频数据的均方误差,以及原始水印信息和预测水印信息的均
方误差,并通过方向传播方式更新原始数字视频水印网络,以构建能够生成与原始视频数据相同的水印视频,且能够准确地提取出水印信息的原始数字视频水印网络。
133.在一些实施例的步骤s601中,评估原始数字视频水印网络的指标主要是鲁棒性和水印视频的质量,视频的质量也即是水印的不可见性,即通过均方误差来确定训练视频数据和原始水印视频数据在人眼查看的区别。所以通过计算训练视频数据和原始水印视频数据之间的均方误差得到视频损失数据。视频损失数据能够判断生成的原始水印视频数据加入数字水印但是人眼分辨不出来的程度,且原始水印视频数据与训练视频数据类似程度。
134.在一些实施例的步骤s602中,为了判断提取的预测水印信息和原始水印信息是否一致,以判断原始数字视频水印网络提取水印是否准确。鲁棒性通过比较原始水印信息和预测水印信息之间的差别得出,也即均方误差。通过计算预测水印信息和原始水印信息之间的均方误差得到水印损失数据,以根据水印损失数据判断原始数字视频水印网络提取水印的准确度。
135.确定了视频损失数据和水印损失数据之后,在一些实施例的步骤s107中,为了构建能够准确添加水印和水印提取的目标数字视频水印网络,根据目标损失数据对原始数字视频水印网络进行参数调整直至目标损失数据收敛,得到目标数字视频水印网络。
136.在一些实施例中,请参照图7,在步骤s108之后,数字视频水印方法还包括但不限于包括步骤s701至步骤s702:
137.步骤s701,获取待处理水印视频数据;
138.步骤s702,将待处理水印视频数据输入至目标数字视频水印网络进行解码处理,得到目标水印信息。
139.构建了能够在h264噪声上表现出过人的鲁棒性的目标数字视频水印网络之后,在步骤s701中,获取待处理水印视频数据,且待处理水印视频数据为带有水印信息的视频数据,以对待处理水印视频数据进行内部水印信息提取。
140.在一些实施例的步骤s702中,将待处理水印视频数据输入至目标数字视频水印网络中的解码器中,以通过解码器将待处理水印视频数据中水印信息解码处理得到目标水印信息,通过目标水印信息可以知晓待处理水印视频数据的创作者的身份标识信息,以便于视频数据的维权。
141.在本技术实施例所示意的步骤s701至步骤s702,通过目标数字视频水印网络自动将待处理水印视频数据中的水印信息解码处理得到目标水印信息,使得待处理水印视频数据的水印提取操作自动化,且提取水印信息准确。
142.需要说明的是,构建通过目标数字视频水印网络将目标视频数据添加上原始水印信息得到目标水印视频数据,再通过目标数字视频水印网络将待处理水印视频数据提取出目标水印细腻些之后,为了判断目标数字视频水印网络的水印不可见性和鲁棒性。其中,本技术测试所构建数字视频水印网络的鲁棒性以通过在软件录屏下来确定,选取了20个kinetics数据集中的视频数据用于抗软件录屏测试。本技术实施例使用一个常见的录屏软件obs studio,并使用默认参数进行视频录制,然后计算目标数字视频水印网络输出的目标水印信息和原始水印信息之间的必特错误率,结果表明在录屏软件的攻击下,计算目标数字视频水印网络的平均必特错误率为95.2%,cin的平均准确率为95.6%。除此之外,计算水印不可见性则是通过计算目标数字视频水印网络输出的目标水印视频数据和原始视
频数据之间的峰值信噪比,以通过峰值信噪比确定水印方法的不可见性。因此,根据比特错误率和峰值信噪比以确定目标数字视频水印网络的水印鲁棒性和水印方法的不可见性。
143.需要说明的是,下表为不同方法在不同噪声情况下的比特准确率如表1所示:
144.表1
[0145][0146]
从实验结果可以看出,通过本技术方法所训练得到的目标数字视频水印网络所输出的视频数据质量有了明显的突破,且本技术所构建的数字视频网络在这八种视频噪声上的比特错误率都要更低,表现出了更强的鲁棒性。
[0147]
请参阅图8,本技术实施例还提供一种数字视频水印装置,可以实现上述数字视频水印方法,该装置包括:
[0148]
数据获取模块801,用于获取原始视频数据和原始水印信息;其中,原始视频数据包括:通道维度信息和时间维度信息;
[0149]
维度合并模块802,用于将原始视频数据的通道维度信息和时间维度信息进行合并处理,得到训练视频数据;
[0150]
编码模块803,用于将训练视频数据和原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据;其中,原始数字视频水印网络通过对数字图片神经网络的数据通道数修改得到;
[0151]
噪声添加模块804,用于将预设的噪声数据增加至原始水印视频数据,得到噪声水印视频数据;其中,噪声数据从预设的噪声数据库随机选取;
[0152]
解码模块805,用于将噪声水印视频数据输入至原始数字视频水印网络进行解码处理,得到预测水印信息;
[0153]
损失计算模块806,用于根据训练视频数据、原始水印视频数据、预测水印信息和原始水印信息进行损失计算,得到目标损失数据;
[0154]
参数调整模块807,用于根据目标损失数据对原始数字视频水印网络进行参数调整,得到目标数字视频水印网络;
[0155]
水印植入模块808,用于获取目标视频数据,将目标视频数据输入至目标数字视频水印网络进行水印植入,得到目标水印视频数据训练视频数据训练视频数据训练视频数据。
[0156]
该数字视频水印装置的具体实施方式与上述数字视频水印方法的具体实施例基本相同,在此不再赘述。
[0157]
本技术实施例还提供了一种电子设备,电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述数字视频水印方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。
[0158]
请参阅图9,图9示意了另一实施例的电子设备的硬件结构,电子设备包括:
[0159]
处理器901,可以采用通用的cpu(central processingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本技术实施例所提供的技术方案;
[0160]
存储器902,可以采用只读存储器(readonlymemory,rom)、静态存储设备、动态存储设备或者随机存取存储器(randomaccessmemory,ram)等形式实现。存储器902可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器902中,并由处理器901来调用执行本技术实施例的数字视频水印方法;
[0161]
输入/输出接口903,用于实现信息输入及输出;
[0162]
通信接口904,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信;
[0163]
总线905,在设备的各个组件(例如处理器901、存储器902、输入/输出接口903和通信接口904)之间传输信息;
[0164]
其中处理器901、存储器902、输入/输出接口903和通信接口904通过总线905实现彼此之间在设备内部的通信连接。
[0165]
本技术实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述数字视频水印方法。
[0166]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0167]
本技术实施例提供的数字视频水印方法和装置、设备及存储介质,其通过将视频数据的通道维度信息和时间维度信息合并以将视频数据降到图片维度,且数字视频水印网络通过对数字图片水印网络修改数据通道数得到,所以数字视频水印网络可以处理降了维度的视频数据,以实现将一个基于深度学习的数字图片水印方法应用于数字视频水印。然后在视频数据中加入噪声数据后再对水印视频数据解码,以构建能够处理带有噪声水印视频数据的数字视频水印网络。因此,本技术所构建的数字视频水印网络在保证数字视频水印网络所需的计算资源和原本数字图片水印方法相似的同时,取得了高不可见性和高鲁棒性。
[0168]
本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
[0169]
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本技术实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
[0170]
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0171]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
[0172]
本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0173]
应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
[0174]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0175]
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0176]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0177]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例的方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-on ly memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序的介质。
[0178]
以上参照附图说明了本技术实施例的优选实施例,并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替
换和改进,均应在本技术实施例的权利范围之内。

技术特征:
1.一种数字视频水印方法,其特征在于,所述方法包括:获取原始视频数据和原始水印信息;其中,所述原始视频数据包括:通道维度信息和时间维度信息;将所述原始视频数据的所述通道维度信息和所述时间维度信息进行合并处理,得到训练视频数据;将所述训练视频数据和所述原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据;其中,所述原始数字视频水印网络通过对数字图片神经网络的数据通道数修改得到;将预设的噪声数据增加至所述原始水印视频数据,得到噪声水印视频数据;其中,所述噪声数据从预设的噪声数据库随机选取;将所述噪声水印视频数据输入至所述原始数字视频水印网络进行解码处理,得到预测水印信息;根据所述训练视频数据、所述原始水印视频数据、所述预测水印信息和所述原始水印信息进行损失计算,得到目标损失数据;根据所述目标损失数据对所述原始数字视频水印网络进行参数调整,得到目标数字视频水印网络;获取目标视频数据,将所述目标视频数据输入至所述目标数字视频水印网络进行水印植入,得到目标水印视频数据。2.根据权利要求1所述的方法,其特征在于,在所述获取目标视频数据,将所述目标视频数据输入至所述目标数字视频水印网络进行水印植入,得到目标水印视频数据之后,所述方法还包括:获取待处理水印视频数据;将所述待处理水印视频数据输入至所述目标数字视频水印网络进行解码处理,得到目标水印信息。3.根据权利要求1所述的方法,其特征在于,所述原始数字视频水印网络包括:编码器和解码器;所述将所述训练视频数据和所述原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据,包括:将所述训练视频数据和所述原始水印信息输入至所述编码器进行编码处理,得到所述原始水印视频数据;所述将所述噪声水印视频数据输入至所述原始数字视频水印网络进行解码处理,得到预测水印信息,包括:将所述噪声水印视频数据输入至所述解码器进行解码处理,得到所述预测水印信息。4.根据权利要求1所述的方法,其特征在于,所述将预设的噪声数据增加至所述原始水印视频数据,得到噪声水印视频数据,包括:获取所述噪声数据的噪声信息;若所述噪声信息表征为非h264噪声,将所述噪声数据加入所述原始水印视频数据,得到所述噪声水印视频数据;若所述噪声信息表征为h264噪声,根据预设的前向攻击模拟层和所述噪声数据,或者
根据所述训练视频数据对所述原始水印视频数据进行噪声加入,得到所述噪声水印视频数据。5.根据权利要求4所述的方法,其特征在于,所述若所述噪声信息表征为h264噪声,根据预设的前向攻击模拟层和所述噪声数据,或者根据所述训练视频数据对所述原始水印视频数据进行噪声加入,得到所述噪声水印视频数据,包括:若所述噪声信息表征为h264噪声,根据所述训练视频数据进行噪声模拟,得到模拟噪声数据,并将所述模拟噪声数据输入至所述原始水印视频数据,得到所述噪声水印视频数据;或者,若所述噪声信息表征为h264噪声,将所述噪声数据输入至所述原始水印视频数据得到噪声水印视频数据,根据所述前向攻击模拟层对所述原始水印视频数据和所述训练视频数据进行差值计算,得到视频数据差值,将所述视频数据差值设置为不参与所述原始数字视频水印网络训练过程梯度的反向传播,并将所述视频数据差值加入至所述原始水印视频数据,得到所述噪声水印视频数据。6.根据权利要求5所述的方法,其特征在于,所述若所述噪声信息表征为h264噪声,根据所述训练视频数据进行噪声模拟,得到模拟噪声数据,并将所述模拟噪声数据输入至所述原始水印视频数据,得到所述噪声水印视频数据,包括:若所述噪声信息表征为h264噪声,对所述训练视频数据进行离散余弦变换处理,得到初步视频频域信息;将所述初步视频频域信息中预设频域区域以外的信息设置为零,得到候选视频频域信息;其中,所述预设频域区域为左上角区域;对所述候选视频频域信息进行离散余弦反变换处理,得到所述模拟噪声数据;将所述模拟噪声数据输入至所述原始水印视频数据,得到所述噪声水印视频数据。7.根据权利要求3所述的方法,其特征在于,所述根据所述训练视频数据、所述原始水印视频数据、所述预测水印信息和所述原始水印信息进行损失计算,得到目标损失数据,包括:对所述训练视频数据和所述原始水印视频数据进行均方误差计算,得到视频损失数据;对所述预测水印信息和所述原始水印信息进行均方误差计算,得到水印损失数据。8.一种数字视频水印装置,其特征在于,所述装置包括:数据获取模块,用于获取原始视频数据和原始水印信息;其中,所述原始视频数据包括:通道维度信息和时间维度信息;维度合并模块,用于将所述原始视频数据的所述通道维度信息和所述时间维度信息进行合并处理,得到训练视频数据;编码模块,用于将所述训练视频数据和所述原始水印信息输入至预设的原始数字视频水印网络进行编码处理,得到原始水印视频数据;其中,所述原始数字视频水印网络通过对数字图片神经网络的数据通道数修改得到;噪声添加模块,用于将预设的噪声数据增加至所述原始水印视频数据,得到噪声水印视频数据;其中,所述噪声数据从预设的噪声数据库随机选取;
解码模块,用于将所述噪声水印视频数据输入至所述原始数字视频水印网络进行解码处理,得到预测水印信息;损失计算模块,用于根据所述训练视频数据、所述原始水印视频数据、所述预测水印信息和所述原始水印信息进行损失计算,得到目标损失数据;参数调整模块,用于根据所述目标损失数据对所述原始数字视频水印网络进行参数调整,得到目标数字视频水印网络;水印植入模块,用于获取目标视频数据,将所述目标视频数据输入至所述目标数字视频水印网络进行水印植入,得到目标水印视频数据训练视频数据训练视频数据训练视频数据。9.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的数字视频水印方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的数字视频水印方法。

技术总结
本申请实施例提供了一种数字视频水印方法和装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取并将通道维度信息和时间维度信息合并的训练视频数据和原始水印信息输入至原始数字视频水印网络进行编码得到原始水印视频数据;将噪声数据加至原始水印视频数据得到噪声水印视频数据;将噪声水印视频数据输入原始数字视频水印网络进行解码得到预测水印信息;根据训练视频数据、原始水印视频数据、预测水印信息和原始水印信息构建目标损失数据对原始数字视频水印网络进行调整得到目标数字视频水印网络;通过目标数字视频水印网络对目标视频数据植入水印得到目标水印视频数据。本申请实施例能够构建实现视频水印方法的高不可见性和高鲁棒性。方法的高不可见性和高鲁棒性。方法的高不可见性和高鲁棒性。


技术研发人员:危学涛 叶冠辉
受保护的技术使用者:南方科技大学
技术研发日:2023.03.24
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐