基于深度学习的图像处理方法及装置与流程
未命名
10-19
阅读:77
评论:0
1.本发明涉及图像处理技术领域,尤其涉及一种基于深度学习的图像处理方法及装置。
背景技术:
2.随着互联网的快速发展,人们对图像数据以及视频数据的使用日渐频繁,尤其是在电商领域,电商素材库中通常会存在许多相似或重复的图像或视频素材。然而,当存储空间中相似或重复的图像或视频数据越来越多时,不仅占用存储空间容量,还增加了人们找到目标图像或视频数据的难度,因此,对相似或重复的图像或视频数据进行去重操作变得十分重要。
3.目前,现有技术中常用的几种去重手段,如md5技术、哈希去重、特征提取去重等,均存在确定图像是否重复时准确性较低,导致去重效果不佳的问题。因此,如何提高确定多个图像之间相似度的精准性是本领域技术人员尚待解决的技术问题。
技术实现要素:
4.本发明提供了一种基于深度学习的图像处理方法及装置,能够有利于提高确定多个图像之间相似度的准确性和可靠性。
5.为了解决上述技术问题,本发明第一方面公开了一种基于深度学习的图像处理方法,所述方法包括:
6.将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值,所述待处理图像集合中至少包括两张待处理图像;
7.在所述待处理图像集合中确定至少两张图像作为待比较图像;
8.根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合;
9.对于每个所述待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件。
10.作为一种可选的实施方式,在本发明第一方面中,所述将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值,包括:
11.将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的第一输出和第二输出;
12.根据每个所述待处理图像对应的第一输出和第二输出,计算每个所述待处理图像对应的哈希值;
13.以及,所述方法还包括:
14.通过预设的数据转换阈值对每个所述待处理图像对应的哈希值进行二值化处理,
得到每个所述待处理图像对应的二值化哈希值,作为每个所述待处理图像对应的哈希值。
15.作为一种可选的实施方式,在本发明第一方面中,每个所述待处理图像对应的第一输出包括该待处理图像对应的第一特征向量,每个所述待处理图像对应的第二输出包括该待处理图像对应的第二特征向量;
16.所述图像处理模型为深度学习类型的图像处理模型,且所述图像处理模型包括特征映射层、双向lstm层以及全连接层;
17.其中,所述特征映射层用于将每个所述待处理图像对应的特征向量映射到预设的第一维度,所述双向lstm层用于捕获每个所述待处理图像对应的上下文特征信息,所述全连接层的数量为至少两个,其中,至少一个所述全连接层用于将所述上下文特征信息降维到预设的第二维度,得到并输出所述第一输出,至少一个所述全连接层用于输出所述第二输出。
18.作为一种可选的实施方式,在本发明第一方面中,所述根据每个所述待处理图像对应的第一输出和第二输出,计算每个所述待处理图像对应的哈希值,包括:
19.根据每个所述待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个所述待处理图像对应的哈希值;
20.其中,每个所述待处理图像中第i个待处理图像对应的哈希值计算公式为:
[0021][0022]
其中,hi表示第i个待处理图像对应的哈希值,k表示梯度信息放大系数,f1i表示第i个待处理图像对应的第一输出,f2i表示第i个待处理图像对应的第二输出。
[0023]
作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
[0024]
将预先确定出的训练图像集合输入到所述图像处理模型中,得到所述训练图像集合中每个训练图像的哈希值,其中,所述训练图像集合包括至少一对样本对以及每个所述样本对对应的样本标签值,所述训练图像集合中所包括的所有所述样本对包括正样本对和/或负样本对,其中,所述正样本对的样本标签值为正样本标签值,所述负样本对的样本标签值为负样本标签值,每个所述样本对中包括至少两个训练图像;
[0025]
对于每个所述样本对,根据该样本对中的每个所述训练图像的哈希值,计算该样本对的相似度表征值;
[0026]
对于每个所述样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应的损失;
[0027]
根据每个所述样本对对应的损失更新所述图像处理模型的参数。
[0028]
作为一种可选的实施方式,在本发明第一方面中,所述根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,包括:
[0029]
在所有所述待比较图像中确定第一待比较图像和第二待比较图像,其中,所述第二待比较图像的数量为至少一个;
[0030]
对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像之间的相似度表
征值,得到所述第一待比较图像和该第二待比较图像之间的相似度表征值;
[0031]
根据所述第一待比较图像和每个所述第二待比较图像之间的相似度表征值,生成所述第一待比较图像的相似度表征值集合;
[0032]
以及,在所述确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件之后,所述方法还包括:
[0033]
根据预先确定出的图像去重条件,从满足所述相似度条件的所有所述待比较图像中确定并去除目标重复图像;
[0034]
其中,所述图像去重条件包括图像入库时长条件、图像尺寸条件以及图像占用存储空间条件中的至少一种。
[0035]
作为一种可选的实施方式,在本发明第一方面中,所述对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像之间的相似度表征值,得到所述第一待比较图像和该第二待比较图像之间的相似度表征值,包括:
[0036]
对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像对应的余弦相似度,作为所述第一待比较图像和该第二待比较图像之间的相似度表征值;
[0037]
或者,
[0038]
对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像对应的汉明距离,作为所述第一待比较图像和该第二待比较图像之间的相似度表征值;
[0039]
所述相似度表征值包括所述余弦相似度或所述汉明距离。
[0040]
本发明第二方面公开了一种基于深度学习的图像处理装置,所述装置包括:
[0041]
第一处理模块,用于将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值,所述待处理图像集合中至少包括两张待处理图像;
[0042]
确定模块,用于在所述待处理图像集合中确定至少两张图像作为待比较图像;
[0043]
计算模块,用于根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合;
[0044]
所述确定模块,还用于对于每个所述待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件。
[0045]
作为一种可选的实施方式,在本发明第二方面中,
[0046]
所述第一处理模块将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值的方式具体包括:
[0047]
将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的第一输出和第二输出;
[0048]
根据每个所述待处理图像对应的第一输出和第二输出,计算每个所述待处理图像对应的哈希值;
[0049]
以及,所述装置还包括:
[0050]
第二处理模块,用于通过预设的数据转换阈值对每个所述待处理图像对应的哈希值进行二值化处理,得到每个所述待处理图像对应的二值化哈希值,作为每个所述待处理图像对应的哈希值。
[0051]
作为一种可选的实施方式,在本发明第二方面中,每个所述待处理图像对应的第一输出包括该待处理图像对应的第一特征向量,每个所述待处理图像对应的第二输出包括该待处理图像对应的第二特征向量;
[0052]
所述图像处理模型为深度学习类型的图像处理模型,且所述图像处理模型包括特征映射层、双向lstm层以及全连接层;
[0053]
其中,所述特征映射层用于将每个所述待处理图像对应的特征向量映射到预设的第一维度,所述双向lstm层用于捕获每个所述待处理图像对应的上下文特征信息,所述全连接层的数量为至少两个,其中,至少一个所述全连接层用于将所述上下文特征信息降维到预设的第二维度,得到并输出所述第一输出,至少一个所述全连接层用于输出所述第二输出。
[0054]
作为一种可选的实施方式,在本发明第二方面中,所述第一处理模块根据每个所述待处理图像对应的第一输出和第二输出,计算每个所述待处理图像对应的哈希值的方式具体包括:
[0055]
根据每个所述待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个所述待处理图像对应的哈希值;
[0056]
其中,每个所述待处理图像中第i个待处理图像对应的哈希值计算公式为:
[0057][0058]
其中,hi表示第i个待处理图像对应的哈希值,k表示梯度信息放大系数,f1i表示第i个待处理图像对应的第一输出,f2i表示第i个待处理图像对应的第二输出。
[0059]
作为一种可选的实施方式,在本发明第二方面中,所述第一处理模块,还用于将预先确定出的训练图像集合输入到所述图像处理模型中,得到所述训练图像集合中每个训练图像的哈希值,其中,所述训练图像集合包括至少一对样本对以及每个所述样本对对应的样本标签值,所述训练图像集合中所包括的所有所述样本对包括正样本对和/或负样本对,其中,所述正样本对的样本标签值为正样本标签值,所述负样本对的样本标签值为负样本标签值,每个所述样本对中包括至少两个训练图像;
[0060]
所述计算模块,还用于对于每个所述样本对,根据该样本对中的每个所述训练图像的哈希值,计算该样本对的相似度表征值;对于每个所述样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应的损失;
[0061]
所述装置还包括:
[0062]
更新模块,用于根据每个所述样本对对应的损失更新所述图像处理模型的参数。
[0063]
作为一种可选的实施方式,在本发明第二方面中,所述计算模块根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合的方式具体包括:
[0064]
在所有所述待比较图像中确定第一待比较图像和第二待比较图像,其中,所述第二待比较图像的数量为至少一个;
[0065]
对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像之间的相似度表征值,得到所述第一待比较图像和该第二待比较图像之间的相似度表征值;
[0066]
根据所述第一待比较图像和每个所述第二待比较图像之间的相似度表征值,生成所述第一待比较图像的相似度表征值集合;
[0067]
以及,所述装置还包括:
[0068]
去除模块,用于在所述确定模块确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件之后,根据预先确定出的图像去重条件,从满足所述相似度条件的所有所述待比较图像中确定并去除目标重复图像;
[0069]
其中,所述图像去重条件包括图像入库时长条件、图像尺寸条件以及图像占用存储空间条件中的至少一种。
[0070]
作为一种可选的实施方式,在本发明第二方面中,所述计算模块对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像之间的相似度表征值,得到所述第一待比较图像和该第二待比较图像之间的相似度表征值的方式具体包括:
[0071]
对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像对应的余弦相似度,作为所述第一待比较图像和该第二待比较图像之间的相似度表征值;
[0072]
或者,
[0073]
对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像对应的汉明距离,作为所述第一待比较图像和该第二待比较图像之间的相似度表征值;
[0074]
所述相似度表征值包括所述余弦相似度或所述汉明距离。
[0075]
本发明第三方面公开了另一种基于深度学习的图像处理装置,所述装置包括:
[0076]
存储有可执行程序代码的存储器;
[0077]
与所述存储器耦合的处理器;
[0078]
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于深度学习的图像处理方法。
[0079]
本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于深度学习的图像处理方法。
[0080]
与现有技术相比,本发明实施例具有以下有益效果:
[0081]
本发明实施例中,将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值,在待处理图像集合中确定至少两张图像作为待比较图像,根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,对于每个待比较图像,当该待比较图像的相似度表征值集
合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件。可见,实施本发明能够结合图像的哈希值确定图像的相似度表征值,提高确定出的图像之间的相似度表征值对于图像差异的表征精准性,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。
附图说明
[0082]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0083]
图1是本发明实施例公开的一种基于深度学习的图像处理方法的流程示意图;
[0084]
图2是本发明实施例公开的另一种基于深度学习的图像处理方法的流程示意图;
[0085]
图3是本发明实施例公开的一种基于深度学习的图像处理装置的结构示意图;
[0086]
图4是本发明实施例公开的另一种基于深度学习的图像处理装置的结构示意图;
[0087]
图5是本发明实施例公开的又一种基于深度学习的图像处理装置的结构示意图。
具体实施方式
[0088]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0089]
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
[0090]
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0091]
本发明公开了一种基于深度学习的图像处理方法及装置,能够结合图像的哈希值确定图像的相似度表征值,提高图像间的相似度表征值对于图像差异的表征精准性,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。以下分别进行详细说明。
[0092]
实施例一
[0093]
请参阅图1,图1是本发明实施例公开的一种基于深度学习的图像处理方法的流程示意图。其中,图1所描述的基于深度学习的图像处理方法可以应用于基于深度学习的图像处理装置中,其中,基于深度学习的图像处理装置可以包括用于控制基于深度学习的图像处理装置的智能服务器或智能平台中的任意一种,其中,智能服务器包括本地服务器或者
云服务器,本发明实施例不做限定。如图1所示,该基于深度学习的图像处理方法可以包括以下操作:
[0094]
101、将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值。
[0095]
本发明实施例中,可选的,待处理图像集合中至少包括两张待处理图像,其中,待处理图像集合中的待处理图像可以是经过预处理的图像,对待处理图像的预处理方法包括但不限于统一尺寸、图像增强以及图像归一化等。可选的,待处理图像集合中的待处理图像的类型可以是相同的,也可以是不同的,举例来说,待处理图像集合中的待处理图像可以都是电商领域的商品图像,也可以是包括人物图像、风景图像、商品图像等多种类型的图像,本发明不做限定。
[0096]
本发明实施例中,可选的,图像处理模型可以是预先训练好的深度学习类型的图像处理模型,具体的,图像处理模型可以使用卷积神经网络或自编码器等进行设计和训练,本发明不做限定。
[0097]
102、在待处理图像集合中确定至少两张图像作为待比较图像。
[0098]
本发明实施例中,可选的,可以根据图像的类型确定待比较图像,即相同类型的图像确定为一组待比较图像,也可以根据预处理图像时的图像信息确定待比较图像,本发明不做限定。
[0099]
103、根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合。
[0100]
本发明实施例中,可选的,可以计算单个待比较图像与所有待比较图像中除该待比较图像外的多个待比较图像之间的相似度表征值,也可以计算单个待比较图像与所有待比较图像中除该待比较图像外的单个待比较图像之间的相似度表征值,相似度表征值可以用于表示某两个图像之间的相似度,也可以用于表示多个图像之间的相似度,例如,确定三个待比较图像以及他们的哈希值,分别可以为图a:[5c5c49cb49cb5c5c],图b:[53cea728d4e9ad92]以及图c:[cb5c495ccb49cb49],可以计算图a与图b之间的相似度表征值,也可以计算图a与图c之间的相似度表征值,还可以计算图a与图b、图c三者的相似度表征值,本发明不做限定。
[0101]
104、对于每个待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件。
[0102]
本发明实施例中,可选的,预设的相似度阈值可以是根据图像去重需求确定的,也可以是由图像处理模型根据历史图像处理记录确定的,还可以是人工设定的,本发明不做限定。可选的,目标相似度表征值对应的待比较图像至少包括两张待比较图像,即当某一待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的除该待比较图像之外的其他待比较图像与该待比较图像满足预设的相似度条件,其中,预设的相似度条件可以用于表示该待比较图像与目标相似度表征值对应的除该待比较图像之外的其他待比较图像相似,也可以用于表示该待比较图像与目标相似度表征值对应的除该待比较图像之外的其他待比较图像不相似,本发明不做限定。
[0103]
可见,实施图1所描述的基于深度学习的图像处理方法能够将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值,在待处理图像集合中确定至少两张图像作为待比较图像,根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,能够结合图像的哈希值确定图像的相似度表征值,提高确定出的图像之间的相似度表征值对于图像差异的表征精准性,对于每个待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。
[0104]
在一个可选的实施例中,该基于深度学习的图像处理方法还可以包括以下操作:
[0105]
将预先确定出的训练图像集合输入到图像处理模型中,得到训练图像集合中每个训练图像的哈希值,其中,训练图像集合包括至少一对样本对以及每个样本对对应的样本标签值,训练图像集合中所包括的所有样本对包括正样本对和/或负样本对,其中,正样本对的样本标签值为正样本标签值,负样本对的样本标签值为负样本标签值,每个样本对中包括至少两个训练图像;
[0106]
对于每个样本对,根据该样本对中的每个训练图像的哈希值,计算该样本对的相似度表征值;
[0107]
对于每个样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应的损失;
[0108]
根据每个样本对对应的损失更新图像处理模型的参数。
[0109]
该可选的实施例中,可选的,训练图像集合中至少包括一对样本对以及每个样本对对应的样本标签值,且样本对中至少包括两张训练图像,训练图像集合中的样本对可以为正样本对,也可以为负样本对,该可以同时包括正样本对和负样本对,且正样本对的样本标签值为正样本标签值,负样本对的样本标签值为负样本标签值。可选的,当正样本中的训练图像为满足预设的相似度条件的图像时,则负样本对中的训练图像为不满足预设的相似度条件的图像,或者,当正样本中的训练图像为不满足预设的相似度条件的图像时,则负样本对中的训练图像为满足预设的相似度条件的图像,可选的,正样本标签值可以定义为1,负样本标签值可以定义为0,或者,当样本对中的训练图像为满足预设的相似度条件的图像时,该样本对的样本标签值可以定义为1,当样本对中的训练图像为不满足预设的相似度条件的图像时,该样本对的样本标签值可以定义为0,本实施例不做限定。
[0110]
该可选的实施例中,可选的,样本对对应的损失的计算公式可以为:
[0111][0112]
其中,n可以用于表示训练图像集合中的样本对的个数,yi可以用于表示训练图像集合中第i个样本对的样本标签值,p(yi)可以用于表示训练图像集合中第i个样本对的相似度表征值,本实施例不做限定。
[0113]
该可选的实施例中,可选的,可以通过反向梯度传播算法对图像处理模型的参数进行更新,具体的,损失表示模型预测值与实际值之间的差距,可以根据计算得出的样本对
对应的损失,对这个损失通过链式求导法则,对模型的参数权重或偏置值求偏导,进而计算出模型的梯度信息,然后根据模型的梯度信息更新模型每一个参数,本实施例不做限定。
[0114]
可见,实施该可选的实施例能够将预先确定出的训练图像集合输入到图像处理模型中,得到训练图像集合中每个训练图像的哈希值,对于每个样本对,根据该样本对中的每个训练图像的哈希值,计算该样本对的相似度表征值,对于每个样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应的损失,根据每个样本对对应的损失更新图像处理模型的参数,能够不断对模型进行训练优化,提高模型计算出的哈希值的准确性,同时能够提高哈希值对于图像的差异的代表性,进而能够提高图像去重的准确性和可靠性。
[0115]
在另一个可选的实施例中,根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合可以包括以下操作:
[0116]
在所有待比较图像中确定第一待比较图像和第二待比较图像,其中,第二待比较图像的数量为至少一个;
[0117]
对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像之间的相似度表征值,得到第一待比较图像和该第二待比较图像之间的相似度表征值;
[0118]
根据第一待比较图像和每个第二待比较图像之间的相似度表征值,生成第一待比较图像的相似度表征值集合;
[0119]
以及,在确定目标相似度表征值对应的待比较图像满足预设的相似度条件之后,该基于深度学习的图像处理方法还可以包括以下操作:
[0120]
根据预先确定出的图像去重条件,从满足相似度条件的所有待比较图像中确定并去除目标重复图像;
[0121]
其中,图像去重条件包括图像入库时长条件、图像尺寸条件以及图像占用存储空间条件中的至少一种。
[0122]
该可选的实施例中,可选的,至少确定一张第二待比较图像用于与第一待比较图像进行计算相应的相似度表征值,即可以计算单个待比较图像与所有待比较图像中除该待比较图像外的多个待比较图像之间的相似度表征值,也可以计算单个待比较图像与所有待比较图像中除该待比较图像外的单个待比较图像之间的相似度表征值,相似度表征值可以用于表示某两个图像之间的相似度,也可以用于表示多个图像之间的相似度,本发明不做限定。
[0123]
该可选的实施例中,可选的,预先确定出的图像去重条件可以包括图像入库时长条件、图像尺寸条件以及图像占用存储空间条件等中的至少一种,且图像去重条件可以是根据人工设定的图像去重需求确定的,也可以是根据历史图像处理记录确定的,举例来说,当图像去重条件包括图像入库时长条件时,可以从满足相似度条件的所有待比较图像中确定图像入库时长最长的一个/几个图像作为目标重复图像,或从满足相似度条件的所有待比较图像中确定图像入库时长最短的一个/几个图像作为目标重复图像;当图像去重条件包括图像尺寸条件时,可以从满足相似度条件的所有待比较图像中确定图像尺寸最大的一个/几个图像作为目标重复图像,或从满足相似度条件的所有待比较图像中确定图像尺寸
最小的一个/几个图像作为目标重复图像,或从满足相似度条件的所有待比较图像中确定图像尺寸满足预设图像尺寸范围的一个/几个图像作为目标重复图像;当图像去重条件包括图像占用存储空间条件时,可以从满足相似度条件的所有待比较图像中确定图像占用存储空间最大的一个/几个图像作为目标重复图像,或从满足相似度条件的所有待比较图像中确定图像占用存储空间最小的一个/几个图像作为目标重复图像,或从满足相似度条件的所有待比较图像中确定图像占用存储空间满足预设图像占用存储空间范围的一个/几个图像作为目标重复图像,本实施例不做限定。
[0124]
可见,实施该可选的实施例能够在所有待比较图像中确定第一待比较图像和第二待比较图像,其中,第二待比较图像的数量为至少一个,对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像之间的相似度表征值,得到第一待比较图像和该第二待比较图像之间的相似度表征值,根据第一待比较图像和每个第二待比较图像之间的相似度表征值,生成第一待比较图像的相似度表征值集合,能够根据图像的哈希值确定图像与图像之间的相似度表征值,且可以确定一一对应图像或一对多图像间的相似度表征值,提高了确定图像之间相似度表征值的效率以及准确性,根据预先确定出的图像去重条件,从满足相似度条件的所有待比较图像中确定并去除目标重复图像,提高了从满足相似度条件的所有待比较图像中去除满足图像去重条件的准确性和可靠性,同时图像去重条件可以根据去重需求而适应性改变,提高了图像去重操作的灵活性。
[0125]
在又一个可选的实施例中,对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像之间的相似度表征值,得到第一待比较图像和该第二待比较图像之间的相似度表征值可以包括以下操作:
[0126]
对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的余弦相似度,作为第一待比较图像和该第二待比较图像之间的相似度表征值;
[0127]
或者,
[0128]
对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的汉明距离,作为第一待比较图像和该第二待比较图像之间的相似度表征值;
[0129]
相似度表征值包括余弦相似度或汉明距离。
[0130]
该可选的实施例中,可选的,第一待比较图像和第二待比较图像对应的余弦相似度的计算公式为:
[0131][0132]
其中,h1表示第一待比较图像的哈希值,h2表示第二待比较图像的哈希值,且公式得到的余弦相似度cosθ的取值范围为[0,1],且当余弦相似度cosθ趋近于1时表示第一待比较图像和第二待比较图像相似,当余弦相似度cosθ趋近于0时表示第一待比较图像和第二待比较图像不相似,可选的,预设的相似度阈值可以为0.8,即当第一待比较图像和第二待
比较图像的余弦相似度大于0.8时,确定第一待比较图像和第二待比较图像相似,本实施例不做限定。
[0133]
该可选的实施例中,可选的,汉明距离可以用于表示两个字符串中不同字符的个数,即可以通过比较第一待比较图像的哈希值和第二待比较图像的哈希值中不同字符的个数,例如,将第一待比较图像的哈希值转化为一个字符串“01011100”,将第二待比较图像的哈希值转换为一个字符串“01001001”,此时二者的不同字符个数为3,即第一待比较图像与第二待比较图像之间的汉明距离为3,可选的,预设的相似度阈值可以为7,即当第一待比较图像和第二待比较图像的汉明距离小于7时,确定第一待比较图像和第二待比较图像相似,且进一步的,预设的相似度阈值的大小(即汉明距离的大小)需要小于第一待比较图像或第二待比较图像的哈希值的位数,本实施例不做限定。
[0134]
可见,实施该可选的实施例能够根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的余弦相似度,作为第一待比较图像和该第二待比较图像之间的相似度表征值,或根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的汉明距离,作为第一待比较图像和该第二待比较图像之间的相似度表征值,能够通过多种不同的形式体现图像之间的相似度表征值,提高确定出的相似度表征值的准确性和可靠性。
[0135]
实施例二
[0136]
请参阅图2,图2是本发明实施例公开的一种基于深度学习的图像处理方法的流程示意图。其中,图2所描述的基于深度学习的图像处理方法可以应用于基于深度学习的图像处理装置中,其中,基于深度学习的图像处理装置可以包括用于控制基于深度学习的图像处理装置的智能服务器或智能平台中的任意一种,其中,智能服务器包括本地服务器或者云服务器,本发明实施例不做限定。如图2所示,该基于深度学习的图像处理方法可以包括以下操作:
[0137]
201、将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的第一输出和第二输出。
[0138]
本发明实施例中,可选的,待处理图像对应的第一输出可以包括待处理图像对应的第一特征向量,待处理图像对应的第二输出可以包括待处理图像对应的第二特征向量,其中,可选的,待处理图像的第二输出可以作为待处理图像的第一输出的哈希阈值,本发明不做限定。
[0139]
202、根据每个待处理图像对应的第一输出和第二输出,计算每个待处理图像对应的哈希值。
[0140]
本发明实施例中,可选的,每个待处理图像对应的哈希值可以理解为是对待处理图像的第一输出和第二输出进行二值近似,得到的一个近似的哈希矩阵,整个过程可微分,从而使得模型计算以及训练过程中不会出现梯度不可导的情况,提高了模型的性能和稳定性。
[0141]
203、通过预设的数据转换阈值对每个待处理图像对应的哈希值进行二值化处理,得到每个待处理图像对应的二值化哈希值,作为每个待处理图像对应的哈希值。
[0142]
本发明实施例中,可选的,数据转换阈值可以将待处理图像对应的哈希值从浮点
型转换为整型,这样可以在损失极小的精度的情况下大幅减少计算开销,提升测试速度。
[0143]
204、在待处理图像集合中确定至少两张图像作为待比较图像。
[0144]
205、根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合。
[0145]
206、对于每个待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件。
[0146]
本发明实施例中,针对步骤204-步骤206的其他描述,请参照实施例一中针对步骤102-步骤104的详细描述,本发明实施例不再赘述。
[0147]
可见,实施图2所描述的基于深度学习的图像处理方法能够将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的第一输出和第二输出,根据每个待处理图像对应的第一输出和第二输出,计算每个待处理图像对应的哈希值,能够通过待处理图像的第一输出和第二输出计算待处理图像的哈希值,提高了确定出的待处理图像的哈希值的准确性和可靠性,同时使得确定出的待处理图像的哈希值能够更加真实的反映图像的细节,在待处理图像集合中确定至少两张图像作为待比较图像,根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,能够结合图像的哈希值确定图像的相似度表征值,能够提高确定出的图像之间的相似度表征值对于图像差异的体现精准性,对于每个待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。
[0148]
在一个可选的实施例中,每个待处理图像对应的第一输出包括该待处理图像对应的第一特征向量,每个待处理图像对应的第二输出包括该待处理图像对应的第二特征向量;
[0149]
图像处理模型为深度学习类型的图像处理模型,且图像处理模型包括特征映射层、双向lstm层以及全连接层;
[0150]
其中,特征映射层用于将每个待处理图像对应的特征向量映射到预设的第一维度,双向lstm层用于捕获每个待处理图像对应的上下文特征信息,全连接层的数量为至少两个,其中,至少一个全连接层用于将上下文特征信息降维到预设的第二维度,得到并输出第一输出,至少一个全连接层用于输出第二输出。
[0151]
该可选的实施例中,可选的,待处理图像对应的第一输出可以包括待处理图像对应的第一特征向量,待处理图像对应的第二输出可以包括待处理图像对应的第二特征向量,其中,可选的,待处理图像的第二输出可以作为待处理图像的第一输出的哈希阈值,本发明不做限定。
[0152]
该可选的实施例中,可选的,以图像处理模型为卷积神经网络类型的模型为例,可以以res-net(残差神经网络)或vgg(visual geometry group)等为基础模型,然后去掉最后一层分类层,添加一个特征映射层,用于将待处理图像对应的特征向量的维度映射到预
设的第一维度,如256维;可选的,至少包括一层双向lstm层(long short-term memory),优选两层双向lstm层,用于捕获全局的上下文信息,同时输出预设的第一维度的特征;可选的,至少包括两层全连接层,其中一层用于将双向lstm层捕获到的全局的上下文信息进行融合并将其降维到预设的第二维度,如128维,得到并输出预设的第二维度的第一输出,另一层用于输出预设的第二维度的第二输出,本实施例不做限定。
[0153]
可见,实施该可选的实施例能够通过对图像处理模型的各个层进行相应的设置,使用双向lstm层捕获上下文全局信息,可以是最终融合并输出的待处理图像的两个特征向量能够更加准确的反映图像的图像细节和表征图像的全局信息,使用两个支路来分别输出第一输出和第二输出,使得第一输出的每个特征值都有单独的阈值,有利于提高后续计算待处理图像的哈希值表征能力,也使整个训练过程的梯度可导,从而提高模型的稳定性和可靠性。
[0154]
在另一个可选的实施例中,根据每个待处理图像对应的第一输出和第二输出,计算每个待处理图像对应的哈希值可以包括以下操作:
[0155]
根据每个待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个待处理图像对应的哈希值;
[0156]
其中,每个待处理图像中第i个待处理图像对应的哈希值计算公式为:
[0157][0158]
其中,hi表示第i个待处理图像对应的哈希值,k表示梯度信息放大系数,f1i表示第i个待处理图像对应的第一输出,f2i表示第i个待处理图像对应的第二输出。
[0159]
该可选的实施例中,可选的,梯度信息放大系数k可以根据训练数据进行调整,也可以由人工调整,优选的,k的值可以设置为60,本实施例不做限定。
[0160]
可见,实施该可选的实施例能够根据每个待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个待处理图像对应的哈希值,能够得到的一个近似的哈希矩阵,整个过程可微分,从而使得模型计算以及训练过程中不会出现梯度不可导的情况,提高了模型的性能和稳定性。
[0161]
实施例三
[0162]
请参阅图3,图3是本发明实施例公开的一种基于深度学习的图像处理装置的结构示意图。其中,图3所描述的基于深度学习的图像处理装置可以包括用于控制基于深度学习的图像处理装置的智能服务器或智能平台中的任意一种,其中,智能服务器包括本地服务器或者云服务器,本发明实施例不做限定。如图3所示,该基于深度学习的图像处理装置可以包括:
[0163]
第一处理模块301,用于将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值,待处理图像集合中至少包括两张待处理图像;
[0164]
确定模块302,用于在待处理图像集合中确定至少两张图像作为待比较图像;
[0165]
计算模块303,用于根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合;
[0166]
确定模块302,还用于对于每个待比较图像,当该待比较图像的相似度表征值集合
中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件。
[0167]
可见,实施图3所描述的基于深度学习的图像处理装置能够将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值,在待处理图像集合中确定至少两张图像作为待比较图像,根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,能够结合图像的哈希值确定图像的相似度表征值,提高确定出的图像之间的相似度表征值对于图像差异的表征精准性,对于每个待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。
[0168]
在一个可选的实施例中,如图4所示,第一处理模块301将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值的具体方式包括:
[0169]
将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的第一输出和第二输出;
[0170]
根据每个待处理图像对应的第一输出和第二输出,计算每个待处理图像对应的哈希值;
[0171]
以及,该基于深度学习的图像处理装置还可以包括:
[0172]
第二处理模块304,用于通过预设的数据转换阈值对每个待处理图像对应的哈希值进行二值化处理,得到每个待处理图像对应的二值化哈希值,作为每个待处理图像对应的哈希值。
[0173]
可见,实施图4所描述的基于深度学习的图像处理装置能够将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的第一输出和第二输出,根据每个待处理图像对应的第一输出和第二输出,计算每个待处理图像对应的哈希值,能够通过待处理图像的第一输出和第二输出计算待处理图像的哈希值,提高了确定出的待处理图像的哈希值的准确性和可靠性,同时使得确定出的待处理图像的哈希值能够更加真实的反映图像的细节,在待处理图像集合中确定至少两张图像作为待比较图像,根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,能够结合图像的哈希值确定图像的相似度表征值,能够提高确定出的图像之间的相似度表征值对于图像差异的体现精准性,对于每个待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。
[0174]
在另一个可选的实施例中,如图4所示,每个待处理图像对应的第一输出包括该待处理图像对应的第一特征向量,每个待处理图像对应的第二输出包括该待处理图像对应的第二特征向量;
[0175]
图像处理模型为深度学习类型的图像处理模型,且图像处理模型包括特征映射层、双向lstm层以及全连接层;
[0176]
其中,特征映射层用于将每个待处理图像对应的特征向量映射到预设的第一维度,双向lstm层用于捕获每个待处理图像对应的上下文特征信息,全连接层的数量为至少两个,其中,至少一个全连接层用于将上下文特征信息降维到预设的第二维度,得到并输出第一输出,至少一个全连接层用于输出第二输出。
[0177]
可见,实施图4所描述的基于深度学习的图像处理装置能够通过对图像处理模型的各个层进行相应的设置,使用双向lstm层捕获上下文全局信息,可以是最终融合并输出的待处理图像的两个特征向量能够更加准确的反映图像的图像细节和表征图像的全局信息,使用两个支路来分别输出第一输出和第二输出,使得第一输出的每个特征值都有单独的阈值,有利于提高后续计算待处理图像的哈希值表征能力,也使整个训练过程的梯度可导,从而提高模型的稳定性和可靠性。
[0178]
在又一个可选的实施例中,如图4所示,第一处理模块301根据每个待处理图像对应的第一输出和第二输出,计算每个待处理图像对应的哈希值的具体方式包括:
[0179]
根据每个待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个待处理图像对应的哈希值;
[0180]
其中,每个待处理图像中第i个待处理图像对应的哈希值计算公式为:
[0181][0182]
其中,hi表示第i个待处理图像对应的哈希值,k表示梯度信息放大系数,f1i表示第i个待处理图像对应的第一输出,f2i表示第i个待处理图像对应的第二输出。
[0183]
可见,实施图4所描述的基于深度学习的图像处理装置能够根据每个待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个待处理图像对应的哈希值,能够得到的一个近似的哈希矩阵,整个过程可微分,从而使得模型计算以及训练过程中不会出现梯度不可导的情况,提高了模型的性能和稳定性。
[0184]
在又一个可选的实施例中,如图4所示,第一处理模块301,还用于将预先确定出的训练图像集合输入到图像处理模型中,得到训练图像集合中每个训练图像的哈希值,其中,训练图像集合包括至少一对样本对以及每个样本对对应的样本标签值,训练图像集合中所包括的所有样本对包括正样本对和/或负样本对,其中,正样本对的样本标签值为正样本标签值,负样本对的样本标签值为负样本标签值,每个样本对中包括至少两个训练图像;
[0185]
计算模块303,还用于对于每个样本对,根据该样本对中的每个训练图像的哈希值,计算该样本对的相似度表征值;对于每个样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应的损失;
[0186]
该基于深度学习的图像处理装置还可以包括:
[0187]
更新模块305,用于根据每个样本对对应的损失更新图像处理模型的参数。
[0188]
可见,实施图4所描述的基于深度学习的图像处理装置能够将预先确定出的训练图像集合输入到图像处理模型中,得到训练图像集合中每个训练图像的哈希值,对于每个样本对,根据该样本对中的每个训练图像的哈希值,计算该样本对的相似度表征值,对于每个样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应
的损失,根据每个样本对对应的损失更新图像处理模型的参数,能够不断对模型进行训练优化,提高模型计算出的哈希值的准确性,同时能够提高哈希值对于图像的差异的代表性,进而能够提高图像去重的准确性和可靠性。
[0189]
在又一个可选的实施例中,如图4所示,计算模块303根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合的具体方式包括:
[0190]
在所有待比较图像中确定第一待比较图像和第二待比较图像,其中,第二待比较图像的数量为至少一个;
[0191]
对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像之间的相似度表征值,得到第一待比较图像和该第二待比较图像之间的相似度表征值;
[0192]
根据第一待比较图像和每个第二待比较图像之间的相似度表征值,生成第一待比较图像的相似度表征值集合;
[0193]
以及,该基于深度学习的图像处理装置还可以包括:
[0194]
去除模块306,用于在确定模块302确定目标相似度表征值对应的待比较图像满足预设的相似度条件之后,根据预先确定出的图像去重条件,从满足相似度条件的所有待比较图像中确定并去除目标重复图像;
[0195]
其中,图像去重条件包括图像入库时长条件、图像尺寸条件以及图像占用存储空间条件中的至少一种。
[0196]
可见,实施图4所描述的基于深度学习的图像处理装置能够在所有待比较图像中确定第一待比较图像和第二待比较图像,其中,第二待比较图像的数量为至少一个,对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像之间的相似度表征值,得到第一待比较图像和该第二待比较图像之间的相似度表征值,根据第一待比较图像和每个第二待比较图像之间的相似度表征值,生成第一待比较图像的相似度表征值集合,能够根据图像的哈希值确定图像与图像之间的相似度表征值,且可以确定一一对应图像或一对多图像间的相似度表征值,提高了确定图像之间相似度表征值的效率以及准确性,根据预先确定出的图像去重条件,从满足相似度条件的所有待比较图像中确定并去除目标重复图像,提高了从满足相似度条件的所有待比较图像中去除满足图像去重条件的准确性和可靠性,同时图像去重条件可以根据去重需求而适应性改变,提高了图像去重操作的灵活性。
[0197]
在又一个可选的实施例中,如图4所示,计算模块303对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像之间的相似度表征值,得到第一待比较图像和该第二待比较图像之间的相似度表征值的具体方式包括:
[0198]
对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的余弦相似度,作为第一待比较图像和该第二待比较图像之间的相似度表征值;
[0199]
或者,
[0200]
对于每个第二待比较图像,根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的汉明距离,作为第一待比较图像和该第二待比较图像之间的相似度表征值;
[0201]
相似度表征值包括余弦相似度或汉明距离。
[0202]
可见,实施图4所描述的基于深度学习的图像处理装置能够根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的余弦相似度,作为第一待比较图像和该第二待比较图像之间的相似度表征值,或根据第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算第一待比较图像和该第二待比较图像对应的汉明距离,作为第一待比较图像和该第二待比较图像之间的相似度表征值,能够通过多种不同的形式体现图像之间的相似度表征值,提高确定出的相似度表征值的准确性和可靠性。
[0203]
实施例四
[0204]
请参阅图5,图5是本发明实施例公开的又一种基于深度学习的图像处理装置的结构示意图。如图5所示,该基于深度学习的图像处理装置可以包括:
[0205]
存储有可执行程序代码的存储器401;
[0206]
与存储器401耦合的处理器402;
[0207]
处理器402调用存储器401中存储的可执行程序代码,执行本发明实施例一或本发明实施例二所描述的基于深度学习的图像处理方法中的步骤。
[0208]
实施例五
[0209]
本发明实施例公开了一种计算机存储介质,该计算机存储介质存储有计算机指令,该计算机指令被调用时,用于执行本发明实施例一或本发明实施例二所描述的基于深度学习的图像处理方法中的步骤。
[0210]
实施例六
[0211]
本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一或实施例二中所描述的基于深度学习的图像处理方法中的步骤。
[0212]
以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0213]
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(read-only memory,rom)、随机存储器(random access memory,ram)、可编程只读存储器(programmable read-only memory,prom)、可擦除可编程只读存储器(erasable programmable read only memory,eprom)、一次可编程只读存储器(one-time programmable read-only memory,otprom)、电子抹除式可复写只读存储器
(electrically-erasable programmable read-only memory,eeprom)、只读光盘(compact disc read-only memory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
[0214]
最后应说明的是:本发明实施例公开的一种基于深度学习的图像处理方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。
技术特征:
1.一种基于深度学习的图像处理方法,其特征在于,所述方法包括:将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值,所述待处理图像集合中至少包括两张待处理图像;在所述待处理图像集合中确定至少两张图像作为待比较图像;根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合;对于每个所述待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件。2.根据权利要求1所述的基于深度学习的图像处理方法,其特征在于,所述将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值,包括:将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的第一输出和第二输出;根据每个所述待处理图像对应的第一输出和第二输出,计算每个所述待处理图像对应的哈希值;以及,所述方法还包括:通过预设的数据转换阈值对每个所述待处理图像对应的哈希值进行二值化处理,得到每个所述待处理图像对应的二值化哈希值,作为每个所述待处理图像对应的哈希值。3.根据权利要求2所述的基于深度学习的图像处理方法,其特征在于,每个所述待处理图像对应的第一输出包括该待处理图像对应的第一特征向量,每个所述待处理图像对应的第二输出包括该待处理图像对应的第二特征向量;所述图像处理模型为深度学习类型的图像处理模型,且所述图像处理模型包括特征映射层、双向lstm层以及全连接层;其中,所述特征映射层用于将每个所述待处理图像对应的特征向量映射到预设的第一维度,所述双向lstm层用于捕获每个所述待处理图像对应的上下文特征信息,所述全连接层的数量为至少两个,其中,至少一个所述全连接层用于将所述上下文特征信息降维到预设的第二维度,得到并输出所述第一输出,至少一个所述全连接层用于输出所述第二输出。4.根据权利要求2或3所述的基于深度学习的图像处理方法,其特征在于,所述根据每个所述待处理图像对应的第一输出和第二输出,计算每个所述待处理图像对应的哈希值,包括:根据每个所述待处理图像对应的第一输出和第二输出,结合预先确定出的哈希值计算公式,计算每个所述待处理图像对应的哈希值;其中,每个所述待处理图像中第i个待处理图像对应的哈希值计算公式为:其中,h
i
表示第i个待处理图像对应的哈希值,k表示梯度信息放大系数,f1
i
表示第i个待处理图像对应的第一输出,f2
i
表示第i个待处理图像对应的第二输出。
5.根据权利要求1-3任一项所述的基于深度学习的图像处理方法,其特征在于,所述方法还包括:将预先确定出的训练图像集合输入到所述图像处理模型中,得到所述训练图像集合中每个训练图像的哈希值,其中,所述训练图像集合包括至少一对样本对以及每个所述样本对对应的样本标签值,所述训练图像集合中所包括的所有所述样本对包括正样本对和/或负样本对,其中,所述正样本对的样本标签值为正样本标签值,所述负样本对的样本标签值为负样本标签值,每个所述样本对中包括至少两个训练图像;对于每个所述样本对,根据该样本对中的每个所述训练图像的哈希值,计算该样本对的相似度表征值;对于每个所述样本对,根据该样本对的相似度表征值以及该样本对的样本标签值,计算该样本对对应的损失;根据每个所述样本对对应的损失更新所述图像处理模型的参数。6.根据权利要求1-3任一项所述的基于深度学习的图像处理方法,其特征在于,所述根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合,包括:在所有所述待比较图像中确定第一待比较图像和第二待比较图像,其中,所述第二待比较图像的数量为至少一个;对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像之间的相似度表征值,得到所述第一待比较图像和该第二待比较图像之间的相似度表征值;根据所述第一待比较图像和每个所述第二待比较图像之间的相似度表征值,生成所述第一待比较图像的相似度表征值集合;以及,在所述确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件之后,所述方法还包括:根据预先确定出的图像去重条件,从满足所述相似度条件的所有所述待比较图像中确定并去除目标重复图像;其中,所述图像去重条件包括图像入库时长条件、图像尺寸条件以及图像占用存储空间条件中的至少一种。7.根据权利要求6所述的基于深度学习的图像处理方法,其特征在于,所述对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像之间的相似度表征值,得到所述第一待比较图像和该第二待比较图像之间的相似度表征值,包括:对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像对应的余弦相似度,作为所述第一待比较图像和该第二待比较图像之间的相似度表征值;或者,对于每个所述第二待比较图像,根据所述第一待比较图像对应的哈希值和该第二待比较图像对应的哈希值,计算所述第一待比较图像和该第二待比较图像对应的汉明距离,作
为所述第一待比较图像和该第二待比较图像之间的相似度表征值;所述相似度表征值包括所述余弦相似度或所述汉明距离。8.一种基于深度学习的图像处理装置,其特征在于,所述装置包括:第一处理模块,用于将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个所述待处理图像对应的哈希值,所述待处理图像集合中至少包括两张待处理图像;确定模块,用于在所述待处理图像集合中确定至少两张图像作为待比较图像;计算模块,用于根据每个所述待比较图像对应的哈希值,对于每个所述待比较图像,计算该待比较图像与所有所述待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,得到该待比较图像的相似度表征值集合;所述确定模块,还用于对于每个所述待比较图像,当该待比较图像的相似度表征值集合中存在大于预设相似度阈值的目标相似度表征值时,确定所述目标相似度表征值对应的待比较图像满足预设的相似度条件。9.一种基于深度学习的图像处理装置,其特征在于,所述装置包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的基于深度学习的图像处理方法。10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的基于深度学习的图像处理方法。
技术总结
本发明公开了一种基于深度学习的图像处理方法及装置,该方法包括:将待处理图像集合中的每个待处理图像输入到图像处理模型中,得到每个待处理图像对应的哈希值,并根据每个待比较图像对应的哈希值,对于每个待比较图像,计算该待比较图像与所有待比较图像中除该待比较图像外的每个剩余待比较图像之间的相似度表征值,且当待比较图像间的目标相似度表征值大于预设相似度阈值时,确定目标相似度表征值对应的待比较图像满足预设的相似度条件。可见,实施本发明能够结合图像的哈希值确定图像的相似度表征值,提高图像间的相似度表征值对于图像差异的表征精准性,能够提高确定图像是否相似的准确性和可靠性,进而能够提高图像去重的准确性和可靠性。重的准确性和可靠性。重的准确性和可靠性。
技术研发人员:陈畅新 李展铿
受保护的技术使用者:有米科技股份有限公司
技术研发日:2023.07.12
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
