相似图片识别方法、装置、电子设备和存储介质与流程

未命名 10-18 阅读:111 评论:0


1.本技术属于图片识别技术领域,特别是涉及一种相似图片识别方法、装置、电子设备和存储介质。


背景技术:

2.新零售是近年来兴起的一种商业模式,通过整合线上和线下销售渠道,为用户提供更便捷、个性化和全方位的购物体验。随着新零售的普及,售后服务也变得至关重要。在售后服务中,经常出现用户使用相似图片进行退款的情况。为了减少退款纠纷,并为用户提供更加高效的售后服务,有必要对相似图片进行智能识别和匹配。
3.传统的相似图片识别方法通常基于特征提取和相似度比对算法。然而,由于图像特征的复杂性和变化性,传统方法在准确性和处理速度方面存在一定的局限性。例如,传统的基于哈希的方法往往难以准确识别和检索相似图片。此外,对于大规模的图像数据集,传统的特征提取方法需要耗费大量的计算资源和时间,计算复杂度高。另外,传统的相似度搜索方法受限于时间和空间复杂度,搜索速度一般较慢。
4.为了解决上述问题,近年来深度学习技术的快速发展为相似图片的识别提供了新的可能。深度学习模型通过学习大量的图像数据来提取更高层次的语义特征,从而实现更准确和快速的相似图片识别。与传统方法相比,深度学习模型可以通过端到端的训练方式,直接从原始图像数据中学习特征表示,避免了手工设计特征的繁琐过程。同时,深度学习模型还可以通过大规模并行计算的方式,加速相似图片的搜索和匹配过程,提高处理效率。
5.然而,在将深度学习模型应用于新零售售后领域时,需要考虑到图像特征的复杂性和变化性。传统的浅层特征如sift特征、感知哈希特征等在处理不同形式的图像修改效果时表现较好,但在区分同一物体的不同图像方面存在局限性,因此在新零售售后领域的应用受到限制。此外,深度学习模型中的无监督学习方法需要通过已标注的样本训练模型来提升判断效果,但在新零售领域中,黑产/黄牛攻击迭代快速,难以胜任召回任务。另外,在售后阶段对实时/准实时响应的要求中,传统的遍历方式难以胜任。在新零售风控领域中,除了图像特征外,还存在大量含有文字识别的场景,例如用户上传图像为发票、手机订单截图等。传统方法未考虑对文字的识别,因此难以胜任召回任务。


技术实现要素:

6.本技术的目的在于提供一种相似图片识别方法、装置、电子设备和存储介质,用于解决现有技术在相似图片搜索方面的准确性、处理速度和文字识别方面存在的局限性。
7.第一方面,本技术提供一种相似图片识别方法,包括:
8.构建特征向量的索引库;
9.获取待识别的图像;
10.对所述待识别的图像进行特征提取,以生成第一特征向量;
11.对所述第一特征向量进行降维,以生成第二特征向量;
12.从所述索引库中搜索与所述第二特征向量相似的特征向量。
13.在第一方面的一种实现方式中,对所述待识别的图像进行特征提取,以生成第一特征向量包括:
14.选择预训练模型;
15.将所述待识别的图像输入至所述预训练模型;
16.获取所述待识别的图像在所述预训练模型中的图像特征表示;
17.将所述图像特征表示转换为图像特征向量;所述第一特征向量包括所述图像特征向量。
18.在第一方面的一种实现方式中,对所述第一特征向量进行降维,以生成第二特征向量包括:对所述图像特征向量进行降维,以生成所述第二特征向量。
19.在第一方面的一种实现方式中,还包括:
20.将所述第二特征向量存储于所述索引库,以更新所述索引库中的特征向量;
21.获取售后人员对相似度搜索结果的反馈和评估;
22.根据所述反馈和评估定期对所述预训练模型进行微调和优化。
23.在第一方面的一种实现方式中,对所述待识别的图像进行特征提取,以生成第一特征向量包括:
24.识别所述待识别的图像中的文字;
25.将已识别的所述文字转化为文本数据;
26.提取所述文本数据中的关键信息,以生成文本特征向量;所述第一特征向量包括所述图像特征向量和所述文本特征向量。
27.在第一方面的一种实现方式中,对所述第一特征向量进行降维,以生成第二特征向量包括:
28.对所述图像特征向量进行降维;
29.对所述文本特征向量进行降维;
30.将降维后的图像特征向量和降维后的文本特征向量进行拼接,以生成所述第二特征向量。
31.在第一方面的一种实现方式中,从所述索引库中搜索与所述第二特征向量相似的特征向量包括:
32.逐一选择所述索引库中的特征向量;
33.计算所述特征向量与所述第二特征向量之间的距离;
34.设置筛选阈值;选择距离小于所述筛选阈值的预设数量的特征向量,并作为与所述第二特征向量相似的图像。
35.第二方面,本技术提供一种相似图片识别装置,包括:
36.构建模块,用于构建特征向量的索引库;
37.获取模块,用于获取待识别的图像;
38.提取模块,用于对所述待识别的图像进行特征提取,以生成第一特征向量;
39.降维模块,用于对所述第一特征向量进行降维,以生成第二特征向量;
40.索引模块,用于从所述索引库中搜索与所述第二特征向量相似的特征向量。
41.第三方面,本技术提供一种电子设备,包括:处理器及存储器;
42.所述存储器用于存储计算机程序;
43.所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行上述任一项所述的相似图片识别方法。
44.第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的相似图片识别方法。
45.如上所述,本技术所述的相似图片识别方法、装置、电子设备和存储介质,具有以下有益效果:
46.(1)通过高效的图像特征提取和近似最近邻搜索算法,实现了快速、准确和全面的相似图片搜索功能,解决了新零售售后领域中用户重复退款的问题,提升了售后服务的质量和用户满意度;
47.(2)通过结合图像特征提取和文本识别技术,提高了相似图片匹配的准确性和召回速度,提升了系统对相似图片的识别能力;
48.(3)通过定期的模型微调和优化,使得模型的准确性和召回率不断提高,系统能够适应不断变化的售后场景和用户需求,具有较高的灵活性和可扩展性。
附图说明
49.图1显示为本技术所述的相似图片识别方法于一实施例中的流程图。
50.图2显示为本技术所述的相似图片识别方法于一实施例中的resnet18网络结构示意图。
51.图3显示为本技术所述的相似图片识别装置于一实施例中的结构示意图。
52.图4显示为本技术所述的电子设备于一实施例中的结构示意图。
53.元件标号说明
54.31
ꢀꢀꢀꢀꢀꢀꢀꢀ
构建模块
55.32
ꢀꢀꢀꢀꢀꢀꢀꢀ
获取模块
56.33
ꢀꢀꢀꢀꢀꢀꢀꢀ
提取模块
57.34
ꢀꢀꢀꢀꢀꢀꢀꢀ
降维模块
58.35
ꢀꢀꢀꢀꢀꢀꢀꢀ
索引模块
59.41
ꢀꢀꢀꢀꢀꢀꢀꢀ
处理器
60.42
ꢀꢀꢀꢀꢀꢀꢀꢀ
存储器
61.s1~s7 步骤
62.s31~s37 步骤
63.s51~s54 步骤
具体实施方式
64.以下通过特定的具体实例说明本技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本技术的其他优点与功效。本技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
65.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本技术的基本构想,遂图式中仅显示与本技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
66.另外,在本技术中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本技术要求的保护范围之内。
67.本技术以下实施例提供了相似图片识别方法、装置、电子设备和存储介质,实现的应用场景包括但不限于电子产品、快速消费品、服装鞋包和家居用品等售后服务。本技术的相似图片识别方法可以在计算机设备上实施,包括但不限于服务器、云平台或其他计算资源。实施方式包括基于现有的深度学习框架(如tensorflow、pytorch)和相关的库(如opencv、faiss),并通过编程语言(如python、java)实现相应的算法和功能。本技术提供的相似图片识别方法、装置、电子设备和存储介质能够提供快速、准确和全面的相似图片搜索功能,有效解决了现有技术在相似图片搜索方面的准确性、处理速度和文字识别方面存在的局限性。下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行详细描述。
68.如图1所示,本实施例提供一种相似图片识别方法,具体包括以下步骤s1至步骤s5。
69.步骤s1、构建特征向量的索引库。
70.在本技术实施例中,选择faiss作为所述索引库。
71.faiss是一种高效的相似性搜索库,特别适用于大规模特征向量的索引和快速的相似性匹配。faiss基于近似最近邻(approximate nearest neighbor,ann)算法,通过构建索引结构和使用高效的查询算法,可以在大规模数据集上实现快速的相似性搜索。faiss提供了多种索引结构,如inverted index、ivf、pq等,这些索引结构可以在构建索引时对特征向量进行划分和聚类,以提高搜索效率。在实际应用中,可以根据实际需求选择合适的索引结构。
72.于一实施例中,所述索引库包括多模态特征向量,所述多模态特征向量至少包括以下一种或多种特征向量:
73.(1)文本特征向量。
74.(2)图像特征向量。
75.(3)文件和图像的融合特征向量。
76.一旦特征向量的索引库构建完成,就可以使用faiss进行相似性搜索。例如,给定一个查询图像的特征向量,可以通过faiss的查询算法,在索引库中快速找到与查询图像最相似的特征向量。具体地,根据相似性度量方法,如欧氏距离或余弦相似度,可以计算查询图像的特征向量与索引库中图像的特征向量之间的相似度分数。进一步地,通过设定一个阈值,可以判断查询图像是否与索引库中的某个图像相似。需要说明的是,使用faiss对文
本特征向量进行相似性搜索的过程和原理同图像特征向量基本一致,此处不再赘述。
77.本实现方式中,faiss作为高效的相似性搜索库,通过高效的索引结构和近似最近邻搜索算法,能够实现实时/准实时的相似图片搜索和匹配功能,从而提供更高效的售后服务体验,减少退款纠纷。
78.s2、获取待识别的图像。
79.对于图像识别任务,本技术实施例可以使用各种来源和类型的图像数据进行训练和测试。
80.例如,所述待识别图像可以是内部数据,也可以是外部数据,其中内部数据包括客服提供的相似图片和用户上传的图片等,外部数据包括网络公开的数据集和购物网站上的商品主图数据等。对于图像类型而言,所述待识别的图像可以是不包含文字信息的图像,如仅包含自然风景、动物或人物的图像,也可以是包含文字信息的图像,如购物小票、订单截图等。
81.s3、对所述待识别的图像进行特征提取,以生成第一特征向量。
82.于一实施例中,对所述待识别的图像进行特征提取,以生成第一特征向量包括步骤s31至步骤s34。
83.步骤s31、选择预训练模型。
84.步骤s32、将所述待识别的图像输入至所述预训练模型。
85.步骤s33、获取所述待识别的图像在所述预训练模型中的图像特征表示。
86.步骤s34、将所述图像特征表示转换为图像特征向量;所述第一特征向量包括所述图像特征向量。
87.常见的图像特征提取模型包括resnet、vgg等,本技术实施例选用resnet系列中深度较浅的resnet18模型作为骨干网络执行特征提取任务。
88.resnet18是一种由多个残差块(residual block)组成的深度残差网络(residual network)。相比传统的手工设计特征提取方法,resnet18能够自动学习图像的复杂特征,提高图像特征的表达能力和识别准确性。
89.如图2所示,resnet18包括17个卷积层和1个全连接层,其中每两个卷积层之间通过跳远连接构成一个残差块,最后一个残差块和全连接层相连,用于实现分类任务。但由于本技术的resnet18主要用于实现特征向量相似度的匹配功能,因此在选用resnet18时,并未设置全连接层,而是使用resnet18的最后一卷积层输出的特征向量。
90.进一步地,由于输出的特征向量是多维矩阵,如三维矩阵,可以对所述三维矩阵进行拉直,以生成一维向量。本实现方式中,拉直操作是将矩阵中的所有元素按照一定的顺序排列成一个一维向量。通过拉直操作,可以将复杂的多维矩阵转换为简单的一维向量,方便进行计算、存储和传输。
91.需要说明的,在拉直操作中,可以选择不同的顺序将矩阵元素放入一维向量中。常见的拉直顺序包括行优先、列优先和深度优先等,本技术实施例对使用的拉直顺序不做限定此外,。在使用所述图像特征提取模型之前,需要对所述图像特征提取模型进行训练,以使所述图像特征提取模型具备良好的特征表示能力。本技术实施例采用的数据集为带标签的大规模图像数据集,如coco数据集,采用的深度学习训练技术包括反向传播和梯度下降算法等,由于模型训练方法不在本技术保护范围之内,故此处不再具体描述。
92.另外,在特定的任务中,可以根据任务需求灵活选择图像特征提取模型的深度,以获得最佳的性能和效果。resnet系列网络提供了不同深度的模型,除了resnet18,还包括resnet34、resnet50、resnet101和resnet152等。这些不同深度的模型由不同层数的残差块组成,可以根据任务的复杂性和要求来选择合适的深度。具体而言,在选择特定深度的resnet模型时,需要在训练与推理速度、模型性能和计算资源之间进行权衡。如果任务要求更高的准确性和表达能力,且计算资源足够,可以考虑使用深度较大的模型。如果任务相对简单且计算资源有限,可以选择深度较浅的模型。
93.于另一实施例中,对所述待识别的图像进行特征提取,以生成第一特征向量包括步骤s35至步骤s37。
94.步骤s35、识别所述待识别的图像中的文字。
95.步骤s36、将已识别的所述文字转化为文本数据。
96.步骤s37、提取所述文本数据中的关键信息,以生成文本特征向量;所述第一特征向量包括所述图像特征向量和所述文本特征向量。
97.对于包含文字信息的图像,本技术实施例使用光学字符识别(optical character recognition,ocr)技术来提取和识别图像中的文字信息。
98.具体地,ocr是一种利用计算机视觉和模式识别算法,通过对图像中的文字进行分析和识别,将其转化为计算机可处理的文本形式的技术。在实际应用中,ocr引擎可以有效地对图像中的文字进行识别。常见的ocr引擎如tesseract具有先进的文字识别算法和模型,能够识别多种语言和字体,实现高准确性的文字识别。
99.需要说明的,在使用该模型之前,需要使用大量的带有标注的文字图像数据对模型进行训练,以使模型具备较高的准确性和鲁棒性。进一步地,还可以使用语言模型对ocr的识别结果进行字符校验、错误纠正、语义分析等后处理。
100.s4、对所述第一特征向量进行降维,以生成第二特征向量。
101.于一实施例中,对所述第一特征向量进行降维,以生成第二特征向量包括:对所述图像特征向量进行降维,以生成所述第二特征向量。
102.具体地,本技术实施例采用主成分分析(principal component analysis,pca)技术执行降维任务。例如,在使用图形特征提取模型对待识别的图像进行特征提取之后,可以得到每张图像的512维第一特征向量表示,接着使用pca对所述512维的第一特征向量进行降维,以生成64维的第二特征向量。
103.本实现方式中,pca技术能够将高维的图像特征向量降维到低维空间,减少特征向量的维度,同时保留了图像特征的主要信息,降低了计算复杂度,提高了后续相似度计算和搜索的效率。
104.于另一实施例中,对所述第一特征向量进行降维,以生成第二特征向量包括:对所述图像特征向量进行降维;对所述文本特征向量进行降维;将降维后的图像特征向量和降维后的文本特征向量进行拼接,以生成所述第二特征向量。
105.具体地,本技术实施例同样采用主成分分析(principal component analysis,pca)技术执行降维任务。
106.首先,针对包含文字信息的待识别图像,使用图形特征提取模型对所述待识别图像进行特征提取,生成512维的第一特征向量,其中所述第一特征向量包含512维的图像特
征向量和512维的文字特征向量。接着,使用pca对所述512维的第一特征向量进行降维,对应生成64维的第二特征向量,其中64维的第二特征向量包含64维的图像特征向量和64维的文字特征向量。最后,将64维的图像特征向量和64维的文字特征向量进行特征融合。具体地,直接将图像的embeding和文字的embeding按照顺序连接,以获取128维的联合特征向量。
107.本实现方式中,通过将图像特征向量和文字特征向量进行融合,获得了更全面、更丰富的联合特征表示。本技术的特征融合方法简单直接,能够有效地结合图像和文字的信息,更全面地评估图像的相似度,提高系统对特殊图像的处理能力。
108.s5、从所述索引库中搜索与所述第二特征向量相似的特征向量。
109.于一实施例中,从所述索引库中搜索与所述第二特征向量相似的特征向量包括步骤s51至步骤s54。
110.步骤s51、逐一选择所述索引库中的特征向量。
111.步骤s52、计算所述特征向量与所述第二特征向量之间的距离。
112.步骤s53、设置筛选阈值。
113.步骤s54、选择距离小于所述筛选阈值的预设数量的特征向量,并作为与所述第二特征向量相似的图像。
114.例如,当设置筛选阈值为0.8,从距离小于0.8的特征向量中随机选择5个以内的特征向量,将该5个以内的特征向量作为与所述第二特征向量相似的特征向量返回。
115.具体地,在搜索过程中,遍历索引库,逐个选择其中的特征向量,并计算所选择的特征向量与降维后的第二特征向量之间的距离。针对包含文字信息的待识别图像对应的第二特征向量,首先将128维的联合特征向量降维至64维,再与索引库中的特征向量进行距离度量,即确保参与距离度量的双方维度一致。本技术实施例采用的距离度量方法为l2距离,用于衡量两个特征向量之间的相似度或差异程度。通常情况下,l2距离越小,表示两个特征向量越相似;反之,则表示两个特征向量差异越大。基于此,通过计算和比较l2距离可以从索引库中找到与待识别图像最相似的图像。在其他实施例中,可以将l2距离替换为欧式距离、编辑距离或余弦相似度等,本技术对采用的相似度度量方法不做限制。
116.于一实施例中,本实施例提供的相似图片识别方法还包括以下步骤s6至步骤s7。
117.步骤s6、将所述第二特征向量存储于所述索引库,以更新所述索引库中的特征向量。
118.本实现方式中,通过将新生成的第二特征向量存储于索引库,可以构建高效的索引结构,实现索引库的更新和扩充,帮助提高了图像搜索和检索的准确性和召回速度。
119.步骤s7、获取售后人员对相似度搜索结果的反馈和评估;根据所述反馈和评估定期对所述预训练模型进行微调和优化。
120.具体地,售后人员可以对搜索结果进行审核和验证,以识别是否存在误差或漏检的情况,并提出改进建议。基于售后人员的反馈和评估,可以定期对预训练模型进行微调和优化,其中微调和优化的过程包括对模型的参数、数据处理流程和算法进行调整,以提升搜索结果的准确性和响应速度。例如,可以通过增加训练样本、优化特征提取器、改进距离度量方法等方式不断优化模型的性能。
121.本实现方式中,通过定期的微调和优化可以不断改进模型的搜索能力,使其更加
精确和可靠,提高售后服务的质量和效率。
122.本技术实施例所述的相似图片识别方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本技术的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本技术的保护范围内。
123.如图3所示,于一实施例中,本实施例提供一种相似图片识别装置,包括构建模块31、获取模块32、提取模块33、降维模块34和索引模块35。
124.所述构建模块31用于构建特征向量的索引库。
125.所述获取模块32用于获取待识别的图像。
126.所述提取模块33用于对所述待识别的图像进行特征提取,以生成第一特征向量。
127.所述降维模块34用于对所述第一特征向量进行降维,以生成第二特征向量。
128.所述索引模块35用于从所述索引库中搜索与所述第二特征向量相似的特征向量
129.需要说明的是,本实施例中的构建模块31、获取模块32、提取模块33、降维模块34和索引模块35的结构和原理与上述相似图片识别方法中的步骤及实施例一一对应,故在此不再赘述。
130.本技术实施例提供的相似图片识别装置可以实现本技术所述的相似图片识别方法,但本技术所述的相似图片识别方法的实现装置包括但不限于本实施例列举的相似图片识别装置的结构,凡是根据本技术的原理所做的现有技术的结构变形和替换,都包括在本技术的保护范围内。
131.如图4所示,本技术实施例提供一种电子设备,所述电子设备包括:
132.所述存储器42用于存储计算机程序;
133.所述处理器41用于执行所述存储器42存储的计算机程序,以使所述电子设备执行上述任一项所述的相似图片识别方法。
134.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置或方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块/单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或单元可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
135.作为分离部件说明的模块/单元可以是或者也可以不是物理上分开的,作为模块/单元显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块/单元来实现本技术实施例的目的。例如,在本技术各个实施例中的各功能模块/单元可以集成在一个处理模块中,也可以是各个模块/单元单独物理存在,也可以两个或两个以上模块/单元集成在一个模块/单元中。
136.本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但
是这种实现不应认为超出本技术的范围。
137.本技术实施例还提供了一种计算机可读存储介质,该程序被处理器执行时实现上述任一项所述的相似图片识别方法。本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(magnetic tape),软盘(floppy disk),光盘(optical disc)及其任意组合。上述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,dvd))、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
138.本技术实施例还可以提供一种计算机程序产品,所述计算机程序产品包括一个或多个计算机指令。在计算设备上加载和执行所述计算机指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。
139.所述计算机程序产品被计算机执行时,所述计算机执行前述方法实施例所述的方法。该计算机程序产品可以为一个软件安装包,在需要使用前述方法的情况下,可以下载该计算机程序产品并在计算机上执行该计算机程序产品。
140.上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,可以参见其他流程或结构的相关描述。
141.综上所述,本技术提供的相似图片识别方法、装置、电子设备和存储介质解决了现有技术在相似图片搜索方面的准确性、处理速度和文字识别方面存在的局限性,通过高效的图像特征提取和近似最近邻搜索算法,实现了快速、准确和全面的相似图片搜索功能,解决了新零售售后领域中用户重复退款的问题,提升了售后服务的质量和用户满意度;通过结合图像特征提取和文本识别,提高了相似图片匹配的准确性和召回速度,提升了系统对相似图片的识别能力;通过定期的模型微调和优化,使得模型的准确性和召回率不断提高,系统能够适应不断变化的售后场景和用户需求,具有较高的灵活性和可扩展性。
142.上述实施例仅例示性说明本技术的原理及其功效,而非用于限制本技术。任何熟悉此技术的人士皆可在不违背本技术的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本技术所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本技术的权利要求所涵盖。

技术特征:
1.一种相似图片识别方法,其特征在于,包括:构建特征向量的索引库;获取待识别的图像;对所述待识别的图像进行特征提取,以生成第一特征向量;对所述第一特征向量进行降维,以生成第二特征向量;从所述索引库中搜索与所述第二特征向量相似的特征向量。2.根据权利要求1所述的相似图片识别方法,其特征在于,对所述待识别的图像进行特征提取,以生成第一特征向量包括:选择预训练模型;将所述待识别的图像输入至所述预训练模型;获取所述待识别的图像在所述预训练模型中的图像特征表示;将所述图像特征表示转换为图像特征向量;所述第一特征向量包括所述图像特征向量。3.根据权利要求2所述的相似图片识别方法,其特征在于,对所述第一特征向量进行降维,以生成第二特征向量包括:对所述图像特征向量进行降维,以生成所述第二特征向量。4.根据权利要求2所述的相似图片识别方法,其特征在于,还包括:将所述第二特征向量存储于所述索引库,以更新所述索引库中的特征向量;获取售后人员对相似度搜索结果的反馈和评估;根据所述反馈和评估定期对所述预训练模型进行微调和优化。5.根据权利要求2所述的相似图片识别方法,其特征在于,对所述待识别的图像进行特征提取,以生成第一特征向量包括:识别所述待识别的图像中的文字;将已识别的所述文字转化为文本数据;提取所述文本数据中的关键信息,以生成文本特征向量;所述第一特征向量包括所述图像特征向量和所述文本特征向量。6.根据权利要求5所述的相似图片识别方法,其特征在于,对所述第一特征向量进行降维,以生成第二特征向量包括:对所述图像特征向量进行降维;对所述文本特征向量进行降维;将降维后的图像特征向量和降维后的文本特征向量进行拼接,以生成所述第二特征向量。7.根据权利要求1所述的相似图片识别方法,其特征在于,从所述索引库中搜索与所述第二特征向量相似的特征向量包括:逐一选择所述索引库中的特征向量;计算所述特征向量与所述第二特征向量之间的距离;设置筛选阈值;选择距离小于所述筛选阈值的预设数量的特征向量,并作为与所述第二特征向量相似的图像。
8.一种相似图片识别装置,其特征在于,包括:构建模块,用于构建特征向量的索引库;获取模块,用于获取待识别的图像;提取模块,用于对所述待识别的图像进行特征提取,以生成第一特征向量;降维模块,用于对所述第一特征向量进行降维,以生成第二特征向量;索引模块,用于从所述索引库中搜索与所述第二特征向量相似的特征向量。9.一种电子设备,其特征在于,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行权利要求1至7中任一项所述的相似图片识别方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7任一项所述的相似图片识别方法。

技术总结
本申请提供一种相似图片识别方法、装置、电子设备和存储介质,所述方法包括:构建特征向量的索引库;获取待识别的图像;对所述待识别的图像进行特征提取,以生成第一特征向量;对所述第一特征向量进行降维,以生成第二特征向量;从所述索引库中搜索与所述第二特征向量相似的特征向量。本申请实现了快速、准确和全面的相似图片搜索功能,解决了新零售售后领域中用户重复退款的问题,提升了售后服务的质量和用户满意度;通过结合图像特征提取和文本识别技术,提高了相似图片匹配的准确性和召回速度,提升了系统对相似图片的识别能力;通过定期的模型微调和优化,使得模型的准确性和召回率不断提高,系统具有较高的灵活性和可扩展性。性。性。


技术研发人员:王子超 孙超 关塞
受保护的技术使用者:北京永辉科技有限公司
技术研发日:2023.07.11
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐