商品比对方法及其装置、设备、介质与流程

未命名 10-18 阅读:131 评论:0


1.本技术涉及电商技术领域,尤其涉及一种商品比对方法及其相应的装置、计算机设备、计算机可读存储介质。


背景技术:

2.商品比对,作为一种重要的工具和策略,在多种电商场景下发挥着巨大的作用,例如商品搜索、商品推荐和竞品分析等。它不仅可以帮助用户找到他们真正需要的产品,提升购物体验,还可以帮助企业优化产品设计和制定更有效的营销策略。
3.传统技术中,常见的方式是比对商品之间单方面的商品信息,例如比对商品图片、商品标题等中任意一项,这种方式主要是通过提取出比对各个商品对应的单方面的商品信息中的关键信息,并对各个商品对应的关键信息进行比对,以寻找比对商品之间的相似性。然而这样的实现方式,由于单方面的商品信息不足以提供关于商品完整的描述和细节,难以确保最终所得的相似性的准确度和置信度,使得商品比对效果无法达到预期。
4.鉴于传统技术的不足,本技术人长期从事相关领域的研究,为解决电商领域业内难题,故另辟蹊径。


技术实现要素:

5.本技术的首要目的在于解决上述问题至少之一而提供一种商品比对方法及其相应的装置、计算机设备、计算机可读存储介质。
6.为满足本技术的各个目的,本技术采用如下技术方案:
7.适应本技术的目的之一而提供的一种商品比对方法,包括如下步骤:
8.获取商品比对组中每个商品的商品描述文本和商品图片;
9.采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,所述第一维度分值表征商品比对组中商品之间的图像相似度;
10.采用预设的第二维度模型根据所述商品比对组中每个商品的商品描述文本中的商品标题,确定出第二维度分值,所述第二维度分值表征商品比对组中商品之间的标题相似度;
11.采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,所述详情文本包括商品参数、商品品类、商品品牌中任意多项;
12.采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。
13.另一方面,适应本技术的目的之一而提供的一种商品比对装置,包括数据获取模块、第一维度模块、第二维度模块、第三维度模块以及融合维度模块,其中,数据获取模块,用于获取商品比对组中每个商品的商品描述文本和商品图片;第一维度模块,用于采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,所
述第一维度分值表征商品比对组中商品之间的图像相似度;第二维度模块,用于采用预设的第二维度模型根据所述商品比对组中每个商品的商品描述文本中的商品标题,确定出第二维度分值,所述第二维度分值表征商品比对组中商品之间的标题相似度;第三维度模块,用于采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,所述详情文本包括商品参数、商品品类、商品品牌中任意多项;融合维度模块,用于采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。
14.又一方面,适应本技术的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本技术所述的商品比对方法的步骤。
15.又一方面,适应本技术的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的商品比对方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
16.本技术的技术方案存在多方面优势,包括但不限于如下各方面:
17.本技术通过获取商品比对组中每个商品的商品描述文本和商品图片。采用预设的第一维度模型、第二维度模型、第三维度模型,对应根据商品比对组中每个商品的商品图片、商品描述文本中的商品标题、商品描述文本中的详情文本,分别确定出商品比对组的第一维度分值、第二维度分值、第三维度分值。采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。本技术能够在比对商品时可以综合考虑商品的精炼文本描述、详细文本描述、图片,更全面地描述商品的特征。这样可以在比对商品时,不仅仅依赖于单一维度的特征,而是通过综合考量多个方面,提高比对的准确性和精度。同时,通过训练预设的维度模型和多维融合模型,可以根据具体需求对模型进行调整和优化,提高比对结果的质量。
附图说明
18.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
19.图1为本技术的商品比对方法的典型实施例的流程示意图;
20.图2为本技术的实施例中确定出商品组合的第一维度分值的流程示意图;
21.图3为本技术的实施例中确定商品组合的第三维度分值的流程示意图;
22.图4为本技术的实施例中确定出商品组合的目标比对分值的流程示意图;
23.图5为本技术的实施例中确定出竞品列表,以及标识其中各个竞品商品的区别特征的流程示意图;
24.图6为本技术的一种实施例中训练第一维度模型、第二维度模型、第三维度模型、融合维度模型的流程示意图;
25.图7为本技术的另一种实施例中训练第一维度模型、第二维度模型、第三维度模型、融合维度模型的流程示意图;
26.图8为本技术的商品比对装置的原理框图;
27.图9为本技术所采用的一种计算机设备的结构示意图。
具体实施方式
28.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
29.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
30.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
31.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
32.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
33.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩充到适用于服务器
机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本技术的网络部署方式的实施方式。
34.本技术的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
35.本技术中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
36.本技术所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本技术的技术方案所调用即可。
37.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
38.本技术即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
39.本技术的一种商品比对方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如,本技术的示例性应用场景中,可以在电商平台的服务器中部署实现,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
40.请参阅图1,本技术的商品比对方法,在其典型实施例中,包括如下步骤:
41.步骤s1100、获取商品比对组中每个商品的商品描述文本和商品图片;
42.通常会构造商品数据库用于存放线上店铺内所有商品的商品信息,每个商品关联相应的商品的商品标识,所述商品信息包括商品描述文本和商品图片,所述商品描述文本包括商品标题、详情文本,所述详情文本包括商品品类、商品品牌、商品参数、商品价格等,所述商品图片包括商品主图、商品详情图等。据此,从目标线上店铺的商品数据库中获取关联目标商品的商品标识的商品品类和商品品牌。所述商品标识用于唯一标识单个商品,具体可以是商品id,本领域技术人员可以灵活变通设定。
43.指定任意两个需要比对的不同的商品,便可以所述两个商品构成所述商品比对组,根据商品比对组中每个商品对应的商品标识,从商品数据库中获取商品标识关联的商品信息即商品描述文本和商品图片。
44.步骤s1200、采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,所述第一维度分值表征商品比对组中商品之间的图像相似度;
45.可以理解,商品图片作为表示商品的一种维度信息,可以提供商品的外观、形状、
结构及细节设计等中任意一项或任意多项的关键信息。
46.为了高效直接地确定出商品比对组中每个商品的商品图片之间的相似性,据此相应建模本技术的第一维度模型。所述第一维度模型可以是双塔模型,结构上包括两个图像支路网络和分类器,所述两个图像支路网络是相同的图像特征提取模型,所述图像特征提取模型可采用适用于提取图像特征的模型,推荐选型为vit(vision transformer)模型,亦可采用其他的例如cnn模型、深度卷积模型vgg、resnet等任一种模型。所述分类器适用于二分类任务,可以是mlp(前馈神经网络)或者fc(全连接层)。
47.所述第一维度模型预先经过训练至收敛,习得确定出商品比对组的第一维度分值的能力。所述第一维度模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
48.将所述商品比对组中每个商品的商品图片对应输入至预设的所述第一维度模型的两个图像支路网络,由所述两个图像支路网络分别处理相应的商品图片,对应获得商品图片的图像特征向量,以单个图像支路网络为例,一种实施例中,采用resnet50模型实现所述图像支路网络,将经过常规的预处理后商品图片输入至resnet50模型,由resnet50模型的主干块(stem block)及4个残差块(bottleneck blocks)逐步提取商品图片对应的图像特征,其中浅层阶段(stage)提取商品图片中商品对应的细节、边缘等基础特征,进而在深层阶段提取深层语义特征以及高级逻辑特征,最终获得最后阶段即res5 stage输出的商品图片的向量化表示的图片特征即图像特征向量。由所述第一维度模型的分类器采用向量距离算法,计算出所述两个图像支路网络对应所得的图像特征向量之间的向量距离,根据所述向量距离将所述两个图像特征向量映射至预设的二分类别,将所述向量距离作为映射至正类别的分类概率,相应与该正类别的分类概率互补的值便是映射至负类别的分类概率,获得所述正类别的分类概率作为第一维度分值。所述预处理是适配resnet50模型输入所需,对输入该模型的商品图片进行相应的处理操作,例如图像尺寸调整、像素归一化、数据增强、通道重排等,本领域技术人员可按此处揭示灵活变通实现。所述向量距离算法可以是余弦相似度算法、欧氏距离算法、皮尔逊相关系数算法、杰卡德系数算法等任意一种,本领域技术人员可按需择一实现。所述二分类别包括表征输入模型的两个商品图片之间相似的正类别,以及表征输入模型的两个商品图片之间不相似的负类别。
49.步骤s1300、采用预设的第二维度模型根据所述商品比对组中每个商品的商品描述文本中的商品标题,确定出第二维度分值,所述第二维度分值表征商品比对组中商品之间的标题相似度;
50.可以理解,商品标题作为表示商品的一种维度信息,可以提供商品的商品品牌、商品品类、卖点、特性、功能、制造商、销售状态(新品、特价、清仓甩卖)等中任意一项或任意多项的关键信息。
51.所述第二维度模型预先经过训练至收敛,习得确定出商品比对组的第二维度分值的能力。所述第二维度模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
52.为了高效直接地确定出商品比对组中每个商品的商品标题之间的相似性,据此相应建模本技术的第二维度模型。所述第二维度模型可以是双塔模型,结构上包括两个文本支路网络和分类器,所述两个文本支路网络是相同的文本特征提取模型,所述文本特征提
取模型可以采用nlp领域中适用于提取文本特征的模型,例如bert模型为目前为止较为优秀的能够处理文本时序信息的神经网络模型,可以适用于本技术中负责文本提取工作,同理,electra模型能以更低参数量获得与bert模型同等或相近的效果,故也推荐使用。
53.将所述商品比对组中每个商品的商品描述文本中的商品标题对应输入至预设的所述第二维度模型的两个文本支路网络,由所述两个文本支路网络分别处理相应的商品标题,对应获得商品标题的文本特征向量,以单个文本支路网络为例,一种实施例中,采用bert模型实现所述文本支路网络,将商品标题输入至bert模型,对商品标题进行分词获得分词序列,提取出所述分词序列的深层语义信息,获得相应的文本特征向量。所述分词序列的深层语义信息包含该分词序列中各个分词对应的深层语义信息,每个分词的深层语义信息是通过对分词序列中的每个分词,基于注意力机制分别与其他所有词进行特征交互而得,使得融合相应分词自身的语义与该分词的上下文语义,所述上下文语义是指该分词与其他所有分词之间的语义。由所述第二维度模型的分类器采用向量距离算法,计算出所述两个文本支路网络对应所得的文本特征向量之间的向量距离,根据所述向量距离将所述两个文本特征向量映射至预设的二分类别,将所述向量距离作为映射至正类别的分类概率,相应与该正类别的分类概率互补的值便是映射至负类别的分类概率,获得所述正类别的分类概率作为第二维度分值。所述向量距离算法可以是余弦相似度算法、欧氏距离算法、皮尔逊相关系数算法、杰卡德系数算法等任意一种,本领域技术人员可按需择一实现。所述二分类别包括表征输入模型的两个商品标题之间相似的正类别,以及表征输入模型的两个商品标题之间不相似的负类别。
54.步骤s1400、采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,所述详情文本包括商品参数、商品品类、商品品牌中任意多项;
55.可以理解,详情文本作为表示商品的一种维度信息,可以提供商品的商品品类、商品品牌、商品参数等中任意一项或任意多项的关键信息,其中特别是商品参数,能够提供商品的最详细且完整的相关参数。
56.所述第三维度模型预先经过训练至收敛,习得确定出商品比对组的第三维度分值的能力。所述第三维度模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
57.为了高效直接地确定出商品比对组中每个商品的商品描述文本中的详情文本之间的相似性,据此相应建模本技术的第三维度模型。所述第三维度模型可以是双塔模型,结构上包括两个文本支路网络和分类器,所述两个文本支路网络是相同的文本特征提取模型,所述文本特征提取模型可以采用nlp领域中适用于提取文本特征的模型,例如bert模型为目前为止较为优秀的能够处理文本时序信息的神经网络模型,可以适用于本技术中负责文本提取工作,同理,electra模型能以更低参数量获得与bert模型同等或相近的效果,故也推荐使用。
58.将所述商品比对组中每个商品的详情文本对应输入至预设的所述第三维度模型的两个文本支路网络,由所述两个文本支路网络分别处理相应的详情文本,对应获得详情文本的文本特征向量,以单个文本支路网络为例,一种实施例中,采用bert模型实现所述文本支路网络,将详情文本输入至bert模型,对详情文本进行分词获得分词序列,提取出所述
分词序列的深层语义信息,获得相应的文本特征向量。所述分词序列的深层语义信息包含该分词序列中各个分词对应的深层语义信息,每个分词的深层语义信息是通过对分词序列中的每个分词,基于注意力机制分别与其他所有词进行特征交互而得,使得融合相应分词自身的语义与该分词的上下文语义,所述上下文语义是指该分词与其他所有分词之间的语义。由所述第三维度模型的分类器采用向量距离算法,计算出所述两个文本支路网络对应所得的文本特征向量之间的向量距离,根据所述向量距离将所述两个文本特征向量映射至预设的二分类别,将所述向量距离作为映射至正类别的分类概率,相应与该正类别的分类概率互补的值便是映射至负类别的分类概率,获得所述正类别的分类概率作为第三维度分值。所述向量距离算法可以是余弦相似度算法、欧氏距离算法、皮尔逊相关系数算法、杰卡德系数算法等任意一种,本领域技术人员可按需择一实现。所述二分类别包括表征输入模型的两个详情文本之间相似的正类别,以及表征输入模型的两个详情文本之间不相似的负类别。
59.步骤s1500、采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。
60.可以理解,所述商品比对组的第一维度分值、第二维度分值、第三维度分值均影响商品比对的结果,且各个维度分值分别影响的程度还影响所述结果的准确性。因此,为了合理地确定出各个维度分值对应的影响力相匹配的权重,进而将各个维度分值匹配相对应的权重得出商品比对组的目标比对分值,使得所述目标比对分值基于综合各个维度所体现商品比对组的相似性,全面精准地体现商品比对组的相似性,据此相应建模本技术的多维融合模型。所述多维融合模型可以是mlp(前馈神经网络),其中包括输入层、隐含层及输出层。
61.所述多维度融合模型预先经过训练至收敛,确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。所述多维度融合模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
62.所述多维融合模型的输入层以所述商品比对组的第一维度分值、第二维度分值、第三维度分值作为输入,将各个维度分值输入至隐含层,由隐含层确定出与所述各个维度分值相匹配的权重,进而由输出层将各个维度分值分别乘上其对应的权重之后加和得出商品比对组的目标比对分值。
63.根据本技术的典型实施例可以知晓,本技术的技术方案存在多方面优势,包括但不限于如下各方面:
64.本技术通过获取商品比对组中每个商品的商品描述文本和商品图片。采用预设的第一维度模型、第二维度模型、第三维度模型,对应根据商品比对组中每个商品的商品图片、商品描述文本中的商品标题、商品描述文本中的详情文本,分别确定出商品比对组的第一维度分值、第二维度分值、第三维度分值。采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。本技术能够在比对商品时可以综合考虑商品的精炼文本描述、详细文本描述、图片,更全面地描述商品的特征。这样可以在比对商品时,不仅仅依赖于单一维度的特征,而是通过综合考量多个方面,提高比对的准确性和精度。同时,通过训练预设的维度模型和多维融合模型,可以根据具体需求对模型进行调整和优化,提高比对结果的质量。
65.请参阅图2,进一步的实施例中,步骤s1200、采用预设的第一维度模型根据所述商
品比对组中每个商品的商品图片,确定出第一维度分值,包括如下步骤:
66.步骤s1210、将所述商品比对组中每个商品的商品图片对应输入至预设的第一维度模型中两个图像支路网络;
67.所述第一维度模型可以是双塔模型,结构上包括两个图像支路网络和分类器,所述两个图像支路网络是相同的图像特征提取模型,所述图像特征提取模型可采用适用于提取图像特征的模型,推荐选型为vit(vision transformer)模型,亦可采用其他的例如cnn模型、深度卷积模型vgg、resnet等任一种模型。所述分类器适用于二分类任务,可以是mlp(前馈神经网络)或者fc(全连接层)。
68.所述第一维度模型预先经过训练至收敛,习得确定出商品比对组的第一维度分值的能力。所述第一维度模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
69.将所述商品比对组中每个商品的商品图片对应输入至预设的所述第一维度模型的两个图像支路网络。
70.步骤s1220、由所述两个图像支路网络分别提取出相应商品图片的图像语义信息,获得对应的图像特征向量;
71.由所述两个图像支路网络分别处理相应的商品图片,对应获得商品图片的图像特征向量,以单个图像支路网络为例,一种实施例中,采用vit模型实现所述图像支路网络,将商品图片输入至vit模型,分割所述商品图片而得到多个图片小块,采用卷积层对所述多个图像小块进行卷积,从而将每个图像小块统一线性映射至一个一维向量中,将该一维向量输入至transformerencoder中提取出所述商品图片的深层语义信息,获得相应的图像特征向量。所述提取过程中主要包括注意力机制操作和位置嵌入操作。所述位置嵌入操作是基于商品图片的每个图片小块对应在商品图片中的位置,为每个图片小块嵌入相应的位置嵌入向量。所述注意力机制操作通常基于多头注意力机制实现捕捉商品图片中的各个图片小块之间的相关性和上下文信息,从而确定出对商品比对任务重要的图片小块,重点关注这些图片小块。
72.步骤s1230、由第一维度模型中分类器确定所述两个图像特征向量之间的相似度作为第一维度分值。
73.由所述第一维度模型的分类器采用向量距离算法,计算出所述两个图像支路网络对应所得的图像特征向量之间的向量距离,根据所述向量距离将所述两个图像特征向量映射至预设的二分类别,将所述向量距离作为映射至正类别的分类概率,相应与该正类别的分类概率互补的值便是映射至负类别的分类概率,获得所述正类别的分类概率作为第一维度分值。所述向量距离算法可以是余弦相似度算法、欧氏距离算法、皮尔逊相关系数算法、杰卡德系数算法等任意一种,本领域技术人员可按需择一实现。所述二分类别包括表征输入模型的两个商品图片之间相似的正类别,以及表征输入模型的两个商品图片之间不相似的负类别。
74.本实施例中,通过采用第一维度模型根据商品比对组中各个商品的商品图片,确定出商品比对组的第一维度分值,执行高效,能够确保第一维度分值的准确性。
75.请参阅图3,进一步的实施例中,步骤s1400、采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度
分值表征商品比对组中商品之间的详情相似度,包括如下步骤:
76.步骤s1410、将所述商品比对组中每个商品的商品描述文本中的详情文本对应输入至预设的第三维度模型中两个文本支路网络;
77.所述详情文本包括商品参数、商品品类、商品品牌中任意多项。
78.所述第三维度模型预先经过训练至收敛,习得确定出商品比对组的第三维度分值的能力。所述第三维度模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
79.为了高效直接地确定出商品比对组中每个商品的商品描述文本中的详情文本之间的相似性,据此相应建模本技术的第三维度模型。所述第三维度模型可以是双塔模型,结构上包括两个文本支路网络和分类器,所述两个文本支路网络是相同的文本特征提取模型,所述文本特征提取模型可以采用nlp领域中适用于提取文本特征的模型,例如bert模型为目前为止较为优秀的能够处理文本时序信息的神经网络模型,可以适用于本技术中负责文本提取工作,同理,electra模型能以更低参数量获得与bert模型同等或相近的效果,故也推荐使用。
80.步骤s1420、由所述两个文本支路网络分别提取出相应的详情文本的文本语义信息,获得对应的文本特征向量;
81.将所述商品比对组中每个商品的详情文本分别对应输入至预设的所述第三维度模型的两个文本支路网络,由所述两个文本支路网络分别处理相应的详情文本,对应获得详情文本的文本特征向量,在此过程中,对于高维稀疏的详情文本,可采用pca算法进行降维,在保留详情文本的主要特征前提下,获得相应的低维表示。以单个文本支路网络为例,一种实施例中,采用electra模型实现所述文本支路网络,将详情文本输入至electra模型,对详情文本进行分词获得分词序列,提取出所述分词序列的深层语义信息,获得相应的文本特征向量。所述分词序列的深层语义信息包含该分词序列中各个分词对应的深层语义信息,每个分词的深层语义信息是通过对分词序列中的每个分词,基于注意力机制分别与其他所有词进行特征交互而得,使得融合相应分词自身的语义与该分词的上下文语义,所述上下文语义是指该分词与其他所有分词之间的语义。
82.步骤s1430、由第三维度模型中分类器确定所述两个文本特征向量之间的相似度作为第三维度分值。
83.由所述第三维度模型的分类器采用向量距离算法,计算出所述两个文本支路网络对应所得的文本特征向量之间的向量距离,根据所述向量距离将所述两个文本特征向量映射至预设的二分类别,将所述向量距离作为映射至正类别的分类概率,相应与该正类别的分类概率互补的值便是映射至负类别的分类概率,获得所述正类别的分类概率作为第三维度分值。所述向量距离算法可以是余弦相似度算法、欧氏距离算法、皮尔逊相关系数算法、杰卡德系数算法等任意一种,本领域技术人员可按需择一实现。所述二分类别包括表征输入模型的两个详情文本之间相似的正类别,以及表征输入模型的两个详情文本之间不相似的负类别。
84.本实施例中,通过采用第三维度模型根据商品比对组中各个商品的商品描述文本中的详情文本,确定出商品比对组的第三维度分值,执行高效,能够确保第三维度分值的准确性。
85.请参阅图4,进一步的实施例中,步骤s1500、采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值之前,包括如下步骤:
86.步骤s2500、根据商品比对组中每个商品的商品品类对应的价格区间分布,确定出每个商品的商品价格所属的区间标识,所述区间标识表征相应的价格区间对应的用户选择偏好;
87.预先确定出电商平台中每个商品品类对应的价格区间分布,具体而言,以单个商品品类为例,确定出属于商品品类且被用户购买的所有商品,获取每个商品的商品价格,根据商品价格从低到高的顺序排序所述所有商品价格,获得价格排序列表。进一步,根据价格排序列表确定出预设的多个占总比对应的价格区间,所述多个占总比之和为100%,具体每个占总比的百分比值可由本领域技术人员按需设定,一种实施例中,预设的多个占总比分别是30%、60%、10%,设定所述30%的价格区间的上限值为0,并且计算商品排序列表中商品价格的总数乘上30%所得的数值,得出商品排序列表的排名,以该排名对应的商品价格作为该价格区间的下限值;设定所述60%的价格区间的上限值为所述30%的价格区间的下限值,并且计算商品排序列表中商品价格的总数乘上90%(30%+60%),得出商品排序列表中的排名,以该排名对应的商品价格作为所述60%的价格区间的下限值;设定10%的价格区间的上限值为所述60%的价格区间的下限值,以商品排序列表中最后排名的商品价格作为所述10%的价格区间的下限值。可以理解,所述30%、60%、10%分别的价格区间,相应表示30%的用户、60%的用户、10%的用户分别选择购买的价格区间。据此,将所述每个占总比作为其对应的价格区间的区间标识,进而将每个区间标识关联相应的价格区间构成价格区间分布。
88.根据商品比对组中每个商品的商品品类,获得每个商品品类对应的价格区间分布。从所述每个商品对应的价格区间分布中,对应确定出相应商品的商品价格所属的价格区间,获取所述价格区间的区间标识。
89.步骤s2510、根据所述区间标识是否相同相应确定出所述商品比对组的第四维度分值;
90.当所述商品比对组的每个商品对应的区间标识相同,确定出相应的第四维度分值为1。当所述商品比对组的每个商品对应的区间标识不同,确定出相应的第四维度分值为0。
91.步骤s2520、采用预设的多维融合模型根据所述商品比对组对应的第一维度分值、第二维度分值、第三维度分值、第四维度分值,确定出目标比对分值。
92.可以理解,所述商品比对组的第一维度分值、第二维度分值、第三维度分值、第四维度分值均影响商品比对的结果,且各个维度分值分别影响的程度还影响所述结果的准确性。因此,为了合理地确定出各个维度分值对应的影响力相匹配的权重,进而将各个维度分值匹配相对应的权重得出商品比对组的目标比对分值,使得所述目标比对分值基于综合各个维度所体现商品比对组的相似性,全面精准地体现商品比对组的相似性,据此相应建模本技术的多维融合模型。所述多维融合模型可以是mlp(前馈神经网络),其中包括输入层、隐含层及输出层。
93.所述多维度融合模型预先经过训练至收敛,确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。所述多维度融
合模型的训练过程由后续部分实施例进一步揭示,本步骤暂且按下不表。
94.所述多维融合模型的输入层以所述商品比对组的第一维度分值、第二维度分值、第三维度分值、第四维度分值作为输入,将各个维度分值输入至隐含层,由隐含层确定出与所述各个维度分值相匹配的权重,进而由输出层将各个维度分值分别乘上其对应的权重之后加和得出商品比对组的目标比对分值。
95.本实施例中,通过确定出商品比对组中每个商品对应的区间标识,进而根据区间标识是否相同,确定出相应的第四维度分值,采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值、第四维度分值匹配对应的权重得出目标比对分值。能够考量比对商品全面的商品信息,确保目标比对分值的准确性和可靠性。
96.请参阅图5,进一步的实施例中,步骤s1500、采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值之后,包括如下步骤:
97.步骤s1600、获取包含同一目标商品且目标比对分值满足预设条件的多个商品比对组,根据各个商品比对组对应的目标比对分值、第一维度分值、第二维度分值、第三维度分值中任意一项或任意多项进行排序,依序确定出各个商品比对组中与目标商品比对的商品作为竞品商品,构造出各种排序对应的竞品商品列表;
98.可指定任意一个商品作为所述目标商品,将目标商品和需与其比对的其他单个商品构成所述商品比对组,所需其他商品不同相应构成的商品比对组不同,从而获得多个商品比对组。按照步骤s1100-1500确定出每个所述商品比对组对应的目标比对分值,筛选出目标比对分值满足预设阈值的多个商品比对组。所述预设阈值可以本领域技术人员灵活变通设定。
99.进一步,根据各个所述商品比对组对应的目标比对分值、第一维度分值、第二维度分值、第三维度分值中任意一项或任意多项,根据相应分值从高到低的顺序进行排序,依据各种排序分别确定出相应的各个商品比对组中与目标商品比对的商品作为的竞品商品,获取所述每个竞品商品和目标商品对应的商品信息,构造出各种排序对应的竞品商品列表。
100.步骤s1610、标识出所述各个竞品商品列表中每个竞品商品与目标商品之间的区别特征。
101.获取所述各个竞品商品列表中每个竞品商品和目标商品对应的商品信息,并且标识所述各个竞品商品列表中每个竞品商品与目标商品之间相对应的维度分值或目标比对分值的互补值作为区别特征。
102.本实施例中,揭示了竞品商品列表的构造以及标识列表中每个竞品商品与目标商品之间的区别特征,可以便于用户通过查阅竞品商品列表便可获悉竞品及其与目标商品之间的区别特征,提供用于竞品分析的有力依据。
103.请参阅图6,进一步的实施例中,步骤s1100、获取待投放广告商品的商品描述文本和商品图片之前,包括如下步骤:
104.步骤s1000、单独训练第一维度模型、第二维度模型、第三维度模型,直至分别训练至收敛,使得各个维度模型习得确定出商品比对组相对应的各个维度分值的能力;
105.预先构造出多个商品比对组,并且对每个商品比对组,获取商品比对组中每个商品的商品图片作为第一训练样本、商品描述文本中的商品标题作为第二训练样本、商品描
述文本中的详情文本作为第三训练样本。对每个第一训练样本,人为根据第一训练样本中商品图片之间是否相似,标注相应的监督标签。对每个第二训练样本,人为根据第二训练样本中商品标题之间是否相似,标注相应的监督标签。对每个第三训练样本,人为根据第三训练样本中详情文本之间是否相似,标注相应的监督标签。汇总所述第一训练样本及其监督标签构成第一训练集,汇总所述第二训练样本及其监督标签构成第二训练集,汇总所述第三训练样本及其监督标签构成第三训练集。所述构造的商品比对组的数量可由本领域技术人员按需确定。
106.获取所述第一训练集中单个第一训练样本及其监督标签。将所述第一训练样本中每个商品图片对应输入至第一维度模型中两个图像支路网络,由所述两个图像支路网络分别提取出相应商品图片的图像语义信息,获得对应的图像特征向量,由第一维度模型中分类器确定所述两个图像特征向量之间的相似度作为预测结果,调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述第一训练样本的监督标签计算所述预测结果对应的交叉熵损失值,当所述交叉熵损失值达到预设阈值时,表明第一维度模型已被训练至收敛状态,从而可以终止第一维度模型训练;交叉熵损失值未达到预设阈值时,表明第一维度模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他第一训练样本对第一维度模型实施迭代训练,直至该模型被训练至收敛状态为止。
107.获取所述第二训练集中单个第二训练样本及其监督标签。将所述第二训练样本中每个商品标题对应输入至第二维度模型中两个文本支路网络,由所述两个文本支路网络分别提取出相应商品图片的文本语义信息,获得对应的文本特征向量,由第二维度模型中分类器确定所述两个文本特征向量之间的相似度作为预测结果,调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述第二训练样本的监督标签计算所述预测结果对应的交叉熵损失值,当所述交叉熵损失值达到预设阈值时,表明第二维度模型已被训练至收敛状态,从而可以终止第二维度模型训练;交叉熵损失值未达到预设阈值时,表明第二维度模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他第二训练样本对第二维度模型实施迭代训练,直至该模型被训练至收敛状态为止。
108.获取所述第三训练集中单个第三训练样本及其监督标签。将所述第三训练样本中每个详情文本对应输入至第三维度模型中两个文本支路网络,由所述两个文本支路网络分别提取出相应商品图片的文本语义信息,获得对应的文本特征向量,由第三维度模型中分类器确定所述两个文本特征向量之间的相似度作为预测结果,调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述第三训练样本的监督标签计算所述预测结果对应的交叉熵损失值,当所述交叉熵损失值达到预设阈值时,表明第三维度模型已被训练至收敛状态,从而可以终止第三维度模型训练;交叉熵损失值未达到预设阈值时,表明第三维度模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他第三训练样本对第三维度模型实施迭代训练,直至该模型被训练至收
敛状态为止。
109.步骤s1001、固化所述各个维度模型对应的模型参数,将各个维度模型针对同一商品比对组确定出相对应的各个维度分值,作为多维融合模型的输入;
110.固化所述各个维度模型对应的模型参数,对所述预先构造出的每个商品比对组,采用所述各个维度模型针对同一商品比对组确定出相对应的各个维度分值作为融合训练样本。对每个融合训练样本,人为根据相应的商品比对组中每个商品的商品图片、商品标题、详情文本,各项综合来确定商品比对组中商品之间是否相似,进而根据所述商品之间是否相似标注相应的监督标签。汇总所述融合训练样本及其监督标签构成融合训练集。
111.步骤s1002、训练所述多维融合模型至收敛,使得多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。
112.获取所述融合训练集中单个融合训练样本及其监督标签。多维融合模型的输入层以所述融合训练样本作为输入,将融合训练样本中各个维度分值输入至隐含层,由隐含层确定出与所述各个维度分值相匹配的权重,进而由输出层将各个维度分值分别乘上其对应的权重之后加和得出相应的预测结果。调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述融合训练样本的监督标签计算所述预测结果对应的交叉熵损失值,当所述交叉熵损失值达到预设阈值时,表明融合维度模型已被训练至收敛状态,从而可以终止融合维度模型训练;交叉熵损失值未达到预设阈值时,表明融合维度模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他融合训练样本对融合维度模型实施迭代训练,直至该模型被训练至收敛状态为止。
113.本实施例中,通过首先单独训练每个维度的模型,然后将各个维度的模型的输出作为多维融合模型的输入。在训练过程中,每个维度的模型分别学习确定商品比对组的各个维度分值,然后通过多维融合模型来学习确定出最终的目标比对分值。使得一方面可以充分利用每个维度的特征,单独训练每个维度的模型,更精细地学习每个维度的特征表达能力,另一方面可以灵活调整各个维度模型之间的学习速度和训练策略,以便更好地适应每个维度的数据特点,再一方面,可以对每个维度的模型进行分别优化和调整,提高模型的性能。
114.请参阅图7,进一步的实施例中,步骤s1100、获取商品比对组中每个商品的商品描述文本和商品图片之前,包括如下步骤:
115.步骤s1010、将待训练的第一维度模型、第二维度模型、第三维度模型,分别作为待训练的多维融合模型的输入支路网络,构成整合单体模型;
116.预先构造出多个商品比对组,并且对每个商品比对组,获取商品比对组中每个商品的商品图片、商品描述文本中的商品标题、商品描述文本中的详情文本作为整合训练样本。对每个整合训练样本,人为根据相应的商品比对组中每个商品的商品图片、商品标题、详情文本,各项综合来确定商品比对组中商品之间是否相似,进而根据所述商品之间是否相似标注相应的监督标签。汇总所述整合训练样本及其监督标签构成整合训练集。所述构造的商品比对组的数量可由本领域技术人员按需确定。
117.步骤s1020、训练所述整合单体模型至收敛,使得整合单体模型中的各个维度模型
习得确定出商品比对组相对应的各个维度分值的能力,以及多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。
118.获取所述整合训练集中单个整合训练样本及其监督标签。将所述整合训练样本输入至整合单体模型中,由整合单体模型中的第一维度模型中两个图像支路网络,对应将所述整合训练样本中的每个商品的商品图片作为输入,由所述两个图像支路网络分别提取出相应商品图片的图像语义信息,获得对应的图像特征向量,由第一维度模型中分类器确定所述两个图像特征向量之间的相似度作为预测第一维度分值;由整合单体模型中的第二维度模型中两个文本支路网络,对应将所述整合训练样本中的每个商品的商品描述文本中的商品标题作为输入,由所述两个文本支路网络分别提取出相应商品标题的文本语义信息,获得对应的文本特征向量,由第二维度模型中分类器确定所述两个文本特征向量之间的相似度作为预测第二维度分值;由整合单体模型中的第三维度模型中两个文本支路网络,对应将所述整合训练样本中的每个商品的商品描述文本中的详情文本作为输入,由所述两个文本支路网络分别提取出相应详情文本的文本语义信息,获得对应的文本特征向量,由第三维度模型中分类器确定所述两个文本特征向量之间的相似度作为预测第三维度分值。由整合单体模型中的多维融合模型的输入层以所述预测第一维度分值、预测第二维度分值、预测第三维度分值作为输入,将各个维度分值输入至隐含层,由多维融合模型的隐含层确定出与所述各个维度分值相匹配的权重,进而由多维融合模型的输出层将各个维度分值分别乘上其对应的权重之后加和得出相应的预测结果。
119.调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述整合训练样本的监督标签计算所述预测结果对应的交叉熵损失值,当所述交叉熵损失值达到预设阈值时,表明整合单体模型已被训练至收敛状态,从而可以终止整合单体模型训练;交叉熵损失值未达到预设阈值时,表明整合单体模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他整合训练样本对整合单体模型实施迭代训练,直至该模型被训练至收敛状态为止。
120.本实施例中,通过将待训练的第一维度模型、第二维度模型、第三维度模型、多维融合模型构成整合单体模型,进而将整合单体模型训练至收敛。使得一方面整合后,总体上看模型的结构更简单,减少了模型的复杂度和训练参数数量,另一方面,训练过程中各个维度模型的特征表达能力和权重分配可以相互影响和调整,更好地适应考量比对商品全面的商品信息的需求,再一方面,可以通过整合单体模型来实现端到端的训练,简化了训练流程和调参过程。
121.进一步的实施例中,步骤s2520、采用预设的多维融合模型根据所述商品比对组对应的第一维度分值、第二维度分值、第三维度分值、第四维度分值,确定出目标比对分值之前,包括如下步骤:
122.步骤s2501、单独训练第一维度模型、第二维度模型、第三维度模型,直至分别训练至收敛,使得各个维度模型习得确定出商品比对组相对应的各个维度分值的能力;
123.预先构造出多个商品比对组。
124.具体参考步骤s1000,本步骤恕不赘述。
125.步骤s2502、固化所述各个维度模型对应的模型参数,将各个维度模型针对同一商品比对组确定出相对应的各个维度分值,以及确定出该商品比对组的第四维度分值作为多维融合模型的输入;
126.固化所述各个维度模型对应的模型参数,对所述预先构造出的每个商品比对组,采用所述各个维度模型针对同一商品比对组确定出相对应的各个维度分值,以及参考步骤s2500-2510确定出该商品比对组的第四维度评分作为融合训练样本。对每个融合训练样本,人为根据相应的商品比对组中每个商品的商品图片、商品标题、详情文本、商品价格,各项综合来确定商品比对组中商品之间是否相似,进而根据所述商品之间是否相似标注相应的监督标签。汇总所述融合训练样本及其监督标签构成融合训练集。
127.步骤s2503、训练所述多维融合模型至收敛,使得多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。
128.获取所述融合训练集中单个融合训练样本及其监督标签。多维融合模型的输入层以所述融合训练样本作为输入,将融合训练样本中各个维度分值输入至隐含层,由隐含层确定出与所述各个维度分值相匹配的权重,进而由输出层将各个维度分值分别乘上其对应的权重之后加和得出相应的预测结果。调用预设的交叉熵损失函数,此处可由本领域技术人员根据先验知识或实验经验灵活变通设置,基于根据所述融合训练样本的监督标签计算所述预测结果对应的交叉熵损失值,当所述交叉熵损失值达到预设阈值时,表明融合维度模型已被训练至收敛状态,从而可以终止融合维度模型训练;交叉熵损失值未达到预设阈值时,表明融合维度模型未收敛,于是根据交叉熵损失值对模型实施梯度更新,通常通过反向传播修正模型各个环节的权重参数以使模型进一步逼近收敛,然后,继续调用其他融合训练样本对融合维度模型实施迭代训练,直至该模型被训练至收敛状态为止。
129.本实施例中,揭示了多维融合模型的训练过程,使得能够在比对商品时可以综合考虑商品的精炼文本描述、详细文本描述、图片、价格,更全面地描述商品的特征,从而确保比对商品的比对准确性。
130.请参阅图8,适应本技术的目的之一而提供的一种商品比对装置,是对本技术的商品比对方法的功能化体现,该装置另一方面,适应本技术的目的之一而提供的一种商品比对装置,包括数据获取模块1100、第一维度模块1200、第二维度模块1300、第三维度模块1400以及融合维度模块1500,其中,数据获取模块1100,用于获取商品比对组中每个商品的商品描述文本和商品图片;第一维度模块1200,用于采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,所述第一维度分值表征商品比对组中商品之间的图像相似度;第二维度模块1300,用于采用预设的第二维度模型根据所述商品比对组中每个商品的商品描述文本中的商品标题,确定出第二维度分值,所述第二维度分值表征商品比对组中商品之间的标题相似度;第三维度模块1400,用于采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,所述详情文本包括商品参数、商品品类、商品品牌中任意多项;融合维度模块1500,用于采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。
131.进一步的实施例中,所述第一维度模块1200,包括:第一模型输入子模块,用于将所述商品比对组中每个商品的商品图片对应输入至预设的第一维度模型中两个图像支路网络;第一特征提取子模块,用于由所述两个图像支路网络分别提取出相应商品图片的图像语义信息,获得对应的图像特征向量;第一相似度确定子模块,用于由第一维度模型中分类器确定所述两个图像特征向量之间的相似度作为第一维度分值。
132.进一步的实施例中,所述第三维度模块1400,包括:第二模型输入子模块,用于将所述商品比对组中每个商品的商品描述文本中的详情文本对应输入至预设的第三维度模型中两个文本支路网络;第二特征提取子模块,用于由所述两个文本支路网络分别提取出相应的详情文本的文本语义信息,获得对应的文本特征向量;第二相似度确定子模块,用于由第三维度模型中分类器确定所述两个文本特征向量之间的相似度作为第三维度分值。
133.进一步的实施例中,所述融合维度模块1500之前,包括:价格标识子模块,用于根据商品比对组中每个商品的商品品类对应的价格区间分布,确定出每个商品的商品价格所属的区间标识,所述区间标识表征相应的价格区间对应的用户选择偏好;第四维度子模块,用于根据所述区间标识是否相同相应确定出所述商品比对组的第四维度分值;融合维度子模块,用于采用预设的多维融合模型根据所述商品比对组对应的第一维度分值、第二维度分值、第三维度分值、第四维度分值,确定出目标比对分值。
134.进一步的实施例中,所述融合维度模块1500之后,包括:列表构建子模块,用于获取包含同一目标商品且目标比对分值满足预设条件的多个商品比对组,根据各个商品比对组对应的目标比对分值、第一维度分值、第二维度分值、第三维度分值中任意一项或任意多项进行排序,依序确定出各个商品比对组中与目标商品比对的商品作为的竞品商品,构造出各种排序对应的竞品商品列表;区别标识子模块,用于标识出所述各个竞品商品列表中每个竞品商品与目标商品之间的区别特征。
135.进一步的实施例中,所述数据获取模块1100之前,包括:单独训练子模块,用于单独训练第一维度模型、第二维度模型、第三维度模型,直至分别训练至收敛,使得各个维度模型习得确定出商品比对组相对应的各个维度分值的能力;多维输入子模块,用于固化所述各个维度模型对应的模型参数,将各个维度模型针对同一商品比对组确定出相对应的各个维度分值,作为多维融合模型的输入;融合训练子模块,用于训练所述多维融合模型至收敛,使得多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。
136.进一步的实施例中,所述数据获取模块1100之前,包括:模型整合子模块,用于将待训练的第一维度模型、第二维度模型、第三维度模型,分别作为待训练的多维融合模型的输入支路网络,构成整合单体模型;联合训练子模块,用于训练所述整合单体模型至收敛,使得整合单体模型中的各个维度模型习得确定出商品比对组相对应的各个维度分值的能力,以及多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。
137.为解决上述技术问题,本技术实施例还提供计算机设备。如图9所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可
使得处理器实现一种商品比对方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本技术的商品比对方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
138.本实施方式中处理器用于执行图8中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本技术的商品比对装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
139.本技术还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本技术任一实施例的商品比对方法的步骤。
140.本领域普通技术人员可以理解实现本技术上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)等计算机可读存储介质,或随机存储记忆体(random access memory,ram)等。
141.综上所述,本技术能够考量比对商品全面的商品信息,从而精准地比对商品。
142.本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
143.以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。

技术特征:
1.一种商品比对方法,其特征在于,包括如下步骤:获取商品比对组中每个商品的商品描述文本和商品图片;采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,所述第一维度分值表征商品比对组中商品之间的图像相似度;采用预设的第二维度模型根据所述商品比对组中每个商品的商品描述文本中的商品标题,确定出第二维度分值,所述第二维度分值表征商品比对组中商品之间的标题相似度;采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,所述详情文本包括商品参数、商品品类、商品品牌中任意多项;采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。2.根据权利要求1所述的商品比对方法,其特征在于,采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,包括如下步骤:将所述商品比对组中每个商品的商品图片对应输入至预设的第一维度模型中两个图像支路网络;由所述两个图像支路网络分别提取出相应商品图片的图像语义信息,获得对应的图像特征向量;由第一维度模型中分类器确定所述两个图像特征向量之间的相似度作为第一维度分值。3.根据权利要求1所述的商品比对方法,其特征在于,采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,包括如下步骤:将所述商品比对组中每个商品的商品描述文本中的详情文本对应输入至预设的第三维度模型中两个文本支路网络;由所述两个文本支路网络分别提取出相应的详情文本的文本语义信息,获得对应的文本特征向量;由第三维度模型中分类器确定所述两个文本特征向量之间的相似度作为第三维度分值。4.根据权利要求1所述的商品比对方法,其特征在于,采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值之前,包括如下步骤:根据商品比对组中每个商品的商品品类对应的价格区间分布,确定出每个商品的商品价格所属的区间标识,所述区间标识表征相应的价格区间对应的用户选择偏好;根据所述区间标识是否相同相应确定出所述商品比对组的第四维度分值;采用预设的多维融合模型根据所述商品比对组对应的第一维度分值、第二维度分值、第三维度分值、第四维度分值,确定出目标比对分值。5.根据权利要求1所述的商品比对方法,其特征在于,采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值之后,包括如下步骤:
获取包含同一目标商品且目标比对分值满足预设条件的多个商品比对组,根据各个商品比对组对应的目标比对分值、第一维度分值、第二维度分值、第三维度分值中任意一项或任意多项进行排序,依序确定出各个商品比对组中与目标商品比对的商品作为的竞品商品,构造出各种排序对应的竞品商品列表;标识出所述各个竞品商品列表中每个竞品商品与目标商品之间的区别特征。6.根据权利要求1所述的商品比对方法,其特征在于,获取待投放广告商品的商品描述文本和商品图片之前,包括如下步骤:单独训练第一维度模型、第二维度模型、第三维度模型,直至分别训练至收敛,使得各个维度模型习得确定出商品比对组相对应的各个维度分值的能力;固化所述各个维度模型对应的模型参数,将各个维度模型针对同一商品比对组确定出相对应的各个维度分值,作为多维融合模型的输入;训练所述多维融合模型至收敛,使得多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。7.根据权利要求1所述的商品比对方法,其特征在于,获取商品比对组中每个商品的商品描述文本和商品图片之前,包括如下步骤:将待训练的第一维度模型、第二维度模型、第三维度模型,分别作为待训练的多维融合模型的输入支路网络,构成整合单体模型;训练所述整合单体模型至收敛,使得整合单体模型中的各个维度模型习得确定出商品比对组相对应的各个维度分值的能力,以及多维融合模型习得确定出匹配商品比对组的各个维度分值对应的权重,以各个维度分值匹配对应的权重得出目标比对分值的能力。8.一种商品比对装置,其特征在于,包括:数据获取模块,用于获取商品比对组中每个商品的商品描述文本和商品图片;第一维度模块,用于采用预设的第一维度模型根据所述商品比对组中每个商品的商品图片,确定出第一维度分值,所述第一维度分值表征商品比对组中商品之间的图像相似度;第二维度模块,用于采用预设的第二维度模型根据所述商品比对组中每个商品的商品描述文本中的商品标题,确定出第二维度分值,所述第二维度分值表征商品比对组中商品之间的标题相似度;第三维度模块,用于采用预设的第三维度模型根据所述商品比对组中每个商品的商品描述文本中的详情文本,确定出第三维度分值,所述第三维度分值表征商品比对组中商品之间的详情相似度,所述详情文本包括商品参数、商品品类、商品品牌中任意多项;融合维度模块,用于采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。

技术总结
本申请涉及电商技术领域中一种商品比对方法及其装置、设备、介质,所述方法包括:获取商品比对组中每个商品的商品描述文本和商品图片。采用预设的第一维度模型、第二维度模型、第三维度模型,对应根据商品比对组中每个商品的商品图片、商品描述文本中的商品标题、商品描述文本中的详情文本,分别确定出商品比对组的第一维度分值、第二维度分值、第三维度分值。采用预设的多维融合模型根据所述商品比对组的第一维度分值、第二维度分值、第三维度分值匹配对应的权重得出目标比对分值。本申请能够考量比对商品全面的商品信息,从而精准地比对商品。商品。商品。


技术研发人员:谭华
受保护的技术使用者:广州商研网络科技有限公司
技术研发日:2023.07.14
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐