一种产品打标方法和装置与流程

未命名 08-05 阅读:111 评论:0


1.本发明涉及计算机技术领域,尤其涉及一种产品打标方法和装置。


背景技术:

2.为了进一步提升消费者体验,电商平台通过标签关联来对产品体系进行整合。目前产品打标的方案主要为基于协同过滤等相似度算法以及机器学习对产品标签进行打标。
3.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
4.标签下相似产品的获取受到产品本身信息的质量影响,未充分利用标签下其余产品的信息,忽视了标签的全局信息,影响召回结果的多样性和全面性,打标准确率较低,人力成本和维护成本较高且可扩展性较差。


技术实现要素:

5.有鉴于此,本发明实施例提供一种产品打标方法和装置,能够充分利用海量产品中同类产品的信息、标签中产品的信息和标签本身的全局信息,解决了标签打标受产品本身信息质量影响和标签信息利用不够全面的问题,提高了标签多样性和打标准确率,人力成本和维护成本低,打标效果好,可扩展性好。
6.为实现上述目的,根据本发明实施例的一个方面,提供了一种产品打标方法。
7.一种产品打标方法,包括:基于候选产品的产品信息构建所述候选产品的向量表征;利用与标签对应的种子产品集合的产品信息,构建所述标签的向量表征;将所述候选产品的向量表征和所述标签的向量表征输入预测模型,在所述预测模型的预测结果指示所述候选产品符合所述标签的情况下,将所述候选产品打标为所述标签。
8.可选地,所述候选产品的产品信息包括所述候选产品的重点属性信息;所述方法还包括:对于目标产品为任一产品,通过如下方式得到所述目标产品的重点属性信息:通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定所述目标产品的产品实体,所述目标产品的产品实体是所述目标产品以及所述目标产品的相似产品构成的集合;对所述目标产品的产品实体中的每个产品的每一属性信息打分,得到所述目标产品的产品实体下每一属性信息的重要度分数,对所述重要度分数排序,以筛选出所述重要度分数最高的预设数量的属性信息,作为所述目标产品的重点属性信息。
9.可选地,所述对所述目标产品的产品实体中的每个产品的每一属性信息打分,得到所述目标产品的产品实体下每一属性信息的重要度分数,包括:对于所述目标产品的产品实体下每一待打分的属性信息,根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述目标产品的产品实体中产品总数量,计算所述目标产品的产品实体中所述待打分的属性信息出现的第一条件概率;根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述待打分的属性信息在所述产品库的产品中出现的总频次,计算在已知所述待打分的属性信息的条件下,所述目标产品的产品实体出现的第二条件概率;根据所述第一条件概率、所述第二条件概率计算得到所述待打分的
属性信息的重要度分数。
10.可选地,所述候选产品的产品信息还包括所述候选产品的标题信息;所述基于候选产品的产品信息构建所述候选产品的向量表征,包括:对所述候选产品的标题信息分词,得到所述候选产品的标题分词,所述候选产品的标题分词包括产品词;基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到所述候选产品的重点属性向量、产品词向量、标题分词向量;根据所述候选产品的重点属性向量、产品词向量、标题分词向量,构建得到所述候选产品的向量表征。
11.可选地,所述基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到所述候选产品的重点属性向量、产品词向量、标题分词向量,包括:基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量;以所述候选产品的每一重点属性信息的重要度分数为权重,对所述候选产品的各重点属性信息对应的向量进行加权平均运算,得到所述候选产品的重点属性向量;对所述候选产品的各产品词对应的向量求平均,得到所述候选产品的产品词向量;对所述候选产品的各标题分词对应的向量求平均,得到所述候选产品的标题分词向量。
12.可选地,所述根据所述候选产品的重点属性向量、产品词向量、标题分词向量,构建得到所述候选产品的向量表征,包括:将所述候选产品的重点属性向量、产品词向量、标题分词向量依序连接,得到所述候选产品的向量表征。
13.可选地,所述种子产品集合的产品信息包括所述种子产品集合中产品的标题信息、属性信息、重点属性信息;所述利用与标签对应的种子产品集合的产品信息,构建所述标签的向量表征,包括:根据所述种子产品集合中产品的标题信息、属性信息,抽取所述种子产品集合的关键词,并生成各所述关键词的词向量,对各所述关键词的词向量进行加权平均运算,得到所述种子产品集合的关键词向量;对所述种子产品集合中产品的标题信息分词,得到所述种子产品集合中产品的标题分词,所述种子产品集合中产品的标题分词包括产品词;基于所述种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到所述种子产品集合中产品的产品词向量和重点属性向量;基于所述种子产品集合的关键词向量、所述种子产品集合中产品的产品词向量和重点属性向量,构建所述标签的向量表征。
14.可选地,所述基于所述种子产品集合的关键词向量、所述种子产品集合中产品的产品词向量和重点属性向量,构建所述标签的向量表征,包括:对于所述种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到所述种子产品集合中该产品对应的向量,对所述种子产品集合中各产品对应的向量求平均,得到所述种子产品集合的向量表征;将所述种子产品集合的关键词向量、所述种子产品集合的向量表征依序连接,以构建得到所述标签的向量表征。
15.可选地,所述预测模型为向量相似度计算模型、双塔模型、二分类模型中的一种。
16.根据本发明实施例的另一方面,提供了一种产品打标装置。
17.一种产品打标装置,包括:产品向量表征构建模块,用于基于候选产品的产品信息构建所述候选产品的向量表征;标签向量表征构建模块,用于利用与标签对应的种子产品集合的产品信息,构建所述标签的向量表征;打标模块,用于将所述候选产品的向量表征和所述标签的向量表征输入预测模型,在所述预测模型的预测结果指示所述候选产品符合所
述标签的情况下,将所述候选产品打标为所述标签。
18.可选地,所述候选产品的产品信息包括所述候选产品的重点属性信息;所述装置还包括重点属性信息生成模块,用于:通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定所述目标产品的产品实体,所述目标产品的产品实体是所述目标产品以及所述目标产品的相似产品构成的集合;对所述目标产品的产品实体中的每个产品的每一属性信息打分,得到所述目标产品的产品实体下每一属性信息的重要度分数,对所述重要度分数排序,以筛选出所述重要度分数最高的预设数量的属性信息,作为所述目标产品的重点属性信息。
19.可选地,所述重点属性信息生成模块还用于:对于所述目标产品的产品实体下每一待打分的属性信息,根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述目标产品的产品实体中产品总数量,计算所述目标产品的产品实体中所述待打分的属性信息出现的第一条件概率;根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述待打分的属性信息在所述产品库的产品中出现的总频次,计算在已知所述待打分的属性信息的条件下,所述目标产品的产品实体出现的第二条件概率;根据所述第一条件概率、所述第二条件概率计算得到所述待打分的属性信息的重要度分数。
20.可选地,所述候选产品的产品信息还包括所述候选产品的标题信息;所述产品向量表征构建模块还用于:对所述候选产品的标题信息分词,得到所述候选产品的标题分词,所述候选产品的标题分词包括产品词;基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到所述候选产品的重点属性向量、产品词向量、标题分词向量;根据所述候选产品的重点属性向量、产品词向量、标题分词向量,构建得到所述候选产品的向量表征。
21.可选地,所述产品向量表征构建模块还用于:基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量;以所述候选产品的每一重点属性信息的重要度分数为权重,对所述候选产品的各重点属性信息对应的向量进行加权平均运算,得到所述候选产品的重点属性向量;对所述候选产品的各产品词对应的向量求平均,得到所述候选产品的产品词向量;对所述候选产品的各标题分词对应的向量求平均,得到所述候选产品的标题分词向量。
22.可选地,所述产品向量表征构建模块还用于:将所述候选产品的重点属性向量、产品词向量、标题分词向量依序连接,得到所述候选产品的向量表征。
23.可选地,所述种子产品集合的产品信息包括所述种子产品集合中产品的标题信息、属性信息、重点属性信息;所述标签向量表征构建模块还用于:根据所述种子产品集合中产品的标题信息、属性信息,抽取所述种子产品集合的关键词,并生成各所述关键词的词向量,对各所述关键词的词向量进行加权平均运算,得到所述种子产品集合的关键词向量;对所述种子产品集合中产品的标题信息分词,得到所述种子产品集合中产品的标题分词,所述种子产品集合中产品的标题分词包括产品词;基于所述种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到所述种子产品集合中产品的产品词向量和重点属性向量;基于所述种子产品集合的关键词向量、所述种子产品集合中产品的产品词向量和重点属性向量,构建所述标签的向量表征。
24.可选地,所述标签向量表征构建模块还用于:对于所述种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到所述种子产品集合中该产品对应的向量,对所述种子产品集合中各产品对应的向量求平均,得到所述种子产品集合的向量表征;将所述种子产品集合的关键词向量、所述种子产品集合的向量表征依序连接,以构建得到所述标签的向量表征。
25.可选地,所述预测模型为向量相似度计算模型、双塔模型、二分类模型中的一种。
26.根据本发明实施例的又一方面,提供了一种电子设备。
27.一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明实施例所提供的产品打标方法。
28.根据本发明实施例的又一方面,提供了一种计算机可读介质。
29.一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例所提供的产品打标方法。
30.上述发明中的一个实施例具有如下优点或有益效果:基于候选产品的产品信息构建候选产品的向量表征;利用与标签对应的种子产品集合的产品信息,构建标签的向量表征;将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合标签的情况下,将候选产品打标为标签。能够充分利用海量产品中同类产品的信息、标签中产品的信息和标签本身的全局信息,解决了标签打标受产品本身信息质量影响和标签信息利用不够全面的问题,提高了标签多样性和打标准确率,人力成本和维护成本低,打标效果好,可扩展性好。
31.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
32.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
33.图1是根据本发明一个实施例的产品打标方法的主要步骤示意图;
34.图2是根据本发明一个实施例的产品的重点属性信息生成的流程示意图;
35.图3是根据本发明一个实施例的产品向量表征构建的流程示意图;
36.图4是根据本发明一个实施例的标签向量表征构建的流程示意图;
37.图5是根据本发明一个实施例的产品打标装置的主要模块示意图;
38.图6是本发明实施例可以应用于其中的示例性系统架构图;
39.图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
40.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
41.图1是根据本发明一个实施例的产品打标方法的主要步骤示意图。
42.如图1所示,本发明一个实施例的产品打标方法主要包括如下的步骤s101至步骤s103。
43.步骤s101:基于候选产品的产品信息构建候选产品的向量表征,其中,候选产品的产品信息包括候选产品的重点属性信息和候选产品的标题信息。
44.候选产品即待打标上对应的标签的产品。候选产品的向量表征即用于表征该候选产品的向量。
45.对于目标产品为任一产品,其产品信息可以包括该目标产品的标题信息、重点属性信息,还可以包括该目标产品的属性信息,包括但不限于功能属性、材质属性、样式属性、风格属性、产地属性、颜色属性、味道属性、规格属性等。可以通过如下方式得到目标产品的重点属性信息:通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定目标产品的产品实体,目标产品的产品实体是目标产品以及目标产品的相似产品构成的集合;对目标产品的产品实体中的每个产品的每一属性信息打分,得到目标产品的产品实体下每一属性信息的重要度分数,对重要度分数排序,以筛选出重要度分数最高的预设数量的属性信息,作为目标产品的重点属性信息。参照该方式可以得到候选产品的重点属性信息。
46.聚类算法可采用各种常用聚类算法实现。预设的聚类维度例如产品的标题分词或属性信息等维度。目标产品的相似产品即可与该目标产品聚为一类的产品。
47.对目标产品的产品实体中的每个产品的每一属性信息打分,得到目标产品的产品实体下每一属性信息的重要度分数,包括:对于目标产品的产品实体下每一待打分的属性信息,根据目标产品的产品实体中产品与待打分的属性信息共现的频次,以及目标产品的产品实体中产品总数量,计算目标产品的产品实体中待打分的属性信息出现的第一条件概率;根据目标产品的产品实体中产品与待打分的属性信息共现的频次,以及待打分的属性信息在产品库的产品中出现的总频次,计算在已知待打分的属性信息的条件下,目标产品的产品实体出现的第二条件概率;根据第一条件概率、第二条件概率计算得到待打分的属性信息的重要度分数。
48.基于候选产品的产品信息构建候选产品的向量表征,包括:对候选产品的标题信息分词,得到候选产品的标题分词,候选产品的标题分词包括产品词;基于候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到候选产品的重点属性向量、产品词向量、标题分词向量;根据候选产品的重点属性向量、产品词向量、标题分词向量,构建得到候选产品的向量表征。
49.基于候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到候选产品的重点属性向量、产品词向量、标题分词向量,包括:基于候选产品的重点属性信息、产品词、标题分词分别生成对应的向量;以候选产品的每一重点属性信息的重要度分数为权重,对候选产品的各重点属性信息对应的向量进行加权平均运算,得到候选产品的重点属性向量;对候选产品的各产品词对应的向量求平均,得到候选产品的产品词向量;对候选产品的各标题分词对应的向量求平均,得到候选产品的标题分词向量。
50.根据候选产品的重点属性向量、产品词向量、标题分词向量,构建得到候选产品的向量表征,包括:将候选产品的重点属性向量、产品词向量、标题分词向量依序连接,得到候选产品的向量表征。
51.步骤s102:利用与标签对应的种子产品集合的产品信息,构建标签的向量表征。
52.种子产品集合的产品信息包括种子产品集合中产品的标题信息、属性信息、重点属性信息。参照上文介绍的得到目标产品的重点属性信息的方式,可以得到种子产品集合中产品的重点属性信息。
53.标签的向量表征即用于表征该标签的向量。
54.利用与标签对应的种子产品集合的产品信息,构建标签的向量表征,包括:根据种子产品集合中产品的标题信息、属性信息,抽取种子产品集合的关键词,并生成各关键词的词向量,对各关键词的词向量进行加权平均运算,得到种子产品集合的关键词向量;对种子产品集合中产品的标题信息分词,得到种子产品集合中产品的标题分词,种子产品集合中产品的标题分词包括产品词;基于种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到种子产品集合中产品的产品词向量和重点属性向量;基于种子产品集合的关键词向量、种子产品集合中产品的产品词向量和重点属性向量,构建标签的向量表征。
55.基于种子产品集合的关键词向量、种子产品集合中产品的产品词向量和重点属性向量,构建标签的向量表征,包括:对于种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到所述种子产品集合中该产品对应的向量,对种子产品集合中各产品对应的向量求平均,得到种子产品集合的向量表征;将种子产品集合的关键词向量、种子产品集合的向量表征依序连接,以构建得到标签的向量表征。
56.步骤s103:将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合该标签的情况下,将候选产品打标为该标签。
57.预测模型为向量相似度计算模型、双塔模型、二分类模型中的一种。预测模型的预测结果指示候选产品与该标签是否相符,例如,通过向量相似度计算模型可以计算候选产品的向量表征和标签的向量表征的相似度,如果相似度大于某个设定的阈值,则表示两向量相似,即指示候选产品符合该标签,否则,指示候选产品不符合该标签。本发明实施例的预测模型可采用任一种通用的向量相似度计算模型、双塔模型或二分类模型实现。
58.图2是根据本发明一个实施例的产品的重点属性信息生成的流程示意图。
59.如图2所示,在一个实施例中,基于产品库中的海量产品信息构建产品的向量表征,充分利用每个产品在海量产品中的同类产品的信息,为每个产品构建高层语义向量表征。获取产品库中的产品信息,产品信息包含产品非结构化信息和结构化信息,其中,产品非结构化信息包括产品标题,产品结构化信息包括产品的属性信息等,产品信息可以通过商家手动填写。产品的产品信息示例见表1。
60.表1产品的产品信息示例
[0061][0062][0063]
以产品库中的某一产品为候选产品,对候选产品的标题信息分词,得到候选产品的标题分词,候选产品的标题分词包括产品词。具体地,对产品标题非结构化信息进行标题分词的词性识别,从而转换成结构化的词性标注数据。词性标注数据指示了标题分词所属的类别,标题分词所属的类别可以定义为以下16个种类:品牌词、型号词、产品词、适用事件、适用时间、适用地点、适用人群、其他适用对象、图案描述、功能属性、材质属性、样式属性、风格属性、产地属性、颜色属性、味道属性、规格属性。通过序列标注模型确定每个分词所属的类别,其中,序列标注模型可以为条件随机场模型(crf)、bilstm-crf模型等。产品标题“a品牌休闲裤男卫裤加绒加厚秋冬季运动裤男生直筒宽松休闲男裤子潮牌束脚九分韩版潮流绣花百搭k39花色xl“的词性标注结果部分示例如表2所示。
[0064]
表2产品的词性标注结果部分示例
[0065][0066][0067]
通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定目标产品的产品实体,目标产品的产品实体是目标产品以及目标产品的相似产品构成的集合。该目标产品可以是任一产品,例如可以是候选产品。具体地,产品实体可以为不同商家售卖的相似产品的集合,相似产品表示部分关键属性一致的产品,例如手机相关的产品在型号、品牌、内存等信息一致时,可以认为是相似产品。本发明实施例可以通过机器学习的聚类算法对海量产品中相似产品进行聚合,其中聚类算法包括但不限于k均值聚类、高斯混合聚类等机器学习聚类方式和minhash(最小哈希)等大规模最近邻搜索技术。聚类算法中使用的聚类维度可以基于产品的标题分词和产品属性等信息进行确定,聚类算法中使用的距离度量包括但不限于欧式距离、余弦距离、jaccard(杰卡德)距离等。如表3所示,以minhash近邻搜索技术为例,聚类维度选取产品的标题分词,距离度量选择为jaccard距离,假设产品a的标题分词集合为a={'x品牌','y款手机','11','(','a2223',')','64gb','黑色','移动','联通','电信','4g','手机','双卡','双待','【','换修','无忧','年','付版','】'},产品b的标题分词集合为b={'x品牌','y款手机','11','(','a2223',')','128gb','白色','移动','联通','电信','4g','手机','双卡','双待'},jaccard距离计算公式为:
[0068]
[0069]
其中,“||”表示集合的长度,计算结果为产品a和产品b的jaccard距离为0.56。按照该方法,遍历整个产品集合获取所有jaccard距离,将jaccard距离将大于预设的经验阈值的产品作为该产品a的相似产品,放入产品a的产品实体中。
[0070]
表3产品a和产品b的jaccard距离计算
[0071][0072]
对于目标产品的产品实体下每一待打分的属性信息,根据目标产品的产品实体中产品与待打分的属性信息共现的频次,以及目标产品的产品实体中产品总数量,计算目标产品的产品实体中待打分的属性信息出现的第一条件概率;根据目标产品的产品实体中产品与待打分的属性信息共现的频次,以及待打分的属性信息在产品库的产品中出现的总频次,计算在已知待打分的属性信息的条件下,目标产品的产品实体出现的第二条件概率;根据第一条件概率、第二条件概率计算得到待打分的属性信息的重要度分数。具体地,产品属性包括基于词性标注得到的产品标题中的属性信息和商家本身填写的属性信息。设产品库中实体集合为a={e1,e2,...,ei,...,en},其中ei表示第i个产品实体,产品实体下的产品集合为e={s1,s2,...,si,...,sn},其中si表示集合e中的第i个产品,而每个产品中有k个属性信息,表示为s={a1,a2,...,ai,...,an},其中ai表示产品的第i个属性信息。通过以下公式计算每个产品实体下产品每个属性信息的重要度分数score(ai):
[0073]
score(ai)=p(ai|ej)*p(ej|ai)
[0074]
其中,p(ai|ej)表示在产品实体ej中属性信息ai出现的条件概率(即第一条件概率),实际计算可以基于频次计算概率,具体为:
[0075][0076]
其中,n(ai,ej)表示在产品实体ej中产品和属性信息ai共现的频次,n(ej)表示产品实体ej中产品的总数量。同样地,p(ej|ai)表示在已知属性信息ai的条件下产品实体ej出现的条件概率(即第二条件概率),具体计算方式为:
[0077][0078]
其中,n(ai)表示属性信息ai在全站(产品库)产品中出现的总频次。
[0079]
对重要度分数排序,以筛选出重要度分数最高的预设数量的属性信息,作为目标产品的重点属性信息。具体地,在计算得到每个产品下每个属性信息的重要度分数后,按照分数排序并取重要度分数最高的n个属性,从而得到产品实体的n个重点属性信息,此处n值的选取可以通过经验值来确定。
[0080]
图3是根据本发明一个实施例的产品向量表征构建的流程示意图。
[0081]
如图3所示,在一个实施例中,基于产品的词性标注结果和提取的产品实体的产品重点属性信息生成产品的向量表征,产品的向量表征包括重点属性向量、产品词向量、标题分词向量三个部分。
[0082]
构建候选产品的向量表征,具体地,利用候选产品的标题非结构化信息进行标题分词和词性识别,从而转换成结构化的词性标注数据。基于候选产品的标题分词生成对应的向量,对候选产品的各标题分词对应的向量求平均,得到候选产品的标题分词向量。具体地,将产品的标题分词作为输入至词向量工具,得到标题分词对应的向量,其中,词向量工具包括但不限于fasttext、bert等。设产品p的标题分词集合为p={s1,s2,...,si,...,sn},其中si表示标题中第i个分词,通过词向量工具生成的标题分词对应的向量集合为v
p
={v1,v2,...,vi,...,vn},其中vi表示第i个标题分词对应的分词向量,那么对产品p的各标题分词对应的向量v1,v2,...,vi,...,vn求平均,得到产品p的标题分词向量vec
p
为:
[0083][0084]
基于候选产品的重点属性信息生成对应的向量,以候选产品的每一重点属性信息的重要度分数为权重,对候选产品的各重点属性信息对应的向量进行加权平均运算,得到候选产品的重点属性向量。具体地,基于产品的重点属性信息生成对应的向量,假设产品p对应的实体e的重点属性集合为e={a1,a2,...,ai,...,ak},对应的重要度分数为s={s1,s2,...,si,...,sk},各重点属性信息对应的向量集合为ve={v1,v2,...,vi,...,vk},那么产品p的重点属性向量vece为:
[0085][0086]
其中,表示产品实体下属性分数加和。
[0087]
基于候选产品的产品词生成对应的向量,对候选产品的各产品词对应的向量求平均,得到候选产品的产品词向量。具体地,基于标注类别为“产品词”的标题分词生成对应的向量,以表2为例,产品词为休闲裤、卫裤、运动裤。假设产品p的产品词集合为p={p1,p2,...,pi,...,pm},其中产品词对应的向量集合为v
p
={v1,v2,...,vi,...,vm},那么产品p的产品词向量vec
pt
为:
[0088][0089]
将候选产品的重点属性向量vece、产品词向量vec
pt
、标题分词向量vec
p
依序连接,得到候选产品的向量表征v
p
。具体生成方式为:
[0090][0091]
图4是根据本发明一个实施例的标签向量表征构建的流程示意图。
[0092]
如图4所示,在一个实施例中,为了保证标签的种子产品质量,可以通过人工梳理、电子商务搜索用户行为等方式获取标签的种子产品集合。标签为“迷彩风”的种子产品集合示例如表4所示。
[0093]
表4标签为“迷彩风”的种子产品集合示例
[0094][0095][0096]
根据种子产品集合中产品的标题信息、属性信息,抽取种子产品集合的预设数量的关键词,并生成各关键词的词向量,对各关键词的词向量进行加权平均运算,得到种子产品集合的关键词向量。具体地,关键词的抽取范围包括了种子产品的属性信息和产品标题分词信息,关键词抽取方式包括但不限于词频统计、tfidf关键词提取、lda主题提取算法。以词频统计的抽取方式为例,基于表4中标题分词统计词频,可以得到词频最高的5个关键词为[“迷彩”,“五分裤”,“男士”,“夏季”,“短裤”],以此作为该标签的关键词,作为标签的整体描述。通过词向量工具生成各关键词的词向量,假设关键词集合为w={w1,w2,...,wi,...,wn},对应的关键词的向量集合为vw={v1,v2,...,vi,...,vn},那么种子产品集合的关键词向量vecw为:
[0097][0098]
对种子产品集合中产品的标题信息分词,得到种子产品集合中产品的标题分词,种子产品集合中产品的标题分词包括产品词。基于种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到种子产品集合中产品的产品词向量和重点属性向量。对于种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到种子产品集合中该产品对应的向量,对种子产品集合中各产品对应的向量求平均,得到种子产品集合的向量表征。具体地,根据种子产品集中的各产品的产品信息,分别得到种子产品集中的各产品的产品词向量和重点属性向量。假设种子产品集中的任一产品的产品词向量为vec
pt
、重点属性向量为vece,则种子产品集中该产品对应的向量为v
p
=vec
pt

vece,通过该方法可以得到种子产品集合中每个产品对应的向量,假设种子产品集合为p={p1,p2,...,pi,...,pm},其中的产品对应的向量集合为v={v
p1
,v
p2
,...,v
pi
,...,v
pm
},那么种子产品集合的向量表征为:
[0099][0100]
将种子产品集合的关键词向量、种子产品集合的向量表征依序连接,以构建得到标签的向量表征。具体生成方式为:
[0101][0102]
其中,v
tag
为标签的向量表征。
[0103]
在一个实施例中,将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合标签的情况下,将候选产品打标为标签。具体地,将候选产品的向量表征和标签的向量表征作为输入,通过预测模型判别候选产品是否属于标签。其中,预测模型包括但不限于直接计算向量相似度、双塔深度学习模型、机器学习二分类模型。在使用预测模型之前,可以基于经验得到样本数据,并对预测模型进行训练。
[0104]
图5是根据本发明一个实施例的产品打标装置的主要模块示意图。
[0105]
如图5所示,本发明一个实施例的产品打标装置500主要包括:产品向量表征构建模块501、标签向量表征构建模块502、打标模块503。
[0106]
产品向量表征构建模块501,用于基于候选产品的产品信息构建候选产品的向量表征。
[0107]
标签向量表征构建模块502,用于利用与标签对应的种子产品集合的产品信息,构建标签的向量表征。
[0108]
打标模块503,用于将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合标签的情况下,将候选产品打标为标签。
[0109]
在一个实施例中,候选产品的产品信息包括候选产品的重点属性信息;装置还包括重点属性信息生成模块,用于:通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定目标产品的产品实体,目标产品的产品实体是目标产品以及目标产品的相似产品构成的集合;对目标产品的产品实体中的每个产品的每一属性信息打分,得到目标产品的产品实体下每一属性信息的重要度分数,对重要度分数排序,以筛选出重要度分数最高的预设数量的属性信息,作为目标产品的重点属性信息。
[0110]
在一个实施例中,重点属性信息生成模块还用于:对于目标产品的产品实体下每一待打分的属性信息,根据目标产品的产品实体中产品与待打分的属性信息共现的频次,以及目标产品的产品实体中产品总数量,计算目标产品的产品实体中待打分的属性信息出现的第一条件概率;根据目标产品的产品实体中产品与待打分的属性信息共现的频次,以及待打分的属性信息在产品库的产品中出现的总频次,计算在已知待打分的属性信息的条件下,目标产品的产品实体出现的第二条件概率;根据第一条件概率、第二条件概率计算得到待打分的属性信息的重要度分数。
[0111]
在一个实施例中,候选产品的产品信息还包括候选产品的标题信息;产品向量表征构建模块还用于:对候选产品的标题信息分词,得到候选产品的标题分词,候选产品的标题分词包括产品词;基于候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到候选产品的重点属性向量、产品词向量、标题分词向量;根据候选产品的重点属性向量、产品词向量、标题分词向量,构建得到候选产品的向量表征。
[0112]
在一个实施例中,产品向量表征构建模块还用于:基于候选产品的重点属性信息、产品词、标题分词分别生成对应的向量;以候选产品的每一重点属性信息的重要度分数为权重,对候选产品的各重点属性信息对应的向量进行加权平均运算,得到候选产品的重点属性向量;对候选产品的各产品词对应的向量求平均,得到候选产品的产品词向量;对候选产品的各标题分词对应的向量求平均,得到候选产品的标题分词向量。
[0113]
在一个实施例中,产品向量表征构建模块还用于:将候选产品的重点属性向量、产品词向量、标题分词向量依序连接,得到候选产品的向量表征。
[0114]
在一个实施例中,种子产品集合的产品信息包括种子产品集合中产品的标题信息、属性信息、重点属性信息;标签向量表征构建模块还用于:根据种子产品集合中产品的标题信息、属性信息,抽取种子产品集合的关键词,并生成各关键词的词向量,对各关键词的词向量进行加权平均运算,得到种子产品集合的关键词向量;对种子产品集合中产品的标题信息分词,得到种子产品集合中产品的标题分词,种子产品集合中产品的标题分词包括产品词;基于种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到种子产品集合中产品的产品词向量和重点属性向量;基于种子产品集合的关键词向量、种子产品集合中产品的产品词向量和重点属性向量,构建标签的向量表征。
[0115]
在一个实施例中,标签向量表征构建模块还用于:对于种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到种子产品集合中该产品对应的向量,对种子产品集合中各产品对应的向量求平均,得到种子产品集合的向量表征;将种子产品集合的关键词向量、种子产品集合的向量表征依序连接,以构建得到标签的向量表征。
[0116]
在一个实施例中,预测模型为向量相似度计算模型、双塔模型、二分类模型中的一种。
[0117]
另外,在本发明实施例中产品打标装置的具体实施内容,在上面产品打标方法中已经详细说明了,故在此重复内容不再说明。
[0118]
图6示出了可以应用本发明实施例的产品打标方法或产品打标装置的示例性系统架构600。
[0119]
如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以
包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0120]
用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
[0121]
终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0122]
服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息
‑‑
仅为示例)反馈给终端设备。
[0123]
需要说明的是,本发明实施例所提供的产品打标方法一般由服务器605执行,相应地,产品打标装置一般设置于服务器605中。
[0124]
应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0125]
下面参考图7,其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统700的结构示意图。图7示出的终端设备或服务器仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0126]
如图7所示,计算机系统700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中,还存储有系统700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0127]
以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
[0128]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时,执行本发明的系统中限定的上述功能。
[0129]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储
器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0130]
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0131]
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括产品向量表征构建模块、标签向量表征构建模块、打标模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,产品向量表征构建模块还可以被描述为“用于基于候选产品的产品信息构建候选产品的向量表征的模块”。
[0132]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:利用与标签对应的种子产品集合的产品信息,构建标签的向量表征;将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合标签的情况下,将候选产品打标为标签。
[0133]
根据本发明实施例的技术方案,利用与标签对应的种子产品集合的产品信息,构建标签的向量表征;将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合标签的情况下,将候选产品打标为标签。能够充分利用海量产品中同类产品的信息、标签中产品的信息和标签本身的全局信息,解决了标签打标受产品本身信息质量影响和标签信息利用不够全面的问题,提高了标签多样性和打标准确率,人力成本和维护成本低,打标效果好,可扩展性好。
[0134]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围
之内。

技术特征:
1.一种产品打标方法,其特征在于,包括:基于候选产品的产品信息构建所述候选产品的向量表征;利用与标签对应的种子产品集合的产品信息,构建所述标签的向量表征;将所述候选产品的向量表征和所述标签的向量表征输入预测模型,在所述预测模型的预测结果指示所述候选产品符合所述标签的情况下,将所述候选产品打标为所述标签。2.根据权利要求1所述的方法,其特征在于,所述候选产品的产品信息包括所述候选产品的重点属性信息;所述方法还包括:对于目标产品为任一产品,通过如下方式得到所述目标产品的重点属性信息:通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定所述目标产品的产品实体,所述目标产品的产品实体是所述目标产品以及所述目标产品的相似产品构成的集合;对所述目标产品的产品实体中的每个产品的每一属性信息打分,得到所述目标产品的产品实体下每一属性信息的重要度分数,对所述重要度分数排序,以筛选出所述重要度分数最高的预设数量的属性信息,作为所述目标产品的重点属性信息。3.根据权利要求2所述的方法,其特征在于,所述对所述目标产品的产品实体中的每个产品的每一属性信息打分,得到所述目标产品的产品实体下每一属性信息的重要度分数,包括:对于所述目标产品的产品实体下每一待打分的属性信息,根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述目标产品的产品实体中产品总数量,计算所述目标产品的产品实体中所述待打分的属性信息出现的第一条件概率;根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述待打分的属性信息在所述产品库的产品中出现的总频次,计算在已知所述待打分的属性信息的条件下,所述目标产品的产品实体出现的第二条件概率;根据所述第一条件概率、所述第二条件概率计算得到所述待打分的属性信息的重要度分数。4.根据权利要求2所述的方法,其特征在于,所述候选产品的产品信息还包括所述候选产品的标题信息;所述基于候选产品的产品信息构建所述候选产品的向量表征,包括:对所述候选产品的标题信息分词,得到所述候选产品的标题分词,所述候选产品的标题分词包括产品词;基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到所述候选产品的重点属性向量、产品词向量、标题分词向量;根据所述候选产品的重点属性向量、产品词向量、标题分词向量,构建得到所述候选产品的向量表征。5.根据权利要求4所述的方法,其特征在于,所述基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到所述候选产品的重点属性向量、产品词向量、标题分词向量,包括:基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量;以所述候选产品的每一重点属性信息的重要度分数为权重,对所述候选产品的各重点
属性信息对应的向量进行加权平均运算,得到所述候选产品的重点属性向量;对所述候选产品的各产品词对应的向量求平均,得到所述候选产品的产品词向量;对所述候选产品的各标题分词对应的向量求平均,得到所述候选产品的标题分词向量。6.根据权利要求4所述的方法,其特征在于,所述根据所述候选产品的重点属性向量、产品词向量、标题分词向量,构建得到所述候选产品的向量表征,包括:将所述候选产品的重点属性向量、产品词向量、标题分词向量依序连接,得到所述候选产品的向量表征。7.根据权利要求2所述的方法,其特征在于,所述种子产品集合的产品信息包括所述种子产品集合中产品的标题信息、属性信息、重点属性信息;所述利用与标签对应的种子产品集合的产品信息,构建所述标签的向量表征,包括:根据所述种子产品集合中产品的标题信息、属性信息,抽取所述种子产品集合的关键词,并生成各所述关键词的词向量,对各所述关键词的词向量进行加权平均运算,得到所述种子产品集合的关键词向量;对所述种子产品集合中产品的标题信息分词,得到所述种子产品集合中产品的标题分词,所述种子产品集合中产品的标题分词包括产品词;基于所述种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到所述种子产品集合中产品的产品词向量和重点属性向量;基于所述种子产品集合的关键词向量、所述种子产品集合中产品的产品词向量和重点属性向量,构建所述标签的向量表征。8.根据权利要求7所述的方法,其特征在于,所述基于所述种子产品集合的关键词向量、所述种子产品集合中产品的产品词向量和重点属性向量,构建所述标签的向量表征,包括:对于所述种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到所述种子产品集合中该产品对应的向量,对所述种子产品集合中各产品对应的向量求平均,得到所述种子产品集合的向量表征;将所述种子产品集合的关键词向量、所述种子产品集合的向量表征依序连接,以构建得到所述标签的向量表征。9.根据权利要求1所述的方法,其特征在于,所述预测模型为向量相似度计算模型、双塔模型、二分类模型中的一种。10.一种产品打标装置,其特征在于,包括:产品向量表征构建模块,用于基于候选产品的产品信息构建所述候选产品的向量表征;标签向量表征构建模块,用于利用与标签对应的种子产品集合的产品信息,构建所述标签的向量表征;打标模块,用于将所述候选产品的向量表征和所述标签的向量表征输入预测模型,在所述预测模型的预测结果指示所述候选产品符合所述标签的情况下,将所述候选产品打标为所述标签。11.根据权利要求10所述的装置,其特征在于,所述候选产品的产品信息包括所述候选产品的重点属性信息;
所述装置还包括重点属性信息生成模块,用于:通过聚类算法按照预设的聚类维度对产品库中的产品聚类,以确定所述目标产品的产品实体,所述目标产品的产品实体是所述目标产品以及所述目标产品的相似产品构成的集合;对所述目标产品的产品实体中的每个产品的每一属性信息打分,得到所述目标产品的产品实体下每一属性信息的重要度分数,对所述重要度分数排序,以筛选出所述重要度分数最高的预设数量的属性信息,作为所述目标产品的重点属性信息。12.根据权利要求11所述的装置,其特征在于,所述重点属性信息生成模块还用于:对于所述目标产品的产品实体下每一待打分的属性信息,根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述目标产品的产品实体中产品总数量,计算所述目标产品的产品实体中所述待打分的属性信息出现的第一条件概率;根据所述目标产品的产品实体中产品与所述待打分的属性信息共现的频次,以及所述待打分的属性信息在所述产品库的产品中出现的总频次,计算在已知所述待打分的属性信息的条件下,所述目标产品的产品实体出现的第二条件概率;根据所述第一条件概率、所述第二条件概率计算得到所述待打分的属性信息的重要度分数。13.根据权利要求11所述的装置,其特征在于,所述候选产品的产品信息还包括所述候选产品的标题信息;所述产品向量表征构建模块还用于:对所述候选产品的标题信息分词,得到所述候选产品的标题分词,所述候选产品的标题分词包括产品词;基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量,得到所述候选产品的重点属性向量、产品词向量、标题分词向量;根据所述候选产品的重点属性向量、产品词向量、标题分词向量,构建得到所述候选产品的向量表征。14.根据权利要求13所述的装置,其特征在于,所述产品向量表征构建模块还用于:基于所述候选产品的重点属性信息、产品词、标题分词分别生成对应的向量;以所述候选产品的每一重点属性信息的重要度分数为权重,对所述候选产品的各重点属性信息对应的向量进行加权平均运算,得到所述候选产品的重点属性向量;对所述候选产品的各产品词对应的向量求平均,得到所述候选产品的产品词向量;对所述候选产品的各标题分词对应的向量求平均,得到所述候选产品的标题分词向量。15.根据权利要求13所述的装置,其特征在于,所述产品向量表征构建模块还用于:将所述候选产品的重点属性向量、产品词向量、标题分词向量依序连接,得到所述候选产品的向量表征。16.根据权利要求11所述的装置,其特征在于,所述种子产品集合的产品信息包括所述种子产品集合中产品的标题信息、属性信息、重点属性信息;所述标签向量表征构建模块还用于:根据所述种子产品集合中产品的标题信息、属性信息,抽取所述种子产品集合的关键词,并生成各所述关键词的词向量,对各所述关键词的词向量进行加权平均运算,得到所述种子产品集合的关键词向量;
对所述种子产品集合中产品的标题信息分词,得到所述种子产品集合中产品的标题分词,所述种子产品集合中产品的标题分词包括产品词;基于所述种子产品集合中产品的产品词、重点属性信息分别生成对应的向量,得到所述种子产品集合中产品的产品词向量和重点属性向量;基于所述种子产品集合的关键词向量、所述种子产品集合中产品的产品词向量和重点属性向量,构建所述标签的向量表征。17.根据权利要求16所述的装置,其特征在于,所述标签向量表征构建模块还用于:对于所述种子产品集合中每一产品,将该产品的重点属性向量和产品词向量依序连接,得到所述种子产品集合中该产品对应的向量,对所述种子产品集合中各产品对应的向量求平均,得到所述种子产品集合的向量表征;将所述种子产品集合的关键词向量、所述种子产品集合的向量表征依序连接,以构建得到所述标签的向量表征。18.根据权利要求10所述的装置,其特征在于,所述预测模型为向量相似度计算模型、双塔模型、二分类模型中的一种。19.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。20.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9中任一所述的方法。

技术总结
本发明公开了一种产品打标方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:基于候选产品的产品信息构建候选产品的向量表征,利用与标签对应的种子产品集合的产品信息,构建标签的向量表征;将候选产品的向量表征和标签的向量表征输入预测模型,在预测模型的预测结果指示候选产品符合该标签的情况下,将候选产品打标为该标签。该实施方式能够充分利用了海量产品中同类产品的信息、标签中产品的信息和标签本身的全局信息,解决了标签打标受产品本身信息质量影响和标签信息利用不够全面的问题,人力成本低,维护成本低,打标效果好。效果好。效果好。


技术研发人员:张雄伟 陶通 李勇 包勇军 颜伟鹏 周明龙 苏潇
受保护的技术使用者:北京京东世纪贸易有限公司
技术研发日:2022.01.25
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐