目标对象的推荐方法、画像构建模型的训练方法及其装置与流程

未命名 07-14 阅读:118 评论:0


1.本公开涉及数据处理技术领域,具体涉及一种目标对象的推荐方法、画像构建模型的训练方法及其装置、计算机存储介质、电子设备、计算机程序产品。


背景技术:

2.目前,传统的对象推荐系统主要基于语义相似度,并通过数量有限的检索条件来实现,由此,推荐的结果准确度较低。


技术实现要素:

3.本公开实施例提供一种目标对象的推荐方法、画像构建模型的训练方法及其装置、计算机存储介质、电子设备、计算机程序产品,用以克服或者缓解现有技术中存在的上述技术问题。
4.本公开采用的技术方案为:
5.一种目标对象的推荐方法,所述目标对象包括相似供应商或类案法律文书,所述方法包括:
6.获取用户关注的第一对象的属性信息;
7.将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;
8.确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的;
9.基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。
10.可选地,在所述目标对象为供应商的情况下:所述第二对象的属性信息包括:第二供应商的特征信息;所述特征信息包括所述第二供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。
11.可选地,在所述目标对象为类案法律文书的情况下:所述第二对象的属性信息包括:第二法律事件对应的第二法律文书的特征信息;所述特征信息包括所述第二法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。
12.可选地,基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象推荐,包括:
13.根据设定的筛选条件,从所述至少一个第二对象中选出至少一个第三对象,并将所述至少一个第三对象推荐给所述用户;或者将所述至少一个第二对象直接推荐给所述用户。
14.可选地,所述方法还包括:
15.对存储有所述多个第二对象画像的所述指定数据库进行画像更新。
16.一种对象画像构建模型的训练方法,所述方法包括:
17.获取训练样本,其中,所述训练样本包括多个样本对象的属性信息,其中,所述样本对象包括:样本供应商或样本法律文书;
18.将每个样本对象的属性信息处理成对应的源特征向量;
19.遍历所述多个样本对象,并执行以下操作:
20.利用当前遍历到的样本对象的源特征向量训练编码器,以得到对应的映射特征向量;
21.将所述映射特征向量输入对应的解码器,以得到对应的还原特征向量;
22.响应于所述源特征向量与所述还原特征向量不满足预先设定的损失函数,对所述编码器和/或所述解码器进行参数调整,并继续训练所述编码器以获得对应的对象画像构建模型,直到训练至同一样本对象的源特征向量与对应的还原特征向量满足所述损失函数为止。
23.可选地,还包括:响应于所述源特征向量与所述还原特征向量满足所述损失函数,将当前训练得到的编码器作为所需的对象画像构建模型。
24.可选地,在所述样本对象为样本供应商的情况下:所述样本对象的属性信息包括:样本供应商的特征信息;所述特征信息包括所述样本供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。
25.可选地,在所述样本对象为样本法律文书的情况下:所述样本对象的属性信息包括:样本法律文书的特征信息;所述特征信息包括所述样本法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。
26.可选地,将每个样本对象的属性信息处理成对应的源特征向量,包括:
27.将所述每个样本对象的属性信息与嵌入式矩阵中的向量进行向量积运算,以得到对应的源特征向量。
28.一种目标对象的推荐装置,所述目标对象包括相似供应商或类案法律文书,所述装置包括:
29.第一处理单元,用于获取用户关注的第一对象的属性信息;
30.第二处理单元,用于将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;
31.第三处理单元,用于确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的;
32.第四处理单元,用于基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。
33.一种画像构建模型的训练装置,所述装置包括:
34.第五处理单元,用于获取训练样本,其中,所述训练样本包括多个样本对象的属性信息,所述样本对象包括:样本供应商或样本法律文书;
35.第六处理单元,用于将每个样本对象的属性信息处理成对应的源特征向量;
36.第七处理单元,用于遍历所述多个样本对象,并执行以下操作:
37.利用当前遍历到的样本对象的源特征向量训练编码器,以得到对应的映射特征向量;
38.将所述映射特征向量输入对应的解码器,以得到对应的还原特征向量;
39.响应于所述源特征向量与所述还原特征向量不满足预先设定的损失函数,对所述编码器和/或所述解码器进行参数调整,并继续训练所述编码器,直到训练至同一样本对象的源特征向量与对应的还原特征向量满足所述损失函数为止。
40.一种计算机存储介质,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施根据本技术实施例中任一项所述的方法。
41.一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施根据本技术实施例中任一项所述的方法。
42.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本技术实施例中任一项所述的方法。
43.本公开实施例中,目标对象包括相似供应商或类案法律文书,获取用户关注的第一对象的属性信息;将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的;基于与所述至少一个第二对象画像一一对应的至少一个第二对象,由于在目标对象推荐时,是基于画像间的相似度,进而可以实现对象间更多维度的对比,从而提高了推荐的准确度,可以保证向用户推荐更能满足其需求的招投标供应商,或者,类案法律文书。
附图说明
44.图1示意性示出了本公开实施例画像构建模型的训练方法的流程示意图;
45.图2示意性示出了本公开实施例律师的推荐方法的流程示意图;
46.图3为示意性示出了本公开实施例步骤s204的流程示意图;
47.图4示意性示出了本公开实施例的目标对象的推荐装置的示意图;
48.图5示意性示出了本公开实施例的画像构建模型的训练装置的示意图;
49.图6示意性示出了本公开实施例的电子设备的示意图。
具体实施方式
50.为使本公开要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
51.本公开实施例中,目标对象包括相似供应商或类案法律文书,获取用户关注的第一对象的属性信息;将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的;基于与所述至少一个第二对象画像一一对
应的至少一个第二对象,由于在目标对象推荐时,是基于画像间的相似度,进而可以实现对象间更多维度的对比,从而提高了推荐的准确度,可以保证向用户推荐更能满足其需求的供应商,或者,类案法律文书。
52.比如,以所述目标对象为类案法律文书的情况下,可以在案件审理阶段,执行本公开实施例的方案,给用户(如,法官、律师等)推荐类案法律文书,以向审理过类似争议焦点的法院提交诉状。当案件进入审理阶段,律师作为诉讼代理人,可以根据本案提供的方法获得类案法律文书形成客观、全面、准确的类案检索报告并提交给法院,帮助承办法官更加准确地认定案件争议焦点的性质。另外,类案检索报告也有助于律师对于案件后续走向和可能结果作出更为准确的预判。
53.再比如,以所述目标对象为相似供应商的情况下,基于用户关注过的供应商可形成供应商画像,再通过确定与指定数据库中已有供应商画像的相似度,从而向用户推荐满足其需求的供应商,该方案可应用于招投标场景。
54.本公开实施例中,在进行推荐时,首先获取用户关注的第一对象的属性信息;将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像;再基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。
55.由此可见,从业务的流程来看,是预先进行对象画像构建模型的训练,再基于预训练得到的对象画像构建模型进行上述目标对象的推荐。为此,本公开下述实施例中,以业务流程为线索,先对所述对象画像构建模型的训练进行示例性说明,再对如何基于训练好的所述对象画像构建模型进行目标对象的推荐进行示例性说明。
56.示例性地,本公开实施例中的所述对象画像构建模型可以基于无监督学习进行训练。具体地,所述对象画像构建模型可以通过训练编码器得到。
57.图1示意性示出了本公开实施例画像构建模型的训练方法的流程示意图。
58.图1所示,本实施例中,所述训练方法的执行主体可以为服务端,该服务端可以为单个服务器,也可以为服务器集群。具体地,所述训练方法包括:
59.s101、获取训练样本。
60.本实施例中,所述训练样本包括多个样本对象的属性信息。所述样本对象包括:样本供应商或样本法律文书。
61.在一些实施例中,在所述样本对象为样本供应商的情况下:所述样本对象的属性信息包括:样本供应商的特征信息。
62.示例性地,所述特征信息包括所述样本供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。所述特征信息具体可以从提供企业信息查询的第三方应用程序获取。
63.示例性地,在其他一些实施例中,在所述样本对象为样本法律文书的情况下:所述样本对象的属性信息包括:样本法律文书的特征信息。
64.示例性地,所述特征信息包括所述样本法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。
65.示例性地,所述样本法律文书可以从法院或者律师协会的网站上获取到,比如为具体可以为判决文书,或者裁决文书。当然,可以从提供企业信息查询的第三方应用程序获取。
66.本实施例中,文本特征包括反映法律文书在语言表述上的特征。
67.当然,在其他一些实施例中,所述样本对象还可以为样本律师,所述样本对象的属性信息可以包括所述样本律师代理过的案件的特征信息。示例性地,所述特征信息包括但不限于一下信息中的至少其一:案由、各类案由的胜率、代理关系中的角色、裁判结果、判赔金额、涉及的属地。
68.此处,需要说明的是,所述特征信息包括的数据种类不做特别限定,可以根据应用场景的需求灵活设置,比如,在画像准确度要求度相对较低的场景中,数据种类可以较少,相反,在画像准确度要求度相对较高的场景中,数据种类可以较多。
69.s102、将每个样本对象的属性信息处理成对应的源特征向量。
70.示例性地,所述将每个样本对象的属性信息处理成对应的源特征向量,包括:将每个样本对象的属性信息与嵌入式矩阵中的向量进行向量积运算,以得到对应的源特征向量。
71.本实施例中,所述嵌入式矩阵又可称之为embedding矩阵,该embedding矩阵中的元素值为基于随机化初始值不断进行调整的,以实现对所述样本对象的属性信息的学习,进而准确地实现向量化处理,使得得到的源特征向量能准确地反映所述样本对象的属性信息的关键特征。
72.示例性地,在调整embedding矩阵中的元素值时可以基于随机梯度下降算法进行优化实现。
73.当然,此处需要说明的是,如果embedding矩阵中的元素值刚好可以使得得到的源特征向量能准确地反映所述样本对象的属性信息的关键特征,则无须调整embedding矩阵中的元素值。
74.具体地,如前所述,在所述样本对象为样本供应商的情况下,样本供应商的特征信息中包括所述样本供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力;而在在所述样本对象为样本法律文书的情况下,所述样本法律文书的特征信息包括所述样本法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。为此,针对所述样本供应商的特征信息、样本法律文书的特征信息中的每一类数据配置一个embedding矩阵,从而实现了基于不同类数据的向量化,然后把所有数据对应的向量化结果进行拼装从而得到每个所述样本法律文书、样本供应商的特征信息分别对应的向量化结果,即所述样本对象的属性信息对应的源特征向量。
75.示例性地,对于案由的向量化来说,如果在完成训练的对象画像构建模型中,所述案由要分为m类,另外,则其对应的嵌入矩阵的大小为m*n,其中n为所述对象画像构建模型中自编码器的输入层的维数,如公式(1)所示,案由对应的源特征向量cause1
‑‑
causem依次对应embedding矩阵的第一行到m行。
76.此处,对于所述样本对象的属性信息中的其他数据的embedding矩阵确定类似上述过程,在此不再赘述。
77.此处,需要说明的是,案由、涉及的属地属于类别型数据,在对应的源特征向量中按照阿拉伯数字直接编码。而涉及的判赔金额属于数值型数据,按照数值范围进行分段后,在对应的源特征向量按照判赔金额所处的分段区间(或者又称之分箱区间)进行阿拉伯数字编码。
78.示例性地,参加下述表一和表二,分别为案由、判赔金额对应的源特征向量按照十进制表示的特征编码。表一案由分类特征编码与企业有关的纠纷0人格权纠纷1侵权责任纠纷2以此类推以此类推表二判赔金额的分段区间特征编码100元以内0100-1000元11000-2000元2以此类推以此类推
79.此处,需要说明的是,上述仅仅是以为案由、判赔金额对应的源特征向量按照进行说明,并非唯一性限定。另外,对于属性信息中其他数据对应的源特征向量在原理上,类似上述案由、判赔金额对应的源特征向量的确定思想,在不偏离本公开思想的前提下,对于本领域普通技术人员来说,可以根据应用场景的需求灵活确定即可。
80.遍历所述多个样本对象,并执行以下步骤s103-s105的操作。
81.s103、利用当前遍历到的样本对象的所述源特征向量训练编码器,以得到对应的映射特征向量。
82.可选地,本实施例中,利用当前遍历到的样本对象的所述源特征向量训练编码器可得到映射特征向量,一方面实现了对所述源特征向量的降维处理,另外一方面,基于所述源特征向量,实现了从所述样本对象的属性信息中提取出关键特征信息形成了所述映射特征向量以代表对应的所述样本对象的画像。
83.此处,需要说明的是,类似上述embedding矩阵是基于随机初始化进行调整的,本实施例中,在对所述编码器进行训练时,通过调整所述编码器的参数来实现,所述编码器的参数也是基于随机初始化值进行调整的,即在初始化时,该编码器的参数的初始值是任意的随机数,在模型训练的过程中,同样基于随机梯度下降算法进行优化实现。
84.s104、将所述映射特征向量输入对应的解码器以得到还原特征向量。
85.可选地,本实施例中,所述映射特征向量与所述解码器的参数进行乘积运算,从而
得到还原特征向量。
86.此处,需要说明的是,类似上述embedding矩阵是基于随机初始化进行调整的,本实施例中,所述解码器的参数也是基于随机初始化值进行调整的,即在初始化时,该解码器的参数的初始值是任意的随机数,在模型训练的过程中,同样基于随机梯度下降算法对目标函数进行优化实现。
87.s105、响应于所述源特征向量与所述还原特征向量不满足预先设定的损失函数,对所述编码器和/或所述解码器进行参数调整并继续训练所述编码器,直到训练至同一样本对象的所述源特征向量与对应的原特征向量满足所述损失函数为止。
88.具体地,如果以数学关系式表达上述步骤s103、s104、s105的话,如公式(2)所示:
89.上述公式(2)中,表示源特征向量,表示映射特征向量,f表示源特征向量与编码器的参数进行乘积运算,表示还原特征向量,g表示还原特征向量与解码器的参数进行乘积运算,mse表示计算所述源特征向量与所述还原特征向量的损失函数,loss表示计算出的损失值。
90.本实施例中,所述损失函数为均方差函数,即计算所述源特征向量与所述还原特征向量之间的均方差来确定损失值。此处,以均方差函数为损失函数为例进行说明,并非唯一性限定所述损失函数只能是均方差函数,实际上,损失函数可以根据应用场景的需求灵活选择。
91.进一步地,本实施例中,在步骤s105之后还可以包括:使用所述源特征向量与所述还原特征向量满足与预先设定的损失函数时的映射特征向量作为所述样本对象的画像。
92.可选地,所述方法还包括:将所述样本对象的画像存储到向量数据库中,并针对每个所述样本对象的画像分配唯一性向量id,所述唯一性向量id与所述样本对象的唯一性对象id具有索引关系。该步骤具体可以在上述作为所述样本对象的画像之后执行,此处需要说明的是,可以计算出所有样本对象的画像后,统一将所有样本对象的画像批量存入所述向量数据库,也可以每计算出一个样本对象的画像后,即存入所述向量数据库。置于选择哪一种方式来处理,具体可以根据应用场景来确定。
93.可选地,所述索引关系可以存储到关系性数据库中。
94.本实施例中,通过向量数据库来存储所述样本对象的画像,可以实现向量化存储,因此,可存储的数量容量较大。另外,由于在后续确定推荐目标对象时,要计算画像间的相似度,而画像间相似度的计算,一种优选的方式中是直接计算画像的画像特征向量间的相似度,为此,通过将表征画像的画像特征向量直接存储到向量数据库中,可以实现基于画像特征向量的检索,即可快速直接确定出画像之间的相似度。
95.将所述样本对象的画像存入到所述向量数据库中时,预先构建一个向量表(又称之为collection),在该向量表指定每个向量的长度与反映所述样本对象的画像的映射特
征向量的长度相同,另外在该向量表中设置一字段(metric_type)用于存储上述计算出的相似度。具体地,可以通过api(application programming interface,应用程序编程接口)快速地将所述样本对象的画像存入到所述向量数据库。
96.进一步地,为了对向量数据库中的样本对象的画像进行及时更新,在所述向量数据库中每个样本对象的画像设置增量标签(又称为partition_tag),对所述样本对象的画像进行更新。更新的频次可以根据应用场景灵活确定。通过对样本对象的画像进行更新。
97.图2示意性示出了本公开实施例律师的推荐方法的流程示意图。如图2所示,律师的推荐方法包括:
98.s201、获取用户关注的第一对象的属性信息;
99.本实施例中,用户关注的第一对象比如为用户正在关注或者已关注过的供应商或者法律文书,或者,所述用户正在浏览或者正在检索或者已浏览过或者已检索过的供应商或者法律文书。
100.进一步地,比如可以通过对日志数据进行分析,从而获取第一对象的属性信息。
101.本实施例中,所述第一对象的属性信息类似上述图1实施例中所述样本律师的属性信息,在此不再赘述。
102.s202、将所述第一对象的属性信息输入到预训练的对象画像构建模型,以生成对应的第一对象画像;
103.示例性地,所述将所述第一对象的属性信息输入到预训练的对象画像构建模型中,以生成对应的第一对象画像,包括:对所述第一对象的属性信息进行向量化得到特征向量,将所述特征向量输入到所述对象画像构建模型中进行处理,以生成对应的第一对象画像。
104.本实施例中,所述第一对象画像比如具体通过对特征向量进行处理得到映射特征向量来表示,即用上述表示。
105.s203、确定数据库中与第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像。
106.本实施例中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的。
107.本实施例中,所述第二对象画像比如为上述样本律师画像。
108.进一步地,所述确定所述第一对象画像和已构建的第二对象画像之间的相似度,包括;根据所述第一对象画像和所述第二对象画像的欧式距离来确定所述相似度。具体地,欧式距离越大,相似度越小,反之,则相似度越大。
109.如前所述,所述第一对象画像和所述第二对象画像可以画像特征向量表示,且所述第二对象画像对应的画像特征向量存储在向量数据库中时,为此,确定所述第一对象画像和已构建的第二对象画像之间的相似度之前,包括:从向量数据库获取以画像特征向量表述的所述第二对象画像,以通过计算所述第一对象画像和所述第二对象画像对应的画像特征向量之间的相似度,从而作为所述第一对象画像和所述第二对象画像之间的相似度。
110.s204、基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。
111.示例性地,图3为示意性示出了本公开实施例步骤s204的流程示意图。如图3所示,步骤s204可以包括:
112.s214、根据所述相似度大于预设相似度阈值时对应的第二对象画像的唯一性向量id,获取与所述唯一性向量id具有索引关系的唯一性对象id;
113.s224、根据与所述唯一性向量id具有索引关系的唯一性对象id,确定与所述至少一个第二对象画像一一对应的至少一个第二对象。
114.进一步地,所述步骤s204还可以包括:根据设定的筛选条件,对从所述至少一个第二对象中选出至少一个第三对象,并将所述至少一个第三对象推荐给所述用户;或者,将所述至少一个第二对象直接推荐给所述用户。
115.比如,所述筛选条件可以为涉及的属地,从而从可推荐的第二对象中,选取在涉及的属地这个维度上完全相同的第三对象作为实际推荐给用户的目标对象。比如,用户关注的法律文书涉及的属地为a城市,则将可推荐的法律文书中,属地为a的法律文书推荐给用户。
116.另外,在将所述至少一个第二对象直接推荐给所述用户时,比如直接可推荐的法律文书推荐用户,包括属地为a的法律文书,属地为c的法律文书。
117.此处,筛选条件的说明仅仅是示例,并非唯一性限定,比如还可以基于理关系中的角色进行筛选。
118.此处需要说明的是,推荐的目标对象在数量可以一个,也可以是多个。
119.另外,筛选条件根据应用场景的要求,可以设置多个,以提高推荐的准确度。
120.示例性地,所述方法还包括:对存储有所述多个第二对象画像的所述指定数据库进行画像更新,从而保证了实现了指定数据库的动态更新,使得指定数据库中的画像数量不断增多,进一步提高了推荐的准确度。
121.图4示意性示出了本公开实施例的目标对象的推荐装置的示意图。
122.如图4所示,所述目标对象包括相似供应商或类案法律文书,目标对象的推荐装置400包括:
123.第一处理单元401,用于用户关注的第一对象的属性信息。
124.第二处理单元402,用于将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像。
125.第三处理单元403,用于确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的。
126.第四处理单元404,用于基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。
127.可选地,在所述目标对象为供应商的情况下:所述第二对象的属性信息包括:第二供应商的特征信息;所述特征信息包括所述第二供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。
128.可选地,在所述目标对象为类案法律文书的情况下:所述第二对象的属性信息包括:第二法律事件对应的第二法律文书的特征信息;所述特征信息包括所述第二法律文书
的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。
129.可选地,所述第二处理单元402具体用于:对所述第一对象的属性信息进行向量化处理得到对应的特征向量;将所述特征向量输入到所述对象画像构建模型中进行处理,以生成对应的第一对象画像。
130.可选地,所述第四处理单元404具体用于:根据设定的筛选条件,从所述至少一个第二对象中选出至少一个第三对象,并将所述至少一个第三对象推荐给所述用户;或者,将所述至少一个第二对象直接推荐给所述用户。
131.可选地,所述装置还包括更新单元,用于对存储有所述多个第二对象画像的所述指定数据库进行画像更新。
132.图5示意性示出了本公开实施例的画像构建模型的训练装置的示意图。
133.图5所示,画像构建模型的训练装置500包括:
134.第五处理单元501,用于获取训练样本,其中,所述训练样本包括多个样本对象的属性信息,所述样本对象包括:样本供应商或样本法律文书。
135.第六处理单元502,用于将每个样本对象的属性信息处理成对应的源特征向量。
136.第七处理单元503,用于遍历所述多个样本对象,并执行以下操作:
137.利用当前遍历到的样本对象的源特征向量训练编码器,以得到对应的映射特征向量;
138.将所述映射特征向量输入对应的解码器,以得到对应的还原特征向量;
139.响应于所述源特征向量与所述还原特征向量不满足预先设定的损失函数,对所述编码器和/或所述解码器进行参数调整,并继续训练所述编码器,直到训练至同一样本对象的源特征向量与对应的还原特征向量满足所述损失函数为止。
140.可选地,所述第七处理单元503还用于:响应于所述源特征向量与所述还原特征向量满足所述损失函数,将当前训练得到的编码器作为所需的对象画像构建模型。
141.可选地,在所述样本对象为样本供应商的情况下:所述样本对象的属性信息包括:样本供应商的特征信息;所述特征信息包括所述样本供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。
142.可选地,在所述样本对象为样本法律文书的情况下:所述样本对象的属性信息包括:样本法律文书的特征信息;所述特征信息包括所述样本法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。
143.可选地,所述第六处理单元502具体用于将所述每个样本对象的属性信息与嵌入式矩阵中的向量进行向量积运算,以得到对应的源特征向量。
144.图6示意性示出了本公开实施例的电子设备的示意图。如图6所示,电子设备600包括:存储器601以及处理器602,所述存储器上存储有计算机可执行程序,所述处理器用于运行所述计算机可执行程序以实施根据本公开实施例中任一项所述的方法。
145.本公开实施例还提供一种计算机存储介质,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施根据本公开实施例中任一项所述的方法。
146.本公开实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序在
被处理器执行时实现根据本公开实施例中任一项所述的方法。
147.以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

技术特征:
1.一种目标对象的推荐方法,其特征在于,所述目标对象包括相似供应商或类案法律文书,所述方法包括:获取用户关注的第一对象的属性信息;将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的;基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。2.根据权利要求1所述的方法,其特征在于,在所述目标对象为供应商的情况下:所述第二对象的属性信息包括:第二供应商的特征信息;所述特征信息包括所述第二供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。3.根据权利要求1所述的方法,其特征在于,在所述目标对象为类案法律文书的情况下:所述第二对象的属性信息包括:第二法律事件对应的第二法律文书的特征信息;所述特征信息包括所述第二法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。4.根据权利要求1至3中任一项所述的方法,其特征在于,基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象推荐,包括:根据设定的筛选条件,从所述至少一个第二对象中选出至少一个第三对象,并将所述至少一个第三对象推荐给所述用户;或者将所述至少一个第二对象直接推荐给所述用户。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:对存储有所述多个第二对象画像的所述指定数据库进行画像更新。6.一种对象画像构建模型的训练方法,其特征在于,所述方法包括:获取训练样本,其中,所述训练样本包括多个样本对象的属性信息,所述样本对象包括:样本供应商或样本法律文书;将每个样本对象的属性信息处理成对应的源特征向量;遍历所述多个样本对象,并执行以下操作:利用当前遍历到的样本对象的源特征向量训练编码器,以得到对应的映射特征向量;将所述映射特征向量输入对应的解码器,以得到对应的还原特征向量;响应于所述源特征向量与所述还原特征向量不满足预先设定的损失函数,对所述编码器和/或所述解码器进行参数调整,并继续训练所述编码器以获得对应的对象画像构建模型,直到训练至同一样本对象的源特征向量与对应的还原特征向量满足所述损失函数为止。7.根据权利要求6所述的方法,其特征在于,还包括:
响应于所述源特征向量与所述还原特征向量满足所述损失函数,将当前训练得到的编码器作为所需的对象画像构建模型。8.根据权利要求6所述的方法,其特征在于,在所述样本对象为样本供应商的情况下:所述样本对象的属性信息包括:样本供应商的特征信息;所述特征信息包括所述样本供应商的以下信息中的至少之一:供应链、供主营业务、企业注册资本、企业主营业务年收入、企业主营业务年利润、所述供应商的社保人数、所述供应商的融资情况、所述供应商的投资情况、所述供应商的技术软实力。9.根据权利要求6所述的方法,其特征在于,在所述样本对象为样本法律文书的情况下:所述样本对象的属性信息包括:样本法律文书的特征信息;所述特征信息包括所述样本法律文书的以下信息中的至少之一:涉及的案由、涉及的判赔金额、涉及的属地、文本特征。10.根据权利要求6-9中任一项所述的方法,其特征在于,将每个样本对象的属性信息处理成对应的源特征向量,包括:将所述每个样本对象的属性信息与嵌入式矩阵中的向量进行向量积运算,以得到对应的源特征向量。11.一种目标对象的推荐装置,其特征在于,所述目标对象包括相似供应商或类案法律文书,包括:第一处理单元,用于获取用户关注的第一对象的属性信息;第二处理单元,用于将所述第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;第三处理单元,用于确定指定数据库中与所述第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和所述对象画像构建模型得到的;第四处理单元,用于基于与所述至少一个第二对象画像一一对应的至少一个第二对象,向所述用户进行目标对象的推荐。12.一种画像构建模型的训练装置,其特征在于,所述装置包括:第五处理单元,用于获取训练样本,其中,所述训练样本包括多个样本对象的属性信息,所述样本对象包括:样本供应商或样本法律文书;第六处理单元,用于将每个样本对象的属性信息处理成对应的源特征向量;第七处理单元,用于遍历所述多个样本对象,并执行以下操作:利用当前遍历到的样本对象的源特征向量训练编码器,以得到对应的映射特征向量;将所述映射特征向量输入对应的解码器,以得到对应的还原特征向量;响应于所述源特征向量与所述还原特征向量不满足预先设定的损失函数,对所述编码器和/或所述解码器进行参数调整,并继续训练所述编码器,直到训练至同一样本对象的源特征向量与对应的还原特征向量满足所述损失函数为止。13.一种计算机存储介质,所述计算机存储介质上存储有计算机可执行程序,所述计算机可执行程序被运行以实施根据权利要求1-10中任一项所述的方法。14.一种电子设备,所述电子设备包括存储器以及处理器,所述存储器上用于存储计算
机可执行程序,所述处理器用于运行所述计算机可执行程序以实施根据权利要求1-10中任一项所述的方法。15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。

技术总结
本公开提供了一种目标对象的推荐方法、画像构建模型的训练方法及其装置、计算机存储介质、电子设备、计算机程序产品,属于数据处理技术领域。所述目标对象包括相似供应商或类案法律文书,目标对象的推荐方法包括:获取用户关注的第一对象的属性信息;将第一对象的属性信息输入到预训练得到的对象画像构建模型,以生成对应的第一对象画像;确定指定数据库中与第一对象画像之间的相似度大于预设相似度阈值的至少一个第二对象画像,其中,每个第二对象画像都是基于对应的第二对象的属性信息和对象画像构建模型得到的;基于与至少一个第二对象画像一一对应的至少一个第二对象,向用户进行目标对象的推荐。行目标对象的推荐。行目标对象的推荐。


技术研发人员:刘天宇
受保护的技术使用者:北京金堤科技有限公司
技术研发日:2021.12.27
技术公布日:2023/7/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐