价格偏见因素确定方法和装置与流程

未命名 07-13 阅读:103 评论:0


1.本技术涉及数据处理技术领域,具体涉及价格偏见因素确定方法和装置,位置偏见因素确定方法和装置,偏见因素确定方法和装置,以及电子设备。


背景技术:

2.随着人工智能系统在日常生活中的广泛应用,人工智能已经成为了辅助人们决策的重要工具。影响人工智能系统公平公正的一个重要因素是人工智能系统采用的算法本身,算法公平性归因与评估已经成为业界重点关注的问题。
3.算法公平性归因与评估是对人工智能系统在敏感属性/受保护属性上存在的结果差异进行量化,利用评估结果改进人工智能系统,减少其对敏感属性的依赖,比如年龄、性别、收入——以及任何与这些属性相关的信息,从而确保人工智能系统的公平公正。人工智能系统通常具有技术链路长、影响因素多、敏感属性多的特点,目前主要基于专家对任务的深刻理解对公平性问题的产生进行溯源,发现算法偏见,定位偏见原因。
4.然而,在实现本发明过程中,发明人发现上述技术方案至少存在如下问题:基于专家对任务的深刻理解较难定位技术链路长、影响因素多、敏感属性多的人工智能系统存在偏见(歧视)的原因,偏见原因的定位效率和准确性均较低。


技术实现要素:

5.本技术提供价格偏见因素确定方法,以解决现有技术存在的价格偏见因素的定位效率和准确性均较低的问题。本技术另外提供价格偏见因素确定装置,位置偏见因素确定方法和装置,偏见因素确定方法和装置,以及电子设备。
6.本技术提供一种价格偏见因素确定方法,包括:
7.获取目标数据对象针对不同用户的第一价格数据、所述用户的用户特征数据集、所述目标数据对象的第二价格数据,形成所述目标数据对象的训练数据集;
8.从所述训练数据集内学习得到所述目标数据对象的价格计算模型;
9.通过所述价格计算模型,获取所述用户特征数据对所述第一价格数据的边际贡献数据,作为第一边际贡献数据;
10.根据所述第一边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素。
11.可选的,所述通过所述价格计算模型,获取所述用户特征数据对所述第一价格数据的边际贡献数据,包括:
12.将所述用户特征数据作为目标特征数据,获取与所述目标特征数据对应的其它用户特征的至少一种组合特征数据;
13.通过所述价格计算模型,根据与所述目标特征数据对应的所述用户的组合特征数据和所述第二价格数据,获取第三价格数据;根据所述组合特征数据、所述目标特征数据和所述第二价格数据,获取第四价格数据;
14.根据所述第三价格数据和所述第四价格数据,获取与所述组合特征对应的所述目标特征数据的边际贡献数据,作为第二边际贡献数据;
15.根据与所述至少一种组合特征分别对应的所述第二边际贡献数据,获取所述目标特征数据的所述第一边际贡献数据。
16.可选的,所述通过所述价格计算模型,根据与所述目标特征数据对应的所述用户的组合特征数据和所述第二价格数据,获取第三价格数据,包括:
17.获取与所述目标特征数据对应的至少一个其它用户的所述组合特征以外的第一特征数据;
18.通过所述价格计算模型,根据所述用户的组合特征数据、所述其它用户的所述组合特征以外的第一特征数据和所述第二价格数据,获取第五价格数据;
19.根据与所述至少一个其它用户分别对应的所述第五价格数据,获取所述第三价格数据。
20.可选的,所述根据所述第一边际贡献数据,从多个用户特征中选取用户特征,包括:
21.根据所述第一边际贡献数据和所述用户特征数据,获取所述用户特征对所述第一价格数据的偏见分数,作为第一偏见分数;
22.根据所述第一偏见分数,从所述多个用户特征中选取用户特征。
23.可选的,所述根据所述第一边际贡献数据和所述用户特征数据,获取所述用户特征对所述第一价格数据的偏见分数,包括:
24.获取所述用户特征的第一向量和第二向量之间的第一相关度,作为所述第一偏见分数;所述第一向量包括所述不同用户的所述第一边际贡献数据,所述第二向量包括所述不同用户的所述用户特征数据。
25.可选的,还包括:
26.根据所述多个用户特征,获取至少一个多特征组合;
27.通过所述价格计算模型,获取多特征组合数据对所述第一价格数据的边际贡献数据,作为第三边际贡献数据;
28.根据所述第三边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素。
29.可选的,所述根据所述多个用户特征,获取至少一个多特征组合,包括:
30.根据所述多个用户特征,获取至少一个双特征组合,所述双特征组合包括第一特征和第二特征;
31.所述通过所述价格计算模型,获取多特征组合数据对所述第一价格数据的边际贡献数据,包括:
32.获取目标双特征组合数据以外的其它用户特征的至少一种组合特征数据;
33.通过所述价格计算模型,根据与所述目标双特征组合数据对应的所述用户的所述组合特征数据和所述第二价格数据,获取第六价格数据;根据所述组合特征数据、所述目标双特征组合数据和所述第二价格数据,获取第七价格数据;根据所述组合特征数据、第一特征数据和所述第二价格数据,获取第八价格数据;根据所述组合特征数据、第二特征数据和所述第二价格数据,获取第九价格数据;
34.根据所述第六价格数据、所述第七价格数据、所述第八价格数据和所述第九价格数据,获取与所述组合特征对应的所述目标双特征组合数据的边际贡献数据,作为第四边际贡献数据;
35.根据与所述至少一种组合特征分别对应的所述第四边际贡献数据,获取所述目标双特征组合数据的第三边际贡献数据。
36.可选的,所述根据所述第三边际贡献数据,从多个用户特征中选取用户特征,包括:针对所述多特征组合中的各个目标特征,根据所述第三边际贡献数据和目标特征数据,获取所述目标特征对所述第一价格数据的第二偏见分数;根据所述第二偏见分数,从多个用户特征中选取用户特征。
37.可选的,所述根据所述第三边际贡献数据和目标特征数据,获取所述目标特征对所述第一属性数据的第二偏见分数,包括:获取所述多特征组合的第三向量与目标特征的第二向量之间的第二相关度,作为所述第二偏见分数;所述第二向量包括所述不同用户的目标特征数据,所述第三向量包括所述不同用户的所述第三边际贡献数据。
38.可选的,所述根据所述第一边际贡献数据,从多个用户特征中选取用户特征,包括:根据所述第一边际贡献数据和所述第一特征数据,生成特征边际贡献数据图;获取基于所述分布图确定的用户特征。
39.可选的,不同数据对象对应不同的所述价格偏见因素,所述价格确定系统对不同数据对象采用不同的处理链路。
40.可选的,还包括:确定所述目标数据对象的用户特征集,不同数据对象对应的价格计算模型的输入数据不同。
41.可选的,所述确定所述目标数据对象的用户特征集,包括:获取所述目标数据对象的目标用户群信息;将与所述目标用户群信息无关的用户特征形成所述用户特征集。
42.可选的,所述获取所述目标数据对象的目标用户群信息,采用如下方式之一:从目标数据对象的描述信息中提取所述目标用户群信息;或者,接收客户端提交的所述目标用户群信息。
43.可选的,所述确定所述目标数据对象的用户特征集,包括:接收客户端提交的所述用户特征集。
44.可选的,还包括:获取所述目标数据对象的目标用户群信息;根据所述目标用户群信息,对所述价格偏见因素进行筛选。
45.可选的,还包括:根据所述价格偏见因素的偏见分数,获取所述价格偏见因素的排序数据;向客户端提供所述排序数据。
46.本技术还提供一种位置偏见因素确定方法,包括:
47.获取目标数据对象针对不同用户的展示位置数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;
48.从所述训练数据集内学习得到展示位置计算模型;
49.通过所述展示位置计算模型,获取所述用户特征数据对所述展示位置数据的边际贡献数据;
50.根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的展示位置偏见因素。
51.本技术还提供一种偏见因素确定方法,包括:
52.获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;
53.从所述训练数据集内学习得到目标属性数据计算模型;
54.通过所述目标属性数据计算模型,获取所述用户特征数据对所述目标属性数据的边际贡献数据;
55.根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素。
56.本技术还提供一种偏见因素确定方法,包括:
57.获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述数据对象的训练数据集;
58.从所述训练数据集内学习得到目标属性数据计算模型;
59.根据所述多个用户特征,获取至少一个多特征组合;
60.通过所述目标属性数据计算模型,获取多特征组合数据对所述目标属性数据的边际贡献数据;
61.根据所述边际贡献数据,从多个用户特征中选取用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素。
62.本技术还提供一种偏见因素确定装置,包括:
63.训练数据构建单元,用于获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;
64.模型构建单元,用于从所述训练数据集内学习得到目标属性数据计算模型;
65.边际贡献获取单元,用于通过所述目标属性数据计算模型,获取所述用户特征数据对所述目标属性数据的边际贡献数据;
66.特征选取单元,用于根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素。
67.本技术还提供一种电子设备,包括:处理器和存储器;存储器,用于存储实现上述任一项偏见因素确定方法的程序,该设备通电并通过所述处理器运行该方法的程序。
68.本技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各种方法。
69.本技术还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各种方法。
70.与现有技术相比,本技术具有以下优点:
71.本技术实施例提供的价格偏见因素确定方法,通过为目标数据对象构建与技术链路较长、影响因素较多、敏感属性较多的价格确定系统相拟合的技术链路短、影响因素少的替代模型(价格计算模型),设计可解释的敏感属性(用户特征),利用替代模型获取敏感属性数据对价格确定系统输出的目标数据对象的第一价格数据的边际贡献,以量化在敏感属性上存在的目标数据对象的第一价格数据差异,发现对价格确定系统输出的目标数据对象的第一价格数据的影响较大的敏感属性。采用这种处理方式,至少可达到以下技术效果:
72.1)由于用于评分的替代模型具有技术链路短、影响因素少的特点,因此,可以有效
提升价格偏见原因的定位效率;
73.2)由于引入用户特征边际贡献数据,该数据依据用户特征对第一价格数据的贡献来分配,捕捉各个用户特征之间的博弈关系,这种分配方式更具公平性和合理性,因此,可以有效提升价格偏见原因的定位准确性;
74.3)由于替代模型的输入特征为可解释的多维度用户特征,如性别、年龄段、用户活跃度、用户价值类型等,因此从多维度归因提供可解释的价格偏见定性和定量的结果信息,辅助人类对价格偏见问题的多方位洞察,流程中人类可干预可决策。
75.进一步的,本技术实施例提供的价格偏见因素确定方法,还可通过综合考虑在敏感属性上存在的目标数据对象的第一价格数据差异和敏感属性值,评估敏感属性对价格确定系统输出的目标数据对象的第一价格数据的偏见程度,根据偏见程度评估结果发现对价格确定系统输出的目标数据对象的第一价格数据影响较大的敏感属性。由于综合考虑在敏感属性上存在的第一价格数据差异和敏感属性值来评估偏见程度,因此,可以有效提升价格偏见原因的定位效率和定位准确性。
76.进一步的,本技术实施例提供的价格偏见因素确定方法,还可通过对多特征组合进行偏见归因和评估,实现多维度的不同特征粒度(如单特征、双特征交互效应、三特征交互效应等)的偏见归因,从而进一步提升价格偏见原因的定位准确性。
77.本技术实施例提供的位置偏见因素确定方法,通过为目标数据对象构建与技术链路较长、影响因素较多、敏感属性较多的搜索/推荐系统相拟合的技术链路短、影响因素少的替代模型(展示位置计算模型),设计可解释的敏感属性,利用替代模型获取敏感属性数据对搜索/推荐系统输出的目标数据对象的展示位置数据的边际贡献,以量化在敏感属性上存在的的目标数据对象的展示位置数据差异,发现对搜索/推荐系统输出的目标数据对象的展示位置数据的影响较大的敏感属性。采用这种处理方式,可以有效提升展示位置偏见原因的定位效率和定位准确性,并提供可解释的偏见原因,辅助人类对位置偏见问题的多方位洞察,流程中人类可干预可决策。
78.本技术实施例提供的偏见因素确定方法,通过为目标数据对象构建与技术链路较长、影响因素较多、敏感属性较多的人工智能系统相拟合的技术链路短、影响因素少的替代模型(目标属性数据计算模型),设计可解释的敏感属性,利用替代模型获取敏感属性数据对人工智能系统输出结果(目标属性数据)的边际贡献,以量化在敏感属性上存在的结果差异,发现对人工智能系统输出结果影响较大的敏感属性。采用这种处理方式,可以有效提升系统偏见原因的定位效率和定位准确性,并提供可解释的偏见原因,辅助人类对系统偏见问题的多方位洞察,流程中人类可干预可决策。
79.本技术实施例提供的偏见因素确定方法,根据多因素的边际贡献数据选取用户特征。由于用户特征对目标属性数据的影响正负向不同,可能相互抵消或增强,单个特征上存在的目标属性偏见问题不一定在多特征组合上同样存在,因此可对多特征组合进行目标属性偏见归因和评估,实现多维度的不同特征粒度(如单特征、双特征交互效应、三特征交互效应等)的偏见归因,这样可以有效减少偏见因素的数量,提升偏见因素的准确度。
附图说明
80.图1本技术提供的价格偏见因素确定方法的实施例的流程示意图;
81.图2本技术提供的价格偏见因素确定方法的实施例的场景示意图;
82.图3本技术提供的价格偏见因素确定方法的实施例的单特征的边际贡献分布图;
83.图4本技术提供的价格偏见因素确定方法的实施例的双特征的边际贡献分布图。
具体实施方式
84.在下面的描述中阐述了很多具体细节以便于充分理解本技术。但是本技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本技术内涵的情况下做类似推广,因此本技术不受下面公开的具体实施的限制。
85.在本技术中,提供了价格偏见因素确定方法和装置,位置偏见因素确定方法和装置,偏见因素确定方法和装置,以及电子设备。
86.第一实施例
87.请参考图1,其为本技术的价格偏见因素确定方法的流程图。在本实施例中,所述方法可包括如下步骤:
88.步骤s101:获取目标数据对象针对不同用户的第一价格数据、所述用户的用户特征数据集、所述目标数据对象的第二价格数据,形成所述目标数据对象的训练数据集。
89.第一价格数据是目标数据对象针对不同用户的个性化价格数据,如商品权益价格等。第二价格数据可以是目标数据对象的统一价格数据。目标数据对象可以是商品对象、广告对象、新闻对象等。个性化价格是根据用户数据对统一价格进行调整后的价格,由于每个用户的用户数据不同,因此同一数据对象对不同用户的个性化价格可以不同。
90.第一价格数据是通过价格确定系统根据第二价格数据和用户数据确定的价格数据。价格确定系统用于计算数据对象针对不同用户的第一价格数据,该系统具有处理链路较长、第一价格数据的影响因素较多、敏感属性较多的特点,难以直接通过价格确定系统对目标数据对象进行价格偏见归因和评估。
91.由图2可见,本技术实施例提供的价格偏见因素确定方法,可应用在对电商平台的价格确定系统进行价格歧视原因评估的场景中。价格确定系统可用于计算商品对不同用户的权益价格,同一商品对不同用户的权益价格可以不同。在该场景中,包括第一服务端、第二服务端、第一用户客户端和第二用户客户端。第一用户为电商平台的买家用户,第二用户为价格确定系统的运营人员,第一服务端部署有价格确定系统,价格确定系统为人工智能系统,第二服务端部署有偏见因素评估系统。偏见因素评估系统可采用本技术实施例提供的方法,来确定对价格确定系统的输出数据有较大偏见影响的用户特征,作为价格偏见因素。运营人员根据价格偏见因素调整价格确定系统,以降低用户敏感属性对商品权益价格的影响。
92.具体实施时,电商平台的买家用户可通过第一用户客户端向第一服务端请求查看目标商品的权益价格,第一服务端通过价格确定系统计算目标商品对该买家用户的权益价格。第二服务端通过偏见因素评估系统采集该目标商品对不同用户的权益价格,并获取各用户的用户特征数据(可解释的用户敏感特征),基于这些数据构建训练数据集,其中用户特征可由价格确定系统的运营人员指定;从训练数据集中学习得到价格确定系统的替代模型;通过替代模型,计算各个用户特征数据对商品权益价格的边际贡献数据;根据边际贡献数据选取用户特征作为价格偏见因素。
93.用户特征是对用户而言比较敏感的可解释的用户特征,如性别等受保护的特征、用户价值类型等用户敏感的特征、用户对数据对象的下单次数特征等。用户特征可以是用户属性特征,也可以是用户行为特征。用户属性特征可以是性别、年龄段(如儿童、青年、中年、老人)、所在地区等。用户属性特征还可以是根据用户的网络操作行为数据确定的特征,如根据用户在电商平台的操作行为数据确定的用户价值类型(如高价值用户,一般价值用户,流失用户等)。用户行为特征可以是根据用户对数据对象的操作行为数据(如用户对商品对象a的浏览、下单、加购、收藏等行为数据)确定的用户近期加购次数、浏览次数、下单次数等特征。
94.本技术实施例提供的价格偏见因素确定方法,将目标数据对象对具体用户的第一价格数据、该用户的用户特征数据集和第二价格数据形成训练数据,目标数据对象的多个用户的训练数据形成目标数据对象的训练数据集,表1列出了电商平台中商品对象a的训练数据集。
[0095][0096]
表1、商品对象a的训练数据集
[0097]
具体实施时,用于实现本技术实施例提供的方法的价格偏见因素确定装置、价格确定系统部署在不同的设备端,价格偏见因素确定装置为价格确定系统提供价格偏见因素评估服务,如图2所示。在这种情况下,步骤s101可采用如下方式实现:价格偏见因素确定装置采集价格确定系统输出的第一价格数据,从价格确定系统的设备端获取目标数据对象的第二价格数据,构造用户特征,并从价格确定系统的设备端获取目标数据对象的多个用户的用户特征数据集。
[0098]
需要说明的是,不同数据对象可对应相同的价格确定系统,但对应不同的训练数据集和不同的价格偏见因素,同一价格确定系统可采用不同的计算链路对不同数据对象确定第一价格数据,也即通过同一价格确定系统采用不同的算法为不同的数据对象确定针对不同用户的第一价格数据。此外,不同数据对象也可对应不同的独立价格确定系统,即价格确定系统是与目标数据对象对应的专用系统。
[0099]
步骤s103:从所述训练数据集内学习得到所述目标数据对象的价格计算模型。
[0100]
本技术实施例提供的方法,从训练数据集内学习得到目标数据对象的第一价格数据计算模型(简称价格计算模型),将对该价格计算模型进行价格偏见归因和评估的处理结果作为价格确定系统的价格偏见归因和评估结果。具体实施时,可将第一价格数据作为价格计算模型的输出标注数据,将第二价格数据和用户特征数据集作为价格计算模型的输入数据,采用有监督的机器学习方式调整价格计算模型的参数。
[0101]
需要说明的是,统一的价格确定系统的处理链路较长,可包括多个计算模块,处理方式较为复杂,难以直接通过该统一系统对不同数据对象分别进行价格偏见归因和评估。
而价格计算模型是机器学习模型,如决策树、随机森林、神经网络模型等,处理链路短,且价格计算模型的输入数据为可解释的多维度用户特征,更容易进行价格偏见归因和评估。
[0102]
步骤s105:通过所述价格计算模型,获取所述用户特征数据对所述第一价格数据的边际贡献数据,作为第一边际贡献数据。
[0103]
第一价格数据的边际贡献数据是由用户特征数据导致的第一价格数据的差异数据。例如,用户特征数据为商品对象a的用户1的性别,考虑该性别特征时商品对象a对用户1的第一价格数据是80,不考虑该性别特征时的第一价格数据是95,对应的第一边际贡献数据为15。
[0104]
表2列出了商品对象a的用户特征数据对第一价格数据的第一边际贡献数据。
[0105]
用户标识特征1贡献1特征2贡献2

用户1xxxxxxxxxxxx 用户2xxxxxxxxxxxx 用户3xxxxxxxxxxxx
ꢀ…ꢀꢀꢀꢀꢀ
[0106]
表2、商品对象a的第一边际贡献数据
[0107]
在一个示例中,步骤s105可包括如下子步骤:
[0108]
步骤s1051:将所述用户特征数据作为目标特征数据,获取与所述目标特征数据对应的其它用户特征的至少一种组合特征数据。
[0109]
具体实施时,可对目标数据对象的每个用户的每个用户特征数据执行步骤s1051至步骤s1057的处理,获取每个用户特征数据对第一价格数据的第一边际贡献数据。
[0110]
为了便于描述,将用户特征数据称为目标特征数据,获取与目标特征数据对应的其它用户特征的至少一种组合特征数据。例如,商品对象a的用户1的用户特征数据集包括特征1的数据至特征30的数据,目标特征数据为特征3的数据,与该数据对应的至少一种组合特征数据可以是其它29个特征数据中的任意20个特征数据的组合,20个特征数据的组合数量可以是29*28*

*10种,如一种组合数据为{特征1的数据,特征2的数据,特征4的数据至特征21的数据}。特征组合包括的特征数量可根据应用需求确定,如设置特征组合包括20个或者15个特征数据。
[0111]
步骤s1053:通过所述价格计算模型,根据与所述目标特征数据对应的所述用户的组合特征数据和所述第二价格数据,获取第三价格数据;根据所述组合特征数据、所述目标特征数据和所述第二价格数据,获取第四价格数据。
[0112]
第三价格数据是根据与目标特征数据对应的用户的组合特征数据和第二价格数据确定的价格数据,该价格数据与目标特征数据无关。第四价格数据是根据目标特征数据、对应的组合特征数据和第二价格数据确定的价格数据,该价格数据与目标特征数据相关。
[0113]
在一个示例中,步骤s1053可包括如下子步骤:
[0114]
步骤s10531:获取与所述目标特征数据对应的至少一个其它用户的所述组合特征以外的第一特征数据。
[0115]
例如,目标特征数据为商品对象a的用户1的特征数据3,与该数据对应的一种组合特征数据为{特征数据1,特征数据2,特征数据4至特征数据21},与该数据对应的至少一个其它用户的所述组合特征以外的第一特征数据包括:用户2的{特征数据22至特征数据30},
用户3的{特征数据22至特征数据30,

,用户n的{特征数据22至特征数据30}。
[0116]
步骤s10533:通过所述价格计算模型,根据所述用户的组合特征数据、所述其它用户的所述组合特征以外的第一特征数据和所述第二价格数据,获取第五价格数据。
[0117]
在通过价格计算模型获取第五价格数据时,模型的输入数据包括所有用户特征数据。例如,模型的输入数据包括30个特征数据,分别为:用户1的特征数据3,用户1的{特征数据1,特征数据2,特征数据4至特征数据21},用户2的{特征数据22至特征数据30}。
[0118]
步骤s10535:根据与所述至少一个其它用户分别对应的所述第五价格数据,获取所述第三价格数据。
[0119]
在本步骤中,第三价格数据是根据与各个其它用户分别对应的多个第五价格数据确定的价格数据。具体实施时,第三价格数据可以是多个第五价格数据的均值数据。
[0120]
通过上述步骤s10531至s10535,使得可根据与多个其它用户对应的第五价格数据来确定第三价格数据,因此,可以有效提升第三价格数据的准确度。
[0121]
同理,第四价格数据也可采用类似步骤s10531至s10535的方式来获取,使得可根据与多个其它用户对应的第六价格数据来确定第四价格数据,因此,可以有效提升第四价格数据的准确度。第六价格数据采用如下方式获取:通过所述价格计算模型,根据所述目标特征数据、所述用户的组合特征数据、所述其它用户的所述组合特征以外的第一特征数据和所述第二价格数据,获取第六价格数据。
[0122]
步骤s1055:根据所述第三价格数据和所述第四价格数据,获取与所述组合特征对应的所述目标特征数据的边际贡献数据,作为第二边际贡献数据。
[0123]
第二边际贡献数据可以是所述第三价格数据和所述第四价格数据的差值数据,可体现由目标特征数据导致的与组合特征对应的第一价格数据的差异数据。
[0124]
步骤s1057:根据与所述至少一种组合特征分别对应的所述第二边际贡献数据,获取所述目标特征数据的所述第一边际贡献数据。
[0125]
第一边际贡献数据是根据与各种组合特征分别对应的多个第二边际贡献数据确定的边际贡献数据。具体实施时,第一边际贡献数据可以是多个第二边际贡献数据的均值数据。
[0126]
通过上述步骤s1051至s1057,使得可根据与多种组合特征对应的第二边际贡献数据来确定第一边际贡献数据,因此,可以有效提升第一边际贡献数据的准确度。
[0127]
步骤s107:根据所述第一边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素,用于调整所述价格确定系统。
[0128]
第一边际贡献数据可体现用户特征对第一价格数据的影响度,依据该数据可从多个用户特征中选取用户特征,作为价格确定系统对目标数据对象的价格偏见因素。
[0129]
在一个示例中,步骤s107可包括如下子步骤:1)根据所述第一边际贡献数据和所述第一特征数据,生成特征边际贡献数据图;2)显示所述分布图;3)获取基于所述分布图选取的用户特征。
[0130]
如图3所示的边际贡献分布图,横坐标为第一边际贡献数据,纵坐标包括多个用户特征,如性别、年龄段、用户价值类型等,其中任意一个特征包括多个用户的特征数据,具体的特征值用不同灰度表示。以性别为例,图3示出了多个用户的性别特征对应的第一边际贡献数据,模型调整人员根据不同性别用户的第一边际贡献数据,可判断性别特征对第一价
格数据的影响度。例如,大部分女性的第一边际贡献数据较高,大部分男性的第一边际贡献数据较低,由此可判定性别特征对第一价格数据的影响较大。再如,不同用户价值类型的第一边际贡献数据较为一致(如均较低或者均较高),由此可判定用户价值类型特征对第一价格数据的影响较小。
[0131]
在另一个示例中,步骤s107可包括如下子步骤:
[0132]
步骤s1071:根据所述第一边际贡献数据和所述用户特征数据,获取所述用户特征对所述第一价格数据的偏见分数,作为第一偏见分数。
[0133]
第一偏见分数可体现用户特征对第一价格数据的偏见影响力,第一偏见分数越高表示第一价格数据受用户特征的偏见影响力越高。例如,性别特征对商品权益价格的第一偏见分数越高,说明性别对商品权益价格的偏见影响越大,如对女性的优惠幅度远远大于对男性的优惠幅度,价格确定系统存在性别歧视问题。
[0134]
具体实施时,步骤s1071可采用如下方式实现:获取所述用户特征的第一向量和第二向量之间的第一相关度,作为所述第一偏见分数。所述第一向量包括所述不同用户的所述第一边际贡献数据,所述第二向量包括所述不同用户的所述用户特征数据。所述第一相关度可以是皮尔逊相关系数或者其它相关系数。例如,对于商品对象a而言,与用户性别特征对应的第一向量包括商品对象a的多个用户的性别对商品权益价格的第一边际贡献数据,与用户性别特征对应的第二向量包括商品对象a的多个用户的性别数据值(如0表示男性,1表示女性),第一向量与第二向量的相关度越高,表示性别特征对商品权益价格的偏见影响越大。
[0135]
步骤s1073:根据所述第一偏见分数,从多个用户特征中选取用户特征。
[0136]
具体实施时,可对目标数据对象的每个用户特征数据执行步骤s1071的处理,获取每个用户特征对第一价格数据的第一偏见分数,然后可根据第一偏见分数,从多个用户特征中选取用户特征,如选取第一偏见分数高于偏见分数阈值的用户特征。
[0137]
在又一个示例中,本技术实施例提供的方法还可包括如下步骤:
[0138]
步骤s201:根据所述多个用户特征,获取至少一个多特征组合。
[0139]
所述多特征组合包括的特征数量可以预先设定,如预设多特征组合包括两个、三个或者五个用户特征,如果多特征组合包括两个特征则为双特征组合。
[0140]
步骤s203:通过所述价格计算模型,获取多特征组合数据对所述第一价格数据的边际贡献数据,作为第三边际贡献数据。
[0141]
第三边际贡献数据是由多特征组合数据导致的第一价格数据的差异数据。例如,多特征组合数据为商品对象a的用户1的性别和年龄,考虑性别和年龄时商品对象a对用户1的权益价格是90,不考虑该性别和年龄时的权益价格是93,对应的第三边际贡献数据为3。表3列出了商品对象a的任意双特征组合数据对第一属性数据的第三边际贡献数据。
[0142][0143]
表3、双特征的第三边际贡献数据
[0144]
在一个示例中,步骤s201可采用如下方式实现:根据所述多个用户特征,获取至少一个双特征组合,所述双特征组合包括第一特征和第二特征。在这种情况下,至少一个多特征组合可包括用户特征集内所有特征或者部分特征的两两组合,如特征1和特征2,特征1和特征3,

,特征1和特征n,特征2和特征3,特征2和特征4,

,特征2和特征n,

,特征n-1和特征n。
[0145]
相应的,步骤s203可包括如下子步骤:
[0146]
步骤s2031:获取目标双特征组合数据以外的其它用户特征的至少一种组合特征数据。
[0147]
具体实施时,可对目标数据对象的每个用户的每种双特征组合数据执行步骤s2031至步骤s2037的处理,获取每种双特征组合数据对第一价格数据的第三边际贡献数
据。
[0148]
例如,商品对象a的用户1的用户特征数据集包括特征数据1至特征数据30,目标组合特征数据包括特征数据1和特征数据2,与该组合数据对应的至少一种组合特征数据可以是其它28个特征数据中的任意20个特征数据的组合,如一种组合数据为{特征数据3,特征数据4,特征数据5至特征数据22},另一种组合数据为{特征数据4,特征数据5至特征数据23}。特征组合包括的特征数量可根据应用需求确定,如设置特征组合包括20个或者15个特征数据。
[0149]
步骤s2033:通过所述价格计算模型,根据与所述目标双特征组合数据对应的所述用户的所述组合特征数据和所述第二价格数据,获取第六价格数据;根据所述组合特征数据、所述目标双特征组合数据和所述第二价格数据,获取第七价格数据;根据所述组合特征数据、第一特征数据和所述第二价格数据,获取第八价格数据;根据所述组合特征数据、第二特征数据和所述第二价格数据,获取第九价格数据。
[0150]
第六价格数据是通过价格计算模型,根据与目标双特征组合数据对应的用户的组合特征数据和第二价格数据确定的价格数据,该价格数据与目标双特征组合数据无关。以商品权益价格为例,第六价格数据是根据与目标双特征组合数据对应的用户的组合特征数据和第二价格数据确定的商品权益价格。
[0151]
第七价格数据是根据目标双特征组合数据、对应的组合特征数据和第二价格数据确定的价格数据,该价格数据与目标双特征组合数据相关。以商品权益价格为例,第七价格数据是根据目标双特征组合数据、与目标双特征组合数据对应的用户的组合特征数据和第二价格数据确定的商品权益价格。
[0152]
第八价格数据是根据第一特征数据、对应的组合特征数据和第二价格数据确定的价格数据,该价格数据与第一特征数据相关,与第二特征数据相关。以商品权益价格为例,第八价格数据是根据第一特征数据、对应的组合特征数据和第二价格数据确定的商品权益价格。
[0153]
第九价格数据是根据第二特征数据、对应的组合特征数据和第二价格数据确定的价格数据,该价格数据与第二特征数据相关,与第一特征数据相关。以商品权益价格为例,第九价格数据是根据第二特征数据、对应的组合特征数据和第二价格数据确定的商品权益价格。
[0154]
步骤s2035:根据所述第六价格数据、所述第七价格数据、所述第八价格数据和所述第九价格数据,获取与所述组合特征对应的所述目标双特征组合数据的边际贡献数据,作为第四边际贡献数据。
[0155]
具体实施时,第四边际贡献数据可采用如下方式计算:1)获取第六价格数据与第七价格数据之第一差值,第八价格数据与第七价格数据之第二差值,第九价格数据第七价格数据之第三差值;2)获取第一差值与第二差值、第三差值的第四差值。采用这种处理方式,使得去除单因素偏见,只保留双因素偏见,因此,可以有效提升第四边际贡献数据的准确度。
[0156]
步骤s2037:根据与所述至少一种组合特征分别对应的所述第四边际贡献数据,获取所述目标双特征组合数据的第三边际贡献数据。
[0157]
第三边际贡献数据是根据与各种组合特征分别对应的多个第四边际贡献数据确
定的边际贡献数据。具体实施时,第三边际贡献数据可以是多个第四边际贡献数据的均值数据。
[0158]
通过上述步骤s2031至s2037,使得可根据与多种组合特征对应的第四边际贡献数据来确定第三边际贡献数据,因此,可以有效提升第三边际贡献数据的准确度。
[0159]
步骤s205:根据所述第三边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素。
[0160]
第三边际贡献数据可体现出在多特征组合情况下的用户特征对第一价格数据的影响度,依据该数据从多个用户特征中选取用户特征。
[0161]
需要说明的是,上述步骤s107是根据单因素(单用户特征)的第一边际贡献数据选取的用户特征,而步骤s205根据多因素(多特征组合)的第三边际贡献数据选取的用户特征。由于用户特征对第一价格数据的影响正负向不同,可能相互抵消或增强,单个特征上存在的价格偏见问题不一定在多特征组合上同样存在,因此可对多特征组合进行价格偏见归因和评估,进一步洞察多特征组合上的价格偏见问题。
[0162]
在一个示例中,步骤s205可包括如下子步骤:1)根据所述第三边际贡献数据和所述多特征组合数据,生成多特征的边际贡献数据图;2)显示多特征的边际贡献数据图;3)获取基于所述分布图选取的用户特征。
[0163]
如图4所示的边际贡献分布图,纵坐标为第三边际贡献数据,横坐标为年龄特征,性别特征值用不同灰度表示。模型调整人员可根据图4展示的性别和年龄的双特征交互效应来判断性格和年龄分别对第一价格数据的影响度。例如,30岁男性和30岁女性的第三边际贡献数据相差较小,40岁男性和40岁女性的第三边际贡献数据较为一致,60岁男性和60岁女性的第三边际贡献数据相差较大,70岁男性和70岁女性的第三边际贡献数据较为一致,由此可判定性别对第一价格数据的影响较大,而年龄对第一价格数据的影响较小。而根据步骤s105获得的单特征边际贡献数据可能判定性别和年龄对第一价格数据的影响均较大。由此可见,根据多特征边际贡献数据来确定对第一价格数据的偏见影响大的用户特征,结果会更加准确。
[0164]
在另一个示例中,步骤s205可包括如下子步骤:
[0165]
步骤s2051:针对所述多特征组合中的各个目标特征,根据所述第三边际贡献数据和目标特征数据,获取所述目标特征对所述第一价格数据的第二偏见分数。
[0166]
第二偏见分数可体现多特征组合中的单个用户特征(目标特征)对第一价格数据的偏见影响力,第二偏见分数越高表示第一价格数据受目标特征的偏见影响力越高。
[0167]
具体实施时,步骤s2051可采用如下方式实现:获取所述多特征组合的第三向量与目标特征的第二向量之间的第二相关度,作为所述第二偏见分数;所述第二向量包括所述不同用户的目标特征数据,所述第三向量包括所述不同用户的所述第三边际贡献数据。
[0168]
所述第二相关度可以是皮尔逊相关系数或者其它相关系数。例如,对于商品对象a而言,与用户性别特征对应的第三向量包括商品对象a的多个用户的性别和年龄的双特征组合对商品展示位置的第三边际贡献数据,与用户性别特征对应的第二向量包括商品对象a的多个用户的性别数据值(如0表示男性,1表示女性),第三向量与第二向量的相关度越高,表示性别对商品权益价格的偏见影响越大。
[0169]
表4示出了商品对象a的任意双特征组合对第一价格数据的第三边际贡献数据,以
及各个特征的双因素偏见分数。
[0170]
[0171][0172]
表4、双因素偏见分数
[0173]
步骤s2053:根据所述第二偏见分数,从多个用户特征中选取用户特征。
[0174]
具体实施时,可对目标数据对象的每个用户特征执行步骤s2051的处理,获取每个用户特征对第一价格数据的第二偏见分数,然后可根据第二偏见分数,从多个用户特征中选取用户特征,如选取第二偏见分数高于偏见分数阈值的用户特征。
[0175]
需要说明的是,对于一个目标特征而言,可以对应多个多特征组合的第三边际贡献数据,如目标特征为性别,对应的多特征组合可以是“性别+年龄”、“性别+用户价值类型”、“性别+所在地区”、“性别+年龄+所在地区”、“性别+年龄+所在地区+用户价值类型”等。在这种情况下,可获取每种多特征组合的第三边际贡献数据的第三向量与性别的第二向量之间的相关度,即“性别+年龄”与性别之间的相关度、“性别+用户价值类型”与性别之间的相关度、“性别+所在地区”与性别之间的相关度等,可对每个相关度进行判断,以选取用户特征。以性别特征为例,只要性别对应的多种多特征组合中有一种组合的第三向量与性格的第二向量之间的相关度较低,就可以确定性别对第一价格数据的偏见影响较低;或者,只要性别对应的多种多特征组合中有一种组合的第三向量与性格的第二向量之间的相关度较高,就可以确定性别对第一价格数据的偏见影响较高。
[0176]
在一个示例中,本技术实施例提供的方法还可包括如下步骤:确定所述目标数据对象的用户特征集。采用这种处理方式,使得不同数据对象对应不同的用户特征集,相应的价格计算模型的输入数据也不相同,由于不同价格计算模型的输入数据更为有效,避免处理其它无关的用户特征数据,网络结构更加简洁,因此,可以有效提升价格偏见因素的确定效率和准确度。
[0177]
具体实施时,可以由用户来指定用户特征集,用户可以是目标数据对象的商家,也可以是价格确定系统的运营人员。例如,用户通过客户端向价格偏见因素服务系统提交针对目标数据对象的用户特征集,或者是,价格偏见因素服务系统向用户提供可选的用户特征,用户从中选取用户特征并提交至服务系统。
[0178]
具体实施时,也可以采用如下方式确定用户特征集:获取所述目标数据对象的目标用户群信息;将与所述目标用户群信息无关的用户特征形成所述用户特征集。例如,某款玩具的目标用户群为女童,则性别特征是与该用户群相关的用户特征,用户特征集内不包括性别特征。再例如,某款商品主打南方地区用户,则用户特征集不包括区域特征。其中,目标用户群信息可以由用户通过客户端指定并提交至价格偏见因素服务系统;也可以通过自然语言处理技术,对目标数据对象的描述信息进行分析,自动从中提取出目标用户群信息。
[0179]
在一个示例中,本技术实施例提供的方法还可包括如下步骤:根据价格偏见因素的偏见分数(如第一偏见分数或者第二偏见数据),获取所述价格偏见因素的排序数据;向客户端提供所述排序数据。采用这种处理方式,使得可向价格确定系统的运营人员提供排序后的价格偏见因素,便于运营人员快速确定真正有问题的价格偏见因素。例如,多个数据对象的价格计算模型使用统一的用户特征,但对于某个数据对象而言,有些偏见分数高的用户特征可能恰恰是该数据对象想要针对的目标人群特征,那么这样的用户特征就不是真正的价格偏见因素,运营人员可以指定将其排除在外。
[0180]
从上述实施例可见,本技术实施例提供的价格偏见因素确定方法,通过为目标数据对象构建与技术链路较长、影响因素较多、敏感属性较多的价格确定系统相拟合的技术链路短、影响因素少的替代模型(价格计算模型),设计可解释的敏感属性(用户特征),利用替代模型获取敏感属性数据对价格确定系统输出的目标数据对象的第一价格数据的边际贡献,以量化在敏感属性上存在的目标数据对象的第一价格数据差异,发现对价格确定系统输出的目标数据对象的第一价格数据的影响较大的敏感属性。采用这种处理方式,可以有效提升价格偏见原因的定位效率和定位准确性,并提供可解释的偏见原因,辅助人类对搜索推荐偏见问题的多方位洞察,流程中人类可干预可决策。
[0181]
第二实施例
[0182]
在上述的实施例中,提供了一种价格偏见因素确定方法,与之相对应的,本技术还提供一种价格偏见因素确定装置。该装置是与上述方法的实施例相对应。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0183]
本技术另外提供一种价格偏见因素确定装置,包括:训练数据获取单元,模型拟合单元,单特征边际贡献获取单元,单特征偏见因素选取单元。
[0184]
训练数据获取单元,用于获取目标数据对象针对不同用户的第一价格数据、所述用户的用户特征数据集、所述目标数据对象的第二价格数据,形成所述目标数据对象的训
练数据集;其中,所述第一价格数据通过价格确定系统确定;模型拟合单元,用于从所述训练数据集内学习得到所述目标数据对象的价格计算模型;单特征边际贡献获取单元,用于通通过所述价格计算模型,获取所述用户特征数据对所述第一价格数据的边际贡献数据,作为第一边际贡献数据;单特征偏见因素选取单元,用于根据所述第一边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素,用于调整所述价格确定系统。
[0185]
在一个示例中,所述单特征边际贡献获取单元包括:第一特征组合单元,第一模型计算单元,第一边际贡献计算单元,第二边际贡献计算单元。
[0186]
第一特征组合单元,用于将所述用户特征数据作为目标特征数据,获取与所述目标特征数据对应的其它用户特征的至少一种组合特征数据;第一模型计算单元,用于通过所述价格计算模型,根据与所述目标特征数据对应的所述用户的组合特征数据和所述第二价格数据,获取第三价格数据;根据所述组合特征数据、所述目标特征数据和所述第二价格数据,获取第四价格数据;第一边际贡献计算单元,用于根据所述第三价格数据和所述第四价格数据,获取与所述组合特征对应的所述目标特征数据的边际贡献数据,作为第二边际贡献数据;第二边际贡献计算单元,用于根据与所述至少一种组合特征分别对应的所述第二边际贡献数据,获取所述目标特征数据的所述第一边际贡献数据。
[0187]
在一个示例中,所述第一模型计算单元,具体用于获取与所述目标特征数据对应的至少一个其它用户的所述组合特征以外的第一特征数据;通过所述价格计算模型,根据所述用户的组合特征数据、所述其它用户的所述组合特征以外的第一特征数据和所述第二价格数据,获取第五价格数据;根据与所述至少一个其它用户分别对应的所述第五价格数据,获取所述第三价格数据。
[0188]
在一个示例中,所述单特征偏见因素选取单元,具体用于根据所述第一边际贡献数据和所述用户特征数据,获取所述用户特征对所述第一价格数据的偏见分数,作为第一偏见分数;根据所述第一偏见分数,从所述多个用户特征中选取用户特征。
[0189]
在一个示例中,所述单特征偏见因素选取单元,具体用于获取所述用户特征的第一向量和第二向量之间的第一相关度,作为所述第一偏见分数;所述第一向量包括所述不同用户的所述第一边际贡献数据,所述第二向量包括所述不同用户的所述用户特征数据。
[0190]
在一个示例中,所述装置还包括:第二特征组合单元,第三边际贡献计算单元,多特征偏见因素选取单元。
[0191]
第二特征组合单元,用于根据所述多个用户特征,获取至少一个多特征组合;第三边际贡献计算单元,用于通过所述价格计算模型,获取多特征组合数据对所述第一价格数据的边际贡献数据,作为第三边际贡献数据;多特征偏见因素选取单元,用于根据所述第三边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统的价格偏见因素。
[0192]
在一个示例中,所述第二特征组合单元,具体用于根据所述多个用户特征,获取至少一个双特征组合,所述双特征组合包括第一特征和第二特征;所述第三边际贡献计算单元,具体用于获取目标双特征组合数据以外的其它用户特征的至少一种组合特征数据;通过所述价格计算模型,根据与所述目标双特征组合数据对应的所述用户的所述组合特征数据和所述第二价格数据,获取第六价格数据;根据所述组合特征数据、所述目标双特征组合数据和所述第二价格数据,获取第七价格数据;根据所述组合特征数据、第一特征数据和所
述第二价格数据,获取第八价格数据;根据所述组合特征数据、第二特征数据和所述第二价格数据,获取第九价格数据;根据所述第六价格数据、所述第七价格数据、所述第八价格数据和所述第九价格数据,获取与所述组合特征对应的所述目标双特征组合数据的边际贡献数据,作为第四边际贡献数据;根据与所述至少一种组合特征分别对应的所述第四边际贡献数据,获取所述目标双特征组合数据的第三边际贡献数据。
[0193]
在一个示例中,所述多特征偏见因素选取单元,具体用于针对所述多特征组合中的各个目标特征,根据所述第三边际贡献数据和目标特征数据,获取所述目标特征对所述第一价格数据的第二偏见分数;根据所述第二偏见分数,从多个用户特征中选取用户特征。
[0194]
在一个示例中,所述多特征偏见因素选取单元,具体用于获取所述多特征组合的第三向量与目标特征的第二向量之间的第二相关度,作为所述第二偏见分数;所述第二向量包括所述不同用户的目标特征数据,所述第三向量包括所述不同用户的所述第三边际贡献数据。
[0195]
在一个示例中,所述单特征偏见因素选取单元,具体用于根据所述第一边际贡献数据和所述第一特征数据,生成特征边际贡献数据图;获取基于所述分布图确定的用户特征。
[0196]
在一个示例中,不同数据对象对应不同的所述价格偏见因素,所述价格确定系统对不同数据对象采用不同的处理链路。
[0197]
在一个示例中,所述装置还包括:用户特征集确定单元,用于确定所述目标数据对象的用户特征集,不同数据对象对应的价格计算模型的输入数据不同。
[0198]
在一个示例中,所述用户特征集确定单元,具体用于获取所述目标数据对象的目标用户群信息;将与所述目标用户群信息无关的用户特征形成所述用户特征集。
[0199]
在一个示例中,所述获取所述目标数据对象的目标用户群信息,采用如下方式实现:从目标数据对象的描述信息中提取所述目标用户群信息;或者,接收客户端提交的所述目标用户群信息。
[0200]
在一个示例中,所述用户特征集确定单元,具体用于接收客户端提交的所述用户特征集。
[0201]
在一个示例中,所述装置还包括:价格偏见因素筛选单元,用于获取所述目标数据对象的目标用户群信息;根据所述目标用户群信息,对所述价格偏见因素进行筛选。
[0202]
在一个示例中,所述装置还包括:偏见因素排序单元,用于根据所述价格偏见因素的偏见分数,获取所述价格偏见因素的排序数据;向客户端提供所述排序数据。
[0203]
第三实施例
[0204]
在上述的实施例中,提供了一种价格偏见因素确定方法,与之相对应的,本技术还提供一种位置偏见因素确定方法。由于该方法实施例基本相似于方法实施例一,所以描述得比较简单,相关之处参见方法实施例一的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0205]
本技术另外提供一种位置偏见因素确定方法,包括如下步骤:
[0206]
步骤1:获取目标数据对象针对不同用户的展示位置数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集。
[0207]
所述目标数据对象与实施例一中的目标数据对象为相同概念,目标数据对象针对
不同用户的展示位置数据与上述第一价格数据对应,相同数据对象对不同用户可以有不同的展示位置,展示位置也可以称为排序位置。展示位置数据通过目标系统确定,目标系统可以是搜索系统或者推荐系统,目标系统可确定商品对象对用户的展示位置数据。
[0208]
例如,在电商平台的搜索系统中,用户a和b输入同一搜索词“保温杯”后,用户a和b除了性别不同,其它用户特征相似,保温杯商品1并不针对特定性别更加适合,在这种情况下,通过搜索系统召回的保温杯商品1却对用户a排在第一坑位,而对用户b排在第十坑位,用户b可能会感到性别收到歧视。
[0209]
步骤2:从所述训练数据集内学习得到展示位置计算模型。
[0210]
此步骤与上述步骤s103相对应,此处不再赘述。
[0211]
步骤3:通过所述展示位置计算模型,获取所述用户特征数据对所述展示位置数据的边际贡献数据。
[0212]
此步骤与上述步骤s105相对应,此处不再赘述。
[0213]
步骤4:根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的展示位置偏见因素,用于调整所述目标系统。
[0214]
此步骤与上述步骤s107相对应,此处不再赘述。
[0215]
需要说明的是,实施例一中的各种优选实施方式同样适用于本实施例提供的搜索推荐偏见因素确定方法,将价格数据改为展示位置数据即可,此处不再赘述。
[0216]
从上述实施例可见,本技术实施例提供的位置偏见因素确定方法,通过为目标数据对象构建与技术链路较长、影响因素较多、敏感属性较多的搜索/推荐系统相拟合的技术链路短、影响因素少的替代模型(展示位置计算模型),设计可解释的敏感属性,利用替代模型获取敏感属性数据对搜索/推荐系统输出的目标数据对象的展示位置数据的边际贡献,以量化在敏感属性上存在的的目标数据对象的展示位置数据差异,发现对搜索/推荐系统输出的目标数据对象的展示位置数据的影响较大的敏感属性。采用这种处理方式,可以有效提升展示位置偏见原因的定位效率和定位准确性,并提供可解释的偏见原因,辅助人类对位置偏见问题的多方位洞察,流程中人类可干预可决策。
[0217]
第四实施例
[0218]
在上述的实施例中,提供了一种位置偏见因素确定方法,与之相对应的,本技术还提供一种位置偏见因素确定装置。该装置是与上述方法的实施例相对应。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0219]
本技术另外提供一种位置偏见因素确定装置,包括:训练数据获取单元,模型拟合单元,单特征边际贡献获取单元,单特征偏见因素选取单元。
[0220]
训练数据获取单元,用于获取目标数据对象针对不同用户的展示位置数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;其中,所述展示位置数据通过目标系统确定;模型拟合单元,用于从所述训练数据集内学习得到展示位置计算模型;单特征边际贡献获取单元,用于通过所述展示位置计算模型,获取所述用户特征数据对所述展示位置数据的边际贡献数据;单特征偏见因素选取单元,用于根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的展示位置偏见因素,用于调整所述目标系统。
[0221]
第五实施例
[0222]
在上述的实施例中,提供了一种价格偏见因素确定方法,与之相对应的,本技术还提供一种偏见因素确定方法。由于该方法实施例基本相似于方法实施例一,所以描述得比较简单,相关之处参见方法实施例一的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0223]
本技术另外提供一种偏见因素确定方法,包括如下步骤:
[0224]
步骤1:获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;其中,所述目标属性数据通过目标系统确定。
[0225]
所述目标数据对象与实施例一中的目标数据对象为相同概念,目标数据对象针对不同用户的目标属性数据包括但不限于上述第一价格数据和展示位置数据对应,也可以是价格确定系统、展示位置确定系统以外的其它人工智能系统(目标系统)的输出结果,目标系统可确定数据对象对不同用户的目标属性数据。
[0226]
步骤2:从所述训练数据集内学习得到目标属性数据计算模型。
[0227]
此步骤与上述步骤s103相对应,此处不再赘述。
[0228]
步骤3:通过所述目标属性数据计算模型,获取所述用户特征数据对所述目标属性数据的边际贡献数据。
[0229]
此步骤与上述步骤s105相对应,此处不再赘述。
[0230]
步骤4:根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素,用于调整所述目标系统。
[0231]
此步骤与上述步骤s107相对应,此处不再赘述。
[0232]
需要说明的是,实施例一中的各种优选实施方式同样适用于本实施例提供的偏见因素确定方法,将价格数据改为目标属性数据即可,此处不再赘述。
[0233]
从上述实施例可见,本技术实施例提供的偏见因素确定方法,通过为目标数据对象构建与技术链路较长、影响因素较多、敏感属性较多的人工智能系统相拟合的技术链路短、影响因素少的替代模型(目标属性数据计算模型),设计可解释的敏感属性,利用替代模型获取敏感属性数据对人工智能系统输出结果(目标属性数据)的边际贡献,以量化在敏感属性上存在的结果差异,发现对人工智能系统输出结果影响较大的敏感属性。采用这种处理方式,可以有效提升系统偏见原因的定位效率和定位准确性,并提供可解释的偏见原因,辅助人类对系统偏见问题的多方位洞察,流程中人类可干预可决策。
[0234]
第六实施例
[0235]
在上述的实施例中,提供了一种偏见因素确定方法,与之相对应的,本技术还提供一种偏见因素确定装置。该装置是与上述方法的实施例相对应。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0236]
本技术另外提供一种偏见因素确定装置,包括:训练数据获取单元,模型拟合单元,单特征边际贡献获取单元,单特征偏见因素选取单元。
[0237]
训练数据获取单元,用于获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;其中,所述目标属性数据通过目标系统确定;模型拟合单元,用于从所述训练数据集内学习得到目标属性数据计算模
型;单特征边际贡献获取单元,用于通过所述目标属性数据计算模型,获取所述用户特征数据对所述目标属性数据的边际贡献数据;单特征偏见因素选取单元,用于根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素,用于调整所述目标系统。
[0238]
第七实施例
[0239]
在上述的实施例中,提供了一种价格偏见因素方法,与之相对应的,本技术还提供一种偏见因素确定方法。该方法是与上述方法的实施例中通过步骤s201至s205实现的多因素交互效应下的特征选取方式相对应。由于该方法实施例基本相似于方法实施例一,所以描述得比较简单,相关之处参见方法实施例一的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0240]
本技术另外提供一种偏见因素确定方法,包括如下步骤:
[0241]
步骤1:获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述数据对象的训练数据集;其中,所述目标属性数据通过目标系统确定。
[0242]
步骤2:从所述训练数据集内学习得到目标属性数据计算模型。
[0243]
步骤3:根据所述多个第二用户特征,获取至少一个多特征组合。
[0244]
步骤4:通过所述目标属性数据计算模型,获取多特征组合数据对所述目标属性数据的边际贡献数据。
[0245]
步骤5:根据所述边际贡献数据,从多个用户特征中选取用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素,用于调整所述目标系统。
[0246]
步骤1与实施例一中的步骤s101相对应,步骤2与实施例一中的步骤s103相对应,步骤3与实施例一中的步骤s201相对应,步骤4与实施例一中的步骤s203相对应,步骤5与实施例一中的步骤s205相对应,此处不再赘述。
[0247]
从上述实施例可见,本技术实施例提供的偏见因素确定方法,根据多因素的边际贡献数据选取用户特征。由于用户特征对目标属性数据的影响正负向不同,可能相互抵消或增强,单个特征上存在的目标属性偏见问题不一定在多特征组合上同样存在,因此可对多特征组合进行目标属性偏见归因和评估,实现多维度的不同特征粒度(如单特征、双特征交互效应、三特征交互效应等)的偏见归因,这样可以有效减少偏见因素的数量,提升偏见因素的准确度。
[0248]
第八实施例
[0249]
在上述的实施例中,提供了一种偏见因素确定方法,与之相对应的,本技术还提供一种偏见因素确定装置。该装置是与上述方法的实施例相对应。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0250]
本技术另外提供一种偏见因素确定装置,包括:训练数据获取单元,模型拟合单元,特征组合单元,多特征边际贡献获取单元,多特征偏见因素选取单元。
[0251]
训练数据获取单元,用于获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述数据对象的训练数据集;其中,所述目标属性数据通过目标系统确定;模型拟合单元,用于从所述训练数据集内学习得到目标属性数据计算模型;特征组合单元,用于根据所述多个用户特征,获取至少一个多特征组合;多特征边际贡献获取
单元,用于通过所述目标属性数据计算模型,获取多特征组合数据对所述目标属性数据的边际贡献数据;多特征偏见因素选取单元,用于根据所述边际贡献数据,从多个用户特征中选取用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素,用于调整目标系统。
[0252]
第九实施例
[0253]
在上述的实施例中,提供了偏见因素确定方法,与之相对应的,本技术还提供一种电子设备。该设备是与上述方法的实施例相对应。由于设备实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的设备实施例仅仅是示意性的。
[0254]
本实施例的电子设备,包括:处理器和存储器;存储器,用于存储实现上述任一项偏见因素确定方法的程序,该设备通电并通过所述处理器运行该方法的程序。
[0255]
需要说明的是,本技术实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如,用户明确同意,对用户切实通知,等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。
[0256]
本技术虽然以较佳实施例公开如上,但其并不是用来限定本技术,任何本领域技术人员在不脱离本技术的精神和范围内,都可以做出可能的变动和修改,因此本技术的保护范围应当以本技术权利要求所界定的范围为准。
[0257]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0258]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(f l ash ram)。内存是计算机可读介质的示例。
[0259]
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(trans itory med ia),如调制的数据信号和载波。
[0260]
2、本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

技术特征:
1.一种价格偏见因素确定方法,其特征在于,包括:获取目标数据对象针对不同用户的第一价格数据、所述用户的用户特征数据集、所述目标数据对象的第二价格数据,形成所述目标数据对象的训练数据集;从所述训练数据集内学习得到所述目标数据对象的价格计算模型;通过所述价格计算模型,获取所述用户特征数据对所述第一价格数据的第一边际贡献数据;根据所述第一边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素。2.根据权利要求1所述的方法,其特征在于,所述通过所述价格计算模型,获取所述用户特征数据对所述第一价格数据的边际贡献数据,包括:将所述用户特征数据作为目标特征数据,获取与所述目标特征数据对应的其它用户特征的至少一种组合特征数据;通过所述价格计算模型,根据与所述目标特征数据对应的所述用户的组合特征数据和所述第二价格数据,获取第三价格数据;根据所述组合特征数据、所述目标特征数据和所述第二价格数据,获取第四价格数据;根据所述第三价格数据和所述第四价格数据,获取与所述组合特征对应的所述目标特征数据的边际贡献数据,作为第二边际贡献数据;根据与所述至少一种组合特征分别对应的所述第二边际贡献数据,获取所述目标特征数据的所述第一边际贡献数据。3.根据权利要求2所述的方法,其特征在于,所述通过所述价格计算模型,根据与所述目标特征数据对应的所述用户的组合特征数据和所述第二价格数据,获取第三价格数据,包括:获取与所述目标特征数据对应的至少一个其它用户的所述组合特征以外的第一特征数据;通过所述价格计算模型,根据所述用户的组合特征数据、所述其它用户的所述组合特征以外的第一特征数据和所述第二价格数据,获取第五价格数据;根据与所述至少一个其它用户分别对应的所述第五价格数据,获取所述第三价格数据。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一边际贡献数据,从多个用户特征中选取用户特征,包括:根据所述第一边际贡献数据和所述用户特征数据,获取所述用户特征对所述第一价格数据的偏见分数,作为第一偏见分数;根据所述第一偏见分数,从所述多个用户特征中选取用户特征。5.根据权利要求4所述的方法,其特征在于,所述根据所述第一边际贡献数据和所述用户特征数据,获取所述用户特征对所述第一价格数据的偏见分数,包括:获取所述用户特征的第一向量和第二向量之间的第一相关度,作为所述第一偏见分数;所述第一向量包括所述不同用户的所述第一边际贡献数据,所述第二向量包括所述不同用户的所述用户特征数据。6.根据权利要求4的方法,其特征在于,还包括:
根据所述多个用户特征,获取至少一个多特征组合;通过所述价格计算模型,获取多特征组合数据对所述第一价格数据的边际贡献数据,作为第三边际贡献数据;根据所述第三边际贡献数据,从多个用户特征中选取用户特征,作为所述价格确定系统对所述目标数据对象的价格偏见因素。7.根据权利要求6的方法,其特征在于,所述根据所述多个用户特征,获取至少一个多特征组合,包括:根据所述多个用户特征,获取至少一个双特征组合,所述双特征组合包括第一特征和第二特征;所述通过所述价格计算模型,获取多特征组合数据对所述第一价格数据的边际贡献数据,包括:获取目标双特征组合数据以外的其它用户特征的至少一种组合特征数据;通过所述价格计算模型,根据与所述目标双特征组合数据对应的所述用户的所述组合特征数据和所述第二价格数据,获取第六价格数据;根据所述组合特征数据、所述目标双特征组合数据和所述第二价格数据,获取第七价格数据;根据所述组合特征数据、第一特征数据和所述第二价格数据,获取第八价格数据;根据所述组合特征数据、第二特征数据和所述第二价格数据,获取第九价格数据;根据所述第六价格数据、所述第七价格数据、所述第八价格数据和所述第九价格数据,获取与所述组合特征对应的所述目标双特征组合数据的边际贡献数据,作为第四边际贡献数据;根据与所述至少一种组合特征分别对应的所述第四边际贡献数据,获取所述目标双特征组合数据的第三边际贡献数据。8.根据权利要求6的方法,其特征在于,所述根据所述第三边际贡献数据,从多个用户特征中选取用户特征,包括:针对所述多特征组合中的各个目标特征,根据所述第三边际贡献数据和目标特征数据,获取所述目标特征对所述第一价格数据的第二偏见分数;根据所述第二偏见分数,从多个用户特征中选取用户特征。9.根据权利要求8所述的方法,其特征在于,所述根据所述第三边际贡献数据和目标特征数据,获取所述目标特征对所述第一属性数据的第二偏见分数,包括:获取所述多特征组合的第三向量与目标特征的第二向量之间的第二相关度,作为所述第二偏见分数;所述第二向量包括所述不同用户的目标特征数据,所述第三向量包括所述不同用户的所述第三边际贡献数据。10.一种位置偏见因素确定方法,其特征在于,包括:获取目标数据对象针对不同用户的展示位置数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;从所述训练数据集内学习得到展示位置计算模型;通过所述展示位置计算模型,获取所述用户特征数据对所述展示位置数据的边际贡献数据;根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对
所述目标数据对象的展示位置偏见因素。11.一种偏见因素确定方法,其特征在于,包括:获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;从所述训练数据集内学习得到目标属性数据计算模型;通过所述目标属性数据计算模型,获取所述用户特征数据对所述目标属性数据的边际贡献数据;根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素。12.一种偏见因素确定方法,其特征在于,包括:获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述数据对象的训练数据集;从所述训练数据集内学习得到目标属性数据计算模型;根据所述多个用户特征,获取至少一个多特征组合;通过所述目标属性数据计算模型,获取多特征组合数据对所述目标属性数据的边际贡献数据;根据所述边际贡献数据,从多个用户特征中选取用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素。13.一种偏见因素确定装置,其特征在于,包括:训练数据构建单元,用于获取目标数据对象针对不同用户的目标属性数据、所述用户的用户特征数据集,形成所述目标数据对象的训练数据集;模型构建单元,用于从所述训练数据集内学习得到目标属性数据计算模型;边际贡献获取单元,用于通过所述目标属性数据计算模型,获取所述用户特征数据对所述目标属性数据的边际贡献数据;特征选取单元,用于根据所述边际贡献数据,从多个用户特征中选取目标用户特征,作为所述目标系统对所述目标数据对象的目标属性偏见因素。14.一种电子设备,其特征在于,包括:处理器和存储器;存储器,用于存储实现根据权利要求1至12任一项所述方法的程序,该设备通电并通过所述处理器运行该方法的程序。

技术总结
本申请公开了价格偏见因素确定方法和装置,位置偏见因素确定方法和装置,偏见因素确定方法和装置,以及电子设备。其中,价格偏见因素确定方法通过为目标数据对象构建与价格确定系统相拟合的价格计算模型,设计可解释的用户特征,利用价格计算模型获取用户特征数据对价格确定系统输出的目标数据对象的第一价格数据的边际贡献,以量化在用户特征上存在的目标数据对象的第一价格数据差异,发现对价格确定系统输出数据的影响较大的用户特征。采用这种处理方式,可以有效提升价格偏见原因的定位效率和定位准确性,并提供可解释的偏见原因,辅助人类对价格偏见问题的多方位洞察,流程中人类可干预可决策。人类可干预可决策。人类可干预可决策。


技术研发人员:杨颖一 刘翔宇 张荣 薛晖
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:2023.03.03
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐