数据扩充方法、装置、计算机设备和存储介质
未命名
07-22
阅读:122
评论:0
1.本技术涉及人工智能技术领域,特别是涉及一种数据扩充方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
2.随着机器学习技术的发展,智能感知模型训练过程对于数据需求量越来越大、标注要求越来越高,而有些领域的样本数据获取困难,例如,舰船的非合作目标图像样本获取比较困难,造成目前的图像样本不能满足智能感知模型的样本需求。
3.传统技术中,在舰船的非合作目标图像样本扩充方法中,通过目标训练样本训练智能感知模型,然后,基于训练后的智能感知模型对待扩充样本中的样本数据进行数据扩充,得到扩充后的测试样本。
4.然而,目前的样本扩充方法中,由于待扩充样本的样本类型不均衡、测试数据分布往往存在差异,进而,基于训练后的智能感知模型对该待扩充样本进行样本扩充,会出现过拟合的现象,导致样本扩充效果较差。
技术实现要素:
5.基于此,有必要针对上述技术问题,提供一种数据扩充方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
6.第一方面,本技术提供了一种数据扩充方法。所述方法包括:
7.针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
8.基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;
9.根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;
10.基于所述目标对抗网络和待扩充样本,生成目标样本。
11.在其中一个实施例中,所述针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合之前,所述方法还包括:
12.获取初始样本集,根据所述初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
13.通过所述采样样本集合对所述初始对抗网络进行训练,直至所述初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
14.在其中一个实施例中,所述基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果,包括:
15.根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离;
16.根据所述混合高斯弗雷歇距离,对所述初始对抗网络进行评估,得到所述初始对抗网络的评估结果。
17.在其中一个实施例中,所述根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离,包括:
18.确定每一初始对抗网络对应的所述采样样本集合的采样特征子集,以及所述生成样本集合的生成特征子集;
19.根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离;
20.根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离。
21.在其中一个实施例中,根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离,包括:
22.在所述生成特征子集中确定与所述采样特征子集最接近的第一目标分量;
23.将所述第一目标分量与所述采样特征子集中与所述第一目标分量对应的第二目标分量间的弗雷歇距离确定为所述第二目标分量与所述生成特征子集的弗雷歇距离;
24.对所述采样特征子集中各所述第二目标分量与所述生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
25.在其中一个实施例中,根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离,包括:
26.在所述采样特征子集中确定与所述生成特征子集最接近的第三目标分量;
27.将所述第三目标分量与所述生成特征子集中与所述第三目标分量对应的第四目标分量间的弗雷歇距离确定为所述第三目标分量与所述采样特征子集的弗雷歇距离;
28.对所述生成特征子集中各所述第三目标分量与所述采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
29.在其中一个实施例中,所述根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络,所述方法包括:
30.根据所述评估结果,确定各所述初始对抗网络的性能分数;
31.将所述性能分数最高的所述初始对抗网络,确定为目标对抗网络。
32.第二方面,本技术还提供了一种数据扩充装置。所述装置包括:
33.获取模块,用于针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
34.评估模块,用于基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;
35.确定模块,用于根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;
36.生成模块,用于基于所述目标对抗网络和待扩充样本,生成目标样本。
37.在其中一个实施例中,获取模块还用于:
38.获取初始样本集,根据所述初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
39.通过所述采样样本集合对所述初始对抗网络进行训练,直至所述初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
40.在其中一个实施例中,评估模块具体用于:
41.根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离;
42.根据所述混合高斯弗雷歇距离,对所述初始对抗网络进行评估,得到所述初始对抗网络的评估结果。
43.在其中一个实施例中,评估模块具体用于:
44.确定每一初始对抗网络对应的所述采样样本集合的采样特征子集,以及所述生成样本集合的生成特征子集;
45.根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离;
46.根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离。
47.在其中一个实施例中,评估模块具体用于:
48.在所述生成特征子集中确定与所述采样特征子集最接近的第一目标分量;
49.将所述第一目标分量与所述采样特征子集中与所述第一目标分量对应的第二目标分量间的弗雷歇距离确定为所述第二目标分量与所述生成特征子集的弗雷歇距离;
50.对所述采样特征子集中各所述第二目标分量与所述生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
51.在其中一个实施例中,评估模块具体用于:
52.在所述采样特征子集中确定与所述生成特征子集最接近的第三目标分量;
53.将所述第三目标分量与所述生成特征子集中与所述第三目标分量对应的第四目标分量间的弗雷歇距离确定为所述第三目标分量与所述采样特征子集的弗雷歇距离;
54.对所述生成特征子集中各所述第三目标分量与所述采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
55.在其中一个实施例中,确定模块具体用于:
56.根据所述评估结果,确定各所述初始对抗网络的性能分数;
57.将所述性能分数最高的所述初始对抗网络,确定为目标对抗网络。
58.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
59.针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
60.基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;
61.根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;
62.基于所述目标对抗网络和待扩充样本,生成目标样本。
63.在其中一个实施例中,所述针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合
之前,所述方法还包括:
64.获取初始样本集,根据所述初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
65.通过所述采样样本集合对所述初始对抗网络进行训练,直至所述初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
66.在其中一个实施例中,所述基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果,包括:
67.根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离;
68.根据所述混合高斯弗雷歇距离,对所述初始对抗网络进行评估,得到所述初始对抗网络的评估结果。
69.在其中一个实施例中,所述根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离,包括:
70.确定每一初始对抗网络对应的所述采样样本集合的采样特征子集,以及所述生成样本集合的生成特征子集;
71.根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离;
72.根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离。
73.在其中一个实施例中,根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离,包括:
74.在所述生成特征子集中确定与所述采样特征子集最接近的第一目标分量;
75.将所述第一目标分量与所述采样特征子集中与所述第一目标分量对应的第二目标分量间的弗雷歇距离确定为所述第二目标分量与所述生成特征子集的弗雷歇距离;
76.对所述采样特征子集中各所述第二目标分量与所述生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
77.在其中一个实施例中,根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离,包括:
78.在所述采样特征子集中确定与所述生成特征子集最接近的第三目标分量;
79.将所述第三目标分量与所述生成特征子集中与所述第三目标分量对应的第四目标分量间的弗雷歇距离确定为所述第三目标分量与所述采样特征子集的弗雷歇距离;
80.对所述生成特征子集中各所述第三目标分量与所述采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
81.在其中一个实施例中,所述根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络,所述方法包括:
82.根据所述评估结果,确定各所述初始对抗网络的性能分数;
83.将所述性能分数最高的所述初始对抗网络,确定为目标对抗网络。
84.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,
其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
85.针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
86.基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;
87.根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;
88.基于所述目标对抗网络和待扩充样本,生成目标样本。
89.在其中一个实施例中,所述针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合之前,所述方法还包括:
90.获取初始样本集,根据所述初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
91.通过所述采样样本集合对所述初始对抗网络进行训练,直至所述初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
92.在其中一个实施例中,所述基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果,包括:
93.根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离;
94.根据所述混合高斯弗雷歇距离,对所述初始对抗网络进行评估,得到所述初始对抗网络的评估结果。
95.在其中一个实施例中,所述根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离,包括:
96.确定每一初始对抗网络对应的所述采样样本集合的采样特征子集,以及所述生成样本集合的生成特征子集;
97.根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离;
98.根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离。
99.在其中一个实施例中,根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离,包括:
100.在所述生成特征子集中确定与所述采样特征子集最接近的第一目标分量;
101.将所述第一目标分量与所述采样特征子集中与所述第一目标分量对应的第二目标分量间的弗雷歇距离确定为所述第二目标分量与所述生成特征子集的弗雷歇距离;
102.对所述采样特征子集中各所述第二目标分量与所述生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
103.在其中一个实施例中,根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离,包括:
104.在所述采样特征子集中确定与所述生成特征子集最接近的第三目标分量;
105.将所述第三目标分量与所述生成特征子集中与所述第三目标分量对应的第四目标分量间的弗雷歇距离确定为所述第三目标分量与所述采样特征子集的弗雷歇距离;
106.对所述生成特征子集中各所述第三目标分量与所述采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
107.在其中一个实施例中,所述根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络,所述方法包括:
108.根据所述评估结果,确定各所述初始对抗网络的性能分数;
109.将所述性能分数最高的所述初始对抗网络,确定为目标对抗网络。
110.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
111.针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
112.基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;
113.根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;
114.基于所述目标对抗网络和待扩充样本,生成目标样本。
115.在其中一个实施例中,所述针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合之前,所述方法还包括:
116.获取初始样本集,根据所述初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
117.通过所述采样样本集合对所述初始对抗网络进行训练,直至所述初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
118.在其中一个实施例中,所述基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果,包括:
119.根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离;
120.根据所述混合高斯弗雷歇距离,对所述初始对抗网络进行评估,得到所述初始对抗网络的评估结果。
121.在其中一个实施例中,所述根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离,包括:
122.确定每一初始对抗网络对应的所述采样样本集合的采样特征子集,以及所述生成样本集合的生成特征子集;
123.根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离;
124.根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离。
125.在其中一个实施例中,根据所述采样特征子集和所述生成特征子集,确定所述采
样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离,包括:
126.在所述生成特征子集中确定与所述采样特征子集最接近的第一目标分量;
127.将所述第一目标分量与所述采样特征子集中与所述第一目标分量对应的第二目标分量间的弗雷歇距离确定为所述第二目标分量与所述生成特征子集的弗雷歇距离;
128.对所述采样特征子集中各所述第二目标分量与所述生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
129.在其中一个实施例中,根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离,包括:
130.在所述采样特征子集中确定与所述生成特征子集最接近的第三目标分量;
131.将所述第三目标分量与所述生成特征子集中与所述第三目标分量对应的第四目标分量间的弗雷歇距离确定为所述第三目标分量与所述采样特征子集的弗雷歇距离;
132.对所述生成特征子集中各所述第三目标分量与所述采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
133.在其中一个实施例中,所述根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络,所述方法包括:
134.根据所述评估结果,确定各所述初始对抗网络的性能分数;
135.将所述性能分数最高的所述初始对抗网络,确定为目标对抗网络。
136.上述数据扩充方法、装置、计算机设备、存储介质和计算机程序产品,针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;基于所述目标对抗网络和待扩充样本,生成目标样本。采用本方法,根据多个初始对抗网络生的生成样本集以及预设评估方法,可以对多个初始对抗网络进行评估,根据评估结果确定一个用于生成目标样本的目标对抗网络,生成的用于扩充的目标样本可以排除初始样本的过拟合现象,提高数据扩充的有效性。
附图说明
137.图1为一个实施例中数据扩充方法的流程示意图;
138.图2为一个实施例中训练初始对抗网络方法的流程示意图;
139.图3为一个实施例中训练循环一致性对抗网络步骤的流程示意图;
140.图4为一个实施例中对初始对抗网络进行评估步骤的流程示意图;
141.图5为一个实施例中计算混合高斯弗雷歇距离完整步骤的流程示意图;
142.图6为一个实施例中计算第一混合高斯弗雷歇距离与第二混合高斯弗雷歇距离的流程示意图;
143.图7为一个实施例中计算第一混合高斯弗雷歇距离具体步骤的流程示意图;
144.图8为一个实施例中计算第二混合高斯弗雷歇距离具体步骤的流程示意图;
145.图9为一个实施例中确定目标对抗网络步骤的流程示意图;
146.图10为一个实施例中数据扩充装置的结构框图;
147.图11为一个实施例中计算机设备的内部结构图。
具体实施方式
148.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
149.在一个实施例中,如图1所示,提供了一种数据扩充方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
150.步骤102,针对训练后的各初始对抗网络中的每一初始对抗网络,获取初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合。
151.其中,初始对抗网络可以为初始循环对抗网络。
152.本技术实施例中,在某些样本扩充的实际应用场景中,往往是多节点协同探测,需要根据不同节点的探测结果对训练数据进行扩充。例如,在舰船目标的实际应用场景中,每个节点的数据来自相机、红外和超声设备等传感器的多源异构形式。
153.针对上述场景,循环一致性对抗网络具有更广泛的使用场景,因此终端可以将采样样本集合的每一样本输入至初始循环一致性对抗网络中,根据初始循环一致性对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合,此生成样本集合用于对初始循环对抗网络进行评估。
154.步骤104,基于采样样本集合和生成样本集合,对各初始对抗网络进行评估,得到各初始对抗网络的评估结果。
155.本技术实施例中,终端根据采样样本集合、生成样本集合与fid(frechet inception distance score弗雷歇距离分数)计算原理,确定采样样本集合与生成样本集合间的混合高斯弗雷歇距离,终端根据各初始对抗网络的采样样本集合与生成样本集合间的混合高斯弗雷歇距离对各初始对抗网络进行评估,得到对各初始对抗网络的评估结果。
156.步骤106,根据评估结果,在各初始对抗网络中确定目标对抗网络。
157.本技术实施例中,在训练后的多个初始对抗网络中,终端根据各初始对抗网络的评估结果,确定出各初始对抗网络的性能分数,根据此性能分数,在训练后的各初始对抗网络中确定出用于完成数据扩充的目标对抗网络。
158.步骤108,基于目标对抗网络和待扩充样本,生成目标样本。
159.本技术实施例中,以舰船样本扩充为例进行举例说明,在已有的舰船样本的基础上,终端将待扩充样本输入至目标对抗网络,从而生成扩充后的目标样本。此目标对抗网络经过混合高斯弗雷歇距离的评估,可以保证数据迁移扩充后的舰船样本的真实性和对特定任务模型训练的有效性。
160.上述数据扩充方法中,根据多个初始对抗网络生的生成样本集以及预设评估方法,对多个初始对抗网络进行评估,根据评估结果确定一个用于生成目标样本的目标对抗网络,生成的用于扩充的目标样本可以排除初始样本的过拟合现象,提高数据扩充的有效性。
161.在一个实施例中,如图2所示,步骤102针对训练后的各初始对抗网络中的每一初始对抗网络,获取初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合之前,该方法还包括:
162.步骤202,获取初始样本集,根据初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合。
163.本技术实施例中,在对初始样本集训练阶段,终端对此初始样本集进行随机划分,将每个初始采样样本集合与初始对抗网络一一对应,得到每个初始对抗网络的对应的采样样本集合。
164.步骤204,通过采样样本集合对初始对抗网络进行训练,直至初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
165.其中,初始对抗网络包括生成器g、生成器f、判别器d
x
和判别器dy。
166.本技术实施例中,终端通过采样样本集合对初始对抗网络进行训练,直至初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。具体的,如图3所示,生成器g将为x源风格的采样样本集合映射到y源风格的图像集合,利用判别器dy进行判别,同时将生成的y源风格的图像集合利用生成器f映射回到x源风格的采样样本集合,将生成的x源风格的采样样本集合与x源风格的采样样本集合进行对比,终端根据相同原理对从y源风格的图像映射到x源风格的采样样本集合进行对比。终端将为x源风格的采样样本集合生成y源风格的图像,其损失函数如下所示:
167.l
gan
(g,dy,x,y)=e
y~p(y)
[logdy(y)]+e
x~p(x)
[log(1-dy(g(x)))]
[0168]
其中,x为x源风格的采样样本集合中的样本,y为y源风格图像集合中的样本,p(y)为概率密度函数pdata(y)函数,p(x)为概率密度函数pdata(x)函数,e
y~p(y)
为y服从p(y)分布的期望,e
x~p(x)
为x服从p(x)分布的期望。
[0169]
对于终端根据生成器f与判别器d
x
按照与上述相同的原理,将生成的为y源风格的图像映射回x源风格的采样样本集合,其损失函数如下所示:
[0170]
l
gan
(f,d
x
,y,x)=e
y~p(x)
[logd
x
(x)]+e
x~p(y)
[log(1-d
x
(f(y)))]
[0171]
上述过程的损失函数即为生成判别损失函数与循环一致性损失函数之和,其损失函数如下所示:
[0172]
l(g,f,d
x
,dy)=l
gan
(g,dy,x,y)+l
gan
(f,d
x
,y,x)+λl
cyc
(g,f)
[0173]
其中,λ为损失函数系数。
[0174]
本实施例中,通过对循环对抗网络进行训练,实现在确保图像整体语义结构的同时,对图像风格进行迁移,并得到训练后的多个初始对抗网络。
[0175]
在一个实施例中,如图4所示,步骤104基于采样样本集合和生成样本集合,对各初始对抗网络进行评估,得到各初始对抗网络的评估结果,包括:
[0176]
步骤402,根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的采样样本集合与生成样本集合之间特征分布的混合高斯弗雷歇距离。
[0177]
本技术实施例中,如图5所示,终端根据预训练cnn(convolutional neural networks,cnn卷积神经网络)网络得到采样样本的特征向量和生成样本的特征向量,根据聚类方法得到高斯分布拟合,然后,终端将采样样本集合与生成样本集合的特征向量集合可以得到生成特征子集与采样特征子集,通过生成特征子集与采样特征子集可以得到采样特征子集的分量与生成特征子集的分量。最终终端通过混合高斯弗雷歇距离可以计算每一初始对抗网络对应的采样样本集合与生成样本集合之间特征分布的混合高斯弗雷歇距离,混合高斯弗雷歇距离用于反映生成样本的有效性。
[0178]
步骤404,根据混合高斯弗雷歇距离,对初始对抗网络进行评估,得到初始对抗网络的评估结果。
[0179]
本技术实施例中,终端根据采样特征子集相对生成特征子集的第一混合高斯弗雷歇距离,以及生成特征子集相对采样特征子集的第二混合高斯弗雷歇距离,得到第一混合高斯弗雷歇距离与第二混合高斯弗雷歇距离的均值,将此均值作为最终评价标准来对各初始对抗网络进行评估,得到用于选择初始对抗网络的评估结果。每一对抗网络的采样样本的特征向量和生成样本的特征向量的混合高斯弗雷歇距离可以衡量采样样本的特征向量和生成样本的特征向量中特征分布的差异,混合高斯弗雷歇距离的数值越小,则反映出对抗网络的采样样本与生成样本特征越接近,作为初始对抗网络的评估结果的性能分数越高。
[0180]
本实施例中,通过采样样本集合与生成样本集合的混合高斯弗雷歇距离得到各初始对抗网络的评估结果,根据评估结果选择目标对抗网络,可以避免样本数据分布产生的过拟合问题。
[0181]
在一个实施例中,如图6所示,步骤402根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的采样样本集合与生成样本集合之间特征分布的混合高斯弗雷歇距离,包括:
[0182]
步骤602,确定每一初始对抗网络对应的采样样本集合的采样特征子集,以及生成样本集合的生成特征子集。
[0183]
本技术实施例中,终端将公开大规模数据集预训练分类模型保留其特征提取模块,将采样样本集合与生成样本集合输入至此特征提取模块,得到采样样本的特征向量f
x
和生成样本的特征向量fy,其样本数量分别为m和n,有f
x
={f
xi
|i=1,2,
…
m},fy={f
yi
|j=1,2,
…
n}。假设采样样本和生成样本的特征分布服从多维高斯分布,即:
[0184]fx
~n(μ
x
,σ
x
)
[0185]fy
~n(μy,σy)
[0186]
其中(μ
x
,σ
x
)和(μy,σy)分别为利用采样样本特征估计和生成样本特征估计的均值向量和方差矩阵,μ
x
为采样样本特征估计的均值向量,μy为生成样本特征估计的均值向量,σ
x
为采样样本特征估计的方差矩阵,σy为生成样本特侦估计的方差矩阵:
[0187][0188][0189]
[0190][0191]
利用k-means(一种聚类方法)方法对采样样本和生成样本特征集合进行聚类,分别得到m个采样特征子集和n个生成特征子集,即:
[0192]fx
=f
x1
∪f
x2
∪
…
∪f
xm
[0193]fy
=f
y1
∪f
y2
∪
…
∪f
yn
[0194]
步骤604,根据采样特征子集和生成特征子集,确定采样特征子集相对生成特征子集的第一混合高斯弗雷歇距离。
[0195]
本技术实施例中,终端根据采样特征子集和生成特征子集确定第一目标分量与对应的第二目标分量,根据第二目标分量与采样特征子集的距弗雷歇距离确定第一混合高斯弗雷歇距离。
[0196]
步骤606,根据生成特征子集和采样特征子集,确定生成特征子集相对采样特征子集的第二混合高斯弗雷歇距离。
[0197]
本技术实施例中,终端根据采样特征子集和生成特征子集确定第三目标分量与对应的第四目标分量,根据第四目标分量与采样特征子集的距弗雷歇距离确定第二混合高斯弗雷歇距离。
[0198]
本实施例中,通过采样特征子集和生成特征子集确定第一混合高斯弗雷歇距离和第二混合高斯弗雷歇距离,能够反映生成样本集合的有效性,防止生成样本集合出现过拟合现象,提高数据扩充的有效性。
[0199]
在一个实施例中,如图7所示,步骤604根据采样特征子集和生成特征子集,确定采样特征子集相对生成特征子集的第一混合高斯弗雷歇距离,包括:
[0200]
步骤702,在生成特征子集中确定与采样特征子集最接近的第一目标分量。
[0201]
本技术实施例中,生成特征子集中的分量与采样特征子集中的分量由生成特征子集与采样特征子集中包含的采样样本数量与生成样本数量的比例决定,由如下公式所示:
[0202][0203][0204]
其中,mi为包含该特征的采样样本的数量,m为采样特征子集中特征子集的总数,nj为包含该特征的生成样本的数量,n为生成特征子集中特征子集的总数。
[0205]
终端计算每一生成特征子集中的分量与采样特征子集的弗雷歇距离,将生成特征子集中与采样特征子集距离最小的分量确定为第一目标分量。
[0206]
步骤704,针对采样特征子集中包含的每一分量,将第一目标分量与采样特征子集中与第一目标分量对应的第二目标分量间的弗雷歇距离确定为第二目标分量与生成特征子集的弗雷歇距离。
[0207]
本技术实施例中,在采样特征子集中的每一个分量都具有与第一目标分量对应的
第二目标分量,终端将每个与第一目标分量对应的第二目标分量与第一目标分量的弗雷歇距离确定为第二目标分量与生成特征子集的弗雷歇距离,如下公式所示:
[0208][0209]
步骤706,对采样特征子集中各第二目标分量与生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
[0210]
本技术实施例中,终端针对每个第二目标分量,确定该第二目标分量与生成特征子集的弗雷歇距离,将采样特征子集中每个第二目标分量与生成特征子集的弗雷歇距离作加权和作为第一混合高斯弗雷歇距离,如下公式所示:
[0211][0212]
本实施例中,通过将生成特征子集中与采样特征子集距离最小的分量确定为第一目标分量可以确定出采样特征子集中每一分量与生成特征子集的弗雷歇距离,进而得到第一混合高斯弗雷歇距离,第一混合高斯弗雷歇距离可以反映该初始对抗网络生成的生成样本与采样样本的特征分布,可以避免生成样本出现过拟合现象,提高生成样本的有效性。
[0213]
在一个实施例中,如图8所示,步骤606根据生成特征子集和采样特征子集,确定生成特征子集相对采样特征子集的第二混合高斯弗雷歇距离,包括:
[0214]
步骤802,在采样特征子集中确定与生成特征子集最接近的第三目标分量。
[0215]
本技术实施例中,终端计算每一采样特征子集中的分量与生成特征子集的弗雷歇距离,将采样特征子集中与生成特征子集距离最小的分量确定为第三目标分量。
[0216]
步骤804,针对生成特征子集中包含的每一分量,将第三目标分量与生成特征子集中与第三目标分量对应的第四目标分量间的弗雷歇距离确定为第三目标分量与采样特征子集的弗雷歇距离。
[0217]
本技术实施例中,在生成特征子集中的每一个分量都具有与第三目标分量对应的第四目标分量,终端将每个与第三目标分量对应的第四目标分量与第三目标分量的弗雷歇距离确定为第三目标分量与生成特征子集的弗雷歇距离,如下公式所示:
[0218][0219]
步骤806,对生成特征子集中各第三目标分量与采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
[0220]
本技术实施例中,终端针对每个第三目标分量,确定该第四目标分量与生成特征子集的弗雷歇距离,将采样特征子集中每个第三目标分量与生成特征子集的弗雷歇距离作加权和作为第二混合高斯弗雷歇距离,如下公式所示:
[0221][0222]
本实施例中,第二混合高斯弗雷歇距离可以反映采样样本与该初始对抗网络生成的生成样本的特征分布,可以避免生成样本出现过拟合现象,提高生成样本的有效性。
[0223]
在一个实施例中,如图9所示,步骤106根据评估结果,在各初始对抗网络中确定目标对抗网络,该方法包括:
[0224]
步骤902,根据评估结果,确定各初始对抗网络的性能分数。
[0225]
本技术实施例中,评估结果为第一混合高斯弗雷歇距离与第二混合高斯弗雷歇距离的均值,如下公式所示:
[0226]
d=0.5*(mfid(y,x)+mfid(x,y))
[0227]
其中,d为第一混合高斯弗雷歇距离与第二混合高斯弗雷歇距离的均值。
[0228]
终端获取一个判别常量,此判别常量根据用户经验设定,将此判别常量与第一混合高斯弗雷歇距离与第二混合高斯弗雷歇距离的均值的差值作为各初始对抗网络的性能分数。在计算采样样本集合与生成样本集合之间的距离中,首先针对原sar(synthetic aperture radar合成孔径雷达)图像与可视光图像进行循环一致性对抗网络的图像生成,得到生成可视光图像与生成sar图像,再分别对生成可视光图像与原可视光图像及生成sar图像与原sar图像进行混合高斯弗雷歇距离分数计算,结果如下表1所示:
[0229]
表1
[0230] 混合高斯弗雷歇距离分数(原始仿真数据,原始仿真数据)33.16(原始可视光,原始可视光)80.15(原始仿真数据,生成仿真数据)50.19(原始可视光,生成可视光)120.18
[0231]
由此实验结果可以看出原始仿真图像比较具有整体性,其混合高斯弗雷歇距离分数较低。而原始可视光图像,因其有些图片并没有包含目标,仅含有背景,且其变化较大,因此混合高斯弗雷歇距离分数较高。
[0232]
对于生成的仿真图像、可视光图像与原始仿真图像、可视光图像的混合高斯弗雷歇距离分数计算,可以看出,原始仿真图像、可视光图像对于生成的仿真图像、可视光图像之间的混合高斯弗雷歇距离分数较低,对于原始仿真数据本身的混合高斯弗雷歇距离分数比较接近,表明了生成的仿真风格的图像与原始仿真图像的分布比较类似,反映了生成图像学习到了仿真图像的风格的特点。
[0233]
步骤904,将性能分数最高的初始对抗网络,确定为目标对抗网络。
[0234]
本技术实施例中,终端计算并得到各初始对抗网络的性能分数后,将此性能分数最高的初始对抗网络作为目标对抗网络。
[0235]
本实施例中,通过在各初始对抗网络中选取性能分数较高的初始对抗网络作为目标对抗网络,能够保证目标对抗网络生成的目标样本避免过拟合问题,提高生成样本的有效性。
[0236]
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的
步骤或者阶段的至少一部分轮流或者交替地执行。
[0237]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的数据扩充方法的数据扩充装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个数据扩充装置实施例中的具体限定可以参见上文中对于数据扩充方法的限定,在此不再赘述。
[0238]
在一个实施例中,如图10所示,提供了一种数据扩充装置,包括:获取模块1001、评估模块1002、确定模块1003和生成模块1004,其中:
[0239]
获取模块1001,用于针对训练后的各初始对抗网络中的每一初始对抗网络,获取初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
[0240]
评估模块1002,用于基于采样样本集合和生成样本集合,对各初始对抗网络进行评估,得到各初始对抗网络的评估结果;
[0241]
确定模块1003,用于根据评估结果,在各初始对抗网络中确定目标对抗网络;
[0242]
生成模块1004,用于基于目标对抗网络和待扩充样本,生成目标样本。
[0243]
在其中一个实施例中,获取模块1001还用于:
[0244]
获取初始样本集,根据初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
[0245]
通过采样样本集合对初始对抗网络进行训练,直至初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
[0246]
在其中一个实施例中,评估模块1002具体用于:
[0247]
根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的采样样本集合与生成样本集合之间特征分布的混合高斯弗雷歇距离;
[0248]
根据混合高斯弗雷歇距离,对初始对抗网络进行评估,得到初始对抗网络的评估结果。
[0249]
在其中一个实施例中,评估模块1002具体用于:
[0250]
确定每一初始对抗网络对应的采样样本集合的采样特征子集,以及生成样本集合的生成特征子集;
[0251]
根据采样特征子集和生成特征子集,确定采样特征子集相对生成特征子集的第一混合高斯弗雷歇距离;
[0252]
根据生成特征子集和采样特征子集,确定生成特征子集相对采样特征子集的第二混合高斯弗雷歇距离。
[0253]
在其中一个实施例中,评估模块1002具体用于:
[0254]
在生成特征子集中确定与采样特征子集最接近的第一目标分量;
[0255]
将第一目标分量与采样特征子集中与第一目标分量对应的第二目标分量间的弗雷歇距离确定为第二目标分量与生成特征子集的弗雷歇距离;
[0256]
对采样特征子集中各第二目标分量与生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。
[0257]
在其中一个实施例中,评估模块1002具体用于:
[0258]
在采样特征子集中确定与生成特征子集最接近的第三目标分量;
[0259]
将第三目标分量与生成特征子集中与第三目标分量对应的第四目标分量间的弗
雷歇距离确定为第三目标分量与采样特征子集的弗雷歇距离;
[0260]
对生成特征子集中各第三目标分量与采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。
[0261]
在其中一个实施例中,确定模块1003具体用于:
[0262]
根据评估结果,确定各初始对抗网络的性能分数;
[0263]
将性能分数最高的初始对抗网络,确定为目标对抗网络。
[0264]
上述数据扩充装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0265]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据扩充方法。
[0266]
本领域技术人员可以理解,图11中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0267]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
[0268]
针对训练后的各初始对抗网络中的每一初始对抗网络,获取初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;
[0269]
基于采样样本集合和生成样本集合,对各初始对抗网络进行评估,得到各初始对抗网络的评估结果;
[0270]
根据评估结果,在各初始对抗网络中确定目标对抗网络;
[0271]
基于目标对抗网络和待扩充样本,生成目标样本。
[0272]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0273]
获取初始样本集,根据初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;
[0274]
通过采样样本集合对初始对抗网络进行训练,直至初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。
[0275]
在其中一个实施例中,基于采样样本集合和生成样本集合,对各初始对抗网络进行评估,得到各初始对抗网络的评估结果,包括:
[0276]
根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的采样样本集合与生成样本集合之间特征分布的混合高斯弗雷歇距离;
[0277]
根据混合高斯弗雷歇距离,对初始对抗网络进行评估,得到初始对抗网络的评估结果。
[0278]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0297]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0298]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
技术特征:
1.一种数据扩充方法,其特征在于,所述方法包括:针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;基于所述目标对抗网络和待扩充样本,生成目标样本。2.根据权利要求1所述的方法,其特征在于,所述针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合之前,所述方法还包括:获取初始样本集,根据所述初始样本集和随机采样的方法,得到每一初始对抗网络对应的采样样本集合;通过所述采样样本集合对所述初始对抗网络进行训练,直至所述初始对抗网络满足预设的损失条件,得到训练后的初始对抗网络。3.根据权利要求1所述的方法,其特征在于,所述基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果,包括:根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离;根据所述混合高斯弗雷歇距离,对所述初始对抗网络进行评估,得到所述初始对抗网络的评估结果。4.根据权利要求3所述的方法,其特征在于,所述根据混合高斯弗雷歇距离计算方法,计算每一初始对抗网络对应的所述采样样本集合与所述生成样本集合之间特征分布的混合高斯弗雷歇距离,包括:确定每一初始对抗网络对应的所述采样样本集合的采样特征子集,以及所述生成样本集合的生成特征子集;根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离;根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离。5.根据权利要求4所述的方法,其特征在于,根据所述采样特征子集和所述生成特征子集,确定所述采样特征子集相对所述生成特征子集的第一混合高斯弗雷歇距离,包括:在所述生成特征子集中确定与所述采样特征子集最接近的第一目标分量;将所述第一目标分量与所述采样特征子集中与所述第一目标分量对应的第二目标分量间的弗雷歇距离确定为所述第二目标分量与所述生成特征子集的弗雷歇距离;对所述采样特征子集中各所述第二目标分量与所述生成特征子集的弗雷歇距离进行加权处理,确定第一混合高斯弗雷歇距离。6.根据权利要求4所述的方法,其特征在于,根据所述生成特征子集和所述采样特征子集,确定所述生成特征子集相对所述采样特征子集的第二混合高斯弗雷歇距离,包括:在所述采样特征子集中确定与所述生成特征子集最接近的第三目标分量;
将所述第三目标分量与所述生成特征子集中与所述第三目标分量对应的第四目标分量间的弗雷歇距离确定为所述第三目标分量与所述采样特征子集的弗雷歇距离;对所述生成特征子集中各所述第三目标分量与所述采样特征子集的弗雷歇距离进行加权处理,确定第二混合高斯弗雷歇距离。7.根据权利要求1所述的方法,其特征在于,所述根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络,所述方法包括:根据所述评估结果,确定各所述初始对抗网络的性能分数;将所述性能分数最高的所述初始对抗网络,确定为目标对抗网络。8.一种数据扩充装置,其特征在于,所述装置包括:获取模块,用于针对训练后的各初始对抗网络中的每一所述初始对抗网络,获取所述初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;评估模块,用于基于所述采样样本集合和所述生成样本集合,对各所述初始对抗网络进行评估,得到各所述初始对抗网络的评估结果;确定模块,用于根据所述评估结果,在所述各初始对抗网络中确定目标对抗网络;生成模块,用于基于所述目标对抗网络和待扩充样本,生成目标样本。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
技术总结
本申请涉及一种数据扩充方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:针对训练后的各初始对抗网络中的每一初始对抗网络,获取初始对抗网络针对采样样本集合输出的多个生成样本,构建生成样本集合;基于采样样本集合和生成样本集合,对各初始对抗网络进行评估,得到各初始对抗网络的评估结果;根据评估结果,在各初始对抗网络中确定目标对抗网络;基于目标对抗网络和待扩充样本,生成目标样本。采用本方法能够使得生成的用于扩充的目标样本可以排除初始样本的过拟合现象,提高数据扩充的有效性。数据扩充的有效性。数据扩充的有效性。
技术研发人员:梁秋金 王铎 王焕钢 张涛
受保护的技术使用者:清华大学
技术研发日:2023.03.17
技术公布日:2023/7/20
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
