一种基于独立性增强的对抗主动学习方法与流程

未命名 10-19 阅读:109 评论:0


1.本发明涉及主动学习领域,提出了一种基于独立性增强的对抗主动学习方法。


背景技术:

2.基于池的方法的目的是从样本池中查询具有丰富信息量的样本,之后对这些样本进行标记。
3.在基于池的方法中,基于不确定性的方法首先利用已有的标记样本对任务模型进行训练,之后在每次迭代中都会选择模型最不确定的未标记样本进行标记,即该方法将不确定性当作样本所包含信息量的指标。深度主动学习不仅能够处理高维数据,而且有效降低了标注成本。因此,一些学者开展了深度主动学习研究工作。例如,yang等人提出了一种多类别主动学习方法,该方法利用整个池来评估数据的不确定性,并且考虑了了所选样本的多样性;gal等人将贝叶斯深度学习方法应用于主动学习中,为高维数据开发了一种有效的主动学习框架;yang等人将全卷积层与主动学习相结合,利用全卷积层提供的不确定性信息来确定注释区域,从而显著降低了注释难度;最近,yoo等人设计了一个能够预测任务模型对样本产生的损失值的损失预测模块(lpm),lpm随任务模型优化并且被用于预测未标记样本的损失,依据损失预测值进行样本选择。
4.基于池的方法还包括基于分布的方法,该方法通过分析标记样本与未标记样本的分布,选择那些可以增加标记池的多样性的样本。nguyen等人通过对未标记样本进行聚类并选择不同聚类中的样本来增加样本的多样性;hasan等人提出了一种持续性学习框架,从未标记的视频数据中识别上下文感知信息。此外,一些学者利用梯度与误差来评估分布的多样性。variational adversarial active learning(vaal)方法利用变分自动编码器(vae)与判别器对抗学习,该方法是以多样性为依据进行样本选择,而样本的多样性与样本所含信息量并不直接相关。sraal(state-relabeling adversarial active learning)方法引入了任务相关性指标,与直接赋予未标记样本相同标签不同,使用在线不确定度指标(oui)对未标记样本进行重新标记,以计算样本对模型的贡献度,获得了较好的性能。sraal利用注释信息和标记/未标记的状态信息进行样本选择,充分考虑了样本的分布和不确定性。oui在计算过程中引入了概率向量的最大概率值和方差,但其应用效果一般。例如,假设任务模型对样本的所预测的类别向量为v,其中第k个元素值最大,而样本的的真实类别无论是哪一类,oui计算得到的贡献度都是相同的,限制了模型的性能。
5.本发明考虑了样本的不确定性和多样性以及样本之间的相似性,旨在增加样本间的独立性。此外,本发明对lpm进行了改进,使用改进的lpm预测未标记样本的状态值。为满足sraal对状态的精确性的需求,本发明为lpm设计了新的损失函数,并将改进后的模块命名为batch loss prediction module(blpm),之后利用blpm代替sraal中的oui。
6.目前主流的主动学习方法通常将信息量含量排名前k的样本作为一组最优的样本组合进行标记,其中k为组合内的样本数。事实上,一组样本的总信息量并非组内样本的信息量的简单相加,即只依靠信息量排名选出的样本组合,其所含总信息量并不一定是最高
的。原因是组内某些样本可能存在较高的相似性,相似样本的存在导致组内某些样本对模型的贡献度远小于其信息量。本发明认为组内样本的总信息量与样本之间的相似性成反比,与样本之间的独立性成正比。对高独立性的样本进行标记会得到更加高效的标注。故本发明不但关注单一样本的信息量还兼顾了组内样本之间的独立性。为增加组内样本独立性,本发明设计了基于层次聚类的独立样本选择模块。该模块通过层次聚类后的伪标签和判别器对样本的预测值来选择最优的样本组合。


技术实现要素:

7.本发明综合考虑了样本的多样性、不确定性以及样本之间的独立性,提出一种基于独立性增强的对抗主动学习方法,以解决主动学习方法中样本之间的相似度过高的问题。
8.一种基于独立性增强的对抗主动学习方法,其特征在于,包括如下步骤:
9.步骤1:使用基于编解码结构的无监督图像重构网络作为生成器,对样本进行重构,学习样本的特征表示,将样本的特征表示与任务模型中提取的注释特征进行拼接;
10.步骤2:设计了具有新损失函数的损失预测模块batch loss prediction module(blpm),使用blpm对样本的状态值进行重新标注,并依据新的状态值对判别器进行训练;
11.步骤3:设计了基于层次聚类的独立样本选择模块对样本进行独立性选择,之后对所选择的样本进行标记,并将标记后的样本加入标记池,最终对模型进行更新训练。
12.所述步骤1包括如下步骤:
13.步骤1.1:使用生成器g对样本进行重构,学习样本的特征表示。其中编码器对样本进行编码,从而学习样本的特征,解码器用于对样本进行重构。编解码过程中的目标函数为:
[0014][0015][0016][0017]
其中为未标记样本的目标函数,为标记样本的目标函数,z为特征表示。生成器通过对所有样本进行重构来学习丰富的特征表示。
[0018]
步骤1.2:本发明将编码器学习到的样本特征与从任务模型中提取的特征向量进行拼接,然后将拼接后的向量作为样本最终的特征表示。
[0019]
所述步骤2包括如下步骤:
[0020]
步骤2.1:本发明以样本的损失预测值作为不确定性指标。设计了具有新的损失函数的blpm,其损失函数能够比较一个批次中所有样本的损失值:
[0021][0022][0023]
其中,li和lj为任务模型真实的损失,和为blpm模块预测的任务损失。对于一对
样本(xi,xj),当同时满足li>lj和时,模块才没有损失,否则模块会有损失,从而使它增加的值并且减少的值。目标模型和blpm的联合损失函数为:
[0024][0025]
之后,blpm将对未标记样本的损失值进行预测。最终,本发明把blpm的输出归一化到[0,1],并把归一化后的数值作为未标记样本的状态值。
[0026]
步骤2.2:判别器d的目标函数为:
[0027]
ld=-e[log(d(q
θ
(z
l
|x
l
)))]-e[log(state(xu)
new-d(q
θ
(z
l
|x
l
)))]
[0028]
其中state(xu)
new
表示未标记样本的状态值。生成器g与判别器d在对抗学习过程中的目标函数为:
[0029]
l
adv
=-e[log(d(q
θ
(z
l
|x
l
)))]-e[log(d(q
θ
(zu|xu)))]
[0030]
生成器g的总目标函数定义如下:
[0031]
l
total
=λ2lg+λ3l
adv
[0032]
所述步骤3包括如下步骤:
[0033]
步骤3.1:本发明为了降低所选样本之间的相似性,提高样本之间的独立性,设计了基于层次聚类的独立样本选择模块。本发明首先对样本的类别进行初始化,其中每个样本为一个类,即并设置初始聚类数c=n,用超参数p控制合并速度,用超参数s控制总的合并比例;之后,本发明对样本的特征表示进行自底而上的层次聚类,不断更新xi的伪标签yi。聚类过程中,本发明使用两个簇中所有样本的欧式距离的均值作为两个簇的距离度量:
[0034][0035]
其中,ca和cb为两个簇,vi和vj为两个簇中的样本对应的拼接后的向量,na和nb分别对应ca和cb中的样本数。
[0036]
步骤3.2:在聚类结束后,本发明依据预测值的降序进行样本选择,且所选样本都来自不同的簇。
[0037]
步骤3.3:最终本发明利用oracle对所选的前k个样本进行标记。该过程考虑了单一样本信息量,还兼顾了样本之间的独立性。最终,将标记后的样本加入标记池并对模型进行更新训练。
[0038]
本发明的有益效果:目前,主流的主动学习方法通过计算未标记样本的不确定性或者样本分布来评估样本对模型的贡献度。虽然有些研究结果综合了基于不确定性的方法和基于分布的方法,但由于样本之间不具有较高的独立性,应用效果并不理想。因此,本发明设计了一种基于独立性增强的对抗主动学习方法。首先,使用生成器对样本进行重构以学习样本的特征表示,将样本的特征表示与任务模型中提取的注释特征进行拼接;其次,设计了blpm对样本的状态值进行重新标注,并依据新的状态值对判别器进行训练;然后,设计了基于层次聚类的独立样本选择模块对样本进行独立性选择,之后对所选择的样本进行标记。最终,将标记后的样本加入标记池并且对模型进行更新训练。
附图说明:
[0039]
图1是一种基于独立性增强的对抗主动学习方法的流程图;
[0040]
图2是基于独立性增强的对抗主动学习方法的模型结构图;
[0041]
图3是本发明与目前主流方法在两个图像分类数据集和两个图像分割数据集上的性能对比图。
具体实施方式:
[0042]
下面将结合本发明实施例中的三个具体的附图对本发明实施例中的技术方案进行描述。
[0043]
图1是本发明实施的具体流程示意图,该方法包括如下步骤:
[0044]
步骤1:使用基于编解码结构的无监督图像重构网络作为生成器,对样本进行重构,学习样本的特征表示,将样本的特征表示与任务模型中提取的注释特征进行拼接;
[0045]
步骤2:设计了具有新的损失函数的lpm(blpm),使用blpm对样本的状态值进行重新标注,并依据新的状态值对判别器进行训练;
[0046]
步骤3:设计了基于层次聚类的独立样本选择模块对样本进行独立性选择,之后对最终选择的样本进行标记,并将标记后的样本加入标记池,最终对模型进行更新训练。
[0047]
所述步骤1包括如下步骤:
[0048]
步骤1.1:如图2所示,本发明使用生成器g对样本进行重构,学习样本的特征表示。其中编码器对样本进行编码,从而学习样本的特征,解码器用于对样本进行重构。编解码过程中的目标函数为:
[0049][0050][0051][0052]
其中为未标记样本的目标函数,为标记样本的目标函数,z代表特征表示。生成器通过对所有样本进行重构来学习丰富的特征表示。
[0053]
步骤1.2:本发明将编码器学习到的样本特征与从任务模型中提取的特征向量进行拼接,然后将拼接后的向量作为样本最终的特征表示。
[0054]
所述步骤2包括如下步骤:
[0055]
步骤2.1:本发明以样本的损失预测值作为不确定性指标。设计了具有新的损失函数的lpm(blpm),具体的,blpm的损失函数比较了一个批次中所有样本的损失值:
[0056][0057][0058]
其中li和lj为任务模型真实的损失,和为blpm模块预测的任务损失。对于一对样本(xi,xj),当同时满足li>lj和时,模块才没有损失,否则模块会有损失,从而使它
增加的值并且减少的值。目标模型和blpm的联合损失函数为:
[0059][0060]
之后,blpm将对未标记样本的损失值进行预测。最终本发明把blpm的输出归一化到[0,1],并把归一化后的数值作为未标记样本的状态值。
[0061]
步骤2.2:判别器d的目标函数为:
[0062]
ld=-e[log(d(q
θ
(z
l
|x
l
)))]-e[log(state(xu)
new-d(q
θ
(z
l
|x
l
)))]
[0063]
其中state(xu)
new
表示未标记样本的状态值。g与d对抗学习过程中的目标函数为:
[0064]
l
adv
=-e[log(d(q
θ
(z
l
|x
l
)))]-e[log(d(q
θ
(zu|xu)))]
[0065]
g的总目标函数定义如下:
[0066]
l
total
=λ2lg+λ3l
adv
[0067]
所述步骤3包括如下步骤:
[0068]
步骤3.1:如图2所示,本发明为降低所选样本之间的相似性,提高样本之间的独立性,本发明设计了基于层次聚类的独立样本选择模块。本发明首先对样本的类别进行初始化,其中每个样本为一个类,即并设置初始聚类数c=n,用超参数p控制合并速度,用超参数s控制总的合并比例;之后,本发明对样本的特征表示进行自底而上的层次聚类,不断更新xi的伪标签yi。聚类过程中,本发明使用两个簇中所有样本的欧式距离的均值作为两个簇的距离度量:
[0069][0070]
其中ca和cb分别为两个簇,vi和vj分别表示两个簇中的样本对应的拼接后的向量,na和nb分别对应ca和cb中的样本数。
[0071]
步骤3.2:在聚类结束后,本发明依据预测值的降序进行样本选择,且所选样本都来自不同的簇,最终本发明利用oracle对所选的前k个样本进行标记。综上,该过程在考虑单一样本信息量的同时,还兼顾了样本之间的独立性。
[0072]
步骤3.3:对最终选择的样本进行标记,并将标记后的样本加入标记池,最终对模型进行更新训练。图3显示了本发明与目前主流方法在多个数据集上的性能对比结果。

技术特征:
1.一种基于独立性增强的对抗主动学习方法,其特征在于,包括如下步骤:步骤1:使用基于编解码结构的无监督图像重构网络作为生成器,对样本进行重构,学习样本的特征表示,将样本的特征表示与任务模型中提取的注释特征进行拼接;步骤2:设计了具有新损失函数的损失预测模块batch loss prediction module(blpm),使用blpm对样本的状态值进行重新标注,并依据新的状态值对判别器进行训练;步骤3:设计了基于层次聚类的独立样本选择模块对样本进行独立性选择,之后对所选择的样本进行标记,并将标记后的样本加入标记池,最终对模型进行更新训练。2.根据权利要求1所述的基于独立性增强的对抗主动学习方法,其特征在于,所述步骤1包括如下步骤:步骤1.1:使用生成器g对样本进行重构,学习样本的特征表示。其中编码器对样本进行编码,从而学习样本的特征,解码器用于对样本进行重构。编解码过程中的目标函数为:解码器用于对样本进行重构。编解码过程中的目标函数为:解码器用于对样本进行重构。编解码过程中的目标函数为:其中,为未标记样本的目标函数,为标记样本的目标函数,z代表特征表示。生成器通过对所有样本进行重构来学习丰富的特征表示。步骤1.2:本发明将编码器学习到的样本特征与从任务模型中提取的特征向量进行拼接,然后将拼接后的向量作为样本最终的特征表示。3.根据权利要求1所述的基于独立性增强的对抗主动学习方法,其特征在于,所述步骤2包括如下步骤:步骤2.1:本发明以样本的损失预测值作为不确定性指标。设计了具有新的损失函数的blpm,其损失函数能够比较一个批次中所有样本的损失值:其损失函数能够比较一个批次中所有样本的损失值:其中,l
i
和l
j
为任务模型真实的损失,和为blpm模块预测的任务损失。对于一对样本(x
i
,x
j
),当同时满足l
i
>l
j
和时,模块才没有损失,否则模块会有损失,从而使它增加的值并且减少的值。目标模型和blpm的联合损失函数为:之后,blpm将对未标记样本的损失值进行预测。最终,本发明把blpm的输出归一化到[0,1],并把归一化后的数值作为未标记样本的状态值。步骤2.2:判别器d的目标函数为:l
d
=-e[log(d(q
θ
(z
l
|x
l
)))]-e[log(state(x
u
)
new-d(q
θ
(z
l
|x
l
)))]
其中,state(x
u
)为未标记样本的状态值。生成器g与判别器d在对抗学习过程中的目标函数为:l
adv
=-e[log(d(q
θ
(z
l
|x
l
)))]-e[log(d(q
θ
(z
u
|x
u
)))]生成器g的总目标函数定义如下:l
total
=λ2l
g
+λ3l
adv
。4.根据权利要求1所述的基于独立性增强的对抗主动学习方法,其特征在于,所述步骤3包括如下步骤:步骤3.1:本发明为了降低所选样本之间的相似性,提高样本之间的独立性,设计了基于层次聚类的独立样本选择模块。本发明首先对样本的类别进行初始化,每个样本为一个类,即并设置初始聚类数c=n,用超参数p控制合并速度,用超参数s控制总的合并比例;之后,本发明对样本的特征表示进行自底而上的层次聚类,不断更新x
i
的伪标签y
i
。聚类过程中,本发明使用两个簇中所有样本的欧式距离的均值作为两个簇的距离度量:其中,c
a
和c
b
为两个簇,v
i
和v
j
为两个簇中的样本对应的拼接后的向量,n
a
和n
b
分别对应c
a
和c
b
中的样本数。步骤3.2:在聚类结束后,本发明依据预测值的降序进行样本选择,且所选样本都来自不同的簇。步骤3.3:最终本发明利用oracle对所选取的前k个样本进行标记。该过程考虑了单一样本信息量,还兼顾了样本之间的独立性。最终,将标记后的样本加入标记池并对模型进行更新训练。

技术总结
本发明涉及一种基于独立性增强的对抗主动学习方法。包括如下步骤:1:使用生成器对样本进行重构以学习样本的特征表示,并将样本的特征表示与任务模型中提取的注释特征进行拼接;2:设计Batch Loss Prediction Module(BLPM)对样本的状态值进行重新标注,并依据新的状态值对判别器进行训练;3:设计基于层次聚类的独立样本选择模块对样本进行独立性选择,对所选择的样本进行标记,将标记后的样本加入标记池并且对模型进行更新训练。本发明不仅考虑了单一样本的信息量,而且兼顾了组内样本之间的独立性,同时降低了标记总成本。同时降低了标记总成本。同时降低了标记总成本。


技术研发人员:周远 张斌 常怀雷 李成伟 王首彬 彭桂力 白晓峰 赵杰
受保护的技术使用者:中国电建市政建设集团有限公司
技术研发日:2023.07.10
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐