基于轻量级残差注意力增强网络LRAE-Unet模型的图像分类方法
未命名
07-14
阅读:107
评论:0
基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法
技术领域
1.本发明属于图像处理和计算机视觉技术领域。
背景技术:
2.传统的图像分类算法一般是首先人工设计相对具有特异性的特征,然后提取特征,最后通过分类器对特征进行分类,或者手动设计性能更好的分类器,以提高分类性能,从而实现图像分类的目的。然而,与深度学习相比较,很多现存的方法只能提取原始图像的浅层特征,对于分类任务,这些特征还不够健壮,而深度学习恰好能从原始数据中逐层提取更加复杂、更加抽象的特征,而且这些特征更加丰富和鲁棒,从而提高分类精度。
3.深度学习的基本思想主要包括,利用多个非线性运算层构建深度学习网络,网络底层能够从原始数据中学习到精细的外观信息,底层的输出直接作为高层的输入,以此逐层从输入数据中自适应地学习到高阶的更加抽象、更加复杂的特征表示,最后用这些特征表示来解决分类问题,大量实验表明,深度学习网络在图像分类方面具有非常优越的性能。
4.相关技术中,深度学习最初主要处理简单的图像分类任务,例如mnist手写体分类。在2012年的imagenet比赛上,首次将深度学习用于这种复杂的图像分类任务。imagenet数据集共有100万张图片,1000个类别,分辨率为300*300左右,在该赛事上将图像的分类准确率从74.3%提高到了84.7%,而后在2014年的imagenet比赛上,获得冠军的是深度学习模型googlenet,分类准确率是93.4%,最后深度残差学习模型已经将imagenet数据集的分类精度提高到95%以上,几乎接近于人类的水平。
5.然而,上述提到的模型均是朝着网络更深、更复杂的方向发展,并没有证明相对简化的模型不能够达到上述效果,所以用于图像分类的深度学习网络模型的设计还有很大的探索空间。本专利提出一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法及系统,该方法可以实现基于像素级的分类目的,不受待分类图像类别的限制,而且网络模型参数少,适应性强,模型性能好,从而有效提高图像分类的准确性和便捷性,获得了很好的分类结果。
技术实现要素:
6.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
7.为此,本发明的目的在于提出一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法,用于提高图像分类的准确性和便捷性。
8.为达上述目的,本发明第一方面实施例提出了一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法,包括:
9.获取训练图像数据集;
10.构建轻量级残差注意力增强网络lrae-unet模型,所述轻量级残差注意力增强网络lrae-unet模型包括浅层特征提取通路和深层特征提取通路;
11.利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,生成分类模型;
12.获取待分类图像,将所述待分类图像输入所述分类模型,得到图像分类结果。
13.另外,根据本发明上述实施例的一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法还可以具有以下附加的技术特征:
14.进一步地,在本发明的一个实施例中,所述浅层特征提取通路包括第一卷积块、第二卷积块,第三卷积块、第四卷积块,以及下采样第一模块,下采样第二模块,下采样第三模块和下采样第四模块,所述第一卷积块、第二卷积块,第三卷积块、第四卷积块均包含3个连续的卷积层;计算所述浅层特征提取通路的每个卷积模块输出的fms尺度为:
15.c=m*2,
16.其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。
17.进一步地,在本发明的一个实施例中,所述深层特征提取通路包括第一卷积块、第二卷积块,第三卷积块和第四卷积块,所述第一卷积块、第二卷积块,第三卷积块和第四卷积块均包含七个连续的卷积层;计算所述深层特征提取通路的每个卷积块输出的fms尺度为:
18.c=m/2,
19.其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。
20.进一步地,在本发明的一个实施例中,所述构建轻量级残差注意力增强网络lrae-unet模型,还包括:
21.在所述浅层特征提取通路上,对所述浅层特征提取通路的每个卷积层的权重施加批正则化,其中,
[0022][0023]
其中,y是产生一批满足均值为0,方差为1的fms,x表示输入,mean[x]表示输入的平均值,var[x]表示输入的方差,eps表示稳定系数,防止分母出现0,γ和β是对像素在bn基础上进行的调整,γ初始值为1,用于调整方差,β初始值为0,用于调整均值。
[0024]
进一步地,在本发明的一个实施例中,所述利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,包括:
[0025]
使用随机梯度下降法训练所述轻量级残差注意力增强网络lrae-unet模型,并使用学习率函数调整模型权重,以及使用pytorch深度学习框架,其中,
[0026]
所述随机梯度下降法的参数设置形式如下公式:
[0027]
sgd=sgd(lr=lr_base,momentum=0.9,nesterov=true),
[0028]
学习率函数如下公式:
[0029][0030]
其中,sgd(
·
)为pytorch深度学习框架中的随机梯度下降法的函数,momentum为动量参数,nesterov=true表示使用nesterov动量,lr为每一轮训练的学习率,lr_base表示开始训练时的学习率,epoch为训练的轮次,epoches为设置的训练总轮数,lr_power为设
置的指数参数。
[0031]
进一步地,在本发明的一个实施例中,所述利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,还包括:
[0032]
利用earlystopping控制训练过程,当验证集的精确度不再提高或者训练轮次达到最大时,终止模型训练。
[0033]
为达上述目的,本发明第二方面实施例提出了一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类装置,包括以下模块:
[0034]
获取模块,用于获取训练图像数据集;
[0035]
构建模块,用于构建轻量级残差注意力增强网络lrae-unet模型,所述轻量级残差注意力增强网络lrae-unet模型包括浅层特征提取通路和深层特征提取通路;
[0036]
训练模块,用于利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,生成分类模型;
[0037]
分类模块,用于获取待分类图像,将所述待分类图像输入所述分类模型,得到图像分类结果。
[0038]
为达上述目的,本发明第三方面实施例提出了一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。
[0039]
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。
[0040]
本发明实施例提出的基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法,通过卷积神经网络理论和深度学习网络模型训练方法获得轻量级残差注意力增强网络lrae-unet的图像分类模型,从而可以实现端到端的分类,且可以用于全自动地对图像进行分类,实现基于像素级的分类目的,不受待分类图像类别的限制,适用性强,模型性能好,具有鲁棒性,使分类不但更加便捷、有效,而且操作简单且性能更好,从而有效提高图像分类的准确性和便捷性。
附图说明
[0041]
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0042]
图1为根据本发明实施例的轻量级残差注意力增强网络lrae-unet的图像分类方法流程图;
[0043]
图2为根据本发明一个实施例的轻量级残差注意力增强网络lrae-unet的图像分类方法流程图;
[0044]
图3为根据本发明一个实施例的不同背景下的绿色植物图片示意图;
[0045]
图4为根据本发明一个实施例的不同种类的绿色植物图片示意图;
[0046]
图5为根据本发明一个实施例的轻量级残差注意力增强网络lrae-unet模型框架示意图;
[0047]
图6为根据本发明一个实施例的浅层特征提取通路的结构示意图;
[0048]
图7为根据本发明一个实施例的深层特征提取通路的结构示意图;
[0049]
图8为根据本发明一个实施例的浅层次信息与深层信息相融合的形式示意图;
[0050]
图9为根据本发明一个实施例的卷积块与池化层的连接形式示意图;
[0051]
图10为根据本发明一个实施例的轻量级残差注意力增强网络lrae-unet的图像分类系统的结构示意图。
具体实施方式
[0052]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0053]
下面参考附图描述本发明实施例的基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。
[0054]
图1为本发明实施例所提供的一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法的流程示意图。
[0055]
如图1所示,该基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法包括以下步骤:
[0056]
s101:取训练图像数据集;
[0057]
可以理解的是,如图2所示,步骤a1:输入待分类的绿色植物图像数据。例如,待分类的图像包含不同的类别,每一类图像均在不同的自然场景下拍摄。同一类植物,在不同自然场景下拍摄的图像如图3所示,不同类别的植物叶片如图4所示。
[0058]
s102:构建轻量级残差注意力增强网络lrae-unet模型,所述轻量级残差注意力增强网络lrae-unet模型包括浅层特征提取通路和深层特征提取通路;
[0059]
进一步地,在本发明的一个实施例中,所述浅层特征提取通路包括第一卷积块、第二卷积块,第三卷积块、第四卷积块,以及下采样第一模块,下采样第二模块,下采样第三模块和下采样第四模块,所述第一卷积块、第二卷积块,第三卷积块、第四卷积块均包含3个连续的卷积层;计算所述浅层特征提取通路的每个卷积模块输出的fms尺度为:
[0060]
c=m*2,
[0061]
其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。
[0062]
具体的,第一卷积块、第二卷积块,第三卷积块、第四卷积块均包含3个连续的卷积层,卷积核大小分别为1*1,3*3和1*1,且所述浅层特征提取通路卷积核大小为1*1和3*3,卷积层输出的特征图(feature maps,fms)大小与卷积层输入的fms大小相等,在卷积核大小为1*1卷积层时输出的fms大小变为两倍。不同卷积块输出的fms个数分别为128、256、512和1024,以及所述卷积层输出的fms隔层残差联接,并对每一层卷积进行规定次数循环操作,下采样第一模块和下采样第二模块是最大池化模块,卷积核大小为2*2,步长大小为2,下采样第三模块和下采样第四模块是平均池化模块,卷积核大小为3*3,步长大小为2,除数大小为2。
[0063]
进一步地,在本发明的一个实施例中,所述深层特征提取通路包括第一卷积块、第二卷积块,第三卷积块和第四卷积块,所述第一卷积块、第二卷积块,第三卷积块和第四卷
积块均包含七个连续的卷积层;计算所述深层特征提取通路的每个卷积块输出的fms尺度为:
[0064]
c=m/2,
[0065]
其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。
[0066]
具体的,第一卷积块、第二卷积块,第三卷积块和第四卷积块均包含七个连续的卷积层,卷积核大小分别为3*3、1*1、3*3、1*1、3*3、1*1,1*1,且所述深层特征提取通路的卷积层输出的fms个数分别为512、256、128和64。
[0067]
进一步地,在本发明的一个实施例中,所述构建轻量级残差注意力增强网络lrae-unet模型,还包括:
[0068]
在所述浅层特征提取通路上,对所述浅层特征提取通路的每个卷积层的权重施加批正则化,其中,
[0069][0070]
其中,y是产生一批满足均值为0,方差为1的fms,x表示输入,mean[x]表示输入的平均值,var[x]表示输入的方差,eps表示稳定系数,防止分母出现0,γ和β是对像素在bn基础上进行的调整,γ初始值为1,用于调整方差,β初始值为0,用于调整均值。
[0071]
在所述深度特征提取通路上,也采用bn处理。
[0072]
举例而言,轻量级残差注意力增强网络lrae-unet模型如图5所示。其中,图中(1)表示绿色植物图像,(2)表示单个卷积层,(3)、(4)、(5)和(6)表示卷积块,均包含三个卷积,(3)和(4)卷积块搭配的是最大池化层,(5)和(6)卷积块搭配增强视野平均池化层,(8)、(10)、(12)和(14)表示卷积块,(9)、(11)、(13)和(15)表示跳跃连接(skip connections),即浅层信息与深层信息融合,(16)为分类层。轻量级残差注意力增强网络lrae-unet模型包括提取浅层特征的通路和提取深层特征的通路两种形式,其中,浅层特征通路如图6所示,且轻量级残差注意力增强网络lrae-unet模型提取深层特征的通路如图7所示。图8为本发明一个实施例的浅层次信息与深层信息相融合的形式示意图。
[0073]
可以理解的是,如图2所示,步骤a2:设计轻量级残差注意力增强网络lrae-unet。该轻量级残差注意力增强网络lrae-unet模型由两个通路组成,包括浅层通路和深层通路,模型如图5所示。该模型的输入大小为m
×m×
3,其中,m
×
m表示图像块尺度,“3”表示图像块的三个通道,分别是r(red,红色)、g(green,绿色)、b(blue,蓝色)三个通道。(2)、(3)、(4)、(5)和(6)组成浅层信息提取通路,其中,(3)、(4)、(5)和(6)表示卷积块,各包括三个卷积层,(3)和(4)残差块搭配的是最大池化层,(5)和(6)残差块搭配增强视野平均池化池化层;(7)、(8)、(10)、(12)和(14)组成深层信息提取通路,(8)、(10)、(12)和(14)表示卷积块,各包括七个卷积层,(9)、(11)、(13)和(15)表示跳跃连接(skip connections),即浅层信息与深层信息融合,(16)为分类层,该层计算出输入图像块属于80个类别的概率,取最大概率的类别为图像块的类别。
[0074]
可以理解是,如图2所示,本发明实施例中的浅层信息提取通路为:在(2)中,卷积层的输入为160*160*3,输出为160*160*64,在(3)中,第一个卷积层和第二个卷积层输入和输出为160*160*64,第三个卷积层的输入为160*160*64,输出为160*160*128;在(4)中,第一个卷积层和第二个卷积层输入和输出为80*80*128,第三个卷积层的输入为80*80*128,
输出为80*80*256;在(5)中,第一个卷积层和第二个卷积层输入和输出为40*40*256,第三个卷积层的输入为40*40*256,输出为40*40*512;在(6)中,第一个卷积层和第二个卷积层输入和输出为20*20*512,第三个卷积层的输入为20*20*512,输出为20*20*1024;在(7)中,输出为10*10*1024;(3)和(4)的池化窗口均为2*2,滑动步长均为2,(5)和(6)的池化窗口均为3*3,滑动步长均为2。浅层通路有四个卷积块,每个卷积块包含3个连续的卷积层,卷积核大小分别为1*1,3*3和1*1,卷积核大小为1*1和3*3的卷积层输出的fms大小与卷积层输入的fms大小相等,在卷积核大小为1*1卷积层时输出的fms大小变为两倍。卷积层输出的fms隔层联接,其形式如图9所示。其中,conv1、conv2、conv3为卷积层,fm1s、fm2s、fm3s为卷积层输出的fms。在浅层通路上,卷积块之后是池化层,池化窗口大小为2*2,步长为2*2,其形式如图10所示。其中,(1)、(2)和(3)为卷积层,(4)表示fms联接,(5)为池化层。
[0075]
进一步地,如图2所示,深层信息提取通路:(7)、(8)、(10)、(12)和(14)组成深层信息提取通路;在(7)、(8)、(10)、(12)和(14)中卷积层的输入形式分别为10*10*1024,20*20*512,40*40*256,80*80*128,160*160*64,输出形式分别是20*20*512,40*40*256,80*80*128,160*160*64。所有卷积层的激活函数均为lrelu函数(leaky rectified linear unit),分类层的激活函数为softmax函数。其中,需要说明是,lrelu函数、softmax函数没有相应的中文名称,softmax函数是最常用的多分类函类,其输出是属于各种类的概率。在局部通路上,施加给卷积层权重的正则项均为在深层通路上,(7)、(8)、(10)、(12)和(14)卷积层后面均采用batch normalization方法。
[0076]
lrelu函数形式为,如下所示:
[0077][0078]
其中,yi表示该函数的输入,ai表示斜率。
[0079]
深层特征提取通路包括第一卷积块、第二卷积块,第三卷积块和第四卷积块,所述第一卷积块、第二卷积块,第三卷积块和第四卷积块均包含七个连续的卷积层,卷积核大小分别为3*3、1*1、3*3、1*1、3*3、1*1,1*1,且所述深层特征提取通路的卷积层输出的fms个数分别为512、256、128和64,以及计算所述深层特征提取通路的每个卷积块输出的fms尺度为:
[0080]
c=m/2,
[0081]
其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。
[0082]
需要说明的是,该轻量级残差注意力增强网络lrae-unet分类模型通过一块gpu(graphics processing unit,图形处理器)显卡nvidiageforce(3060ti)训练得到,效果显著,不需要像传统图像处理方法先手动提取图像特征,再进行分类等繁琐的步骤,而是直接可以提取特征,并对图像块进行分类。而且,除了选择合适的裁剪尺寸进行进行模型预训练,不需要再对图像做任何预处理。
[0083]
s103:利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,生成分类模型;
[0084]
进一步地,在本发明的一个实施例中,使用随机梯度下降法训练所述轻量级残差注意力增强网络lrae-unet模型,并使用学习率函数调整模型权重,以及使用pytorch深度
学习框架,其中,
[0085]
所述随机梯度下降法的参数设置形式如下公式:
[0086]
sgd=sgd(lr=lr_base,momentum=0.9,nesterov=true),
[0087]
学习率函数如下公式:
[0088][0089]
其中,sgd(
·
)为pytorch深度学习框架中的随机梯度下降法的函数,momentum为动量参数,nesterov=true表示使用nesterov动量,lr为每一轮训练的学习率,lr_base表示开始训练时的学习率,epoch为训练的轮次,epoches为设置的训练总轮数,lr_power为设置的指数参数。
[0090]
进一步地,在本发明的一个实施例中,所述利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,还包括:
[0091]
利用earlystopping控制训练过程,当验证集的精确度不再提高或者训练轮次达到最大时,终止模型训练。
[0092]
可以理解是,如图2所示,步骤a3:模型训练,生成轻量级残差注意力增强网络lrae-unet分类模型。其中,步骤a3模型训练可以包括a31、a32、a33和a34中的四个步骤。
[0093]
步骤a31:首先,模型参数初始化;其次,卷积层与全连接层中权重的初始化方式均为xavier正态分布初始化法,偏置向量的初始化方式为全零初始化。
[0094]
其中,xavier正态分布初始化法是2010年glorot等人提出的一种有效的神经网络初始化方法。
[0095]
步骤a32:调整模型的权重。训练模型时,采用sgd(stochastic gradient descent,随机梯度下降法)优化模型,使用pytorch深度学习框架,sgd的参数设置形式如公式4所示。
[0096]
sgd=sgd(lr=lr_base,momentum=0.9,nesterov=true),
[0097]
采用变化的学习率,学习率函数如下式所示:
[0098][0099]
其中,sgd(
·
)为pytorh深度学习框架中的sgd的函数,momentum为动量参数,nesterov=true表示使用nesterov动量(牛顿动量),lr为每一轮训练的学习率,lr_base表示开始训练时的学习率,epoch为训练的轮次,epoches为设置的训练总轮数,lr_power为设置的指数参数。使用深度学习方法进行图像分类,既能极大简化分类流程,减少人为干预,又能获得很高的分类精度,是非常有前景的做法。
[0100]
步骤a33:设置训练的终止条件。
[0101]
模型训练过程中使用earlystopping方法,当验证集的精确度不再提高时,或者当训练次数达到设定的最大值时,训练过程自动终止。
[0102]
可选地,earlystopping是指在模型训练过程中,满足设定的终止条件后,不管是否达到最大训练轮次,训练自动终止。
[0103]
其中,步骤a33为利用earlystopping控制训练过程。在训练过程中,验证集的精确度不再提高或者训练轮次达到最大时,终止训练。earlystopping是指在模型训练过程中,
满足设定的终止条件后,不管是否达到最大训练轮次,训练自动终止;训练过程中的验证集占总训练集的20%。
[0104]
需要说明的是,本发明实施例可以采用基于时间变化的学习率来训练模型,基于时间变化的学习率既能加快收敛速度,又能有效避免在模型训练过程中,可能出现的超调现象或者剧烈震荡现象,并且利用网格搜索法确定模型的相关参数,如卷积核数、激活函数、batch normalization的参数取值等等,有效降低优化模型时选参数的难度,以及利用earlystopping方式,使得在训练过程中,模型性能不再提高时及时终止训练。
[0105]
步骤a34:保存训练好的模型。
[0106]
当训练终止后,保存训练好的模型:包括保存模型权重(文件类型为.hdf)、模型结构信息(类型为.json)、模型结构图(文件类型为.png)。
[0107]
s104:获取待分类图像,将所述待分类图像输入所述分类模型,得到图像分类结果。
[0108]
可以理解是,如图2所示,步骤a4:输出绿色植物物种分类结果。
[0109]
其中,如表1所示,确定每张待分类图像类别的流程。其中,表1为确定待分类绿色植物图像类别的流程表。
[0110]
表1
[0111][0112]
具体而言,本发明实施例的基于轻量级残差注意力增强网络lrae-unet的图像分类方法可以包括:输入待分类的图像数据;训练轻量级残差注意力增强网络lrae-unet模型,具体包括设计lrae-unet模型。其中,设计lrae-unet模型包含浅层特征提取的通路和深层特征提取的通路,模型训练过程包括初始化模型的权值,调整模型的权重,设置训练的终止条件;输出图像分类结果,具体包括将待分类的图像块输入训练好的lrae-unet模型,对待测图像数据进行正确分类。
[0113]
根据本发明实施例提出的轻量级残差注意力增强网络lrae-unet的图像分类方法,通过卷积神经网络理论和深度学习网络模型训练方法获得轻量级残差注意力增强网络lrae-unet的图像分类模型,从而可以实现端到端的分类,且可以用于全自动地对图像进行分类,实现基于像素级的分类目的,不受待分类图像类别的限制,适用性强,模型性能好,具有鲁棒性,使分类不但更加便捷、有效,而且操作简单且性能更好,从而有效提高图像分类的准确性和便捷性。
[0114]
为了实现上述实施例,本发明还提出一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类装置。
[0115]
图10为本发明实施例提供的一种基于轻量级残差注意力增强网络lrae-unet模型
的图像分类装置的结构示意图。
[0116]
如图10所示,该基于轻量级残差注意力增强网络lrae-unet模型的图像分类装置包括:获取模块100,构建模块200,训练模块300,分类模块400,其中,
[0117]
获取模块,用于获取训练图像数据集;
[0118]
构建模块,用于构建轻量级残差注意力增强网络lrae-unet模型,所述轻量级残差注意力增强网络lrae-unet模型包括浅层特征提取通路和深层特征提取通路;
[0119]
训练模块,用于利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,生成分类模型;
[0120]
分类模块,用于获取待分类图像,将所述待分类图像输入所述分类模型,得到图像分类结果。
[0121]
为达上述目的,本发明第三方面实施例提出了一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。
[0122]
为达上述目的,本发明第四方面实施例提出了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。
[0123]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0124]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0125]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法,其特征在于,包括以下步骤:获取训练图像数据集;构建轻量级残差注意力增强网络lrae-unet模型,所述轻量级残差注意力增强网络lrae-unet模型包括浅层特征提取通路和深层特征提取通路;利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,生成分类模型;获取待分类图像,将所述待分类图像输入所述分类模型,得到图像分类结果。2.根据权利要求1所述的方法,其特征在于,所述浅层特征提取通路包括第一卷积块、第二卷积块,第三卷积块、第四卷积块,以及下采样第一模块,下采样第二模块,下采样第三模块和下采样第四模块,所述第一卷积块、第二卷积块,第三卷积块、第四卷积块均包含3个连续的卷积层;计算所述浅层特征提取通路的每个卷积模块输出的fms尺度为:c=m*2,其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。3.根据权利要求1所述的方法,其特征在于,所述深层特征提取通路包括第一卷积块、第二卷积块,第三卷积块和第四卷积块,所述第一卷积块、第二卷积块,第三卷积块和第四卷积块均包含七个连续的卷积层;计算所述深层特征提取通路的每个卷积块输出的fms尺度为:c=m/2,其中,c
×
c为所述卷积层输出的fms尺度,m
×
m为卷积层输入的fms尺度。4.根据权利要求1所述的方法,其特征在于,所述构建轻量级残差注意力增强网络lrae-unet模型,还包括:在所述浅层特征提取通路上,对所述浅层特征提取通路的每个卷积层的权重施加批正则化,其中,其中,y是产生一批满足均值为0,方差为1的fms,x表示输入,mean[x]表示输入的平均值,var[x]表示输入的方差,eps表示稳定系数,防止分母出现0,γ和β是对像素在bn基础上进行的调整,γ初始值为1,用于调整方差,β初始值为0,用于调整均值。5.根据权利要求1所述的方法,其特征在于,所述利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,包括:使用随机梯度下降法训练所述轻量级残差注意力增强网络lrae-unet模型,并使用学习率函数调整模型权重,以及使用pytorch深度学习框架,其中,所述随机梯度下降法的参数设置形式如下公式:sgd=sgd(lr=lr_base,momentum=0.9,nesterov=true),学习率函数如下公式:
其中,sgd(
·
)为pytorch深度学习框架中的随机梯度下降法的函数,momentum为动量参数,nesterov=true表示使用nesterov动量,lr为每一轮训练的学习率,lr_base表示开始训练时的学习率,epoch为训练的轮次,epoches为设置的训练总轮数,lr_power为设置的指数参数。6.根据权利要求1所述的方法,其特征在于,所述利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,还包括:利用earlystopping控制训练过程,当验证集的精确度不再提高或者训练轮次达到最大时,终止模型训练。7.一种基于轻量级残差注意力增强网络lrae-unet模型的图像分类装置,其特征在于,包括以下模块:获取模块,用于获取训练图像数据集;构建模块,用于构建轻量级残差注意力增强网络lrae-unet模型,所述轻量级残差注意力增强网络lrae-unet模型包括浅层特征提取通路和深层特征提取通路;训练模块,用于利用所述轻量级残差注意力增强网络lrae-unet模型和所述训练图像数据集进行模型训练,生成分类模型;分类模块,用于获取待分类图像,将所述待分类图像输入所述分类模型,得到图像分类结果。8.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-6中任一所述的基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6任意一项所述的基于轻量级残差注意力增强网络lrae-unet模型的图像分类方法。
技术总结
本发明提出一种基于轻量级残差注意力增强网络LRAE-Unet模型的图像分类方法,包括,获取训练图像数据集;构建轻量级残差注意力增强网络LRAE-Unet模型,轻量级残差注意力增强网络LRAE-Unet模型包括浅层特征提取通路和深层特征提取通路;利用轻量级残差注意力增强网络LRAE-Unet模型和训练图像数据集进行模型训练,生成分类模型;获取待分类图像,将待分类图像输入所述分类模型,得到图像分类结果。通过本发明提出的方法,可以全自动地对图像进行分类,实现基于像素级的分类目的,不受待分类图像类别的限制,而且网络模型参数少,适应性强,模型性能好,从而有效提高图像分类的准确性和便捷性。便捷性。便捷性。
技术研发人员:王瑜 林嘉豪 秦大贵
受保护的技术使用者:北京工商大学
技术研发日:2023.03.15
技术公布日:2023/7/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
