一种图像分类方法、装置、设备和计算机可读存储介质与流程

未命名 08-15 阅读:273 评论:0


1.本技术涉及计算机视觉技术领域,特别是涉及一种图像分类方法、装置、设备和计算机可读存储介质。


背景技术:

2.卷积神经网络在计算机视觉领域取得了巨大的成功,例如,图像分类、目标检测、图像分割等。然而,随着神经网络的发展,对网络的准确率要求越来越高,使得网络的层数越来越深,导致其计算量和参数量也越来越大。
3.深度可分离卷积由于其优异的性能,在轻量级卷积领域被广泛应用。虽然与传统卷积的计算量和参数量相比,深度可分离卷积的计算量和参数量有所减小,但是深度可分离卷积中的逐点卷积的参数量和计算量仍然很大,导致由深度可分离卷积构建的卷积网络的计算量和参数量仍然较大。并且在深度可分离卷积中,负责融合通道特征的逐点卷积(pointwise convolution,pwc)的计算量和参数量远远大于负责提取空间特征的逐通道卷积(depthwise convolution,dwc)的计算量和参数量,这导致卷积网络的空间特征提取能力和通道特征融合能力失衡,影响卷积网络的推理速度。
4.可见,如何减少卷积网络的参数量和计算量,以提升图像分类效率,是本领域技术人员需要解决的问题。


技术实现要素:

5.本技术实施例的目的是提供一种图像分类方法、装置、设备和计算机可读存储介质,可以减少卷积网络的参数量和计算量,以提升图像分类效率。
6.为解决上述技术问题,本技术实施例提供一种图像分类方法,包括:
7.对获取的待分类图像进行预处理,得到标准图像;
8.利用图像分类模型对所述标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于所述图像分类模型的模型输入通道数、所述逐点通道滑动卷积核的输出通道数小于所述图像分类模型的模型输出通道数并且小于所述逐点通道滑动卷积核的输入通道数;
9.对所述输出特征图进行降维和分类处理,以确定出所述待分类图像所属的图像类别。
10.一方面,所述利用图像分类模型对所述标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图包括:
11.对所述标准图像进行空间维度分析,以提取出空间特征信息;
12.对所述空间特征信息进行批归一化处理,以得到批归一化特征信息;
13.按照所述逐点通道滑动卷积核对所述批归一化特征信息进行滑动卷积处理,以得到融合特征信息;
14.依据层归一化参数对所述融合特征信息进行层归一化处理,以得到层归一化特征
信息;
15.将所述层归一化特征信息转换为非线性特征信息。
16.一方面,所述按照所述逐点通道滑动卷积核对所述批归一化特征信息进行滑动卷积处理,以得到融合特征信息包括:
17.将所述逐点通道滑动卷积核的输出通道数作为滑动步长;
18.按照所述滑动步长以及所述逐点通道滑动卷积核,将所述批归一化特征信息分别在通道维度和空间维度进行滑动卷积,以得到融合特征信息。
19.一方面,所述将所述层归一化特征信息转换为非线性特征信息包括:
20.将所述层归一化特征信息中取值大于零的特征值保留,将所述层归一化特征信息中取值小于零的特征值调整为零,以得到非线性特征信息。
21.一方面,在所述将所述层归一化特征信息转换为非线性特征信息之后还包括:
22.每转换得到非线性特征信息,则将迭代次数加一;
23.在当前迭代次数满足预设阈值的情况下,则执行所述对所述输出特征图进行降维和分类处理,以确定出所述待分类图像所属的图像类别的步骤;
24.在当前迭代次数不满足预设阈值的情况下,则返回所述对所述标准图像进行空间维度分析,以提取出空间特征信息的步骤。
25.一方面,针对于所述逐点通道滑动卷积核的输入通道数和输出通道数的设置过程,所述方法还包括:
26.将所述图像分类模型的输入通道数与选定的输入比例值的乘积作为所述逐点通道滑动卷积核的输入通道数;
27.计算所述逐点通道滑动卷积核的输入通道数与选定的输出比例值的乘积值;
28.在所述乘积值小于所述图像分类模型的输出通道数的情况下,将所述乘积值作为所述逐点通道滑动卷积核的输出通道数;
29.在所述乘积值不小于所述图像分类模型的输出通道数的情况下,将所述图像分类模型的输出通道数与选定的输出比例值的乘积值作为所述逐点通道滑动卷积核的输出通道数;其中,所述输入比例值和所述输出比例值均小于1。
30.一方面,还包括:
31.预先建立不同图像类型与不同比例组之间的对应关系列表;
32.在获取到所述待分类图像的情况下,基于所述待分类图像所属的图像类型从所述对应关系列表中查询匹配的目标比例组;其中,所述目标比例组包括输入比例值和输出比例值。
33.本技术实施例还提供了一种图像分类装置,包括预处理单元、超轻量级卷积单元和确定单元;
34.所述预处理单元,用于对获取的待分类图像进行预处理,得到标准图像;
35.所述超轻量级卷积单元,用于利用图像分类模型对所述标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于所述图像分类模型的模型输入通道数、所述逐点通道滑动卷积核的输出通道数小于所述图像分类模型的模型输出通道数并且小于所述逐点通道滑动卷积核的输入通道数;
36.所述确定单元,用于对所述输出特征图进行降维和分类处理,以确定出所述待分
类图像所属的图像类别。
37.一方面,所述超轻量级卷积单元包括提取子单元、批归一化子单元、融合子单元、层归一化子单元和转换子单元;
38.所述提取子单元,用于对所述标准图像进行空间维度分析,以提取出空间特征信息;
39.所述批归一化子单元,用于对所述空间特征信息进行批归一化处理,以得到批归一化特征信息;
40.所述融合子单元,用于按照所述逐点通道滑动卷积核对所述批归一化特征信息进行滑动卷积处理,以得到融合特征信息;
41.所述层归一化子单元,用于依据层归一化参数对所述融合特征信息进行层归一化处理,以得到层归一化特征信息;
42.所述转换子单元,用于将所述层归一化特征信息转换为非线性特征信息。
43.一方面,所述批归一化子单元用于将所述逐点通道滑动卷积核的输出通道数作为滑动步长;
44.按照所述滑动步长以及所述逐点通道滑动卷积核,将所述批归一化特征信息分别在通道维度和空间维度进行滑动卷积,以得到融合特征信息。
45.一方面,所述转换子单元用于将所述层归一化特征信息中取值大于零的特征值保留,将所述层归一化特征信息中取值小于零的特征值调整为零,以得到非线性特征信息。
46.一方面,还包括累加单元;
47.所述累加单元,用于每转换得到非线性特征信息,则将迭代次数加一;在当前迭代次数满足预设阈值的情况下,则触发所述确定单元执行所述对所述输出特征图进行降维和分类处理,以确定出所述待分类图像所属的图像类别的步骤;在当前迭代次数不满足预设阈值的情况下,则触发所述提取子单元执行所述对所述标准图像进行空间维度分析,以提取出空间特征信息的步骤。
48.一方面,针对于所述逐点通道滑动卷积核的输入通道数和输出通道数的设置过程,所述装置还包括第一作为单元、计算单元、第二作为单元和第三作为单元;
49.所述第一作为单元,用于将所述图像分类模型的输入通道数与选定的输入比例值的乘积作为所述逐点通道滑动卷积核的输入通道数;
50.所述计算单元,用于计算所述逐点通道滑动卷积核的输入通道数与选定的输出比例值的乘积值;
51.所述第二作为单元,用于在所述乘积值小于所述图像分类模型的输出通道数的情况下,将所述乘积值作为所述逐点通道滑动卷积核的输出通道数;
52.所述第三作为单元,用于在所述乘积值不小于所述图像分类模型的输出通道数的情况下,将所述图像分类模型的输出通道数与选定的输出比例值的乘积值作为所述逐点通道滑动卷积核的输出通道数;其中,所述输入比例值和所述输出比例值均小于1。
53.一方面,还包括建立单元和查询单元;
54.所述建立单元,用于预先建立不同图像类型与不同比例组之间的对应关系列表;
55.所述查询单元,用于在获取到所述待分类图像的情况下,基于所述待分类图像所属的图像类型从所述对应关系列表中查询匹配的目标比例组;其中,所述目标比例组包括
输入比例值和输出比例值。
56.本技术实施例还提供了一种电子设备,包括:
57.存储器,用于存储计算机程序;
58.处理器,用于执行所述计算机程序以实现如上述图像分类方法的步骤。
59.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述图像分类方法的步骤。
60.由上述技术方案可以看出,对获取的待分类图像进行预处理,得到标准图像;利用图像分类模型对标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于图像分类模型的模型输入通道数、逐点通道滑动卷积核的输出通道数小于图像分类模型的模型输出通道数并且小于逐点通道滑动卷积核的输入通道数。对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别。在该技术方案中,通过设置小于图像分类模型的模型输入通道数和模型输出通道数的逐点通道滑动卷积核,可以构建出具有极低时间和空间复杂度的超轻量级高效图像分类卷积神经网络,减少了深度可分离卷积中逐点卷积的参数量和计算量,平衡了网络空间特征提取能力和通道特征融合能力,极大减少了网络的参数量和计算量。与传统深度可分离卷积神经网络相比,本技术提出的超轻量级高效卷积神经网络具有极低的时间和空间复杂度,以极少的参数量和计算量完成空间特征提取和通道特征融合,提升了图像的分类效率。
附图说明
61.为了更清楚地说明本技术实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
62.图1为本技术实施例提供的一种图像分类方法的流程图;
63.图2为本技术实施例提供的一种逐点通道滑动卷积的结构示意图;
64.图3为本技术实施例提供的一种图像分类装置的结构示意图;
65.图4为本技术实施例提供的一种电子设备的结构图。
具体实施方式
66.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本技术保护范围。
67.本技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”,以及与“包括”和“具有”相关的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
68.传统的图像分类深度可分离卷积网络中,逐点卷积的参数量和计算量比较大,网络的空间特征提取能力和通道特征融合能力存在失衡,影响卷积网络的推理速度。
69.为此,本技术实施例提供了一种图像分类方法、装置、设备和计算机可读存储介
质,依据逐点通道滑动卷积核,构建具有极低时间和空间复杂度的超轻量级高效图像分类卷积神经网络,减少深度可分离卷积中逐点卷积的参数量和计算量,平衡网络空间特征提取能力和通道特征融合能力,极大减少了网络的参数量和计算量。
70.为了使本技术领域的人员更好地理解本技术方案,下面结合附图和具体实施方式对本技术作进一步的详细说明。
71.接下来,详细介绍本技术实施例所提供的一种图像分类方法。图1为本技术实施例提供的一种图像分类方法的流程图,该方法包括:
72.s101:对获取的待分类图像进行预处理,得到标准图像。
73.预处理可以包括将待分类图像的尺寸转换为符合图像分类模型要求的统一尺寸。
74.在本技术实例中可以采用cifar-10图片分类数据集作为待分类图像,每个图片的统一尺寸可以设置为32
×
32,数据集中一共有50000张训练图片和10000张测试图片,共10类,每个类别有6000个图像,其中5000张训练图片和1000张测试图片,将图片预处理为32
×
32大小,每个通道分别进行归一化。
75.s102:利用图像分类模型对标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图。
76.在本技术实施例中,为了减少卷积网络的参数量和计算量,以提升图像分类效率,可以采用超轻量级卷积单元,超轻量级卷积单元对应的逐点通道滑动卷积核的输入通道数小于图像分类模型的模型输入通道数、逐点通道滑动卷积核的输出通道数小于图像分类模型的模型输出通道数并且小于逐点通道滑动卷积核的输入通道数。
77.基于卷积网络所需实现的功能,可以将其划分为五层,第一层可以采用逐深度卷积,对标准图像进行空间维度分析,以提取出空间特征信息。第二层为批归一化,对空间特征信息进行批归一化处理,以得到批归一化特征信息。第三层为逐点通道滑动卷积,按照逐点通道滑动卷积核对批归一化特征信息进行滑动卷积处理,以得到融合特征信息。第四层为层归一化层,依据层归一化参数对融合特征信息进行层归一化处理,以得到层归一化特征信息。第五层为激活层,用于将层归一化特征信息转换为非线性特征信息。
78.第一层的逐深度卷积的卷积核空间大小可以统一为3
×
3,可以实现空间特征提取,不改变特征图通道数。假设输入特征图大小为m
×r×
c,逐深度卷积的参数为量m
×
9,计算量为m
×r×c×
9,参数量和计算量都非常少。
79.第二层的批归一化可以加快模型的收敛速度,缓解了深层网络中梯度弥散的问题,使图像分类模型更加容易和稳定。
80.第三层的逐点通道滑动卷积是一种新型卷积方式,在具体实现中,可以将逐点通道滑动卷积核的输出通道数作为滑动步长;按照滑动步长以及逐点通道滑动卷积核,将批归一化特征信息分别在通道维度和空间维度进行滑动卷积,以得到融合特征信息。
81.如图2所示为本技术实施例提供的一种逐点通道滑动卷积的结构示意图,假设输入特征图维度为m
×r×
c,输出特征图维度为n
×r×
c,m为模型输入通道数,n为模型输出通道数,r和c为特征图的空间大小,逐点通道滑动卷积核的空间大小为1
×
1,输入通道大小为m,m《m,输出通道大小为d,d《n,大小为d
×m×1×
1的逐点通道滑动卷积核分别在通道维度和空间维度进行滑动卷积,通道维度滑动步长为d,得到融合特征信息。
82.逐点通道滑动卷积核不仅在空间维度参数共享,在通道维度上也实现了稀疏连接
和参数共享,逐点通道滑动卷积的参数量和计算量小于传统逐点卷积、分组卷积等轻量级卷积,是一种更轻量的卷积形式,卷积核共在通道维度滑动n/d次,每次得到d个输出特征图,最终得到n个输出特征图,实现融合通道维度特征。
83.传统逐点卷积的参数量为m
×
n,计算量为m
×n×r×
c。本技术实施例提供的逐点通道滑动卷积的参数量为d
×
m,计算量为d
×n×r×
c。逐点通道滑动卷积的参数量是传统逐点卷积的dm/mn,计算量是传统逐点卷积的d/m。在本技术实例中,通过实验测试的方式,可以将输入比例值设置为3/4,即m取值为3m/4;将输出比例值设置为1/3,即d取值为m/3。
84.第四层的层归一化层整层具有相同的归一化参数,容易与参数通道维度共享的逐点通道滑动卷积的参数进行参数融合,利于加速运算。
85.第五层的激活函数在本技术实例中可以统一采用relu激活函数。relu激活函数可以将层归一化特征信息中取值大于零的特征值保留,将层归一化特征信息中取值小于零的特征值调整为零,以得到非线性特征信息。
86.利用relu激活函数实现网络的非线性表达,提高了网络表达能力,并且relu激活函数计算简单、计算量小,有利于提高计算速度。
87.s103:对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别。
88.在得到输出特征图之后,可以将输出特征图进行2
×
2的最大池化,将特征图尺寸缩小,然后通过图像分类模型的全局平均池化层和全连接层进行分类,以得到图像类别。
89.以m取值设置为3m/4,d取值设置为m/3为例,相比于传统的深度可分离卷积图像分类网络,本技术实施例仅用15%的权重数和不到三分之一的计算量,准确率仅下降不到4%,用于空间特征提取的参数量和用于通道特征融合的参数量比例从74:1改善到10:1,运行在gpu上,有3倍的加速比,按照本技术实施例提供的逐点通道滑动卷积核,可以构建非常轻量化的高效图像分类卷积神经网络且保持较高的准确率,有更快的推理速度。
90.由上述技术方案可以看出,对获取的待分类图像进行预处理,得到标准图像;利用图像分类模型对标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于图像分类模型的模型输入通道数、逐点通道滑动卷积核的输出通道数小于图像分类模型的模型输出通道数并且小于逐点通道滑动卷积核的输入通道数。对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别。在该技术方案中,通过设置小于图像分类模型的模型输入通道数和模型输出通道数的逐点通道滑动卷积核,可以构建出具有极低时间和空间复杂度的超轻量级高效图像分类卷积神经网络,减少了深度可分离卷积中逐点卷积的参数量和计算量,平衡了网络空间特征提取能力和通道特征融合能力,极大减少了网络的参数量和计算量。与传统深度可分离卷积神经网络相比,本技术提出的超轻量级高效卷积神经网络具有极低的时间和空间复杂度,以极少的参数量和计算量完成空间特征提取和通道特征融合,提升了图像的分类效率。
91.在本技术实施例中,为了充分提取出图像特征,需要多次重复执行上述提及的卷积网络的五层所对应的操作。在实际应用中,可以根据分类任务的复杂度决定重复次数。
92.在具体实现中,每转换得到非线性特征信息,则将迭代次数加一;在当前迭代次数满足预设阈值的情况下,说明重复次数已满足要求,此时可以执行对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别的步骤。
93.在当前迭代次数不满足预设阈值的情况下,说明重复次数还未满足要求,此时需
要返回对标准图像进行空间维度分析,以提取出空间特征信息的步骤,以重复执行卷积网络的五层所对应的操作。
94.考虑到实际应用中,不同类型的图像的分析难度有所差异,因此针对不同类型的图像可以设置各自对应的输入比例值和输出比例值。其中,输入比例值和输出比例值均小于1。
95.在本技术实施例中,可以预先建立不同图像类型与不同比例组之间的对应关系列表;在获取到待分类图像的情况下,基于待分类图像所属的图像类型从对应关系列表中查询匹配的目标比例组;其中,目标比例组包括输入比例值和输出比例值。
96.不同图像类型进行图像分类识别时所需的精度有所不同,在具体实现中,可以通过前期实验测试的方式确定出每种图像类型所匹配的较优的输入比例值和输出比例值。
97.图像类型可以基于图像分类的不同进行划分,例如,图像类型可以包括建筑物图像类型、文字内容图像类型、人脸图像类型等。
98.在具体实现中,操作者可以基于待分类图像所属的图像类型,选定所需的输入比例值和输出比例值。将图像分类模型的输入通道数与选定的输入比例值的乘积作为逐点通道滑动卷积核的输入通道数。计算逐点通道滑动卷积核的输入通道数与选定的输出比例值的乘积值。在乘积值小于图像分类模型的输出通道数的情况下,将乘积值作为逐点通道滑动卷积核的输出通道数;在乘积值不小于图像分类模型的输出通道数的情况下,将图像分类模型的输出通道数与选定的输出比例值的乘积值作为逐点通道滑动卷积核的输出通道数。
99.通过预先设置不同类型的图像各自对应的输入比例值和输出比例值,可以便于用户合理的选择输入比例值和输出比例值,避免了用户盲目设置输入比例值和输出比例值,导致逐点通道滑动卷积核的输入通道数和输出通道数设置不合理的情况发生。
100.图3为本技术实施例提供的一种图像分类装置的结构示意图,包括预处理单元31、超轻量级卷积单元32和确定单元33;
101.预处理单元31,用于对获取的待分类图像进行预处理,得到标准图像;
102.超轻量级卷积单元32,用于利用图像分类模型对标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于图像分类模型的模型输入通道数、逐点通道滑动卷积核的输出通道数小于图像分类模型的模型输出通道数并且小于逐点通道滑动卷积核的输入通道数;
103.确定单元33,用于对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别。
104.在一些实施例中,超轻量级卷积单元包括提取子单元、批归一化子单元、融合子单元、层归一化子单元和转换子单元;
105.提取子单元,用于对标准图像进行空间维度分析,以提取出空间特征信息;
106.批归一化子单元,用于对空间特征信息进行批归一化处理,以得到批归一化特征信息;
107.融合子单元,用于按照逐点通道滑动卷积核对批归一化特征信息进行滑动卷积处理,以得到融合特征信息;
108.层归一化子单元,用于依据层归一化参数对融合特征信息进行层归一化处理,以
得到层归一化特征信息;
109.转换子单元,用于将层归一化特征信息转换为非线性特征信息。
110.在一些实施例中,批归一化子单元用于将逐点通道滑动卷积核的输出通道数作为滑动步长;
111.按照滑动步长以及逐点通道滑动卷积核,将批归一化特征信息分别在通道维度和空间维度进行滑动卷积,以得到融合特征信息。
112.在一些实施例中,转换子单元用于将层归一化特征信息中取值大于零的特征值保留,将层归一化特征信息中取值小于零的特征值调整为零,以得到非线性特征信息。
113.在一些实施例中,还包括累加单元;
114.累加单元,用于每转换得到非线性特征信息,则将迭代次数加一;在当前迭代次数满足预设阈值的情况下,则触发确定单元执行对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别的步骤;在当前迭代次数不满足预设阈值的情况下,则触发提取子单元执行对标准图像进行空间维度分析,以提取出空间特征信息的步骤。
115.在一些实施例中,针对于逐点通道滑动卷积核的输入通道数和输出通道数的设置过程,装置还包括第一作为单元、计算单元、第二作为单元和第三作为单元;
116.第一作为单元,用于将图像分类模型的输入通道数与选定的输入比例值的乘积作为逐点通道滑动卷积核的输入通道数;
117.计算单元,用于计算逐点通道滑动卷积核的输入通道数与选定的输出比例值的乘积值;
118.第二作为单元,用于在乘积值小于图像分类模型的输出通道数的情况下,将乘积值作为逐点通道滑动卷积核的输出通道数;
119.第三作为单元,用于在乘积值不小于图像分类模型的输出通道数的情况下,将图像分类模型的输出通道数与选定的输出比例值的乘积值作为逐点通道滑动卷积核的输出通道数;其中,输入比例值和输出比例值均小于1。
120.在一些实施例中,还包括建立单元和查询单元;
121.建立单元,用于预先建立不同图像类型与不同比例组之间的对应关系列表;
122.查询单元,用于在获取到待分类图像的情况下,基于待分类图像所属的图像类型从对应关系列表中查询匹配的目标比例组;其中,目标比例组包括输入比例值和输出比例值。
123.图3所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
124.由上述技术方案可以看出,对获取的待分类图像进行预处理,得到标准图像;利用图像分类模型对标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于图像分类模型的模型输入通道数、逐点通道滑动卷积核的输出通道数小于图像分类模型的模型输出通道数并且小于逐点通道滑动卷积核的输入通道数。对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别。在该技术方案中,通过设置小于图像分类模型的模型输入通道数和模型输出通道数的逐点通道滑动卷积核,可以构建出具有极低时间和空间复杂度的超轻量级高效图像分类卷积神经网络,减少了深度可分离卷积中逐点卷积的参数量和计算量,平衡了网络空间特
征提取能力和通道特征融合能力,极大减少了网络的参数量和计算量。与传统深度可分离卷积神经网络相比,本技术提出的超轻量级高效卷积神经网络具有极低的时间和空间复杂度,以极少的参数量和计算量完成空间特征提取和通道特征融合,提升了图像的分类效率。
125.图4为本技术实施例提供的一种电子设备的结构图,如图4所示,电子设备包括:存储器40,用于存储计算机程序;
126.处理器41,用于执行计算机程序时实现如上述实施例图像分类方法的步骤。
127.本实施例提供的电子设备可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
128.其中,处理器41可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器41可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器41也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器41可以在集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器41还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
129.存储器40可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器40还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器40至少用于存储以下计算机程序401,其中,该计算机程序被处理器41加载并执行之后,能够实现前述任一实施例公开的图像分类方法的相关步骤。另外,存储器40所存储的资源还可以包括操作系统402和数据403等,存储方式可以是短暂存储或者永久存储。其中,操作系统402可以包括windows、unix、linux等。数据403可以包括但不限于模型输入通道数、模型输出通道数、图像类别等。
130.在一些实施例中,电子设备还可包括有显示屏42、输入输出接口43、通信接口44、电源45以及通信总线46。
131.本领域技术人员可以理解,图4中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的组件。
132.可以理解的是,如果上述实施例中的图像分类方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对目前技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本技术各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、磁碟或者光盘等各种可以存储程序代码的介质。
133.基于此,本技术实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述图像分类方法的步骤。
134.以上对本技术实施例所提供的一种图像分类方法、装置、设备和计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
135.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
136.以上对本技术所提供的一种图像分类方法、装置、设备和计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以对本技术进行若干改进和修饰,这些改进和修饰也落入本技术权利要求的保护范围内。

技术特征:
1.一种图像分类方法,其特征在于,包括:对获取的待分类图像进行预处理,得到标准图像;利用图像分类模型对所述标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于所述图像分类模型的模型输入通道数、所述逐点通道滑动卷积核的输出通道数小于所述图像分类模型的模型输出通道数并且小于所述逐点通道滑动卷积核的输入通道数;对所述输出特征图进行降维和分类处理,以确定出所述待分类图像所属的图像类别。2.根据权利要求1所述的图像分类方法,其特征在于,所述利用图像分类模型对所述标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图包括:对所述标准图像进行空间维度分析,以提取出空间特征信息;对所述空间特征信息进行批归一化处理,以得到批归一化特征信息;按照所述逐点通道滑动卷积核对所述批归一化特征信息进行滑动卷积处理,以得到融合特征信息;依据层归一化参数对所述融合特征信息进行层归一化处理,以得到层归一化特征信息;将所述层归一化特征信息转换为非线性特征信息。3.根据权利要求2所述的图像分类方法,其特征在于,所述按照所述逐点通道滑动卷积核对所述批归一化特征信息进行滑动卷积处理,以得到融合特征信息包括:将所述逐点通道滑动卷积核的输出通道数作为滑动步长;按照所述滑动步长以及所述逐点通道滑动卷积核,将所述批归一化特征信息分别在通道维度和空间维度进行滑动卷积,以得到融合特征信息。4.根据权利要求2所述的图像分类方法,其特征在于,所述将所述层归一化特征信息转换为非线性特征信息包括:将所述层归一化特征信息中取值大于零的特征值保留,将所述层归一化特征信息中取值小于零的特征值调整为零,以得到非线性特征信息。5.根据权利要求2所述的图像分类方法,其特征在于,在所述将所述层归一化特征信息转换为非线性特征信息之后还包括:每转换得到非线性特征信息,则将迭代次数加一;在当前迭代次数满足预设阈值的情况下,则执行所述对所述输出特征图进行降维和分类处理,以确定出所述待分类图像所属的图像类别的步骤;在当前迭代次数不满足预设阈值的情况下,则返回所述对所述标准图像进行空间维度分析,以提取出空间特征信息的步骤。6.根据权利要求1至5任意一项所述的图像分类方法,其特征在于,针对于所述逐点通道滑动卷积核的输入通道数和输出通道数的设置过程,所述方法还包括:将所述图像分类模型的输入通道数与选定的输入比例值的乘积作为所述逐点通道滑动卷积核的输入通道数;计算所述逐点通道滑动卷积核的输入通道数与选定的输出比例值的乘积值;在所述乘积值小于所述图像分类模型的输出通道数的情况下,将所述乘积值作为所述逐点通道滑动卷积核的输出通道数;
在所述乘积值不小于所述图像分类模型的输出通道数的情况下,将所述图像分类模型的输出通道数与选定的输出比例值的乘积值作为所述逐点通道滑动卷积核的输出通道数;其中,所述输入比例值和所述输出比例值均小于1。7.根据权利要求6所述的图像分类方法,其特征在于,还包括:预先建立不同图像类型与不同比例组之间的对应关系列表;在获取到所述待分类图像的情况下,基于所述待分类图像所属的图像类型从所述对应关系列表中查询匹配的目标比例组;其中,所述目标比例组包括输入比例值和输出比例值。8.一种图像分类装置,其特征在于,包括预处理单元、超轻量级卷积单元和确定单元;所述预处理单元,用于对获取的待分类图像进行预处理,得到标准图像;所述超轻量级卷积单元,用于利用图像分类模型对所述标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;其中,逐点通道滑动卷积核的输入通道数小于所述图像分类模型的模型输入通道数、所述逐点通道滑动卷积核的输出通道数小于所述图像分类模型的模型输出通道数并且小于所述逐点通道滑动卷积核的输入通道数;所述确定单元,用于对所述输出特征图进行降维和分类处理,以确定出所述待分类图像所属的图像类别。9.一种电子设备,其特征在于,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序以实现如权利要求1至7任意一项所述图像分类方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述图像分类方法的步骤。

技术总结
本申请涉及计算机视觉技术领域,公开了一种图像分类方法、装置、设备和计算机可读存储介质,对获取的待分类图像进行预处理,得到标准图像;利用图像分类模型对标准图像进行逐深度卷积和逐点通道滑动卷积处理,以得到输出特征图;逐点通道滑动卷积核的输入通道数小于图像分类模型的模型输入通道数、逐点通道滑动卷积核的输出通道数小于图像分类模型的模型输出通道数并且小于逐点通道滑动卷积核的输入通道数。对输出特征图进行降维和分类处理,以确定出待分类图像所属的图像类别。通过设置小于模型输入通道数和模型输出通道数的逐点通道滑动卷积核,可以构建出具有极低时间和空间复杂度的超轻量级高效图像分类卷积神经网络,提升了图像的分类效率。提升了图像的分类效率。提升了图像的分类效率。


技术研发人员:李国庆 李拓 邹晓峰 王长红 李南君 席鑫
受保护的技术使用者:山东云海国创云计算装备产业创新中心有限公司
技术研发日:2023.06.09
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐