基于深度卷积融合多尺度图像特征的矿物分类方法

未命名 07-15 阅读:134 评论:0


1.本发明涉及机器学习领域,更具体的说,它涉及一种基于深度卷积融合多尺度图像特征的矿物分类方法。


背景技术:

2.在矿物的开采加工过程中,及时对矿物进行分类能够有效提升后续配矿和选矿的效率。目前针对矿物的分类通常会采用硫碳分析仪测定和高频红外法测定等方式,但是这类方式由于前处理较为复杂和相关测定装置不适于复杂的矿物开采环境等原因,在实际作业时会出现不能及时测定矿物类型的情况,进而延缓整个流程的进度。


技术实现要素:

3.本发明提供一种基于深度卷积融合多尺度图像特征的矿物分类方法,通过结合深度学习对矿物进行分类,只需获取矿物的图片,极大地提升了矿物分类的效率;通过空间注意力机制层和深度卷积层对矿物特征进行提取,融合矿物图像的空间特征和通道特征等多尺度特征,从而在通道维度和空间维度两方面描述石墨矿石图像的纹理信息,逐步捕获空间和通道间的相关性,引导网络关注目标区域,更加全面地捕获石墨矿石图像的纹理特征,提升石墨矿石图像的识别准确率。
4.基于深度卷积融合多尺度图像特征的矿物分类方法,包括:s1:获取石墨矿图像;s2:对石墨矿图像进行预处理;s3:将待分类图像送入训练好的深度卷积分类模型中进行分类,输出矿物类型,矿物类型包括低品位矿物、较低品位矿物、较高品位矿物和高品位矿物,矿物类型以矿物内有用组分的含量进行划分;其中深度卷积分类模型基于resnet50建立,记为convnext-g,包括前处理块、第一深度卷积块、第二深度卷积块、第三深度卷积块、第四深度卷积块、空间下采样块、全局平均池化块和分类层,其中空间下采样块有三个,分别位于第一深度卷积块和第二深度卷积块之间、第二深度卷积块和第三深度卷积块之间与第三深度卷积块和第四深度卷积块之间;前处理块、第一深度卷积块、第二深度卷积块、第三深度卷积块、第四深度卷积块、空间下采样块和全局平均池化块共同完成对待分类图像的特征提取,并输出石墨矿特征图;分类块内置softmax算法,用于根据石墨矿特征图输出矿物类型。
5.进一步地,前处理块由一个卷积层和一个第一ln层组成,卷积层中卷积核大小为“4
×
4”,步长为4。
6.进一步地,第一深度卷积块、第二深度卷积块、第三深度卷积块和第四深度卷积块分别包括3、3、9和3个瓶颈前置深度卷积块,瓶颈前置深度卷积块包括深度卷积层、第二ln层、升维卷积层、gelu层、grn层、降维卷积层、layer-scale层和drop-path层,其中深度卷积层中采用分组卷积方法,卷积核大小为“7
×
7”,卷积核与输入特征图的通道数一致,其中输
入特征图为进行分类计算时输入至深度卷积层的特征图,步长为1,填充为3,在进行卷积操作时,对输入特征图的每一个通道应用一个单独的卷积核,深度卷积层不改变特征图的尺寸,将经过深度卷积层处理后输出的特征图记为第一特征图;第二ln层与前处理块中第一ln层一致,将经过第二ln层处理后输出的特征图记为第二特征图;升维卷积层的卷积核大小为“1
×
1”,卷积核个数为输入特征图通道数的四倍,步长为1,将经过升维卷积层处理后输出的特征图记为第三特征图;gelu层内置gelu激活函数,grn层中grn指全局响应归一化,对第三特征图的特征信息进行标准化,grn层将经过gelu层和grn层处理后的特征图记为第四特征图;降维卷积层的卷积核大小为“1
×
1”,卷积核个数与输入特征图通道数一致,步长为1,降维卷积层实现对第四特征图的降维;升维卷积层和降维卷积层都采用全连接的方式;layer-scale层和drop-path层都是正则化手段。
7.进一步地,空间下采样块包括空间注意力机制层、第三ln层和下采样卷积层,其中空间注意力机制层将输入至空间下采样块的特征图从通道方向进行全局最大池化和全局平均池化分别得到两个特征图,再将得到的两个特征图进行拼接,将拼接得到的特征图进行卷积操作,再经过sigmoid函数进行激活得到注意力权重矩阵,注意力权重矩阵中每个元素对应输入至空间下采样块的特征图中的一个像素点坐标,将权重矩阵与输入至空间下采样块的特征图进行点乘,得到第五特征图;第三ln层与前处理块中第一ln层一致,将经过第三ln层处理后输出的特征图记为第六特征图;下采样卷积层的卷积核大小为“2
×
2”,卷积核个数与第六特征图的通道数一致,步长为2,下采样卷积层将第六特征图的大小缩小至1/4。
8.进一步地,全局平均池化块包括全局平均池化层、第四ln层和linear层,其中第四ln层前处理块中第一ln层一致,linear层为线性全连接层。
9.进一步地,针对深度卷积分类模型的训练包括如下步骤:获取石墨矿样本图像集,测定石墨矿样本图像对应石墨矿石中固定碳含量,并对对应的石墨矿样本图像进行标注,构建石墨矿样本数据集;将石墨矿样本数据集按照6:2:2划分为石墨矿样本训练集、石墨矿样本验证集和石墨矿样本测试集;选择设定好超参数的深度卷积分类模型,将设定好超参数的深度卷积分类模型内部的模型参数进行初始化;通过石墨矿样本训练集对模型参数初始化后的深度卷积分类模型进行训练,并计算交叉熵损失函数值,若是交叉熵损失函数值在预设范围内,输出训练好的深度卷积分类模型;若是交叉熵损失函数值不在预设范围内,继续对模型参数初始化后的深度卷积分类模型进行训练。
10.进一步地,将设定好超参数的深度卷积分类模型内部的模型参数进行初始化具体包括如下步骤:通过大规模数据集imagenet对未初始化的深度卷积分类模型进行训练,对未初始化的深度卷积分类模型中的模型参数进行初始化。
11.进一步地,将深度卷积分类模型内作为超参数的学习率进行动态调整,具体包括如下步骤:以余弦退火作为学习率衰减策略对学习率进行调整。
12.进一步地,预处理包括图像滤波和图像伸缩。
13.本发明具有以下优点:1、本发明通过结合深度学习对矿物进行分类,只需获取矿物的图片,极大地提升了矿物分类的效率。
14.2、本发明采用的瓶颈前置深度卷积块通过将较大的卷积核进行前置,即瓶颈前
置,在特征提取阶段的初期更关注矿石图像的长远距离依赖关系,从而能够更快的提取到矿石对应的特征信息,同时使得较大卷积核的卷积操作在一个较低尺度下进行,能够显著提升运算速度;通过升维卷积层和降维卷积层实现不同维度特征空间转换,并且避免直接压缩维度造成的信息损失;升维卷积层和降维卷积层都采用全连接的方式,能够进一步提升运算速率。
15.3、本发明通过空间注意力机制层,对特征图中不同空间位置进行不同的加权,使得深度卷积分类模型能够更好地结合空间特征信息,突出矿物图像中纹理的位置信息,从而提升深度卷积分类模型对矿物分类的准确率。
16.4、本发明通过空间注意力机制层和深度卷积层对矿物特征进行提取,融合矿物图像的空间特征和通道特征等多尺度特征,从而在通道维度和空间维度两方面描述石墨矿石图像的纹理信息,逐步捕获空间和通道间的相关性,引导网络关注目标区域,更加全面地捕获石墨矿石图像的纹理特征,提升石墨矿石图像的识别准确率。
附图说明
17.图1为本发明实施例采用的基于深度卷积融合多尺度图像特征的矿物分类方法的流程示意图。
18.图2为本发明实施例采用的深度卷积分类模型的结构示意图。
19.图3为本发明实施例采用的前处理块的结构示意图。
20.图4为本发明实施例采用的瓶颈前置深度卷积块的结构示意图。
21.图5为本发明实施例采用的空间下采样块的结构示意图。
22.图6为本发明实施例采用的全局平均池化块的结构示意图。
23.图7为本发明对比例中准确率分析对比的结果示意图。
24.图8为本发明对比例中神经网络训练过程中的损失值对比的结果示意图。
25.图9为本发明对比例中神经网络在训练过程中的混淆矩阵对比的结果示意图。
具体实施方式
26.本发明针对矿物的分类采用基于机器学习的方法,由于考虑到石墨矿具备良好的颜色特征和纹理特征,为了使本技术领域的人员更好地理解本发明中的技术方案,下面将针对石墨矿的分类任务,并结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
实施例1
27.基于深度卷积融合多尺度图像特征的矿物分类方法,参见图1,包括:s1:获取石墨矿图像,此石墨矿图像为工作人员在石墨矿开采实地处拍摄的石墨矿图像,拍摄设备可以为手持式的,固定式的等。
28.s2:对石墨矿图像进行预处理,预处理操作包括图像滤波和图像伸缩,将经过预处理的石墨矿图像记为待分类图像,其中图像滤波采用中值滤波算法,图像伸缩用于调整石墨矿图像的尺寸大小,使得待分类的石墨矿图像统一尺寸,一般为224*224。
29.s3:将待分类图像送入训练好的深度卷积分类模型中进行分类,输出矿物类型,矿
物类型包括低品位矿物、较低品位矿物、较高品位矿物和高品位矿物,矿物类型以矿物内有用组分的含量进行划分,例如针对石墨矿的固定碳含量进行分类,包含1%-5%固定碳含量的为低品位矿物,包含6%-10%固定碳含量的为较低品位矿物,包含11%-15%固定碳含量的为较高品位矿物,包含16%-20%固定碳含量的为高品位矿物。
30.参见图2,其中深度卷积分类模型基于resnet50建立,记为convnext-g,包括前处理块、第一深度卷积块、第二深度卷积块、第三深度卷积块、第四深度卷积块、空间下采样块、全局平均池化块和分类层,其中空间下采样块有三个,分别位于第一深度卷积块和第二深度卷积块之间、第二深度卷积块和第三深度卷积块之间与第三深度卷积块和第四深度卷积块之间;前处理块、第一深度卷积块、第二深度卷积块、第三深度卷积块、第四深度卷积块、空间下采样块和全局平均池化块共同完成对待分类图像的特征提取,并输出石墨矿特征图;分类块内置softmax算法,用于根据石墨矿特征图输出矿物类型。
31.本发明通过结合深度学习对矿物进行分类,只需获取矿物的图片,极大地提升了矿物分类的效率。
32.如图3所示,前处理块由一个卷积层和一个第一ln层组成,其中ln指层归一化,卷积层中卷积核大小为“4
×
4”,卷积核个数为96,步长为4;由于自然环境下会存在冗余信息,因此需要对输入的待分类图像进行降采样,而前处理块便是实现对待分类图像的降采样;前处理块中的卷积层采用“4
×
4”的卷积核,在尽可能保留待分类图像的信息的同时降低了计算量,并且控制步长为4,在进行卷积操作时,滑动窗口不会相交,每次卷积都是处理待分类图像的一个碎片(参考视觉transformer),能够更好的提取局部的图像特征,从而提升深度卷积分类模型的分类准确率;ln层采用线性归一化,用于避免待分类图像经过卷积后特征边缘化的问题,采用ln层能够有效缓解特征崩溃问题,并且保留石墨矿特征的多样性。
33.第一深度卷积块、第二深度卷积块、第三深度卷积块和第四深度卷积块分别包括3、3、9和3个瓶颈前置深度卷积块,参见图4,瓶颈前置深度卷积块包括深度卷积层、第二ln层、升维卷积层、gelu层、grn层、降维卷积层、layer-scale层和drop-path层,其中深度卷积层中采用分组卷积方法,卷积核大小为“7
×
7”,卷积核与输入特征图的通道数一致,其中输入特征图为进行分类计算时输入至深度卷积层的特征图,步长为1,填充为3,在进行卷积操作时,对输入特征图的每一个通道应用一个单独的卷积核,深度卷积层不改变特征图的尺寸,并且相较于例如cnn和resnet50等神经网络内的卷积操作能够显著降低计算量,提升计算速度,同时提取空间上下文的依赖关系,将经过深度卷积层处理后输出的特征图记为第一特征图;第二ln层与前处理块中第一ln层一致,将经过第二ln层处理后输出的特征图记为第二特征图;升维卷积层的卷积核大小为“1
×
1”,卷积核个数为输入特征图通道数的四倍,步长为1,升维卷积层实现对第二特征图的升维,同时将深度卷积层中各通道提取的特征进行线性组合,将经过升维卷积层处理后输出的特征图记为第三特征图;同时考虑到第三特征图相较于第二特征图的尺度发生了变化,为了稳定整个瓶颈前置深度卷积块,便设置gelu层和grn层,其中gelu层内置gelu激活函数,用于实现对特征信息的非线性变换,grn层中grn指全局响应归一化,对第三特征图的特征信息进行标准化,grn层将经过gelu层和grn层处理后的特征图记为第四特征图;降维卷积层的卷积核大小为“1
×
1”,卷积核个数与输入特征图通道数一致,步长为1,降维卷积层实现对第四特征图的降维;升维卷积层和降维卷积层都采用全连接的方式;layer-scale层和drop-path层都是正则化手段,用于对维
度变化后的第四特征图中的特征信息进行标准化,避免特征信息崩溃,其中layer-scale层是将第四特征图乘以一个向量,向量中的每一个元素对应一个通道,即实现对每个通道中特征信息的缩放,drop-path层将正在经过layer-scale层的第四特征图中随机通道内的特征信息赋值为0,在提升运算速度的同时避免过拟合。
34.本发明采用的瓶颈前置深度卷积块通过将较大的卷积核进行前置,即瓶颈前置,在特征提取阶段的初期更关注矿石图像的长远距离依赖关系,从而能够更快的提取到矿石对应的特征信息,同时使得较大卷积核的卷积操作在一个较低尺度下进行,能够显著提升运算速度;通过升维卷积层和降维卷积层实现不同维度特征空间转换,并且避免直接压缩维度造成的信息损失;升维卷积层和降维卷积层都采用全连接的方式,能够进一步提升运算速率。
35.如图5所示,空间下采样块包括空间注意力机制层(sam)、第三ln层和下采样卷积层,其中空间注意力机制层将输入至空间下采样块的特征图从通道方向进行全局最大池化和全局平均池化分别得到两个特征图,再将得到的两个特征图进行拼接,将拼接得到的特征图进行卷积操作,再经过sigmoid函数进行激活得到注意力权重矩阵,注意力权重矩阵中每个元素对应输入至空间下采样块的特征图中的一个像素点坐标,将权重矩阵与输入至空间下采样块的特征图进行点乘,得到第五特征图;第三ln层与前处理块中第一ln层一致,将经过第三ln层处理后输出的特征图记为第六特征图;下采样卷积层的卷积核大小为“2
×
2”,卷积核个数与第六特征图的通道数一致,步长为2,下采样卷积层将第六特征图的大小缩小至1/4,即长和宽各缩减至1/2。参见表一,表一是不同神经网络的网络参数,convnext-g的模型计算量(flops)与模型参数量(params)和swintransformer、resnet-50的相差不大。
[0036][0037]
表一.swintransformer、resnet-50及convnext-g网络参数本发明通过空间注意力机制层,对特征图中不同空间位置进行不同的加权,使得深度卷积分类模型能够更好地结合空间特征信息,突出矿物图像中纹理的位置信息,从而提升深度卷积分类模型对矿物分类的准确率。
[0038]
如图6所示,全局平均池化块包括全局平均池化层、第四ln层和linear层,其中第四ln层前处理块中第一ln层一致,linear层为线性全连接层。
[0039]
综上所述,本发明通过空间注意力机制层和深度卷积层对矿物特征进行提取,融合矿物图像的空间特征和通道特征等多尺度特征,从而在通道维度和空间维度两方面描述石墨矿石图像的纹理信息,逐步捕获空间和通道间的相关性,引导网络关注目标区域,更加全面地捕获石墨矿石图像的纹理特征,提升石墨矿石图像的识别准确率。
[0040]
针对深度卷积分类模型的训练包括如下步骤:获取石墨矿样本图像集,石墨矿样本图像集中的石墨矿样本图像经由专业工作人员采集,通过碳硫分析仪测定石墨矿样本图像对应石墨矿石中固定碳含量,并对对应的石墨矿样本图像进行标注,构建石墨矿样本数据集;将石墨矿样本数据集按照6:2:2划分为石墨矿样本训练集、石墨矿样本验证集和石墨
矿样本测试集;选择设定好超参数的深度卷积分类模型,本实施例中设定的超参数包括:初始学习率设置为5e-5
,batchsize为512,即每轮次选用512副图像提取训练,轮次(epoch)的最大值设定为200,将设定好超参数的深度卷积分类模型内部的模型参数进行初始化;通过石墨矿样本训练集对模型参数初始化后的深度卷积分类模型进行训练,并计算交叉熵损失函数值,若是交叉熵损失函数值在预设范围内,说明深度卷积分类模型的分类准确率在可接受范围内,具备良好的分类效果,输出训练好的深度卷积分类模型;若是交叉熵损失函数值不在预设范围内,说明深度卷积分类模型的分类效果较差,继续对模型参数初始化后的深度卷积分类模型进行训练。
[0041]
将设定好超参数的深度卷积分类模型内部的模型参数进行初始化具体包括如下步骤:通过大规模数据集imagenet对未初始化的深度卷积分类模型进行训练,对未初始化的深度卷积分类模型中的模型参数进行初始化;由于石墨矿石图像分类任务的公开数据量较少,为了避免深度卷积分类模型的训练过程中过拟合,便预先在imagenet上训练好参数用以初始化主干网络,不仅能完成模型参数的优化,又减少了训练数据不足的负面影响。
[0042]
将深度卷积分类模型内作为超参数的学习率进行动态调整,具体包括如下步骤:以余弦退火作为学习率衰减策略对学习率进行调整,使用学习率衰减的原因是,当逐渐逼近损失函数的全局最小值时,学习率应当能变得更小以使得模型尽可能地接近这一点,因此需要对学习率进行衰减。余弦退火训练方法的特点是,随着训练轮次的增加,余弦函数值先缓慢下降,然后加速下降,再减速下降,因此选用余弦退火来降低学习率。
[0043]
为了评估深度卷积分类模型中相较于同类分类算法的表现,现选择基于残差连接网络resnet系列的resnet-50、resnet-101、resnet-152,复合模型缩放卷积网络(efficientnet)系列的efficientnet-b0、efficientnet-b2和视觉转换器(vision transformer)系列的vit-s、vit-b、vit-l与深度卷积分类模型(convnext-g)进行对比,主要指标为:混淆矩阵(confusion matrix)、宏查准率(macro-p)、宏查全率(macro-r)、宏f1(macro-f1)和准确率(accuracy),具体内容如下:在模型训练阶段,为保证比较的客观公正,进行不同卷积神经网络实验时,选取同样的超参数设置。
[0044]
参见表二,表二是不同卷积神经网络的评价指标定量分析对比结果,convnext-g的准确率为93.401%、宏查准率93.317%、宏查全率92.856%、宏f1为93.086%;与resnet-50相比有显著提升,稍高于visiontransformer的各项参数;efficientnet-b3的准确率为92.718%、宏查准率92.261%、宏查全率92.488%、宏f1为92.802%与convnext-g的模型评估效果相当。
[0045][0046]
表二.不同卷积神经网络的评价指标定量分析对比结果参见图7,a为resnet-101的准确率对比图,b为efficientnet-b3的准确率对比图,c为vision transformer的准确率对比图,d为convnext-g的准确率对比图,随着神经网络学习轮次的增加,resnet系列中resnet-101的准确率在180轮次左右收敛,收敛后准确率在88%上下波动;vision transformer在有迁移学习的辅助下,能够在60轮次完成收敛,且准确率维持在88.6%左右;以高效著称的efficientnet系列的efficientnet-b3在大的计算复杂度和资源占用情况下收敛轮次为120,最终准确率在92.8%上下波动;而convnext-g的收敛轮次为160轮位于resnet-101及visiontransformer之间,准确率维持在93.4%上下波动。说明这4种模型在基于石墨矿石图像多分类识别上的性能相似。
[0047]
参见图8,a为resnet-101在训练过程中的损失值示意图,b为efficientnet-b3在训练过程中的损失值示意图,c为vision transformer在训练过程中的损失值示意图,d为convnext-g在训练过程中的损失值示意图,视觉转换器(visiontransformer)在前50轮的训练中,损失值的收敛速度明显慢于基于残差连接构建的神经网络模型,损失值在0.7与1.5之间波动,在60轮训练后,损失值逐渐收敛,在1.25上下波动;相比之下,resnet-101的损失值收敛速度较快,前50轮训练后,损失值已趋于收敛,60轮时损失值在0.8左右波动,但在80轮、120轮及160轮附近有较大波动,最终收敛到0.8附近;convnext-g是基于resnet-50,融合vision transformer思想改进的模型,训练过程中,损失值从2.5开始逐步减少,得益于刚好的初始化,损失值在前45轮时已趋于平稳,逐步收敛于0.7附近;efficientnet-b3在训练过程中,损失值从3.5逐渐减小,第40轮下降到1.0,第120轮训练下降到0.6并在附近收敛。比较分析可得,convnext-g的收敛速度明显优于visiontransformer及层数较多的efficientnet-b3,且与基于残差连接的resnet-101的速度相当。
[0048]
参见图9,a为resnet-101在训练过程中的混淆矩阵对比图,b为efficientnet-b3在训练过程中的混淆矩阵对比图,c为vision transformer在训练过程中的混淆矩阵对比图,d为convnext-g在训练过程中的混淆矩阵对比图,当实际品位区间分布在6%-10、11%-15%中时,基于注意力改进的卷积神经网络模型对矿石图像的识别准确率较高,通过将空间信息和图像特征融合,达到对石墨矿石图像的特征能有效的进行提取和分类识别;同时得益于全局相应归一化层(grn)的引入,改进神经网络模型在混淆矩阵性能评估中,具有误差相邻性,即在少数分类识别有误的样本中,多为相邻品位,由于本性质,可以降低因识别误
差而造成的资源浪费。
[0049]
特别地,本矿物检测方法可以延伸至其他矿物的分类识别任务中。
[0050]
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。本说明书中未作详细描述的部分属于本领域专业技术人员公知的现有技术。

技术特征:
1.基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,包括:s1:获取石墨矿图像;s2:对石墨矿图像进行预处理;s3:将待分类图像送入训练好的深度卷积分类模型中进行分类,输出矿物类型,矿物类型包括低品位矿物、较低品位矿物、较高品位矿物和高品位矿物,矿物类型以矿物内有用组分的含量进行划分;其中深度卷积分类模型基于resnet50建立,记为convnext-g,包括前处理块、第一深度卷积块、第二深度卷积块、第三深度卷积块、第四深度卷积块、空间下采样块、全局平均池化块和分类层,其中空间下采样块有三个,分别位于第一深度卷积块和第二深度卷积块之间、第二深度卷积块和第三深度卷积块之间与第三深度卷积块和第四深度卷积块之间;前处理块、第一深度卷积块、第二深度卷积块、第三深度卷积块、第四深度卷积块、空间下采样块和全局平均池化块共同完成对待分类图像的特征提取,并输出石墨矿特征图;分类块内置softmax算法,用于根据石墨矿特征图输出矿物类型。2.根据权利要求1所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,前处理块由一个卷积层和一个第一ln层组成,卷积层中卷积核大小为“4
×
4”,步长为4。3.根据权利要求2所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,第一深度卷积块、第二深度卷积块、第三深度卷积块和第四深度卷积块分别包括3、3、9和3个瓶颈前置深度卷积块,瓶颈前置深度卷积块包括深度卷积层、第二ln层、升维卷积层、gelu层、grn层、降维卷积层、layer-scale层和drop-path层,其中深度卷积层中采用分组卷积方法,卷积核大小为“7
×
7”,卷积核与输入特征图的通道数一致,其中输入特征图为进行分类计算时输入至深度卷积层的特征图,步长为1,填充为3,在进行卷积操作时,对输入特征图的每一个通道应用一个单独的卷积核,深度卷积层不改变特征图的尺寸,将经过深度卷积层处理后输出的特征图记为第一特征图;第二ln层与前处理块中第一ln层一致,将经过第二ln层处理后输出的特征图记为第二特征图;升维卷积层的卷积核大小为“1
×
1”,卷积核个数为输入特征图通道数的四倍,步长为1,将经过升维卷积层处理后输出的特征图记为第三特征图;gelu层内置gelu激活函数,grn层中grn指全局响应归一化,对第三特征图的特征信息进行标准化,grn层将经过gelu层和grn层处理后的特征图记为第四特征图;降维卷积层的卷积核大小为“1
×
1”,卷积核个数与输入特征图通道数一致,步长为1,降维卷积层实现对第四特征图的降维;升维卷积层和降维卷积层都采用全连接的方式;layer-scale层和drop-path层都是正则化手段。4.根据权利要求3所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,空间下采样块包括空间注意力机制层、第三ln层和下采样卷积层,其中空间注意力机制层将输入至空间下采样块的特征图从通道方向进行全局最大池化和全局平均池化分别得到两个特征图,再将得到的两个特征图进行拼接,将拼接得到的特征图进行卷积操作,再经过sigmoid函数进行激活得到注意力权重矩阵,注意力权重矩阵中每个元素对应输入至空间下采样块的特征图中的一个像素点坐标,将权重矩阵与输入至空间下采样块的特征图进行点乘,得到第五特征图;第三ln层与前处理块中第一ln层一致,将经过第三ln层处理后输出的特征图记为第六特征图;下采样卷积层的卷积核大小为“2
×
2”,卷积核个数与第六
特征图的通道数一致,步长为2,下采样卷积层将第六特征图的大小缩小至1/4。5.根据权利要求4所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,全局平均池化块包括全局平均池化层、第四ln层和linear层,其中第四ln层前处理块中第一ln层一致,linear层为线性全连接层。6.根据权利要求5所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,针对深度卷积分类模型的训练包括如下步骤:获取石墨矿样本图像集,测定石墨矿样本图像对应石墨矿石中固定碳含量,并对对应的石墨矿样本图像进行标注,构建石墨矿样本数据集;将石墨矿样本数据集按照6:2:2划分为石墨矿样本训练集、石墨矿样本验证集和石墨矿样本测试集;选择设定好超参数的深度卷积分类模型,将设定好超参数的深度卷积分类模型内部的模型参数进行初始化;通过石墨矿样本训练集对模型参数初始化后的深度卷积分类模型进行训练,并计算交叉熵损失函数值,若是交叉熵损失函数值在预设范围内,输出训练好的深度卷积分类模型;若是交叉熵损失函数值不在预设范围内,继续对模型参数初始化后的深度卷积分类模型进行训练。7.根据权利要求6所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,将设定好超参数的深度卷积分类模型内部的模型参数进行初始化具体包括如下步骤:通过大规模数据集imagenet对未初始化的深度卷积分类模型进行训练,对未初始化的深度卷积分类模型中的模型参数进行初始化。8.根据权利要求7所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,将深度卷积分类模型内作为超参数的学习率进行动态调整,具体包括如下步骤:以余弦退火作为学习率衰减策略对学习率进行调整。9.根据权利要求8所述的基于深度卷积融合多尺度图像特征的矿物分类方法,其特征在于,预处理包括图像滤波和图像伸缩。

技术总结
本发明涉及机器学习领域,更具体的说,它涉及一种基于深度卷积融合多尺度图像特征的矿物分类方法。基于深度卷积融合多尺度图像特征的矿物分类方法,包括:S1,获取石墨矿图像;S2,对石墨矿图像进行预处理;S3,将待分类图像送入训练好的深度卷积分类模型中进行分类,输出矿物类型。本发明通过空间注意力机制层和深度卷积层对矿物特征进行提取,融合矿物图像的空间特征和通道特征等多尺度特征,从而在通道维度和空间维度两方面描述石墨矿石图像的纹理信息,逐步捕获空间和通道间的相关性,引导网络关注目标区域,更加全面地捕获石墨矿石图像的纹理特征,提升石墨矿石图像的识别准确率。率。率。


技术研发人员:刘耀坤 黄学雨 常绍鹏
受保护的技术使用者:江西理工大学南昌校区
技术研发日:2023.06.06
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐