基于可见光影像和改进随机森林算法的农田杂草识别方法与流程

未命名 07-22 阅读:280 评论:0


1.本发明涉及图像处理技术领域,特别是一种基于可见光影像和改进随机森林算法的农田杂草识别方法。


背景技术:

2.水稻是世界上食用人数最多、历史最悠久的农作物。在水稻的生长过程中,田中的杂草被视为最主要的影响因素之一。杂草因其生长速度快,易于传播,易集中大规模爆发等特点,易与水稻苗争夺养分、水分以及生长空间等生长资源,从而导致水稻生长慢,抽穗少等现象。因此在杂草的生长过程中必须加以人为控制。当前,主要的除草方式是人工大面积喷洒化学药物,该方式往往没有针对性且工作效率很低,同时不仅对生态环境造成极大的破坏也会影响农民的身体健康。因此,采取智能设备对农田进行自动化精准管理具有很重要的意义。
3.近年来,随着无人机遥感以及计算机技术的迅速发展,利用图像处理技术对杂草进行识别成为了一个重要的方向。此外,随着机器学习在各个专业领域大方异彩,利用计算机技术分析图象中的光谱、指数、纹理、几何等特征结合随机森林等机器学习算法对杂草进行识别检测受到了众多专业人士的青睐。但是,如何进一步优化分割效果、特征集以及随机森林算法提高识别精度仍旧是当前值得关注的问题。


技术实现要素:

4.为解决现有技术中存在的问题,本发明的目的是提供一种基于可见光影像和改进随机森林算法的农田杂草识别方法,本发明通过优化分割效果、特征集以及随机森林算法提高识别精度,实现农田中杂草的高精度识别。
5.为实现上述目的,本发明采用的技术方案是:一种基于可见光影像和改进随机森林算法的农田杂草识别方法,包括以下步骤:
6.s1、在农田区域内,通过使用搭载可见光波段相机的无人机获取农田的可见光影像集,对获取的所述可见光影像集进行预处理,得到该农田区域的可见光数字正射影像;
7.s2、通过gis平台对所获取的可见光数字正射影像进行初分割,以获取最佳分割尺度,最后依据最佳分割尺度对所述可见光数字正射影像进行分割;
8.s3、利用gis平台提取可见光数字正射影像中各个分割对象的特征参数;
9.s4、综合利用递归特征消除方法和交叉验证对步骤s3中得到的特征参数进行降维处理,得到最优特征集合;
10.s5、根据步骤s4中获取的最优特征集合对随机森林模型进行初训练,以获取随机森林算法中最佳树数量参数;
11.s6、根据步骤s4中最优特征集合和步骤s5中最佳树数量参数建立随机森林分类模型,通过该模型对农田区域内的杂草进行识别提取。
12.作为本发明的进一步改进,在步骤s1中,通过无人机保持规定的航向重叠度和旁
向重叠度获取农田的可见光影像集;所述的预处理包括:根据无人机所获取的可见光影像集,通过空中三角测量生成原始影像的点云模型并输出可见光数字正射影像。
13.作为本发明的进一步改进,在步骤s4中,所述递归特征消除方法用于给出原始特征集中各个特征对提取杂草的重要性评级,所述交叉验证用于计算不同数量特征的集和的精度;其中,所述的递归特征消除方法具体包括:
14.(1)对当前n个特征参数作为特征初始子集{f1,f2,f3,
…fn
},并对随机森林模型进行训练,并计算当前每个特征参数的重要性f={f1,f2,f3,
…fn
};
15.(2)对当前特征参数的重要性f进行排序,并去除重要性最小fk对应的特征fk,构建新的特征子集{fi,

,f
k-1
,f
k+1
,
…fj
};
16.(3)重复步骤(1)和步骤(2)直到完成所有特征参数的重要性评级;
17.所述的交叉验证具体包括:
18.根据递归特征消除方法确定的特征参数的重要性,依次选择i个特征(i=1,2,3,

,n),对该i个特征进行交叉验证,确定该特征集的平均分,选择平均分最高的特征数量,完成特征选择,具体如下:
[0019][0020]
式中,k表示将i个特征集平均划分为k个大小相等的样本子集;e
ji
表示在i个特征集划分为k个大小相等的样本子集下,利用第j个样本子集对随机森林模型进行测试的得分;ga表示最高的平均得分,a表示精度所对应的特征数量。
[0021]
作为本发明的进一步改进,步骤s3中的特征参数包括:光谱特征、指数特征、纹理特征和几何特征;其中,所述光谱特征包括红、绿、蓝三个波段的均值、标准差、不同波段的最大差异值以及亮度值;所述指数特征包括差异增强植被指数、过绿指数、过绿减过红指数、过红指数、绿蓝比值指数、绿度植被指数、改进型绿红植被指数、归一化绿蓝差异指数、归一化绿红差异指数、红绿蓝植被指数、红绿比值指数、可见光波段差异植被指数;所述纹理特征包括均值、标准差、熵、均质性、相异性、对比度、相关性、角二阶矩;所述几何特征包括面积、长度、长宽比、宽度、边界长、像素数、体积、不对称性、边界指数、紧致度、密度、椭圆拟合、形状指数、圆度、矩形拟合。
[0022]
作为本发明的进一步改进,在步骤s4中,综合利用递归特征消除方法和交叉验证对步骤s3中得到的特征参数进行降维处理后的特征参数包括:改进型绿红植被指数、红绿比值指数、归一化绿红差异指数、过红指数、过绿减过红指数、差异增强植被指数、绿度植被指数、可见光波段差异植被指数、红绿蓝植被指数、角二阶矩、熵、相异性、面积、像素数、体积、边界长、不同波段的最大差异值。
[0023]
作为本发明的进一步改进,步骤5具体如下:
[0024]
根据最优特征集合对随机森林模型中树数量参数1到m分别进行循环训练,并利用交叉验证给出每一次训练的平均得分,平均得分最高所对应的树数量为随机森林模型在该特征集合下的最佳树数量参数,具体可由以下公式表示:
[0025][0026]
式中,k表示对特征集合均匀的折叠分为k份;acc[ri(x\dj),(y\dj)]表示将有i个树的随机森林应用到去掉第j个折叠的数据集x\dj上,得到预测结果的精度;hc表示最高的平均精度,c表示该精度所对应的树数量,即为最佳树数量。
[0027]
作为本发明的进一步改进,还包括对步骤6中建立的随机森林分类模型进行结果分析与精度评价,并采取总体精度oa、kappa系数作为精度评价指标,具体如下:
[0028][0029][0030]
式中,p
ii
表示被正确分类的样本数量,p
+i
表示第i类的真实样本数量,p
i+
表示预测为第i类的样本数量,p表示总样本数量,k表示总类别数量。
[0031]
本发明的有益效果是:
[0032]
1、本发明中,综合递归特征消除和交叉验证的特征降维方法能有效地对原始数据降维,提高杂草的识别精度。
[0033]
2、本发明通过对随机森林算法中树参数的优化能有效提高随机森林模型对杂草的提取效果。
附图说明
[0034]
图1是本发明实施例中杂草识别方法的流程图;
[0035]
图2是本发明实施例中局部方差和局部方差变化率随尺度的变化图;
[0036]
图3是本发明实施例中分类精度与特征数量关系图;
[0037]
图4是本发明实施例中优选特征重要性图;
[0038]
图5是本发明实施例中分类精度与树数量关系图;
[0039]
图6是本发明实施例中基于随机森林算法的不同特征集分类结果图;
[0040]
图7是本发明实施例中基于不同树数量的随机森林算法分类结果图。
具体实施方式
[0041]
下面结合附图对本发明的实施例进行详细说明。
[0042]
实施例
[0043]
如图1所示,一种基于可见光影像和改进随机森林算法的农田杂草识别方法,包括如下步骤:
[0044]
步骤s1、获取农田试验区正射影像,即在农田区域,通过搭载可见光相机的无人机获取农田数据集,在无人机飞行高度为10m,飞行速度为5m/s,航向重叠度和旁向重叠度均为80%的飞行状态下,采取垂直摄影的方式,获取可见光影像共计515幅。将所获得的影像
通过影像拼接平台进行矫正、拼接等操作,通过空中三角测量生成原始影像的点云模型并输出农田实验区的数字正射影像。
[0045]
步骤s2、依据最佳分割尺度进行影像分割,即将农田正射影像输入gis平台中,通过计算局部方差(lv)和局部方差变化率(roc)来评价基于不同分割尺度下分割区域内像素的均质性,局部方差(lv)和局部方差变化率(roc)随不同尺度的变化趋势如图2所示。备选多个均质性较高的所对应的分割尺度,即当局部方差变化率出现峰值时,该点对应的尺度可作为备选尺度;根据备选分割尺度进行影像分割,对分割结果进行人工判读,选择分割效果最优的分割尺度。本实施例的备选尺度有28,48,61,81,96,107和118;本实施例的最佳尺度为61。评价分割区域内像素均质性公式如下所示:
[0046][0047]
式中:lv-1为下一层分割结果的均值lv。
[0048]
步骤s3、提取特征参数,即利用gis平台提取影像中各个分割对象的光谱特征、指数特征、纹理特征、几何特征等特征参数。本实验在该步骤中所提取的具体特征包括:光谱特征有红、绿、蓝三个波段的均值、标准差、不同波段的最大差异值以及亮度值;指数特征有差异增强植被指数、过绿指数、过绿减过红指数、过红指数、绿蓝比值指数、绿度植被指数、改进型绿红植被指数、归一化绿蓝差异指数、归一化绿红差异指数、红绿蓝植被指数、红绿比值指数、可见光波段差异植被指数;纹理特征有均值、标准差、熵、均质性、相异性、对比度、相关性、角二阶矩;几何特征有面积、长度、长宽比、宽度、边界长、像素数、体积、不对称性、边界指数、紧致度、密度、椭圆拟合、形状指数、圆度、矩形拟合。
[0049]
步骤s4、综合递归特征消除与交叉验证方法进行特征降维,即使用python实现该方法,递归特征消除方法会对原始特征集(43个)进行建模,并计算每个特征的重要性,然后删除最不重要的一个或多个特征,并更新数据集,重复以上直至完成所有特征的重要性评分。交叉验证会在递归特征消除方法给出各个特征的重要性后,依次选择不同数量的特征,并进行交叉验证,直到确定评分最高的特征数量完成特征选择,分类精度与特征数量关系如图3所示,优选特征集中各个特征的重要性如图4所示。本实验完成特征降维后的特征有:改进型绿红植被指数(mgrvi)、红绿比值指数(rgri)、归一化绿红差异指数(ngrdi)、过红指数(exr)、过绿减过红指数(exgr)、差异增强植被指数(devi)、绿度植被指数(gvi)、可见光波段差异植被指数(vdvi)、红绿蓝植被指数(rgbvi)、角二阶矩(glcm_angular second moment)、熵(glcm_entropy)、相异性(glcm_dissimilarity)、面积(area)、像素数(number of pixels)、体积(volume)、边界长(border length)、不同波段的最大差异值(max.diff.),等一共17个特征。
[0050]
递归特征消除会给出原始特征集中各个特征对提取杂草的重要性评级,交叉验证会计算不同数量特征的集和的精度,两者的算法原理如下所示:
[0051]
递归特征消除阶段:(1)对当前n个特征作为特征初始子集{f1,f2,f3,
…fn
},并对随机森林模型进行训练,并计算当前每个特征的重要性f={f1,f2,f3,
…fn
};(2)对当前特征重要性f进行排序,并去除重要性最小fk对应的特征fk,构建新的特征子集{fi,

,f
k-1
,f
k+1
,
…fj
};(3)重复步骤(1)(2)直到完成所有特征重要性评级。
[0052]
交叉验证阶段:根据递归特征消除阶段确定的特征重要性,依次选择i个特征(i=
1,2,3,

,n),对该i个特征进行交叉验证,确定该特征集的平均分,选择平均分最高的特征数量,完成特征选择。具体如下公式:
[0053][0054]
式中,i=43,k表示将该i个特征集平均划分为k个大小相等的样本子集;e
ji
表示在该i个特征集划分为k个大小相等的样本子集下,利用第j个样本子集对随机森林模型进行测试的得分;ga表示最高的平均得分,a表示该精度所对应的特征数量。
[0055]
步骤5、确定最佳树数量参数,即根据优选的特征集对随机森林模型中树数量参数分别进行1到500进行循环训练,并给出每一次训练的得分,得分最高所对应的树数量为随机森林模型在该特征集下的最佳树数量参数,本实施例中各个特征组合方案的最佳树数量参数如图5所示。本实验在最优特征子集的训练下得到的最佳树数量为65。
[0056]
选取最佳树参数公式如下式所示:
[0057][0058]
式中m=500,k表示对特征集均匀的折叠分为k份;acc[ri(x\dj),(y\dj)]表示将有i个树的随机森林应用到去掉第j个折叠的数据集x\dj上,得到预测结果的精度;hc表示最高的平均精度,c表示该精度所对应的树数量,即为最佳树数量。
[0059]
步骤6、建立随机森林模型分类模型,即在分割出的对象中按一定比例选取训练集和测试集,并利用训练集的特征以及最佳树数量参数进行随机森林模型训练。本实验选取的训练集有杂草样本114个,非杂草样本556个;测试集有杂草样本72个,非杂草样本358个。
[0060]
步骤7、结果分析与精度评价,即利用步骤6选取的测试集对随机森林分类结果进行精度评价,采用总体精度oa、kappa系数作为评价指标,计算公式分别为:
[0061][0062][0063]
式中:p
ii
表示被正确分类的样本数量,p
+i
表示第i类的真实样本数量,p
i+
表示预测为第i类的样本数量,p表示总样本数量,k表示总类别数量。
[0064]
将测试集输入随机森林模型模型中,并输出预测结果,再与测试集真实标签做对比,总体精度与kappa系数越接近1,说明模型预测精度越高,本实施例中基于随机森林算法的不同特征集分类结果如图6所示。本实验除了将最优特征子集作为训练样本特征外,还另取4种维度特征集作为训练样本集。分类精度如表1所示:
[0065]
表1不同维度测试精度对比结果
[0066][0067]
由表1数据可知,基于本文方法的优选特征集在最佳树数量的条件下总体精度(oa)与kappa系数分别达到了97.21%、0.90。相比于光谱+指数+纹理+几何的特征集和的测试结果,总体精度(oa)提高了0.7,kappa系数提高了0.03。该结果表明了利用本文的特征消除方法能有效的剔除掉特征集合中重要性较低特征,增加模型的测试精度。
[0068]
在本杂草识别方法中,为测试最佳树数量对模型精度有积极作用,实验中基于优选特征集分别取随机森林树数量1、10、25、45、65(最佳树数量)对模型进行训练,不同树数量测试结果如图7所示,不同树数量测试精度对比结果如表2所示:
[0069]
表2不同树数量测试精度对比结果
[0070][0071]
由表2数据可知,基于优选特征集和不同树数量的随机森林杂草提取结果中总体精度(oa)与kappa系数均在96.28%、0.87及以上,其中最佳树数量的精度最高,其总体精度(oa)与kappa系数为97.21%、0.90。该结果表明了利用本文确定最佳树数量的方法能有效增加模型的测试精度。
[0072]
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

技术特征:
1.一种基于可见光影像和改进随机森林算法的农田杂草识别方法,其特征在于,包括以下步骤:s1、在农田区域内,通过使用搭载可见光波段相机的无人机获取农田的可见光影像集,对获取的所述可见光影像集进行预处理,得到该农田区域的可见光数字正射影像;s2、通过gis平台对所获取的可见光数字正射影像进行初分割,以获取最佳分割尺度,最后依据最佳分割尺度对所述可见光数字正射影像进行分割;s3、利用gis平台提取可见光数字正射影像中各个分割对象的特征参数;s4、综合利用递归特征消除方法和交叉验证对步骤s3中得到的特征参数进行降维处理,得到最优特征集合;s5、根据步骤s4中获取的最优特征集合对随机森林模型进行初训练,以获取随机森林算法中最佳树数量参数;s6、根据步骤s4中最优特征集合和步骤s5中最佳树数量参数建立随机森林分类模型,通过该模型对农田区域内的杂草进行识别提取。2.根据权利要求1所述的基于可见光影像和改进随机森林算法的农田杂草识别方法,其特征在于,在步骤s1中,通过无人机保持规定的航向重叠度和旁向重叠度获取农田的可见光影像集;所述的预处理包括:根据无人机所获取的可见光影像集,通过空中三角测量生成原始影像的点云模型并输出可见光数字正射影像。3.根据权利要求1所述的基于可见光影像和改进随机森林算法的农田杂草识别方法,其特征在于,在步骤s4中,所述递归特征消除方法用于给出原始特征集中各个特征对提取杂草的重要性评级,所述交叉验证用于计算不同数量特征的集和的精度;其中,所述的递归特征消除方法具体包括:(1)对当前n个特征参数作为特征初始子集{f1,f2,f3,

f
n
},并对随机森林模型进行训练,并计算当前每个特征参数的重要性f={f1,f2,f3,

f
n
};(2)对当前特征参数的重要性f进行排序,并去除重要性最小f
k
对应的特征f
k
,构建新的特征子集{f
i
,

,f
k-1
,f
k+1
,

f
j
};(3)重复步骤(1)和步骤(2)直到完成所有特征参数的重要性评级;所述的交叉验证具体包括:根据递归特征消除方法确定的特征参数的重要性,依次选择i个特征(i=1,2,3,

,n),对该i个特征进行交叉验证,确定该特征集的平均分,选择平均分最高的特征数量,完成特征选择,具体如下:式中,k表示将i个特征集平均划分为k个大小相等的样本子集;e
ji
表示在i个特征集划分为k个大小相等的样本子集下,利用第j个样本子集对随机森林模型进行测试的得分;g
a
表示最高的平均得分,a表示精度所对应的特征数量。4.根据权利要求3所述的基于可见光影像和改进随机森林算法的农田杂草识别方法,
其特征在于,步骤s3中的特征参数包括:光谱特征、指数特征、纹理特征和几何特征;其中,所述光谱特征包括红、绿、蓝三个波段的均值、标准差、不同波段的最大差异值以及亮度值;所述指数特征包括差异增强植被指数、过绿指数、过绿减过红指数、过红指数、绿蓝比值指数、绿度植被指数、改进型绿红植被指数、归一化绿蓝差异指数、归一化绿红差异指数、红绿蓝植被指数、红绿比值指数、可见光波段差异植被指数;所述纹理特征包括均值、标准差、熵、均质性、相异性、对比度、相关性、角二阶矩;所述几何特征包括面积、长度、长宽比、宽度、边界长、像素数、体积、不对称性、边界指数、紧致度、密度、椭圆拟合、形状指数、圆度、矩形拟合。5.根据权利要求4所述的基于可见光影像和改进随机森林算法的农田杂草识别方法,其特征在于,在步骤s4中,综合利用递归特征消除方法和交叉验证对步骤s3中得到的特征参数进行降维处理后的特征参数包括:改进型绿红植被指数、红绿比值指数、归一化绿红差异指数、过红指数、过绿减过红指数、差异增强植被指数、绿度植被指数、可见光波段差异植被指数、红绿蓝植被指数、角二阶矩、熵、相异性、面积、像素数、体积、边界长、不同波段的最大差异值。6.根据权利要求3所述的基于可见光影像和改进随机森林算法的农田杂草识别方法,其特征在于,步骤5具体如下:根据最优特征集合对随机森林模型中树数量参数1到m分别进行循环训练,并利用交叉验证给出每一次训练的平均得分,平均得分最高所对应的树数量为随机森林模型在该特征集合下的最佳树数量参数,具体可由以下公式表示:式中,k表示对特征集合均匀的折叠分为k份;acc[r
i
(x\d
j
),(y\d
j
)]表示将有i个树的随机森林应用到去掉第j个折叠的数据集x\d
j
上,得到预测结果的精度;h
c
表示最高的平均精度,c表示该精度所对应的树数量,即为最佳树数量。7.根据权利要求1-6任一项所述的基于可见光影像和改进随机森林算法的农田杂草识别方法,其特征在于,还包括对步骤6中建立的随机森林分类模型进行结果分析与精度评价,并采取总体精度oa、kappa系数作为精度评价指标,具体如下:价,并采取总体精度oa、kappa系数作为精度评价指标,具体如下:式中,p
ii
表示被正确分类的样本数量,p
+i
表示第i类的真实样本数量,p
i+
表示预测为第i类的样本数量,p表示总样本数量,k表示总类别数量。

技术总结
本发明公开了一种基于可见光影像与改进随机森林算法的农田杂草识别方法,其属于图像处理技术领域;包括:根据搭载可见光摄影平台的无人机所获取的影像构建农田影像数据;根据最佳分割尺度对所获取的农田影像进行图像分割;提取分割后影像上各个对象的光谱特征、指数特征、纹理特征、几何特征的特征值;综合递归特征消除和交叉验证方法实现特征降维;根据降维后的特征集对随机森林模型进行初训练得到最佳树数量参数,同时根据最佳树数量参数和降维后的特征集建立随机森林分类模型对待识别农田影像上的杂草进行识别。通过基于无人机可见光影像和改进随机森林算法的农田杂草识别方法,实现了农田中杂草的识别,并具有较高的识别精度。识别精度。识别精度。


技术研发人员:邓辉 冯超 胡孝洪 董磊 张文江
受保护的技术使用者:西藏自治区地质矿产勘查开发局第二地质大队
技术研发日:2023.04.21
技术公布日:2023/7/21
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐