一种基于子空间的多个子类均值高光谱图像聚类方法
未命名
08-03
阅读:122
评论:0
1.本发明涉及高光谱遥感图像处理技术领域,特别是涉及一种基于子空间的多个子类均值高光谱图像聚类方法。
背景技术:
2.目前,高光谱图像(hyperspectral image)已经广泛应用于地质勘测、生物识别以及农作物管理等领域。高光谱图像本身包含丰富的空间特征和光谱信息,随着高光谱遥感技术的发展,高光谱图像获得了更高的信息丰富度。聚类算法是一种常用的数据挖掘方法,它通过同一个类中样本的相似度尽可能小,类与类之间的相似度尽可能大,实现对样本的区分。基于聚类的高光谱图像分割方法,能够有效的区分高光谱图像中的各种对象。例如常用的k-means、模糊c均值(fuzzy c-means, fcm)在处理高光谱图像也有着一定效果。
3.然而,高光谱数据维度较高,并且受到图像采集仪器的影响,其中往往存在大量的异常像素点,这对聚类方法的效果造成了极大影响。传统的k-means根据样本点到类中心的距离划分样本,并且每个样本只能隶属于某一个类,这样的聚类方法无法适应真实世界的数据集,因此在高光谱图像的分割中变现不佳。基于k-means改进的fcm,引入了模糊集合的概念,让每个样本可以对多个类拥有隶属度,实现了样本的模糊划分,相比于k-means提高了聚类精度。但是,它没有考虑像素的空间信息,高光谱图像中大量的异常像素点可能会影响fcm的鲁棒性以及分割精度。
4.现有技术公开了一种基于k-means聚类的高光谱遥感图像分割方法,它属于高光谱遥感图像的聚类分割技术领域。本发明解决了目前的聚类分割方法对高光谱遥感图像的分割不准确的问题。本发明对高光谱遥感图像的d个维度进行协同聚类,在对高光谱遥感图像每一次k-means迭代时,协同d个维度的聚类结果,并在每一次k-means迭代结束后,利用每个像素点的d个聚类结果计算该像素点属于各个类别的概率值,然后利用得到的概率值计算新的聚类中心,按相同的聚类中心开始各个维度的下一次迭代过程,直至获得最终的聚类结果,该现有技术采用传统的k-means根据样本点到类中心的距离划分样本,并且每个样本只能隶属于某一个类,这样的聚类方法无法适应真实世界的数据集,在高光谱图像的分割中表现不佳。
技术实现要素:
5.本发明的目的是:提供一种基于子空间的多个子类均值高光谱图像聚类方法,以解决现有技术存在的聚类方法不适应真实世界的数据集,表现不佳以及没有考虑像素的空间信息,高光谱图像中大量的异常像素点可能会影响鲁棒性以及分割精度的问题。
6.为了实现上述目的,本发明提供了一种基于子空间的多个子类均值高光谱图像聚类方法,包括:s1、获取高光谱数据集;s2、将高光谱数据集映射到低维的子空间,得到高光谱数据集的低维表示矩阵;
s3、将步骤s2获得的低维表示矩阵进行模糊聚类得到q个类,计算每个数据点对到q个类中心的距离,并对其进行排序,计算每个样本对类中心的隶属度,并仅保留对距离最近的t个类中心的隶属度,从而获得稀疏的隶属度矩阵y;s4、将q个类中心的数据聚类为指定类数,并且得到模糊隶属度矩阵z;s5、重复步骤s2-s4,更新参数,直到迭代结束,可以获得最优的稀疏的隶属度矩阵y与隶属度矩阵z,输出l=y*z,即为高光谱数据集的聚类。
7.优选的,在步骤s2中,将高光谱数据集通过投影矩阵映射到低维的子空间,获得高光谱数据集的低维表示矩阵,其中,所述的高光谱数据集的低维表示矩阵为,其中q为子类中心个数,e为维度,其表达式如下:;其中,投影矩阵为,d和e都表示维度,表示原始数据的第个数据点,d为维度,n为样本个数,通过投影矩阵,可以得到从高维映射到低维的高光谱数据集。
8.优选的,在步骤s3中,对降维后的高光谱数据集的低维表示矩阵聚类一次,得到q个类,通过引入非相关约束获得目标函数,目标函数为:;其中,为投影矩阵,表示原始数据的第个数据点,d为维度,n为样本数量,表示高光谱数据集的低维映射,为子类中心,表示子空间中每个样本点到子类中心的距离,其中,模糊隶属度矩阵,n为样本数量,q为子类中心,r表示模糊隶属的模糊因子,表示第i个样本对第个子类的隶属度。
9.优选的,在步骤s4中,将q个类中心的数据聚类为指定类数,目标函数为:;其中,为第k个子类中心,为第个类中心,类中心矩阵,模糊隶属度矩阵,c为聚类类数,e为维度,q为子类中心数,r为模糊因子。
10.优选的,包括两个目标函数:;
;为投影矩阵,表示原始数据的第个数据点,d为维度,n为样本数量,表示高光谱数据集的低维映射,为子类中心,表示子空间中每个样本点到子类中心的距离,表示第i个样本对第个子类的隶属度,为非相关约束,为全局散度矩阵,模糊隶属度矩阵,其中,n为样本数量,q为子类中心,为子类中心,为类中心,为子类中心到类中心的距离,表示第k个子类中心对第个类中心的隶属程度,r为模糊因子,模糊隶属度矩阵,q为子类中心,c为聚类类数;在上述两个目标函数基础上引入一个范数,即,获得第一目标函数,所述第一目标函数收敛时,迭代结束,所述第一目标函数为:;其中,w为投影矩阵,为数据集x的第i个数据点,表示第k个子类中心,表示在子类空间中,每个样本点到子类中心的距离,r为模糊因子,表示第i个数据点对第f个类中心的隶属程度,为第个类中心,则为第k个子类到第个类中心的距离,表示第k个样本点对第个类中心的隶属程度,为非相关约束,为全局散度矩阵,表示只有t个为非零元素,表示第i个样本对第个子类的隶属度,y和z为模糊隶属度矩阵,且每个样本点对所有类的隶属度之和为1;当,则第一目标函数收敛,其中表示第一目标函数的第i次迭代;在步骤s5中,所述参数为投影矩阵w、稀疏的隶属度矩阵y、矩阵m、模糊隶属度矩阵z和类中心矩阵v。
11.优选的,在步骤s5中,更新投影矩阵w,目标函数为:;其中,为拉格朗日乘数矩阵,为全局散度矩阵,且与满足约束条件,h为对称矩阵。
12.优选的,在步骤s5中,更新稀疏的隶属度矩阵y,目标函数为:
;其中,表示第i个样本对第个子类的隶属度,w为投影矩阵,为数据集x的第i个数据点,表示高光谱数据集的低维映射,为子类空间中的子类中心,表示子空间中每个样本点到q个子类中心的距离按升序排列,而表示只计算前t个最小距离,r为模糊因子。
13.优选的,在步骤s5中,更新矩阵m,目标函数为:;其中,为投影矩阵,表示第i个样本点,代表高光谱数据集的低维表示,表示第i个样本对第个子类的隶属程度,表示第k个样本对第个子类的隶属程度,r为模糊因子,为参数,n为样本点个数,c为聚类类数。
14.优选的,在步骤s5中,更新模糊隶属度矩阵z,目标函数为:;其中,表示第k个子类中心,表示第个类中心,且的范围为(1,c),表示第个类中心,范围也为(1,c),q为子类中心个数,c为聚类类数。
15.优选的,在步骤s5中,更新类中心矩阵v,目标函数为:;其中,表示第个类中心,表示第k个子类中心,表示第k个样本点对第个子类的隶属程度,r为模糊因子,q表示子类中心个数。
16.与现有技术相比,本发明有益效果在于:本发明通过将高维的高光谱数据集映射到低维的子空间中,最大限度保留了数据的特征,减少冗余数据的干扰,同时在聚类子空间中优化投影矩阵和模糊隶属度矩阵,引进范数,增强了鲁棒性,通过将q个类中心的数据聚类为指定类数,减弱了高光谱数据中异
常点的影响,提高了对高光谱图像分割的精确度。
附图说明
17.图1是本发明实施例提出的基于子空间的多个子类均值高光谱图像聚类方法的流程图;图2是本发明实施例提出的基于子空间的多个子类均值高光谱图像聚类方法中indian_pines数据集的指标评估表;图3是本发明实施例提出的基于子空间的多个子类均值高光谱图像聚类方法中indian_pines数据集的高光谱聚类效果的可视化图,其中,(a)为k-means对indian_pines数据集的聚类结果可视化图,(b)为fcm对indian_pines数据集的聚类结果可视化图,(c)为fcm_s对indian_pines数据集的聚类结果可视化图,(d)为rsfkm对indian_pines数据集的聚类结果可视化图,(e)为fcmms对indian_pines数据集的聚类结果可视化图;图4是本发明实施例提出的基于子空间的多个子类均值高光谱图像聚类方法中salinas数据集的指标评估表;图5是本发明实施例提出的基于子空间的多个子类均值高光谱图像聚类方法中salinas数据集的高光谱聚类效果的可视化图,其中,(a)为k-means对salinas数据集的聚类结果可视化图,(b)为fcm对salinas数据集的聚类结果可视化图,(c)为fcm_s1对salinas数据集的聚类结果可视化图,(d)为rsfkm对salinas数据集的聚类结果可视化图,(e)为fcmms对salinas数据集的聚类结果可视化图。
具体实施方式
18.下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
19.在本发明的描述中,需要说明的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
20.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
21.此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
22.实施例一如图1所示,本发明优选实施例的一种基于子空间的多个子类均值高光谱图像聚类方法,包括:s1、获取高光谱数据集;
s2、将高光谱数据集映射到低维的子空间,得到高光谱数据集的低维表示矩阵;s3、将步骤s2获得的低维表示矩阵进行模糊聚类得到q个类,计算每个数据点对到q个类中心的距离,并对其进行排序,计算每个样本对类中心的隶属度,并仅保留对距离最近的t个类中心的隶属度,从而获得稀疏的隶属度矩阵y;s4、将q个类中心的数据聚类为指定类数,并且得到模糊隶属度矩阵z;s5、重复步骤s2-s4,更新参数,直到迭代结束,可以获得最优的稀疏的隶属度矩阵y与隶属度矩阵z,输出l=y*z,即为高光谱数据集的聚类。
23.如图2-5所示,本发明采用两个常用的高光谱数据集indian_pines以及salinas,其中,indain_pines数据集包含了16类地物,共有21025个像素,而salinas数据集包含16类地物,共有111104个像素。
24.选用的评价指标有ua(用户精确度)、aa(平均精度)、oa(整体精度)、kappa系数以及可视化聚类效果图。
25.实施例二本实施例与实施例一的区别在于,在步骤s2中,设原始数据集为,其中n代表样本个数,d表示维度,传统的模糊c均值的损失函数为:;其中,表示第个数据点,第个类中心,为数据点到类中心的距离,模糊隶属度矩阵为,表示第个数据点对第个类中心中的隶属程度,数值范围为,并且第个数据点对所有类中心的隶属度之和为1,为模糊因子。
26.但是,在传统的模糊c均值中,直接对原始数据集聚类,对高光谱图像的分割效果易受到异常点的影响,通过将原始数据集投影到低维子空间的方式,在保留数据集空间信息的同时,降低异常点导致类中心偏移的可能性。
27.将高光谱数据集通过投影矩阵映射到低维的子空间,获得高光谱数据集的低维表示矩阵,其中,所述的高光谱数据集的低维表示矩阵为,其中q为子类中心个数,e为维度,其表达式如下:;其中,投影矩阵为,d和e都表示维度,表示原始数据的第个数据点,d为维度,n为样本个数,通过投影矩阵,可以得到从高维映射到低维的高光谱数据集。
28.本实施例的其他过程与实施例一相同,此处不再赘述。
29.实施例三本实施例与实施例二的区别在于,在步骤s3中,对降维后的高光谱数据集的低维表示矩阵聚类一次,得到q个类,通过引入非相关约束获得目标函数,目标函数为:
;其中,为投影矩阵,表示原始数据的第个数据点,d为维度,n为样本数量,表示高光谱数据集的低维映射,为子类中心,表示子空间中每个样本点到子类中心的距离,其中,模糊隶属度矩阵,n为样本数量,q为子类中心,r表示模糊隶属的模糊因子,表示第i个样本对第个子类的隶属度。
30.为了避免w出现平凡解,我们引入非相关约束,消除特征之间的相关性,并使子空间的冗余最小,为全局散度矩阵。
31.为了进一步减弱异常像素的影响,在投影子空间中使用q个类表示子空间的高光谱数据,避免异常点与普通数据点一起被分到同一个类中。
32.在步骤s4中,将q个类中心的数据聚类为指定类数,目标函数为:;其中,为第k个子类中心,为第个类中心,类中心矩阵,模糊隶属度矩阵,c为聚类类数,e为维度,q为子类中心数,r为模糊因子。
33.具体地,包括两个目标函数:;;为投影矩阵,表示原始数据的第个数据点,d为维度,n为样本数量,表示高光谱数据集的低维映射,为子类中心,表示子空间中每个样本点到子类中心的距离,表示第i个样本对第个子类的隶属度,为非相关约束,为全局散度矩阵,模糊隶属度矩阵,其中,n为样本数量,q为子类中心,为子类中心,为类中心,为子类中心到类中心的距离,表示第k个子类中心对第个类中心的隶属程度,r为模糊因子,模糊隶属度矩阵,q为子类中心,c为聚类类数;由于模糊隶属度的质量往往决定了聚类效果的情况,为了获得更为稀疏的模糊隶属度矩阵,在上述两个目标函数基础上引入一个范数,即,获得第一目标函数,
所述第一目标函数收敛时,迭代结束,所述第一目标函数为:;其中,w为投影矩阵,为数据集x的第i个数据点,表示第k个子类中心,表示在子类空间中,每个样本点到子类中心的距离,r为模糊因子,表示第i个数据点对第f个类中心的隶属程度,为第个类中心,则为第k个子类到第个类中心的距离,表示第k个样本点对第个类中心的隶属程度,为非相关约束,为全局散度矩阵,表示只有t个为非零元素,表示第i个样本对第个子类的隶属度,y和z为模糊隶属度矩阵,且每个样本点对所有类的隶属度之和为1;当,则第一目标函数收敛,其中表示第一目标函数的第i次迭代;在步骤s5中,所述参数为投影矩阵w、稀疏的隶属度矩阵y、矩阵m、模糊隶属度矩阵z和类中心矩阵v。
34.在步骤s5中,更新投影矩阵w,固定m、y、z、v,此时第一目标函数可以表示为:;其中,为投影矩阵,表示第个样本点,表示子类中心,表示子空间中每个样本点到q个子类中心的距离,r为模糊因子,表示第i个样本对第个子类的隶属度。
35.通过拉格朗日乘子法,对m求偏导,并令其为0,可以得到子类中心的表达式:=;其中,为投影矩阵,表示第个样本点,n为样本个数,r为模糊因子,表示第i个样本对第个子类中心的隶属度,此时上式可以表示为:;为投影矩阵,表示第个样本点,表示子空间中每个样本点到
q个子类中心的距离,为子类空间中的子类中心,表示第i个样本对第个子类中心的隶属度,r为模糊因子,n为样本个数,q为子类中心个数。
36.上式可以写为迹的形式:;其中:;因为,因此上述公式中,此外,矩阵p和q都是对角矩阵,,,表示第i个样本点到第f个类中心的隶属程度,r为模糊因子,模糊隶属度矩阵,n为样本点个数,q为子类中心。
37.由拉格朗日乘子法上述公式可写为:;此时,更新投影矩阵w的目标函数为:;其中,为拉格朗日乘数矩阵,为全局散度矩阵,且与满足约束条件,h为对称矩阵。
38.在步骤s5中,更新稀疏的隶属度矩阵y,固定w、m、z、v,可以写为如下形式:;其中,r为模糊因子,表示第i个样本对第个子类的隶属程度,,为投影矩阵,表示第个样本点,为子类空间中的子类中心,表示最优子空间中,数据点到子类中心的距离。
39.定义一个排序函数,将按升序排列,表示第f个最小的元素,然后从中,仅取前t个最小的元素,即选取与样本相似性最大的t个子类,并计算样本对这t个子类的隶属度,从而获得稀疏的隶属度矩阵:
;其中,表示子空间中,第i个样本点到子类中心的距离按照升序排列,第f个最小元素,且此元素是大于等于0的。表示第i个样本点对各个子类的隶属程度,按升序排列,其中第f个最小元素,r为模糊因子,而表示第i个样本对q个子类的隶属程度之和为1。
40.上式的拉格朗日函数形式为:;其中,为拉格朗日乘数,表示第i个样本点对各个子类的隶属程度,按升序排列,其中第f个最小元素,对求偏导并令其为0,可以得到:;其中,r为模糊因子,表示子空间中,第i个样本点到子类中心的距离按照升序排列,第f个最小元素。为投影矩阵,表示第个样本点,为子类空间中的子类中心,表示子空间中每个样本点到q个子类中心的距离按升序排列,而表示只计算前t个最小距离。
41.综上所述,更新稀疏的隶属度矩阵y的目标函数为:;其中,表示第i个样本对第个子类的隶属度,w为投影矩阵,为数据集x的第i个数据点,表示高光谱数据集的低维映射,为子类空间中的子类中心,表示子空间中每个样本点到q个子类中心的距离按升序排列,而
表示只计算前t个最小距离,r为模糊因子。
42.在步骤s5中,更新矩阵m,固定w、y、z、v,可以得到:;其中,为投影矩阵,表示第i个样本点,代表高光谱数据集的低维表示,为第f个子类中心,表示第i个样本对第个子类的隶属程度。表示第k个子类中心,表示第个类中心,表示第k个样本对第个子类的隶属程度,r为模糊因子。n表示样本个数,q为子类中心个数,c为聚类类数。
43.对矩阵m求偏导并令其为0得:;其中,表示第i个样本点,为第f个子类中心,表示第i个样本对第个子类的隶属程度,为参数,表示第个类中心,表示第k个样本对第个子类的隶属程度,r为模糊因子,n为样本点个数,c为聚类类数,f与k都表示子类中心个数,且范围都为,使用代替与,可以化简为:;其中,为投影矩阵,表示第i个样本点,代表高光谱数据集的低维表示,表示第i个样本对第个子类的隶属程度,表示第k个样本对第个子类的隶属程度,r为模糊因子,为参数,n为样本点个数,c为聚类类数。
44.更新矩阵m的目标函数为:;其中,为投影矩阵,表示第i个样本点,代表高光谱数据集的低维表示,表示第i个样本对第个子类的隶属程度,表示第个类中心,表示第k个样本对第个子类的隶属程度,r为模糊因子,为参数,n为样本点个数,c为聚类类数。
45.在步骤s5中,更新模糊隶属度矩阵z,固定w、m、y、v,可以得到:
;其中,表示第k个子类中心,表示第个类中心,表示第k个样本对第个子类的隶属程度,r为模糊因子,q代表子类中心个数,c为聚类类数。
46.通过拉格朗日乘子法,可以得到更新模糊隶属度矩阵z的目标函数为:;其中,表示第k个子类中心,表示第个类中心,且的范围为(1,c),表示第个类中心,范围也为(1,c),q为子类中心个数,c为聚类类数。
47.在步骤s5中,更新类中心矩阵v,固定w、m、y、z,使用拉格朗日乘子法,关于求导并令其导数为0,更新类中心矩阵v的目标函数为:;其中,表示第个类中心,表示第k个子类中心,表示第k个样本点对第个子类的隶属程度,r为模糊因子,q表示子类中心个数。
48.如图2-5所示,本发明提出的处理高光谱图像的方法(fcmms),在aa、oa、kappa系数三个主要评价指标中,都拥有最高的数值。本发明提出的一种基于子空间的多个子类均值高光谱图像聚类方法,在indian_pines数据集和salinas数据集上对高光谱图像的聚类效果都优于其他对比算法,其中,基于fcm改进得到的算法fcm_s1以及rsfkm,对高光谱图像的聚类效果也低于fcmms,并且在可视化聚类图中,fcmms也拥有更加平滑的聚类图。
49.本实施例的其他过程与实施例二相同,此处不再赘述。
50.本发明的工作过程为:s1、获取高光谱数据集;s2、将高光谱数据集映射到低维的子空间,得到高光谱数据集的低维表示矩阵;s3、将步骤s2获得的低维表示矩阵进行模糊聚类得到q个类,计算每个数据点对到q个类中心的距离,并对其进行排序,计算每个样本对类中心的隶属度,并仅保留对距离最近的t个类中心的隶属度,从而获得稀疏的隶属度矩阵y;s4、将q个类中心的数据聚类为指定类数,并且得到模糊隶属度矩阵z;s5、重复步骤s2-s4,更新参数,直到迭代结束,可以获得最优的稀疏的隶属度矩阵y与隶属度矩阵z,输出l=y*z,即为高光谱数据集的聚类。
51.综上,本发明实施例提供一种基于子空间的多个子类均值高光谱图像聚类方法,首先获取高光谱数据集,将高光谱数据集映射到低维的子空间,得到高光谱数据集的低维表示矩阵,然后将获得的低维表示矩阵进行模糊聚类得到q个类,计算每个数据点对到q个
类中心的距离,并对其进行排序,计算每个样本对类中心的隶属度,并仅保留对距离最近的t个类中心的隶属度,从而获得稀疏的隶属度矩阵y,再将q个类中心的数据聚类为指定类数,并且得到模糊隶属度矩阵z,重复上述步骤,更新投影矩阵w、稀疏的隶属度矩阵y、矩阵m、模糊隶属度矩阵z和类中心矩阵v,直到迭代结束,可以获得最优的稀疏的隶属度矩阵y与隶属度矩阵z,输出l=y*z,即为高光谱数据集的聚类,本发明通过将高维的高光谱数据集映射到低维的子空间中,最大限度保留了数据的特征,减少冗余数据的干扰,同时在聚类子空间中优化投影矩阵和模糊隶属度矩阵,引进范数,增强了鲁棒性,通过将q个类中心的数据聚类为指定类数,减弱了高光谱数据中异常点的影响,提高了对高光谱图像分割的精确度。
52.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。
技术特征:
1.一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,包括:s1、获取高光谱数据集;s2、将高光谱数据集映射到低维的子空间,得到高光谱数据集的低维表示矩阵;s3、将步骤s2获得的低维表示矩阵进行模糊聚类得到q个类,计算每个数据点对到q个类中心的距离,并对其进行排序,计算每个样本对类中心的隶属度,并仅保留对距离最近的t个类中心的隶属度,从而获得稀疏的隶属度矩阵y;s4、将q个类中心的数据聚类为指定类数,并且得到模糊隶属度矩阵z;s5、重复步骤s2-s4,更新参数,直到迭代结束,可以获得最优的稀疏的隶属度矩阵y与隶属度矩阵z,输出l=y*z,即为高光谱数据集的聚类。2.根据权利要求1所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s2中,将高光谱数据集通过投影矩阵映射到低维的子空间,获得高光谱数据集的低维表示矩阵,其中,所述的高光谱数据集的低维表示矩阵为,其中q为子类中心个数,e为维度,其表达式如下:;其中,投影矩阵为,d和e都表示维度,表示原始数据的第个数据点,d为维度,n为样本个数,通过投影矩阵,可以得到从高维映射到低维的高光谱数据集。3.根据权利要求1所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s3中,对降维后的高光谱数据集的低维表示矩阵聚类一次,得到q个类,通过引入非相关约束获得目标函数,目标函数为:;其中,为投影矩阵,表示原始数据的第个数据点,d为维度,n为样本数量,表示高光谱数据集的低维映射,为子类中心, 表示子空间中每个样本点到子类中心的距离,其中,模糊隶属度矩阵,n为样本数量,q为子类中心,r表示模糊隶属的模糊因子,表示第i个样本对第个子类的隶属度。4.根据权利要求3所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s4中,将q个类中心的数据聚类为指定类数,目标函数为:;其中,为第k个子类中心,为第个类中心,类中心矩阵,模糊隶属度矩阵,c为聚类类数,e为维度,q为子类中心数,r为模糊因子。5.根据权利要求4所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特
征在于,包括两个目标函数:;;为投影矩阵,表示原始数据的第个数据点,d为维度,n为样本数量,表示高光谱数据集的低维映射,为子类中心,表示子空间中每个样本点到子类中心的距离,表示第i个样本对第个子类的隶属度,为非相关约束,为全局散度矩阵,模糊隶属度矩阵,其中,n为样本数量,q为子类中心,为子类中心,为类中心,为子类中心到类中心的距离,表示第k个子类中心对第个类中心的隶属程度,r为模糊因子,模糊隶属度矩阵,q为子类中心,c为聚类类数;在上述两个目标函数基础上引入一个范数,即,获得第一目标函数,所述第一目标函数收敛时,迭代结束,所述第一目标函数为:;其中,w为投影矩阵,为数据集x的第i个数据点,表示第k个子类中心,表示在子类空间中,每个样本点到子类中心的距离,r为模糊因子,表示第i个数据点对第f个类中心的隶属程度,为第个类中心,则为第k个子类到第个类中心的距离,表示第k个样本点对第个类中心的隶属程度,为非相关约束,为全局散度矩阵, 表示只有t个为非零元素,表示第i个样本对第个子类的隶属度,y和z为模糊隶属度矩阵,且每个样本点对所有类的隶属度之和为1;当,则第一目标函数收敛,其中表示第一目标函数的第i次迭代;在步骤s5中,所述参数为投影矩阵w、稀疏的隶属度矩阵y、矩阵m、模糊隶属度矩阵z和类中心矩阵v。6.根据权利要求5所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s5中,更新投影矩阵w,目标函数为:
其中,为拉格朗日乘数矩阵,为全局散度矩阵,且与满足约束条件,h为对称矩阵。7.根据权利要求5所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s5中,更新稀疏的隶属度矩阵y,目标函数为:;其中,表示第i个样本对第个子类的隶属度,w为投影矩阵,为数据集x的第i个数据点,表示高光谱数据集的低维映射,为子类空间中的子类中心,表示子空间中每个样本点到q个子类中心的距离按升序排列,而表示只计算前t个最小距离,r为模糊因子。8.根据权利要求5所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s5中,更新矩阵m,目标函数为:;其中,为投影矩阵,表示第i个样本点,代表高光谱数据集的低维表示,表示第i个样本对第个子类的隶属程度,表示第k个样本对第个子类的隶属程度,r为模糊因子,为参数,n为样本点个数,c为聚类类数。9.根据权利要求5所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s5中,更新模糊隶属度矩阵z,目标函数为:;其中,表示第k个子类中心,表示第个类中心,且的范围为(1,c),表示第个类中心,范围也为(1,c),q为子类中心个数,c为聚类类数。10.根据权利要求5所述的一种基于子空间的多个子类均值高光谱图像聚类方法,其特征在于,在步骤s5中,更新类中心矩阵v,目标函数为:
;其中,表示第个类中心,表示第k个子类中心,表示第k个样本点对第个子类的隶属程度,r为模糊因子,q表示子类中心个数。
技术总结
本发明涉及高光谱遥感图像处理技术领域,公开了一种基于子空间的多个子类均值高光谱图像聚类方法,获取高光谱数据集,映射到低维的子空间,得到低维表示矩阵,进行模糊聚类得到q个类,计算隶属度,从而获得稀疏的隶属度矩阵Y,将q个类中心的数据聚类为指定类数,并且得到模糊隶属度矩阵Z,重复上述步骤,更新参数,直到迭代结束,输出L=Y*Z,本发明通过将高维的高光谱数据集映射到低维的子空间中,最大限度保留了数据的特征,减少冗余数据的干扰,同时在聚类子空间中优化投影矩阵和模糊隶属度矩阵,引进范数,增强了鲁棒性,通过将q个类中心的数据聚类为指定类数,减弱了高光谱数据中异常点的影响,提高了对高光谱图像分割的精确度。精确度。精确度。
技术研发人员:杨晓君 武千千 闵海波 祝明君 程昱
受保护的技术使用者:广州大学城(广工)科技成果转化中心 北京爱宾果科技有限公司
技术研发日:2023.06.25
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
