一种显微高光谱胆囊癌图像降维方法
未命名
09-22
阅读:69
评论:0
1.本发明涉及高光谱胆囊癌影像分类领域,具体涉及一种显微高光谱胆囊癌图像降维方法。
背景技术:
2.胆囊癌(gallbladder carcinoma,gbc)是胆道系统常见恶性肿瘤,其恶性程度高、早期诊断困难,70%~80%的病人发现时已为晚期,放化疗等综合治疗效果不佳,预后极差,5年生存率仅5%~15%。因此,若能在早期(t1)肿瘤阶段进行根治性切除,患者预后可显著改善,5年生存率达75%。因此,及早识别胆囊早期癌变、癌前病变将有效提高临床生存率。加强胆囊癌的基础研究,以期提高其临床诊治水平,是改善胆囊癌病人预后的关键。
3.高光谱图像技术通过搭载在不同空间平台上的高光谱传感器,即成像光谱仪,在电磁波谱的紫外、可见光、近红外和中红外区域,以数十至数百个连续且细分的光谱波段对目标区域同时成像。在获得图像空间信息的同时,也获得其光谱信息,做到了光谱与图像的结合。因而,高光谱图像技术所具有的影响及发展潜力,是以往技术的各个发展阶段所不可比拟的,引起了医学领域的极大兴趣。
4.高光谱胆囊癌图像包含了丰富的光谱信息,数以百计的光谱连续波段使我们能够以更多的细节区分有癌与无癌区域的类别。然而,由于训练样本数量有限,高光谱胆囊癌图像的高维特性增加了计算复杂度,甚至可能降低分类精度。另外,只有原始光谱很难很好地表示或揭示胆囊癌图像的内在几何结构。所以,通过数据降维来实现特征提取成为高光谱图像高维数据分类的一个重要步骤。
5.基于光谱特征的线性特征提取方法,有主成分分析(principle component analysis,pca)、独立主成分分析等,非线性流形学习算法包括等距离特征映射(isomap)、局部线性嵌入(lle)以及拉普拉斯特征映射(le)等。典型的线性流形学习算法有局部保持投影(lpp)和近邻保持嵌入(npe),分别是对le和lle算法的线性扩展表示。然而这些方法在降维过程中仅考虑了局部特征或全局特征,未能同时考虑局部特征和全局特征。如何更好地考虑局部特征和全局特征来进行图像降维是高光谱胆囊癌图像分类任务的一个关键。
技术实现要素:
6.发明目的:为了克服现有技术中存在的高光谱胆囊癌图像分类算法中存在的会导致不同样本类别不可分等问题,提供一种显微高光谱胆囊癌图像降维方法,通过引入引入awf滤波模块、流行学习pacmap模块、超像素模块、和核主成分分析模块,可以通过获取丰富的空间-光谱特征来利用低维数据来有效地表达高维数据的特征,同时也压缩了数据量,更有利于信息的快速提取。
7.技术方案:为实现上述目的,本发明提供一种显微高光谱胆囊癌图像降维方法,包括如下步骤:
8.s1:采用pacmap技术对高光谱影像的光谱维进行降维处理,将实验中的原始数据
集的光谱维使用pacmap方法压缩至3维,在保留有效光谱信息的基础上大大减少数据量,从而达到减少训练时间的目的,之后通过awf滤波器对上述降维数据进行滤波处理,起到平滑像素的效果;
9.s2:基于设置的超像素分割数目,采用简单迭代线性聚类方法对上述滤波后数据进行分割,得到若干超像素块。对每个超像素块采用核主成分分析法进行降维,得到低维子空间低维特征;
10.s3:这些低维图像块中的训练样本将会被输送到支持向量机模型中网络模型中,进行模型的训练;
11.s4:待支持向量机经过样本训练之后,将测试样本输入到网络中进行测试样本的分类,并通过最大投票器产生最终分类标签。
12.2、根据权利要求1所述的一种显微高光谱胆囊癌图像降维方法,其特征在于,所述步骤s1中流行学习pacmap提取特征的过程为:
13.a1:在图中分别寻找一定数量的近程像素点对、中程像素点对及远程像素点对;
14.a2:使用pca初始化像素点对应的嵌入值;
15.a3:分三个阶段将损失函数的函数值降至最低,并得到最终像素点对应的类别值。
16.3、根据权利要求1所述的一种显微高光谱胆囊癌图像降维方法,其特征在于,所述步骤s2中简单迭代线性聚类的过程为:
17.b1:初始化种子点(聚类中心):按照设定的超像素个数,在图像内均匀的分配种子点。假设图片总共有n个像素点,预分割为k个相同尺寸的超像素,那么每个超像素的大小为n/k,则相邻种子点的距离(步长)近似为s=sqrt(n/k);
18.b2:在种子点的n*n邻域内重新选择种子点(一般取n=3)。具体方法为:计算该邻域内所有像素点的梯度值,将种子点移到该邻域内梯度最小的地方;
19.b3:在每个种子点周围的邻域内为每个像素点分配类标签(即属于哪个聚类中心)。和标准的k-means在整张图中搜索不同,slic的搜索范围限制为2s*2s,可以加速算法收敛;
20.b4:距离度量。包括颜色距离和空间距离。对于每个搜索到的像素点,分别计算它和该种子点的距离。
21.b5:迭代优化。理论上上述步骤不断迭代直到误差收敛(可以理解为每个像素点聚类中心不再发生变化为止);
22.b6:增强连通性。经过上述迭代优化可能出现以下瑕疵:出现多连通情况、超像素尺寸过小,单个超像素被切割成多个不连续超像素等,这些情况可以通过增强连通性解决。主要思路是:新建一张标记表,表内元素均为-1,按照“z”型走向(从左到右,从上到下顺序)将不连续的超像素、尺寸过小超像素重新分配给邻近的超像素,遍历过的像素点分配给相应的标签,直到所有点遍历完毕为止。
23.有益效果:通过引入awf滤波模块、流行学习pacmap模块、超像素模块、和核主成分分析模块,可以通过获取丰富的空间-光谱特征来利用低维数据来有效地表达高维数据的特征,同时也压缩了数据量,更有利于信息的快速提取,保证了良好稳定的分类效果。
附图说明
24.图1为本发明实施的网络模型图;
具体实施方式
25.下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本技术所附权利要求所限定的范围。
26.本发明提供一种显微高光谱胆囊癌图像降维方法,首先构建整体网络,包括一个awf滤波模块、一个流行学习pacmap模块、七个简单线性迭代聚类模块、和七个核主成分分析模块,具体如图1所示;awf滤波模块滤除原始图像中的尖锐噪声,使图像的特征更加明显;随后,流行学习pacmap模块通过通过结合近、中远程图像像素点信息来提取图像特征;之后通过简单线性迭代聚类模块用少量的超像素代替大量的像素来表达图片特征,降低了图像后处理的复杂度;最后通过支持向量机模型进行分类并由最大投票器得到最终分类结果。
27.基于上述方法,本实施例将上述方法应用于高光谱胆囊癌图像分类,具体的过程如下:
28.步骤1:采用pacmap技术对高光谱影像的光谱维进行降维处理,将实验中的原始数据集的光谱维使用pacmap方法压缩至3维,在保留有效光谱信息的基础上大大减少数据量,从而达到减少训练时间的目的,之后通过awf滤波器对上述降维数据进行滤波处理,起到平滑像素的效果;
29.步骤2:基于设置的超像素分割数目,采用简单迭代线性聚类方法对上述滤波后数据进行分割,得到若干超像素块。对每个超像素块采用核主成分分析法进行降维,得到低维子空间低维特征;
30.步骤3:这些低维图像块中的训练样本将会被输送到支持向量机模型中网络模型中,进行模型的训练;
31.步骤4:待支持向量机经过样本训练之后,将测试样本输入到网络中进行测试样本的分类,并通过最大投票器产生最终分类标签。
32.流行学习pacmap特征提取网络,其具体学习过程包括以下子步骤:
33.步骤1.1:在图中分别寻找一定数量的近程像素点对、中程像素点对及远程像素点对;
34.步骤1.2:使用pca初始化像素点对应的嵌入值;
35.步骤1.3:分三个阶段将损失函数的函数值降至最低,并得到最终像素点对应的类别值。
36.简单迭代线性聚类网络,其具体学习过程包括以下子步骤:
37.步骤2.1:初始化种子点(聚类中心):按照设定的超像素个数,在图像内均匀的分配种子点。假设图片总共有n个像素点,预分割为k个相同尺寸的超像素,那么每个超像素的大小为n/k,则相邻种子点的距离(步长)近似为s=sqrt(n/k);
38.步骤2.2:在种子点的n*n邻域内重新选择种子点(一般取n=3)。具体方法为:计算该邻域内所有像素点的梯度值,将种子点移到该邻域内梯度最小的地方;
39.步骤2.3:在每个种子点周围的邻域内为每个像素点分配类标签(即属于哪个聚类中心)。和标准的k-means在整张图中搜索不同,slic的搜索范围限制为2s*2s,可以加速算法收敛;
40.步骤2.4:距离度量。包括颜色距离和空间距离。对于每个搜索到的像素点,分别计算它和该种子点的距离。
41.步骤2.5:迭代优化。理论上上述步骤不断迭代直到误差收敛(可以理解为每个像素点聚类中心不再发生变化为止);
42.步骤2.6:增强连通性。经过上述迭代优化可能出现以下瑕疵:出现多连通情况、超像素尺寸过小,单个超像素被切割成多个不连续超像素等,这些情况可以通过增强连通性解决。主要思路是:新建一张标记表,表内元素均为-1,按照“z”型走向(从左到右,从上到下顺序)将不连续的超像素、尺寸过小超像素重新分配给邻近的超像素,遍历过的像素点分配给相应的标签,直到所有点遍历完毕为止。
43.为了验证本发明方法的效果,基于上述技术方案,本实施例进行了仿真实验,具体的结果和分析如下:
44.1.实验图像及实验配置
45.实验所需的高光谱遥感影像选用高光谱胆囊癌数据集,表1为三种数据集的基本信息。图像尺寸大小为1024
×
1280,光谱波段为60。实验的测试环境是intel core i5-7200u cpu、64-bit windows 10操作系统、gpu时tesla t4。使用的仿真实验工具是于keras的深度学习框架,python版本号为3.6.6。
46.表1数据集特征
[0047][0048]
2.实验过程及实验结果
[0049]
为了突出本方法的先进性,我们将与其他四种典型方法在定量分类结果进行对比,3种典型方法分别为pca、lda、lpp。为了保证对比试验的准确性,高光谱胆囊癌图像中,我们均测试了在训练样本大小固定的情况下,各类降维方法的性能。
[0050]
表2胆囊癌数据集上4种降维方法的分类结果(%)
[0051][0052]
从表2可以看出,随训练样本的增加,各算法的分类精度逐步提高。训练样本的增加,意味着包含的类别信息越丰富,提取的特征能更好地表征不同地物之间的差异性,从而提高分类精度。在相同训练样本数下,sml算法的分类精度均是最高,这是因为sml算法兼顾全局和局部信息构造投影矩阵,并对原始数据进行空-谱重构,减小了信息冗余和噪声干扰,使得低维空间中的数据能够保持原有局部结构,提取的特征更具鉴别性。
技术特征:
1.一种显微高光谱胆囊癌图像降维方法,其特征在于,包括如下步骤:s1:采用pacmap技术对高光谱影像的光谱维进行降维处理,将实验中的原始数据集的光谱维使用pacmap方法压缩至3维,在保留有效光谱信息的基础上大大减少数据量,从而达到减少训练时间的目的,之后通过awf滤波器对上述降维数据进行滤波处理,起到平滑像素的效果;s2:基于设置的超像素分割数目,采用简单迭代线性聚类方法对上述滤波后数据进行分割,得到若干超像素块。对每个超像素块采用核主成分分析法进行降维,得到低维子空间低维特征;s3:这些低维图像块中的训练样本将会被输送到支持向量机模型中网络模型中,进行模型的训练;s4:待支持向量机经过样本训练之后,将测试样本输入到网络中进行测试样本的分类,并通过最大投票器产生最终分类标签。2.根据权利要求1所述的一种显微高光谱胆囊癌图像降维方法,其特征在于,所述步骤s1中流行学习pacmap提取特征的过程为:a1:在图中分别寻找一定数量的近程像素点对、中程像素点对及远程像素点对;a2:使用pca初始化像素点对应的嵌入值;a3:分三个阶段将损失函数的函数值降至最低,并得到最终像素点对应的类别值。3.根据权利要求1所述的一种显微高光谱胆囊癌图像降维方法,其特征在于,所述步骤s2中简单迭代线性聚类的过程为:b1:初始化种子点(聚类中心):按照设定的超像素个数,在图像内均匀的分配种子点。假设图片总共有n个像素点,预分割为k个相同尺寸的超像素,那么每个超像素的大小为n/k,则相邻种子点的距离(步长)近似为s=sqrt(n/k);b2:在种子点的n*n邻域内重新选择种子点(一般取n=3)。具体方法为:计算该邻域内所有像素点的梯度值,将种子点移到该邻域内梯度最小的地方;b3:在每个种子点周围的邻域内为每个像素点分配类标签(即属于哪个聚类中心)。和标准的k-means在整张图中搜索不同,slic的搜索范围限制为2s*2s,可以加速算法收敛;b4:距离度量。包括颜色距离和空间距离。对于每个搜索到的像素点,分别计算它和该种子点的距离。b5:迭代优化。理论上上述步骤不断迭代直到误差收敛(可以理解为每个像素点聚类中心不再发生变化为止);b6:增强连通性。经过上述迭代优化可能出现以下瑕疵:出现多连通情况、超像素尺寸过小,单个超像素被切割成多个不连续超像素等,这些情况可以通过增强连通性解决。主要思路是:新建一张标记表,表内元素均为-1,按照“z”型走向(从左到右,从上到下顺序)将不连续的超像素、尺寸过小超像素重新分配给邻近的超像素,遍历过的像素点分配给相应的标签,直到所有点遍历完毕为止。
技术总结
本发明公开了一种显微高光谱胆囊癌图像降维方法,可以减少高光谱胆囊癌图像特征冗余性,从而高效提取高光谱胆囊癌图像的特征,显著提高癌变部位分类的精度,且降维效果较传统的PCA与LDA等降维方法相比,在高光谱胆囊癌图像分类上有明显的优势。传统的降维方法(如PCA与LDA等)是线性降维方法,会导致不同样本类别不可分。而基于超像素流形学习的高光谱胆囊癌图像降维方法,通过引入AWF滤波模块、流行学习PaCMAP模块、超像素模块、和核主成分分析模块,可以利用低维数据来有效地表达高维数据的特征,同时也压缩了数据量,更有利于信息的快速提取。提取。提取。
技术研发人员:高红民 杨琪 朱敏 曹雪莹 李臣明
受保护的技术使用者:河海大学
技术研发日:2022.03.08
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
