一种基于Swin-Transformer的AD分类方法

未命名 09-17 阅读：158 评论：0

一种基于swin-transformer的ad分类方法
技术领域
1.本发明涉及图像视觉领域，具体为一种基于swin-transformer的ad分类方法。

背景技术：

2.目前，由于医学图像的数量训练swin-transformer((层次化视觉))不能充分发挥其优势，深度学习领域的输入图像大小一般调整为224*224，训练和推理都在该分辨率下进行，但目前均将双线性和三线性插值用于图像的缩放，但实际上这种调整在一定程度上限制了网络模型的性能；因此，提供一种基于swin-transformer的ad(全称：alzheimer’s disease，阿尔兹海默)分类方法。

技术实现要素：

3.本发明的目的在于克服现有的缺陷而提供的一种基于swin-transformer的ad分类方法，利用resizer模块与swin-transformer网络联合训练，学习利于swin-transformer网络分类的特征，提升分类性能。
4.实现上述目的的技术方案是：
5.一种基于swin-transformer的ad分类方法，包括：
6.步骤s1，从adni(阿尔茨海默氏病神经影像学倡议)数据库中获取3dsmri(3维结构性磁共振成像)数据；
7.步骤s2，利用matlab(一种计算分析软件)的spm12和cat12工具包通过对3dsmri进行数据转换、ac-pc(前连合-后连合)校准、配准到mni(全称：montreal neurological institute，蒙特利尔神经内科研究院)模板以及直方均衡化等预处理；
8.步骤s3，对图像进行归一化处理，加快收敛速度；
9.步骤s4，创建vgg(全称：visual geometry group，视觉几何组)网络模型，将获取的最大程度保留的灰度图像输入至所述vgg网络模型中；
10.步骤s5，在所述vgg网络模型中，采用cie lab(均匀的颜色空间)颜色空间，通过对灰度图像上给定亮度，并通过image(图像)、opencv(机器视觉)库将亮度-色度颜色空间转换到rgb(红(r)、绿(g)、蓝(b))颜色空间；
11.步骤s6，建立resizer(缩放)模块，从所述vgg模型中获取的rgb图像输入至所述resizer模块中，调整图像的输入尺寸大小为224*224；
12.步骤s7，在所述resizer模块基础上创建swin-transformer网络，通过所述swin-transformer网络对图像进行分类，输出ad分类结果。
13.优选的，所述步骤s5中，采用cie lab颜色空间，通过对灰度图像上给定的亮度y，对两个色度通道a，b进行检索，而后利用image、opencv库将亮度-色度颜色空间转换到rgb颜色空间；
14.对于给定的亮度通道通过学习将其映射到其中h，w为图像维度；
15.对于给定的x，学习x的概率分布其中q为ab输出空间的个数。
16.优选的，所述步骤s5中，所述vgg网络模型利用多项式交叉熵损失比较与真实值，公式如下：
[0017][0018]
其中通过将真实的颜色y转换为向量z，v(
·
)是权重，用于度量颜色类的稀有度从而重新平衡损失，最后将概率分布通过函数映射为颜色值。
[0019]
优选的，所述步骤s7中，在训练所述swin-transformer网络时，采用迁移学习的方式，在imagenet-1k(一个数据集)上预训练权重。
[0020]
优选的，所述swin-transformer网络通过移动窗口机制将计算复杂度从平方级降低到了线性级，并通过跨窗口连接和patchmerging实现多尺度学习。
[0021]
优选的，在所述swin-transformer网络训练过程中使用交叉熵损失函数，公式如下：
[0022][0023]
其中，n是样本个数，yi是第i个样本的标签，p(yi)表示第i个样本被预测为ad的概率。
[0024]
本发明的有益效果是：本发明采用vgg网络模型，实现单通道到三通道的跨通道学习，将获取的最大程度的灰度图像转换成rgb图像，并通过resizer模块对获取的rgb图像调整尺寸大小至224*224，随后输入至swin transformer网络中，通过移动窗口机制使以往的vit计算复杂度从平方级降低到了线性级，并通过跨窗口连接和patch merging实现了多尺度学习，通过resizer模块与swintransformer网络联合训练，提高了ad分类性能。
附图说明
[0025]
图1是本发明的一种基于swin-transformer的ad分类方法的流程图。
具体实施方式
[0026]
下面将结合附图对本发明的技术方案进行清楚、完整地描述。在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相正对地重要性。
[0027]
下面将结合附图对本发明作进一步说明。
[0028]
如图1所示，一种基于swin-transformer的ad分类方法，包括：
[0029]
步骤s1，从adni数据库中获取3d smri数据；其中，adni数据集具体数量如
[0030]
表1所示：
[0031][0032]
表1
[0033]
步骤s2，利用matlab的spm12和cat12工具包通过对3dsmri进行数据转换、ac-pc校准、配准到mni模板以及直方均衡化等预处理。
[0034]
从adni数据集中采集到的原始图像可能为dicom(存储医疗图像的文件格式协议)格式；为了得到便于后续操作的数据格式：nifti，扩展名为.nii；图像预处理需要使用fsl、spm(都为数据处理平台)等工具对采集到的图像完成从dicom到nifti数据格式的转换。
[0035]
校正步骤操作主要是前连合(ac)-后连合(pc)校正，重采样图像采用标准的256
×
256
×
256模式,之后使用n3算法去校正非均匀的组织强度，通过ac
–
pc校正校正之后的图像，通过cat12工具包实施头骨剥离、小脑切除操作。
[0036]
将前面预处理流程的图像配准到标准脑模版空间mni(montreal neurological institute)上，统一所有图像的坐标空间，mni空间是基于大量的正常被试的mri扫描平均得到的新的标准脑，是大脑图像标准化常用到的模版；标准化用到的算法是非刚体配准算法，包括仿射变换与非线性变换等。
[0037]
在完成上述一系列处理后，还需要将图像做一次直方均衡化处理，以抑制功能像的噪声，提高信噪比，减少各图像间仍残余的解剖结构或功能上的不同；通常，直方均衡化处理采用的函数是高斯核(标准方差)函数。
[0038]
步骤s3，对图像进行归一化处理，加快收敛速度；图像尺寸转为256*256*256，体素尺寸为1*1*1mm3，归一化强度值为[0,1]。
[0039]
步骤s4，创建vgg网络模型，将获取的最大程度保留的灰度图像输入至vgg网络模型中。
[0040]
目前大多数实验对输入网络的smri图像要求剥除颅骨以减少无关信息对分类结果的干扰，以及降低模型的计算复杂度；但剥除颅骨完成后仍需手工挑选清洗数据，需要花费更多时间，因此，本发明利用不剥除颅骨的smri图像，省略颅骨剥除和手工清洗数据的步骤，最大程度保留原始图片信息。
[0041]
步骤s5，在所述vgg网络模型中，采用cielab颜色空间，通过对灰度图像上给定的亮度y，对两个色度通道a，b进行检索，而后利用image、opencv库将亮度-色度颜色空间转换到rgb颜色空间。
[0042]
对于给定的亮度通道通过学习将其映射到其中h，w为图像维度；对于给定的x，学习x的概率分布其中其中q为ab输出空间的个数。
[0043]
vgg网络模型利用多项式交叉熵损失比较与真实值，公式如下：
[0044][0045]
其中通过将真实的颜色y转换为向量z，v(
·
)是权重，用于度量颜色类的稀有度从而重新平衡损失，最后将概率分布通过函数映射为颜色值。
[0046]
步骤s6，建立resizer模块，从所述vgg模型中获取的rgb图像输入至所述resizer模块中，利用resizer模块对图像的尺寸进行调整，imagenet(图像识别的数据库)预训练模型大多都是基于224x224尺寸训练的结果，因此将图像输入尺寸调整成大小为224*224。
[0047]
步骤s7，在所述resizer模块基础上创建swin-transformer网络，通过所述swin-transformer网络对尺寸图像进行分类，输出ad分类结果。
[0048]
在训练swin-transformer网络时，采用迁移学习的方式，在imagenet-1k上预训练权重。
[0049]
将尺寸大小为224*224的图像输入swin-transformer网络中，swin-transformer网络通过移动窗口机制将计算复杂度从平方级降低到了线性级，并通过跨窗口连接和patchmerging实现多尺度学习，从而实现对图像的ad分类。
[0050]
在swin-transformer网络训练过程中使用交叉熵损失函数，公式如下：
[0051][0052]
其中，n是样本个数，yi是第i个样本的标签，p(yi)表示第i个样本被预测为ad的概率。
[0053]
其中，利用smri的ad分类方法实验结果与其他实验结果对比如表2所示：
[0054][0055]
表2
[0056]
为验证vgg+reswin(全称：vgg+resizer swin-transformer)的有效性，设置了一系列消融实验，epoch(神经网络超参数)为50，结果如表3所示：
[0057][0058]
表3
[0059]
以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

技术特征：
1.一种基于swin-transformer的ad分类方法，其特征在于，包括：步骤s1，从adni数据库中获取3d smri数据；步骤s2，利用matlab的spm12和cat12工具包通过对3d smri进行数据转换、ac-pc校准、配准到mni模板以及直方均衡化等预处理；步骤s3，对图像进行归一化处理，加快收敛速度；步骤s4，创建vgg网络模型，将获取的最大程度保留的灰度图像输入至所述vgg网络模型中；步骤s5，在所述vgg网络模型中，采用cielab颜色空间，通过对灰度图像上给定亮度，并通过image、opencv库将亮度-色度颜色空间转换到rgb颜色空间；步骤s6，建立resizer模块，从所述vgg模型中获取的rgb图像输入至所述resizer模块中，调整图像的输入尺寸大小为224*224；步骤s7，在所述resizer模块基础上创建swin-transformer网络，通过所述swin-transformer网络对图像进行分类，输出ad分类结果。2.根据权利要求1所述的一种基于swin-transformer的ad分类方法，其特征在于，所述步骤s5中，采用cielab颜色空间，通过对灰度图像上给定的亮度y，对两个色度通道a，b进行检索，而后利用image、opencv库将亮度-色度颜色空间转换到rgb颜色空间；对于给定的亮度通道通过学习将其映射到其中h，w为图像维度；对于给定的x，学习x的概率分布其中q为ab输出空间的个数。3.根据权利要求2所述的一种基于swin-transformer的ad分类方法，其特征在于，所述步骤s5中，所述vgg网络模型利用多项式交叉熵损失比较与真实值，公式如下：其中通过将真实的颜色y转换为向量z，v(
·
)是权重，用于度量颜色类的稀有度从而重新平衡损失，最后将概率分布通过函数映射为颜色值。4.根据权利要求1所述的一种基于swin-transformer的ad分类方法，其特征在于，所述步骤s7中，在训练所述swin-transformer网络时，采用迁移学习的方式，在imagenet-1k上预训练权重。5.根据权利要求4所述的一种基于swin-transformer的ad分类方法，其特征在于，所述swin-transformer网络通过移动窗口机制将计算复杂度从平方级降低到了线性级，并通过跨窗口连接和patch merging实现多尺度学习。6.根据权利要求4所述的一种基于swin-transformer的ad分类方法，其特征在于，在所述swin-transformer网络训练过程中使用交叉熵损失函数，公式如下：其中，n是样本个数，y
i
是第i个样本的标签，p(y
i
)表示第i个样本被预测为ad的概率。

技术总结
本发明涉及一种基于Swin-Transformer的AD分类方法，包括：步骤S1，从ADNI数据库中获取3D sMRI数据；步骤S2，利用Matlab的SPM12和CAT12工具包通过对3D sMRI进行数据转换、AC-PC校准、配准到MNI模板以及直方均衡化等预处理；步骤S3，对图像进行归一化处理，加快收敛速度；步骤S4，创建VGG网络模型，将获取的最大程度保留的灰度图像输入至所述VGG网络模型中；步骤S5，在所述VGG网络模型中，采用CIE lab颜色空间，通过对灰度图像上给定亮度，并通过image、OpenCV库将亮度-色度颜色空间转换到RGB颜色空间；步骤S6，建立Resizer模块，从所述VGG模型中获取的RGB图像输入至所述Resizer模块中，调整图像的输入尺寸大小为224*224。本发明利用Resizer模块与Swin-Transformer网络联合训练，学习利于Swin-Transformer网络分类的特征，提升分类性能。提升分类性能。提升分类性能。

技术研发人员：李琬黄弋航桑屹林严雨姿
受保护的技术使用者：北京工商大学
技术研发日：2023.04.07
技术公布日：2023/9/14

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

一种基于Swin-Transformer的AD分类方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于Swin-Transformer的AD分类方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表