一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统

未命名 10-19 阅读:86 评论:0


1.本发明涉及系统生物学领域,特别涉及一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统。


背景技术:

2.癌症,如非小细胞肺癌,具有高度的异质性,不同的组织学亚型和分期具有不同的诊疗策略。目前临床使用的肺癌分期是国际抗癌联盟(union for international cancer control,uicc)于2017年1月颁布的第八版tnm分期。正确的肺癌分期对于非小细胞肺癌的治疗至关重要,因为治疗方案的选择和预后因分期而异。
3.淋巴结转移与肺癌分期中的n分期有关,通常代表着癌细胞通过某些途径逃避了免疫系统的监视,有淋巴结转移的患者的预后要比没有淋巴结转移的患者差。淋巴结转移也是决定癌症患者有效治疗方案的一个重要因素。以往一些研究报道了淋巴结转移过程中的基因表达异常,但是,非小细胞肺癌具有很高的异质性,单个基因的异常表达不能完全解释癌症的发展和转移。
4.由于是否出现淋巴结转移会显著影响治疗决策,因此非小细胞肺癌评估淋巴结转移的可能性至关重要。zhang等人将淋巴结转移组和非转移组之间差异表达的mrnas、mirnas和lncrnas作为分子特征,构建了不同癌症的淋巴转移预测分类器。对于具有代表性的癌症,分类器实现了最高81.97%的总体准确度。ren等人则利用tcga数据集,提出了一种基于癌症中mirna介导的rna相互作用的差异性相关的预测淋巴结转移方法。其构建了癌症患者特定的mirna介导的rna相互作用网络,并从网络中找出关键的mirna-rna相互作用,对于非小细胞肺癌的预测准确性达到0.867。细胞-细胞相互作用分析可以挖掘组织内部的“生态”,不同亚型和分期的内部“生态”具有一定的差异,挖掘这类差异可以协助疾病的诊疗。例如salcher等人利用cellphonedb分析了肺腺癌(肺腺癌)和肺鳞癌(肺鳞癌)的癌细胞对不同免疫细胞的异细胞串扰的差异。然而,目前大多数肺癌淋巴结转移预测或鉴定的方法都是基于影像学的数据,尚无利用细胞相互作用网络鉴定非小细胞肺癌淋巴结转移的方法。


技术实现要素:

5.鉴于上述状况,本发明的主要目的是为了提出一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,以解决上述技术问题。
6.本发明提供了一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其中,所述系统包括:
7.细胞聚类模块,用于:
8.获取若干患者标准化后的基因表达矩阵,选择基因表达矩阵中标准分数大于设定值的基因作为特征基因,计算特征基因中细胞类型差异和细胞状态差异,根据细胞类型差异,计算两个细胞之间的距离,根据两个细胞之间的距离利用谱聚类完成聚类过程,并对聚
类结果进行分析和细胞类型鉴定,获得标记细胞类型的各个细胞簇;
9.推断计算模块,用于:
10.利用cellchat方法推断各个细胞簇,得到不同患者的细胞相互作用网络,细胞相互作用网络为由相互作用的细胞簇之间的显著的配体-受体对组成的加权有向图;
11.整图嵌入模块,用于:
12.将加权有向图利用graph2vec方法进行整图嵌入,得到不同患者的细胞相互作用网络的向量表示;
13.分类分析模块,用于:
14.将向量表示输入分类器构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性,得到分类模型;
15.模型建立模块,用于:
16.采用fisher精确检验提取细胞相互作用网络的网络特征,网络特征包括不同亚型在不同分期上的若干相互作用,采用label encoding对若干相互作用进行编码,将编码结果输入分类模型中进行分类分析,并采用十次十折交叉验证来训练并验证分类模型的有效性,得到淋巴结转移鉴定模型;
17.类别鉴定模块,用于:
18.将所需预测患者数据重复细胞聚类模块与推断计算模块中的步骤以得到患者细胞相互作用网络,采用fisher精确检验提取患者细胞相互作用网络的网络特征,并进行编码输入淋巴结转移鉴定模型中进行分类分析,根据淋巴结转移鉴定模型分类结果以鉴定病症类别。
19.进一步的,在细胞聚类模块中,根据两个细胞之间的距离利用谱聚类完成聚类过程具体方法包括:
20.步骤1.1、根据细胞之间的距离,利用k最近邻法构建邻接矩阵;
21.步骤1.2、利用谱聚类从邻接矩阵中得到聚类,从邻接矩阵中构建拉普拉斯矩阵;
22.步骤1.3、标准化拉普拉斯矩阵的构造,得到l
norm
前k个最小的特征值及对应的特征向量,将特征向量标准化,得到特征矩阵f;
23.步骤1.4、对特征矩阵f使用离散化的标签分配策略得到标记细胞类型的各个细胞簇。
24.进一步的,在推断计算模块中,利用cellchat方法推断各个细胞簇的方法具体包括:
25.将细胞簇作为信号的发送者和接受者,利用细胞簇作为信号的发送者发出信号的概率之和以及细胞簇作为信号的接收者接收信号的概率之和以推断细胞通讯过程中不同细胞簇作为信号的发送者及接收者的强度,得到细胞相互作用网络。
26.在整图嵌入模块中,一组加权有向图表示为g={g1,g2,...,gn};
27.为图集中的每一个图gi∈g训练一个δ维的向量表示,所有图的向量表示矩阵表示为:φ∈r
|g|
×
δ
,r
|g|
×
δ
向量表示矩阵的行数为有向图g的长度,即|g|,列数为δ;
28.将一组加权有向图表示为g={n,e,λ},其中n是节点的集合,是边的集合;
29.当有一个函数λ:n

1从字母表1中为每个节点n∈n分配一个唯一的标签。
30.进一步的,在分类分析模块中,分类器为逻辑回归,将向量表示输入逻辑回归算法构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性的方法具体包括:
31.步骤4.1a、将向量表示利用十折交叉分为训练数据集与测试数据集;
32.步骤4.2a、将训练数据集与测试数据集进行降维,再进行归一化处理;
33.步骤4.3a、将处理后的训练数据集输入逻辑回归算法中进行模型训练,训练过程中,利用梯度下降法更新模型参数,并采用正则化防止过度拟合;
34.步骤4.4a、模型训练完成后,将测试数据集输入训练后的模型验证模型的有效性,得到分类模型。
35.进一步的,在分类分析模块中,分类器为svm,将向量表示输入svm算法构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性的方法具体包括:
36.步骤4.1b、将向量表示利用十折交叉分为训练数据集与测试数据集;
37.步骤4.2b、将训练数据集与测试数据集进行降维,再进行归一化处理;
38.步骤4.3b、将训练数据集输入svm算法,使用核函数将处理后的训练数据集映射到高维空间中;
39.步骤4.4b、在高维空间中寻找一个超平面,使得各类数据点到该超平面的距离最大;
40.步骤4.5b、训练过程中,利用梯度下降法更新模型参数,并采用正则化防止过度拟合;
41.步骤4.6b、模型训练完成后,将测试数据集输入训练后的模型验证模型的有效性,得到分类模型。
42.进一步的,在模型建立模块中,利用fisher精确检验提取细胞相互作用网络的网络特征的具体方法包括:
43.步骤5.1、统计细胞相互作用网络中所有相互作用在不同类别的阳性情况,得到阳性和阴性的频数;
44.步骤5.2、排除在所有类别阳性的比例小于10%的相互作用,减小cellchat假阳性的影响;
45.步骤5.3、利用fisher精确检验检查每一个相互作用与不同类别的相关性,零假设该相互作用是否阳性与类别无关;
46.步骤5.4、根据相互作用在不同类别阳性的比例,确定每一个相互作用是哪一个类别的特征,根据fisher精确检验结果,确认相互作用是否与类别显著相关,筛选并统计显著的相互作用,以显著的相互作用作为该类别的特征,提取该类别的特征作为细胞相互作用网络的网络特征。
47.根据相互作用在不同类别阳性的比例,确定每一个相互作用是哪一个类别的特征。例如,对于相互作用fisher精确检验结果p-value=0.00257,该相互作用与类别显著相关,并且其在肺腺癌阳性比例更高,该相互作用可作为肺腺癌的特征,以肺腺癌的特征作为细胞相互作用网络的网络特征。
48.进一步的,在模型建立模块中,在计算频数时,若患者缺少相互作用相关的细胞类
型,则该患者被排除,假设某一类别缺少细胞类型的患者的占比大于75%,则该相互作用被排除。
49.本发明的附加方面与优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
附图说明
50.图1为本发明提出的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统的结构图;
51.图2为本发明部分细胞相互作用网络可视化图;
52.图3为本发明非小细胞肺癌luad无淋巴结转移组(n0)与正常样本具有显著差异的相互作用对应通路占比图;
53.图4为本发明非小细胞肺癌luad无淋巴结转移组(n0)与淋巴结转移组(n1|n2|n3)具有显著差异的相互作用对应通路占比图;
54.图5为本发明正常样本、n0和n1|n2|n3三分类模型在十次十折交叉验证中的性能指标图;
55.图6为本发明n0和n1|n2|n3组分类模型在十次十折交叉验证中的性能指标图;
56.图7为本发明非小细胞肺癌组织学亚型分类模型在十次十折交叉验证中的性能指标图;
57.图8为本发明基于不同类型特征的淋巴结转移鉴定模型(逻辑回归)在十次十折交叉验证中的性能指标图。
具体实施方式
58.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
59.参照下面的描述和附图,将清楚本发明的实施例的这些和其他方面。在这些描述和附图中,具体公开了本发明的实施例中的一些特定实施方式,来表示实施本发明的实施例的原理的一些方式,但是应当理解,本发明的实施例的范围不受此限制。
60.本发明实施例从6个数据集,所有患者的样本均采集自肿瘤原发部位,肺腺癌(luad)患者69名,肺鳞癌(lusc)患者41名。6个数据集中部分患者由于没有提供n分期的信息而没有被包含在内。
61.请参阅图1,本发明实施例提供了本发明提供了一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,所述系统包括:
62.细胞聚类模块,用于:
63.获取若干患者标准化后的基因表达矩阵,选择基因表达矩阵中标准分数大于设定值的基因作为特征基因,计算特征基因中细胞类型差异和细胞状态差异,根据细胞类型差异,计算两个细胞之间的距离,根据两个细胞之间的距离利用谱聚类完成聚类过程,并对聚类结果进行分析和细胞类型鉴定,获得标记细胞类型的各个细胞簇;
64.其中,根据两个细胞之间的距离利用谱聚类完成聚类过程具体方法包括如下步
骤:
65.步骤1.1、根据细胞之间的距离,利用k最近邻法构建邻接矩阵;
66.步骤1.2、利用谱聚类从邻接矩阵中得到聚类,从邻接矩阵中构建拉普拉斯矩阵,拉普拉斯矩阵l的表达式为:
67.l=d-w;
68.其中,w为邻接矩阵,l为拉普拉斯矩阵,d为度矩阵;
69.其中,度矩阵和邻接矩阵存在如下关系式:
70.d
ii
=∑
alljwij

71.其中,d
ii
表示度矩阵d中第i行第i列的值,allj表示第j列所有的值,w
ij
表示邻接矩阵w中第i行第j列的值。
72.步骤1.3、标准化拉普拉斯矩阵的构造:l
norm
=d-1/2
ld-1/2
,得到l
norm
前k个最小的特征值及对应的特征向量,将特征向量标准化,得到特征矩阵f;
73.步骤1.4、对特征矩阵f使用离散化的标签分配策略得到标记细胞类型的各个细胞簇。
74.进一步的,标准化拉普拉斯矩阵的构造的方法具体包括:
75.利用邻接矩阵创建无同图g,对无同图g进行的切图,得到相互没有连接的k个子图,其中每个子图点的集合为a1,a2,...,ak,任意两个不相同的子图点ai和aj满足ai∩aj=φ,且子图点a1∪a2∪...∪ak=v,v表示无向图g中各个顶点的集合;
76.其中,任意两个子图定义a和b之间的切图权重为:
77.w(a,b)=∑
i∈a,j∈bwij

78.对于k个子图的集合a1,a2,...,ak,定义切图cut为:
[0079][0080]
其中,表示ai的平均值,表示ai与的切图权重,对每个子图的规模做出限定,最小化切图cut(a1,a2,...,ak),并最大化每个子图点的个数,即:
[0081][0082]
其中,vol(ai)表示子图ai内所有顶点的度之和;
[0083]
聚类指标矩阵记引入指示向量hj∈{h1,h2,...,hk},j=1,2,...,k,对ncut函数最小化,其中任意一个向量hj,为n维向量既样本数,h
ij
表示指示向量hj的第i维,h
ij
定义表达式为:
[0084][0085]
其中,vi表示各个子图点中的各个顶点;
[0086]
那么对于表示向量hi的转置与拉普拉斯矩阵l以及hi相乘,有:
[0087][0088]
所以,ncut函数可以表示为:
[0089][0090]
其中tr(h
t
lh)为矩阵h
t
lh的迹,(h
t
lh)
ii
表示矩阵h
t
lh第i行第i列的值。最终,优化目标可以表示为:
[0091]
aurg min tr(h
t
lh)s.t.h
t
dh=i;
[0092]
其中,f
t
f表示特征矩阵f的转置乘以特征矩阵f;
[0093]
此时h中的指示向量h并不是标准正交基。所以,令h=d-1/2
f,则优化目标变为:
[0094]
arg min tr(f
t
d-1/2
ld-1/2
f)s.t.f
t
f=i;
[0095]
计算d-1/2
ld-1/2
的前k个最小的特征值及对应的特征向量,将特征向量标准化,得到特征矩阵f,对特征矩阵f使用离散化的标签分配策略得到标记细胞类型的各个细胞簇。
[0096]
推断计算模块,用于:
[0097]
利用cellchat方法推断各个细胞簇,得到不同患者的细胞相互作用网络,细胞相互作用网络为由相互作用的细胞簇之间的显著的配体-受体对组成的加权有向图;
[0098]
其中,利用cellchat方法推断各个细胞簇的具体方法包括:将细胞簇作为信号的发送者和接受者,利用细胞簇作为信号的发送者发出信号的概率之和以及细胞簇作为信号的接收者接收信号的概率之和以推断细胞通讯过程中不同细胞簇作为信号的发送者及接收者的强度,得到细胞相互作用网络。本实施例中cellchat参数设置:所涉及的参数均使用默认值。
[0099]
整图嵌入模块,用于:
[0100]
将加权有向图利用graph2vec方法进行整图嵌入,得到不同患者的细胞相互作用网络的向量表示;
[0101]
其中,细胞相互作用网络内存在着丰富的信息,特别是不同患者在网络结构上的差异。但较为离散化的特征对随后的分析较为困难,本发明实施例中使用无监督整图嵌入
方法graph2vec,graph2vec参数设置:嵌入的维度为64,epochs为128,初始学习率为0.005,其它参数使用默认值;该方法是数据驱动的,其需要一个相当大的图集来学习图表示。这种方法的一个优点是能够捕捉到图结构上的相似性:结构上相似的图的向量在向量空间中是相近的。
[0102]
其中,一组加权有向图表示为g={g1,g2,...,gn};
[0103]
为图集中的每一个图gi∈g训练一个δ维的向量表示,所有图的向量表示矩阵表示为:φ∈r
|g|
×
δ
,r
|g|
×
δ
表示矩阵的行数为有向图g的长度,即|g|,列数为δ,矩阵中的值为各个子图顶点的数据。
[0104]
将一组加权有向图表示为g={n,e,λ},其中n是节点的集合,是边的集合;
[0105]
当有一个函数λ:n

1从字母表1中为每个节点n∈n分配一个唯一的标签。
[0106]
此外,边也可以被标记,在这种情况下,有一个边的标记函数,标记函数的表达式为:
[0107]
η:e

1;
[0108]
该方法的主要是把整个图看作是一个文件,把每个节点周围的有根子图(包括一定程度的邻域)看作是构成文件的词。既不同的子图组成图,就像不同的词在一起使用时组成句子/文件一样。
[0109]
分类分析模块,用于:
[0110]
将向量表示输入分类器构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性,得到分类模型;
[0111]
其中,分类器为逻辑回归,将向量表示输入逻辑回归算法构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性的方法具体包括如下步骤:
[0112]
步骤4.1a、将向量表示利用十折交叉分为训练数据集与测试数据集;
[0113]
步骤4.2a、将训练数据集与测试数据集进行降维,再进行归一化处理;
[0114]
步骤4.3a、将处理后的训练数据集输入逻辑回归算法中进行模型训练,训练过程中,利用梯度下降法更新模型参数,并采用正则化防止过度拟合;
[0115]
步骤4.4a、模型训练完成后,将测试数据集输入训练后的模型验证模型的有效性,得到分类模型。
[0116]
其中,分类器为svm,将向量表示输入svm算法构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性的方法具体包括如下步骤:
[0117]
步骤4.1b、将向量表示利用十折交叉分为训练数据集与测试数据集;
[0118]
步骤4.2b、将训练数据集与测试数据集进行降维,再进行归一化处理;
[0119]
步骤4.3b、将训练数据集输入svm算法,使用核函数将处理后的训练数据集映射到高维空间中;
[0120]
步骤4.4b、在高维空间中寻找一个超平面,使得各类数据点到该超平面的距离最大;
[0121]
步骤4.5b、训练过程中,利用梯度下降法更新模型参数,并采用正则化防止过度拟合;
[0122]
步骤4.6b、模型训练完成后,将测试数据集输入训练后的模型验证模型的有效性,得到分类模型。
[0123]
模型建立模块,用于:
[0124]
采用fisher精确检验提取细胞相互作用网络的网络特征,网络特征包括肺腺癌和肺鳞癌无淋巴结转移组(n0)和淋巴结转移组(n1|n2|n3)的特征,共计552个相互作用,采用label encoding对相互作用进行编码,患者对相互作用呈阳性为1,阴性为0,共计110个患者,将编码结果输入分类模型中进行分类分析,并采用十次十折交叉验证来训练并验证分类模型的有效性,得到淋巴结转移鉴定模型。
[0125]
其中,利用fisher精确检验提取细胞相互作用网络的网络特征的具体方法包括如下步骤:
[0126]
步骤5.1、统计细胞相互作用网络中所有相互作用在不同类别(亚型或分期)的阳性情况,得到阳性和阴性的频数;计算频数时,若患者缺少相互作用相关的细胞类型,则该患者被排除,如相互作用患者a缺少细胞类型在计算该相互作用阳性和阴性的频数时,排除该患者。假设某一类别缺少细胞类型的患者的占比大于75%,则该相互作用被排除。
[0127]
步骤5.2、排除在所有类别阳性的比例小于10%的相互作用,减小cellchat假阳性的影响;
[0128]
步骤5.3、利用fisher精确检验(95%置信度)检查每一个相互作用与不同类别的相关性,零假设该相互作用是否阳性与类别无关;
[0129]
步骤5.4、根据相互作用在不同类别阳性的比例,确定每一个相互作用是哪一个类别的特征,根据fisher精确检验结果,确认相互作用是否与类别显著相关,筛选并统计显著的相互作用,以显著的相互作用作为该类别的特征,提取该类别的特征作为细胞相互作用网络的网络特征。例如,对于相互作用网络的网络特征。例如,对于相互作用fisher精确检验结果p-value=0.00257,该相互作用与类别显著相关,并且其在肺腺癌阳性比例更高,该相互作用可作为肺腺癌的特征。
[0130]
类别鉴定模块,用于:
[0131]
将所需预测患者数据重复细胞聚类模块与推断计算模块中的步骤以得到患者细胞相互作用网络,采用fisher精确检验提取患者细胞相互作用网络的网络特征,并进行编码输入淋巴结转移鉴定模型中进行分类分析,根据淋巴结转移鉴定模型分类结果以鉴定病症类别。
[0132]
为了发现一些已知与肺癌发展有关的相互作用证明方法的有效性,分别分析了肺腺癌和肺鳞癌各个阶段在细胞相互作用网络上的差异,发现了肺腺癌和肺鳞癌在各个阶段的特征,描述了肺癌淋巴结转移发展图谱。具体方法为:将网络特征分别对比正常样本与肺腺癌无淋巴结转移组(n0)在细胞相互作用网络上的差异、肺腺癌无淋巴结转移组(n0)与淋巴结转移组(n1|n2|n3)在细胞相互作用网络上的差异、正常样本与肺鳞癌无淋巴结转移组(n0)在细胞相互作用网络上的差异、肺鳞癌无淋巴结转移组(n0)与淋巴结转移组(n1|n2|n3)在细胞相互作用网络上的差异。
[0133]
图2显示了本发明实施例采用的cellchat方法推断出的细胞相互作用网络,图中
展示了部分可视化的患者相互作用网络。图3显示了对比正常样本与肺腺癌无淋巴结转移组(n0)在细胞相互作用网络上的差异的结果。结果显示,54个相互作用属于肺腺癌无淋巴结转移组(n0)的特征,归属于15个信号通路。在这其中,隶属于mk信号通路的相互作用有16个,占比最大。mk通路中的mdk蛋白的过表达已被确定与nsclc患者的恶性状态和不良预后之间存在明显的关联。并且mdk蛋白的过表达与nsclc患者的临床分期、t分期、n分期和m分期呈正相关。图4显示了比较肺腺癌无淋巴结转移组(n0)与淋巴结转移组(n1|n2|n3)在细胞相互作用网络上的差异的结果,共找到116个相互作用,涉及27个通路。结果发现collagen通路在正常样本与n0组,和n0组和n1|n2|n3组之间都存在阳性比例具有显著差异的相互作用。在n0组和n1|n2|n3分析结果中,collagen信号通路涉及34个相互作用,占29.31%。
[0134]
本发明实施例中分类采用十折交叉验证评估结果,重复10次。二分类评价指标为准确率、精确率、召回率、f1-score、mcc和auc;多分类评价指标为micro-f1、macro-f1、mcc和auc。最终结果取平均数,并计算95%置信水平的置信区间。图5显示了利用整图嵌入训练的分类器可以很好的区分三者,两种分类器micro-f1和macro-f1都在0.8以上。如图6所示,在排除正常样本后,仅区分n0组和n1|n2|n3组,f1-score也可以达到0.7937。
[0135]
对6个数据集中的两种组织学亚型采用分类模型进行分类。如图7所示,两种分类器的f1-score达到了0.891和0.911,分类效果良好。上述结果表明:非小细胞肺癌两种组织学亚型以及无淋巴结转移组(n0)和淋巴结转移组(n1|n2|n3)之间在细胞相互作用网络上存在显著差异。
[0136]
为了评估提取的网络特征能否真实反映淋巴结转移的特征,本发明整合了肺腺癌和肺鳞癌无淋巴结转移组(n0)和淋巴结转移组(n1|n2|n3)的特征,共计552个相互作用,并使用label encoding编码特征,患者对相互作用呈阳性为1,阴性为0,共计110个患者。分类器为逻辑回归,并使用十次十折交叉验证测试模型性能。结果如图8所示,提取的相互作用特征,对于肿瘤样本的淋巴结转移鉴定具有强大的作用。并且,经过特征提取后训练的模型明显优于只进行了图嵌入的分类模型。
[0137]
相较于现有技术,本发明的有益效果如下:
[0138]
1、现有预测和鉴定淋巴结转移的技术大多是基于bulk测序的数据,本发明则是基于单细胞测序预测淋巴结转移的方法,在模型性能上优于最新的基于bulk测序预测淋巴结转移的办法。
[0139]
2、现有技术大多是直接使用图嵌入提取细胞相互作用网络特征直接构建模型,本发明采用fisher精确检验提取特征来进一步优化模型,提升了模型性能,进而保证鉴定和预测结果的准确性。
[0140]
3、现有技术大多基于影像学数据来预测和鉴定淋巴结转移,本发明不需要使用影像学数据,降低了方法的复杂程度。
[0141]
应当理解的,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现
场可编程门阵列(fpga)等。
[0142]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0143]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

技术特征:
1.一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征在于,所述系统包括:细胞聚类模块,用于:获取若干患者标准化后的基因表达矩阵,选择基因表达矩阵中标准分数大于设定值的基因作为特征基因,计算特征基因中细胞类型差异和细胞状态差异,根据细胞类型差异,计算两个细胞之间的距离,根据两个细胞之间的距离利用谱聚类完成聚类过程,并对聚类结果进行分析和细胞类型鉴定,获得标记细胞类型的各个细胞簇;推断计算模块,用于:利用cellchat方法推断各个细胞簇,得到不同患者的细胞相互作用网络,细胞相互作用网络为由相互作用的细胞簇之间的显著的配体-受体对组成的加权有向图;整图嵌入模块,用于:将加权有向图利用graph2vec方法进行整图嵌入,得到不同患者的细胞相互作用网络的向量表示;分类分析模块,用于:将向量表示输入分类器构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性,得到分类模型;模型建立模块,用于:采用fisher精确检验提取细胞相互作用网络的网络特征,网络特征包括不同亚型在不同分期上的若干相互作用,采用label encoding对若干相互作用进行编码,将编码结果输入分类模型中进行分类分析,并采用十次十折交叉验证来训练并验证分类模型的有效性,得到淋巴结转移鉴定模型;类别鉴定模块,用于:将所需预测患者数据重复细胞聚类模块与推断计算模块中的步骤以得到患者细胞相互作用网络,采用fisher精确检验提取患者细胞相互作用网络的网络特征,并进行编码输入淋巴结转移鉴定模型中进行分类分析,根据淋巴结转移鉴定模型分类结果以鉴定病症类别。2.根据权利要求1所述的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征在于,在细胞聚类模块中,根据两个细胞之间的距离利用谱聚类完成聚类过程具体包括:步骤1.1、根据细胞之间的距离,利用k最近邻法构建邻接矩阵;步骤1.2、利用谱聚类从邻接矩阵中得到聚类,从邻接矩阵中构建拉普拉斯矩阵;步骤1.3、标准化拉普拉斯矩阵的构造,得到l
norm
前k个最小的特征值及对应的特征向量,将特征向量标准化,得到特征矩阵f;步骤1.4、对特征矩阵f使用离散化的标签分配策略得到标记细胞类型的各个细胞簇。3.根据权利要求1所述的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征在于,在推断计算模块中,利用cellchat方法推断各个细胞簇的方法具体包括:将细胞簇作为信号的发送者和接受者,利用细胞簇作为信号的发送者发出信号的概率之,以及细胞簇作为信号的接收者接收信号的概率之和以推断细胞通讯过程中不同细胞簇作为信号的发送者及接收者的强度,进而得到细胞相互作用网络。4.根据权利要求1所述的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征
在于,在分类分析模块中,分类器为逻辑回归,将向量表示输入逻辑回归算法构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性的方法具体包括:步骤4.1a、将向量表示利用十折交叉分为训练数据集与测试数据集;步骤4.2a、将训练数据集与测试数据集进行降维,再进行归一化处理;步骤4.3a、将处理后的训练数据集输入逻辑回归算法中进行模型训练,训练过程中,利用梯度下降法更新模型参数,并采用正则化防止过度拟合;步骤4.4a、模型训练完成后,将测试数据集输入训练后的模型验证模型的有效性,得到分类模型。5.根据权利要求1所述的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征在于,在分类分析模块中,分类器为svm,将向量表示输入svm算法构建模型进行分类分析,并采用十次十折交叉验证来训练并验证模型的有效性的方法具体包括:步骤4.1b、将向量表示利用十折交叉分为训练数据集与测试数据集;步骤4.2b、将训练数据集与测试数据集进行降维,再进行归一化处理;步骤4.3b、将训练数据集输入svm算法,使用核函数将处理后的训练数据集映射到高维空间中;步骤4.4b、在高维空间中寻找一个超平面,使得各类数据点到该超平面的距离最大;步骤4.5b、训练过程中,利用梯度下降法更新模型参数,并采用正则化防止过度拟合;步骤4.6b、模型训练完成后,将测试数据集输入训练后的模型验证模型的有效性,得到分类模型。6.根据权利要求1所述的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征在于,在模型建立模块中,利用fisher精确检验提取细胞相互作用网络的网络特征的具体方法包括:步骤5.1、统计细胞相互作用网络中所有相互作用在不同类别的阳性情况,得到阳性和阴性的频数;步骤5.2、排除在所有类别阳性的比例小于10%的相互作用,减小cellchat假阳性的影响;步骤5.3、利用fisher精确检验检查每一个相互作用与不同类别的相关性,零假设该相互作用是否阳性与类别无关;步骤5.4、根据相互作用在不同类别阳性的比例,确定每一个相互作用是哪一个类别的特征,根据fisher精确检验结果,确认相互作用是否与类别显著相关,筛选并统计显著的相互作用,以显著的相互作用作为该类别的特征,提取该类别的特征作为细胞相互作用网络的网络特征。7.根据权利要求6所述的基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,其特征在于,在模型建立模块中,在计算频数时,若患者缺少相互作用相关的细胞类型,则该患者被排除,假设某一类别缺少细胞类型的患者的占比大于75%,则该相互作用被排除。

技术总结
本发明提出一种基于细胞相互作用网络的肺癌淋巴结转移鉴定系统,该系统用于:获取若干患者标准化后的基因表达矩阵并进行聚类分析,利用聚类结果推断细胞相互作用网络,将细胞相互作用网络进行整图嵌入,得到细胞相互作用网络的向量表示,利用逻辑回归算法对向量表示进行分类分析,得到分类模型,再提取患者细胞相互作用网络的网络特征,将网络特征输入分类模型训练,得到淋巴结转移鉴定模型,将所需预测患者数据输入淋巴结转移鉴定模型获取分类结果,根据分类结果鉴定患者的病症类别,根据病症类别提前预测淋巴结转移的发生。本发明能够有助于确定肺癌患者的特征,鉴定病症类别。别。别。


技术研发人员:周娟 魏壹明 李亦欣 林杨凯 李雄 陈浩文
受保护的技术使用者:华东交通大学
技术研发日:2023.07.12
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐