一种层级聚类约束的多标签细粒度术后并发症预测装置的制作方法

未命名 07-19 阅读:112 评论:0


1.本发明属于医疗数据挖掘领域,特别涉及癌症术后并发症预测方面,具体为一种层级聚类约束的多标签细粒度术后并发症预测装置。


背景技术:

2.肺癌是一种急性疾病,其由细胞变异导致异常生长并可能侵袭周围组织器官,并远距离转移。对于早期肺癌,手术治疗是唯一实现根治的方法。但手术切除是有创治疗方式,会引发各种并发症,如肺部感染、肺不张、肺栓塞等,给术后患者带来了严重的伤害,同时增加了经济负担。
3.尽管众多研究利用患者术前及术中数据,结合统计学、机器学习方法,构建并发症预测模型已成为当今医疗领域的研究热点,但是现有的预测模型仍然存在一些问题。其中最突出的问题是缺乏细粒度的预测信息。大多数相关研究(wang, c., wang, s., li, z. et al. a multiple-center nomogram to predict pneumonectomy complication risk for non-small cell lung cancer patients. ann surg oncol 29, 561

569 (2022). https://doi.org/10.1245/s10434-021-10504-1)将所有并发症合并在一起,而忽略了它们之间的差异性,这使得预测模型只能告诉医生患者是否存在并发症的风险,而无法具体指出哪些并发症可能发生。因此,这样的预测模型在临床实践中的实用性很有限。
4.此外,另外一个问题是现有技术中的预测模型未充分考虑细粒度术后并发症与是否发生并发症之间的约束关系,例如alexander, b. et al. assessing the utility of deep neural networks in predicting postoperative surgical complications: a retrospective study. the lancet digital health 3, e471-e485 (2021). https://doi.org/10.1016/s2589-7500(21)00084-4。虽然一些研究采用了多标签分类方法来预测患者会发生哪些并发症,但是这些方法并没有考虑到不同并发症之间的相互制约关系。例如,某些并发症的发生可能导致其他并发症的发生概率降低,而某些并发症的发生则可能增加其他并发症的发生概率。因此,如果预测模型能够考虑到这些约束关系,就可以提高预测的准确性和可靠性,更好地指导医生进行临床决策。


技术实现要素:

5.鉴于上述,为解决现有术后并发症预测中存在的问题,本发明提供一种层级聚类约束的多标签细粒度术后并发症预测方法和装置,通过引入层级聚类图构建网络架构,进而预测精准度。
6.为实现上述发明目的,本发明实施例提供了一种层级聚类约束的多标签细粒度术后并发症预测装置,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,处理器执行计算机程序时实现以下步骤:根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;基于损失函数对预测模型进行参数优化;利用优化的预测模型进行术后并发症预测。
7.在一个实施例中,所述层次聚类图的构建采用团聚型层次聚类的方式,利用余弦距离或欧氏距离计算不同细粒度术后并发症之间的距离,然后利用全连接算法、单链接算法或平均连接算法对不同细粒度术后并发症进行层次聚类,构建每个系统并发症下各个细粒度有并发症之间的层次聚类图。
8.在一个实施例中,所述底层网络采用全连接层+relu激活函数或transformer编码层,通过全连接层+relu激活函数或transformer编码层对临床诊疗数据进行映射以获得底层隐藏特征,该底层隐藏特征作为次层网络的输入值;所述次层网络的分支数量与系统并发症数量相等,每个分支采用全连接层+relu激活函数或transformer编码层,将底层隐藏特征映射为次层隐藏特征,该次层隐藏特征作为中间层网络的输入值。
9.在一个实施例中,所述中间网络包含多个子网络,每个子网络与一个系统并发症对应的层次聚类图对应,且子网络的拓扑关系与对应层次聚类图的拓扑关系相同,子网络的层数与层次聚类图的最大深度相等;每个子网络采用全连接层+relu激活函数或transformer编码层,将输入的次层隐藏特征映射为中间隐藏特征,该中间隐藏特征作为预测网络的输入值。
10.在一个实施例中,所述预测网络包括映射层和相对应的sigmoid激活函数,用于对输入的中间隐藏特征进行映射后再通过sigmoid激活函数作非线性变换,预测并输出细粒度术后并发症概率。
11.在一个实施例中,所述基于次层隐藏特征预测的整体并发症概率通过以下方式得到:将所有次层网络隐藏特征拼接为次层拼接网络隐藏特征,通过映射层和相应的sigmoid层对次层拼接网络隐藏特征进行映射,预测并输出整体并发症概率。
12.在一个实施例中,所述预测损失包括:各细粒度术后并发症概率与各细粒度术后并发症的真实标签之间的二分类交叉熵损失,整体并发症概率与是否发生整体并发症的标签之间的二分类交叉熵损失。
13.在一个实施例中,是否发生整体并发症的标签通过以下方式获得:利用各细粒度术后并发症的真实标签进行或运算,得到是否发生整体并发症的标签。
14.在一个实施例中,所述自下而上的层级约束损失的构建方式包括:当没有整体并发症发生时,不会有一项细粒度术后并发症,以此逻辑构建自下而上的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部;所述自上而下的层级约束损失的构建方式包括:当有任意一项细粒度术后并发症
发生时,会发生整体并发症,以此逻辑构建自上而下的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部。
15.为实现上述发明目的,实施例还提供了一种层级聚类约束的多标签细粒度术后并发症预测装置,包括数据获取单元、模型构建单元、损失函数构建单元、训练单元、应用单元,所述数据获取单元用于根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;所述模型建构单元用于构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;所述损失函数构建单元用于构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;所述训练单元用于基于损失函数对预测模型进行参数优化;所述应用单元用于利用优化的预测模型进行术后并发症预测。
16.与现有技术相比,本发明具有的有益效果至少包括:首先利用医学先验知识将并发症按系统并发症这一大类进行分类;然后利用层级聚类构建每个系统并发症相对于各细粒度术后并发症的层次聚类图;再依据各层次聚类图构建网络架构,在构建损失函数时,通过添加是否发生整体并发症的辅助预测任务,并利用次层隐藏特征来进行预测;最后通过设计两种层级约束损失,来实现细粒度术后并发症与是否发生整体并发症之间的约束关系,从而可实现更为精准的细粒度术后并发症预测。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
18.图1是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测方法的流程图;图2是本发明实施例提供的构建层次聚类图的流程图;图3是本发明实施例提供的层次聚类图的一个示例图;图4是本发明实施例提供的预测模型的结构示意图;图5是本发明实施例提供的预测模型的一个实例图;图6是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测装置的结构图;图7是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测装置的另一结构图。
具体实施方式
19.为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
20.本发明的发明构思为:为了解决现有技术中对细粒度术后并发症预测不精确的问题,本发明实施例提供了一种层级聚类约束的多标签细粒度术后并发症预测方法和装置,利用细粒度术后并发症之间的相关性以及与是否发生整体并发症之间的约束,来实现更为精准的细粒度术后并发症预测。
21.图1是本发明实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测方法的流程图。如图1所示,实施例提供的层级聚类约束的多标签细粒度术后并发症预测,包括以下步骤:
22.s110,根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图。
23.实施例中,针对待预测的z种细粒度术后并发症,构建层次聚类图的过程包括:如图2所示,s1101,按照医学先验知识将多种细粒度术后并发症分类为不同系统并发症,例如分类为呼吸系统并发症、心血管系统并发症等n种不同系统并发症;s1102,利用层次聚类方法为每个系统并发症构建对应的层次聚类图,所有层次聚类图中的最大深度记为m。
24.具体地,为构建每个大类对应的系统并发症下,各细粒度术后并发症之间的相关关系,采用团聚型层次聚类(agglomerative)方式,利用余弦距离或欧氏距离计算不同细粒度术后并发症之间的距离,然后利用全连接算法、单链接算法或平均连接算法对不同细粒度术后并发症进行层次聚类,构建每个系统并发症下各个细粒度术后并发症之间的层次聚类图。
25.示例性地,利用上述s1101和s1102所示的层次聚类图构建方式,构建如图3所述的呼吸系统并发症的层次聚类图和心血管系统并发症的层次聚类图,其中,呼吸系统并发症的层次聚类图的深度为2,对应的细粒度术后并发症包括肺不张y1,哮喘发作y2,胸腔积液y3,肺部感染y4。心血管系统并发症的层次聚类图的深度为3,对应的细粒度术后并发症包括肺栓塞y5,神经脉血栓y6,心律失常y7,心绞痛y8。
26.s120,构建预测模型,包括底层网络、次层网络、中间网络以及预测网络。
27.实施例中,根据每个系统并发症的层次聚类图构建预测模型,如图4所示,整个预测模型包括底层网络、次层网络、中间网络以及预测网络,其中,底层网络用于将临床诊疗数据映射为底层隐藏特征,次层网络与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征,中间网络与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征,预测网络用于依据各中间隐藏特征预测各细粒度术后并发症概率。
28.实施例中,底层网络采用全连接层+relu激活函数或transformer编码层,通过全连接层+relu激活函数或transformer编码层对临床诊疗数据进行映射以获得底层隐藏特征,该底层隐藏特征作为次层网络的输入值。
29.具体地,如图5所示,利用一层全连接层将原始的临床诊疗数据x进行映射,再经过relu激活函数进行非线性变换,得到底层隐藏特征,对应整个预测模型的根节
点,其中和的上标为网络的层数,小标为该层网络的个数。
30.实施例中,次层网络的分支数量与系统并发症数量相等,每个分支采用全连接层+relu激活函数或transformer编码层,将底层隐藏特征线性映射为次层隐藏特征,该次层隐藏特征作为中间层网络的输入值。
31.具体地,次层网络中,利用n个全连接层{,,

,}将底层隐藏特征作为输入,将输出经过relu激活函数后,得到n个次层隐藏特征{,,

,},对应于n个系统并发症的节点,也即对应n个层次聚类图的父节点。示例性地,如图5所示,次层网络的分支数量为2,与呼吸系统并发症和心血管系统并发症两个系统并发症的数量对应相等,即利用2个全连接层{,}和relu激活函数将输入的底层隐藏特征映射得到2个次层隐藏特征{,}。
32.实施例中,中间网络包含多个子网络,每个子网络与一个系统并发症对应的层次聚类图对应,且子网络的拓扑关系与对应层次聚类图的拓扑关系相同,子网络的层数与层次聚类图的最大深度相等;每个子网络采用全连接层+relu激活函数或transformer编码层,将输入的次层隐藏特征映射为中间隐藏特征,该中间隐藏特征作为预测网络的输入值。
33.具体地,根据每种系统并发症对应的次级隐藏特征{,,

,},和每种系统并发症的层次聚类图,构建对应的中间网络。构建过程为:
34.(a)针对每个层次聚类图的每个最底层父节点,将父节点对应的隐藏特征作为两个新网络层和的输入,并经过relu激活函数变换后,得到关于两个分支的第三层隐藏特征和,分别利用遍历所有全部层级聚类图的所有父节点得到全部第三层隐藏特征{,,

,}, 。
35.(b)判断当前隐藏特征层数m是否小于m+2。实施例中,步骤(b)为判断当前与层级聚类图对应的中间网络是否已经完成构建,即达到最大深度。若m小于m+2,则表明还有隐藏特征未达到最大深度,隐藏特征对应在层次聚类图中的节点还有非叶子节点,则执行(c)。若m等于m+2,则表明所有隐藏特征均对应于层次聚类图中的叶子节点,中间网络构建完成,则执行构建预测网络。
36.(c)判断当前第m层的隐藏特征是否均根据层次聚类图中对应节点的分裂情况来构建相应的网络结构。实施例中,步骤(c)判断当前第m层隐藏特征是否都根据层次聚类图中对应节点分类情况进行了特征提取处理。当还有未处理的隐藏特征时,则执行步骤(d)。如果均已特征提取处理时,则执行步骤(g)。
37.(d)针对当前未处理的隐藏特征,判断其在对应层次聚类图中节点的分裂状态。实施例中,步骤(d)为根据层次聚类图中的分裂状态判断当前隐藏特征后续如何连接新一层网络层。当当前隐藏特征对应的节点继续分裂时,则执行步骤(e)。若当前隐藏特征对应的节点已经对应叶子节点,不在分裂时,则执行步骤(f)。
38.(e)针对第m层当前还未处理的隐藏特征,添加两个新网络层,得到新隐藏特征。实施例中,步骤(e)通过两个网络层得到当前隐藏特征对应的下一层分裂后的两个隐藏特征。
39.(f)针对第m层当前还未处理的隐藏特征,添加一个新网络层,得到新隐藏特征。实施例中,步骤(f)通过一个网络层得到当前隐藏特征对应的下一层分裂后的一个隐藏特征,保证提前成为叶子节点的隐藏特征也能经过最大层数的网络层。
40.(g)针对第m层所有的隐藏特征,都根据层次聚类图的分类状态进行处理,则将m+1赋值给m。实施例中,步骤(g)到最新隐藏特征层数,执行步骤(b)判断是否已经达到最深网络层数,即是否所有隐藏特征均对应于层次聚类图中的叶子节点。
41.经过上述步骤(a)-步骤(g)循环构建得到对应层次聚类图拓扑分类情况的中间网络,中间网络的每个网络层可以采用全连接层+relu激活函数或transformer编码层。
42.实施例中,预测网络包括映射层(如全连接层)和相对应的sigmoid激活函数,用于对输入的中间隐藏特征进行映射后再通过sigmoid激活函数作非线性变换,预测并输出细粒度术后并发症概率。
43.具体地,在构建得到z个叶子节点的隐藏特征之后,分别连接一层全连接层和sigmoid层,用于预测各个细粒度术后并发症概率, ,其中s为患者样本数量,z为细粒度术后并发症数量。
44.s130,构建损失函数,包括预测损失、自下而上的层级约束损失和自上而下的层级约束损失。
45.实施例中,构建的损失函数包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失。其中,基于次层隐藏特征预测的整体并发症概率通过以下方式得到:
46.将所有次层网络隐藏特征拼接为次层拼接网络隐藏特征,通过映射层(如全连接层)和相应的sigmoid层对次层拼接网络隐藏特征进行映射,预测并输出整体并发症概率。具体地,将次级层隐藏特征{,,

,}进行拼接得到次层拼接网络隐藏特征,之后连接一层映射层(如全连接层)和sigmoid层作为二分类辅助任务,基于二分类辅助任务预测并输出是整体并发症概率,依据取值大小确定是否发生整体并发症。
47.将整体并发症概率与是否发生整体并发症的标签之间的二分类交叉熵损失作为预测损失的一部分,将各个细粒度并发症预测概率与各细粒度术后并发症的真实标签之间的二分类交叉熵损失作为的另一部分,以此来构建预测损失。
48.其中,整体并发症概率对应的是否发生整体并发症的标签通过以下方式获得:利用各细粒度术后并发症的真实标签进行或运算,得到是否发生整体并发症的标签。
49.实施例中,还根据各个细粒度并发症预测概率以及根据辅助任务是否发生整体并发症概率,构建层级约束损失函数,该层级约束损失函数包括自下而上的层级约束损失和自下而上的层级约束损失函数。
50.自下而上的层级约束损失的构建方式包括:当没有整体并发症发生时,不会有一项细粒度术后并发症,以此逻辑构建自下而上的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部。具体地,构建的自下而上的层级约束损失用公式表示为:
51.自下而上的层级约束损失通过最小化优化时,使得底层是否发生整体并发症的标签为0的患者样本,其对应的细粒度并发症概率也趋向于0。
52.自上而下的层级约束损失的构建方式包括:当有任意一项细粒度术后并发症发生时,会发生整体并发症,以此逻辑构建自上而下的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部。具体地,构建的自上而下的层级约束损失用公式表示为:
53.自上而下的层级约束损失通过最小化优化时,使得顶层细粒度术后并发症的真实标签为1的患者样本,其对应的整体并发症概率也趋向于1。
54.最终构建的损失函数为各损失的加权和,用公式表示为:
55.其中,和为权重因子,控制两个层级约束损失对于预测模型的影响程度。
56.s140,基于损失函数对预测模型进行参数优化。
57.实施例中,将包含临床诊疗数据的数据集划分为训练数据和测试集,在训练数据上采用多重交叉验证,得到多组训练集和验证集。基于构建的损失函数利用训练集对预测模型以及构建辅助任务的网络层进行训练,并在验证集上进行提前终止防止过拟合。最后,将每一重交叉验证训练中在验证集上效果最好的预测模型进行集成作为最终的预测模型,将其输出结果平均最为最终的预测结果,并在测试集上进行验证。
58.s150,利用优化的预测模型进行术后并发症预测。
59.实施例中,在应用时,将临床诊疗数据输入至参数优化的预测模型中,经过计算得到各细粒度术后并发症概率和整体并发症概率。
60.对于现有并发症预测模型无法给出具体是什么并发症可能发生,欠缺临床实用性以及未充分考虑细粒度术后并发症与是否发生并发症之间的约束关系的问题,上述实施例提供的层级聚类约束的多标签细粒度术后并发症预测中,首先利用医学先验知识将并发症按大类进行分类,并在每一大类中利用层级聚类构建各个细粒度术后并发症的层次聚类图;然后依据各层次聚类图构建网络架构;接着添加是否发生并发症的辅助预测任务,并利用底层隐藏特征来进行预测;最后通过设计了两种层级约束损失函数,来实现细粒度术后并发症与是否发生并发症之间的约束关系。从而可实现更为精准的细粒度术后并发症预测。
61.基于同样的发明思路,实施例还提供了一种层级聚类约束的多标签细粒度术后并发症预测装置,如图6所示,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,处理器执行计算机程序时实现上述层级聚类约束的多标签细粒度术后并发症预测方法,包括以下步骤:s110,根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;
s120,构建预测模型,包括底层网络、次层网络、中间网络以及预测网络;s130,构建损失函数,包括预测损失、自下而上的层级约束损失和自上而下的层级约束损失;s140,基于损失函数对预测模型进行参数优化;s150,利用优化的预测模型进行术后并发症预测。
62.实施例中,存储器可以为在近端的易失性存储器,如ram,还可以是非易失性存储器,如rom,flash,软盘,机械硬盘等,还可以是远端的存储云。处理器可以为中央处理器(cpu)、微处理器(mpu)、数字信号处理器(dsp)、或现场可编程门阵列(fpga),即可以通过这些处理器实现层级聚类约束的多标签细粒度术后并发症预测方法的步骤。
63.基于同样的发明思路,如图7所示,实施例还提供了一种层级聚类约束的多标签细粒度术后并发症预测装置700,包括数据获取单元710、模型构建单元720、损失函数构建单元730、训练单元740、应用单元740,其中,数据获取单元710用于根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;模型建构单元720用于构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;损失函数构建单元730用于构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;训练单元740用于基于损失函数对预测模型进行参数优化;应用单元750用于利用优化的预测模型进行术后并发症预测。
64.需要说明的是,上述实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测模型的构建装置在进行术后并发症预测时,应以上述各功能单元的划分进行举例说明,可以根据需要将上述功能分配由不同的功能单元完成,即在终端或服务器的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,上述实施例提供的一种层级聚类约束的多标签细粒度术后并发症预测装置与一种层级聚类约束的多标签细粒度术后并发症预测方法实施例属于同一构思,其具体实现过程详见一种层级聚类约束的多标签细粒度术后并发症预测方法实施例,这里不再赘述。
65.实施例还提供一个实验例对上一种层级聚类约束的多标签细粒度术后并发症预测方法进行验证。以验证方法的效果。获取临床诊疗数据作为数据集,该临床诊疗数据包括术后非小细胞肺癌患者的性别、年龄、吸烟史、饮酒史、肿瘤史、家族史、术前检查、术前治疗、手术方式、肿瘤大小、肿瘤位置、病理类型、淋巴结转移情况、术后ptnm分期等临床信息。根据患者术后在院期间是否发生肺不张、哮喘发作、胸腔积液、肺部感染、肺栓塞、深静脉血栓、心律失常、心绞痛的情况,定义八种细粒度术后并发症。然后将发生任意一种上述并发症的患者定义为发生并发症的患者。
66.实验例中选择全连接层作为预测模型构建过程中的网络层;采用3折交叉验证机制将数据集划分为三组训练测试集;然后在每组训练测试集的训练集上采用4折交叉验证来进行模型训练和超参选择,得到在验证集上性能最好的4个模型,将4个模型的结果平均作为输出结果,在3折交叉验证中的每一折测试集上进行测试;采用受试者工作特征曲线下
面积(auc)作为评估指标;同时单标签算法、多标签算法作为基线算法进行比较。实验结果如表1所示。根据表1实验结果能够看到,本方法针对八种细粒度术后并发症以及是否发生并发症所有九个预测问题,取得了最佳的综合预测性能,平均auc值为0.654,显著超过其他基线方法。特别地,将本发明方法的损失函数中和去掉时,发现预测效果会下降,证明了本发明提出的层级聚类约束的有效性。
67.表1实验结果
肺不张胸腔积液哮喘发作肺部感染肺栓塞深静脉血栓心律失常心绞痛平均值lr0.6550.5360.7570.6720.6540.3240.6120.5440.594rf0.6270.6020.5410.7090.3680.2750.6110.4830.527svm0.4970.5010.4830.4670.4700.6950.5260.3910.504mlaram0.5350.4390.4190.4890.4010.5810.5530.4790.487mlknn0.5190.4570.5470.5090.4860.4750.5400.4670.500cc0.6340.5790.7130.6860.5900.4660.5810.5730.603lp0.5790.5820.6820.6990.6520.4720.5720.5750.602rakeld0.6150.5750.6030.6700.7070.5160.5740.5590.602本专利方法(无层级约束)0.6650.7620.7070.6440.5540.6240.5990.6120.646本专利方法0.6770.6870.7520.6520.5950.6570.6040.6090.654
68.以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

技术特征:
1.一种层级聚类约束的多标签细粒度术后并发症预测装置,包括存储器、处理器以及存储在存储器中并可在处理器上执行的计算机程序,其特征在于,处理器执行计算机程序时实现以下步骤:根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;基于损失函数对预测模型进行参数优化;利用优化的预测模型进行术后并发症预测。2.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述层次聚类图的构建采用团聚型层次聚类的方式,利用余弦距离或欧氏距离计算不同细粒度术后并发症之间的距离,然后利用全连接算法、单链接算法或平均连接算法对不同细粒度术后并发症进行层次聚类,构建每个系统并发症下各个细粒度有并发症之间的层次聚类图。3.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述底层网络采用全连接层+relu激活函数或transformer编码层,通过全连接层+relu激活函数或transformer编码层对临床诊疗数据进行映射以获得底层隐藏特征,该底层隐藏特征作为次层网络的输入值;所述次层网络的分支数量与系统并发症数量相等,每个分支采用全连接层+relu激活函数或transformer编码层,将底层隐藏特征映射为次层隐藏特征,该次层隐藏特征作为中间层网络的输入值。4.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述中间网络包含多个子网络,每个子网络与一个系统并发症对应的层次聚类图对应,且子网络的拓扑关系与对应层次聚类图的拓扑关系相同,子网络的层数与层次聚类图的最大深度相等;每个子网络采用全连接层+relu激活函数或transformer编码层,将输入的次层隐藏特征映射为中间隐藏特征,该中间隐藏特征作为预测网络的输入值。5.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述预测网络包括映射层和相对应的sigmoid激活函数,用于对输入的中间隐藏特征进行映射后再通过sigmoid激活函数作非线性变换,预测并输出细粒度术后并发症概率。6.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述基于次层隐藏特征预测的整体并发症概率通过以下方式得到:将所有次层网络隐藏特征拼接为次层拼接网络隐藏特征,通过映射层和相应的sigmoid层对次层拼接网络隐藏特征进行映射,预测并输出整体并发症概率。7.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征
在于,所述预测损失包括:各细粒度术后并发症概率与各细粒度术后并发症的真实标签之间的二分类交叉熵损失,整体并发症概率与是否发生整体并发症的标签之间的二分类交叉熵损失。8.根据权利要求7所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,是否发生整体并发症的标签通过以下方式获得:利用各细粒度术后并发症的真实标签进行或运算,得到是否发生整体并发症的标签。9.根据权利要求1所述的层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,所述自下而上的层级约束损失的构建方式包括:当没有整体并发症发生时,不会有一项细粒度术后并发症,以此逻辑构建自下而上的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部;所述自上而下的层级约束损失的构建方式包括:当有任意一项细粒度术后并发症发生时,会发生整体并发症,以此逻辑构建自上而下的层级约束损失函数,构建过程中,选择任一预测的细粒度术后并发症概率参与计算,并非全部。10.一种层级聚类约束的多标签细粒度术后并发症预测装置,其特征在于,包括数据获取单元、模型构建单元、损失函数构建单元、训练单元、应用单元,所述数据获取单元用于根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;所述模型建构单元用于构建预测模型,包括用于将临床诊疗数据映射为底层隐藏特征的底层网络、与每个系统并发症对应且用于将底层隐藏特征映射为次层隐藏特征的次层网络、与每个层次聚类图的拓扑关系对应且用于将次层隐藏特征映射为各中间隐藏特征的中间网络、用于依据各中间隐藏特征预测各细粒度术后并发症概率的预测网络;所述损失函数构建单元用于构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;所述训练单元用于基于损失函数对预测模型进行参数优化;所述应用单元用于利用优化的预测模型进行术后并发症预测。

技术总结
本发明公开了一种层级聚类约束的多标签细粒度术后并发症预测装置,属于医疗数据挖掘领域,包括:根据医学先验知识将多种细粒度术后并发症分类成不同系统并发症,并构建每个系统并发症的层次聚类图;构建预测模型,包括底层网络、次层网络、中间网络、预测网络;构建损失函数,包括基于次层隐藏特征预测的整体并发症概率和各细粒度术后并发症概率构建的预测损失、自下而上的层级约束损失和自上而下的层级约束损失;基于损失函数对预测模型进行参数优化;利用优化的预测模型进行术后并发症预测。该装置通过引入层级聚类图构建网络架构,进而预测精准度。进而预测精准度。进而预测精准度。


技术研发人员:胡丹青 吴楠 程乐超 刘冰
受保护的技术使用者:北京肿瘤医院
技术研发日:2023.06.14
技术公布日:2023/7/18
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐