多源异构医疗数据多视图聚类方法、装置、介质及设备

未命名 07-23 阅读:102 评论:0


1.本发明涉及多视图聚类技术领域,尤其涉及一种多源异构医疗数据多视图聚类方法、装置、介质及设备。


背景技术:

2.在现存医疗领域存在着各种各样的数据,而这些数据往往是来源于不同的采集装置,并且以不同的形式以及结构出现,如ct图像可以展示病灶,血液分析数据可以体现血液的状况,这种数据就是多视图数据。这些数据通过从不同的角度对同一个样本进行描述,蕴含了不同的信息却始终共享了样本的本质特征。通过多视图聚类对这些医疗数据进行分析,得到样本的类簇分布,从而能够实现辅助病情诊断、同类型病患管理、预后分析等。
3.在现有技术中,传统的多视图聚类方法,一般采用子空间聚类、矩阵分解以及典型相关分析并直接进行融合操作等技术来对多视图数据进行聚类。
4.现有技术中,由于各个视图来源于不同的域,其特征空间往往不对齐,直接进行融合会造成特征尺度混乱,并且由于各个视图往往不是具有同等重要性,直接平均地融合所有视图会造成重要信息被忽略而不重要信息干扰学习,从而影响聚类效果。


技术实现要素:

5.为了解决上述技术问题,本发明实施例提出了一种多源异构医疗数据多视图聚类方法、装置、介质及设备,能够对多源异构数据的各个视图进行分布对齐,并采用基于自监督的聚类损失以指导特征学习,从而能够对各个视图进行有效地融合,并得到更佳的聚类效果。
6.为了实现上述目的,本发明实施例提供了一种多源异构医疗数据多视图聚类方法,包括:
7.获取原始多源异构医疗数据;其中,所述原始多源异构医疗数据包括若干个视图;
8.对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;
9.对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;
10.根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;
11.将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。
12.进一步的,所述对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示,具体包括:将每一所述视图分别输入至与每一所述视图一一对应的自编码器网络,得到各个所述自编码器网络一一对应输出的隐表示。
13.进一步的,所述原始多源异构医疗数据包括m个视图;其中,m≥2;
14.对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示,具体包括:选取第v个视图作为参考视图;其中,v=1,2,......,m;将每一所述隐表示
输入至与所述参考视图对应的判别器,得到所述判别器输出的与每一所述隐表示一一对应的输出结果;根据所述输出结果和预设的轮换对抗损失函数进行一次计算,得到轮换对抗损失结果,并基于计算得到的轮换对抗损失结果对所述隐表示进行修正;判断所述轮换对抗损失结果是否满足预设的轮换对抗学习条件;其中,所述轮换对抗学习条件包括之前n次计算得到的轮换对抗损失结果均在预设的第一稳定区间内,n为预设正整数;若满足所述轮换对抗学习条件,则将修正后的隐表示重新确定为新的隐表示;
15.若不满足所述轮换对抗学习条件,则:若(v+1)≤m,则将(v+1)作为新的v,以重新选取新的参考视图;若(v+1)》m,则将(v+1-m)作为新的v,以重新选取新的参考视图;根据新的参考视图重新计算得到新的轮换对抗损失结果并修正隐表示,直至满足所述轮换对抗学习条件,以使得所有视图分布达到对齐状态后进行一致性表示学习。
16.进一步的,所述轮换对抗损失函数为式(1):
[0017][0018]
其中,g为自编码器网络,d为判别器,m为视图的个数,r为参考视图,i为视图中除参考视图之外的视图,z
(v)
为与第v个视图对应的隐表示,e为数学期望。
[0019]
进一步的,根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示,具体包括:沿各个所述视图一一对应的特征维度,将所述视图进行拼接后输入至预设的权重学习网络,得到所述权重学习网络输出的权重向量w;其中,w=(w1,w2,......,wm),且w
t
为第t个视图的权重;将w
t
以及第t个视图的隐表示相乘,得到zt;计算得到所述一致性隐表示
[0020]
进一步的,所述方法还包括:采用一致性隐表示学习损失函数对所述一致性隐表示学习进行迭代训练,直至满足预设的一致性隐表示学习条件,得到训练完成的一致性隐表示学习;其中,所述一致性隐表示学习条件包括迭代训练的次数达到预设的第二次数阈值,或所述一致性隐表示学习损失函数迭代计算得到的值在预设的第二稳定区间内;
[0021]
其中,所述一致性隐表示学习损失函数为式(2):
[0022][0023]
其中,k()是维度为n
×
n的矩阵,n为每次迭代训练时的样本数,zu为一致性隐表示,wv为第t个视图的权重,z
(v)
为与第v个视图对应的隐表示,代表矩阵的f范数;
[0024]
其中,n维矩阵k()的第i行第j列元素k
i,j
计算如下式(3):
[0025]ki,j
=exp(-||k()
i-k()j||2)/2σ2;
ꢀꢀ
(3)
[0026]
其中,k()i为矩阵k()的第i行,k()j为矩阵k()的第j行,σ为预设常量。
[0027]
进一步的,所述聚类自监督损失函数为式(4):
[0028]
min d
cs
+l
ortho

ꢀꢀ
(4)
[0029]
其中,d
cs
为基于cs散度的类簇约束,l
ortho
为聚类正交约束;
[0030][0031]
l
ortho
=trisum(aa
t
);
[0032]
其中,c为预设的聚类数,a为聚类结果,αi为a的第i行,trisum()为上三角矩阵的元素和,k()是维度为n
×
n的矩阵,zu为一致性隐表示。
[0033]
本发明实施例还提供了一种多源异构医疗数据多视图聚类装置,包括:
[0034]
原始数据获取模块,用于获取原始多源异构医疗数据;其中,所述原始多源异构医疗数据包括若干个视图;
[0035]
特征提取模块,用于对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;
[0036]
轮换对抗学习模块,用于对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;
[0037]
一致性隐表示学习模块,用于根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;
[0038]
聚类模块,用于将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。
[0039]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的多源异构医疗数据多视图聚类方法的步骤。
[0040]
本发明实施例还提供了一种计算机设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的多源异构医疗数据多视图聚类方法的步骤。
[0041]
综上,本发明具有以下有益效果:
[0042]
采用本发明实施例,能够采用轮换对抗学习对多源异构医疗数据的各个视图进行分布对齐,并利用权重学习网络对分布对齐后的特征进行权重分配,解决了各个视图特征空间不对齐造成的难以融合的问题,从而实现更有效地特征融合,得到一致性隐表示,再引入基于cs散度的类簇约束和聚类正交约束的自监督损失,来引导特征学习,并得到类内更紧凑且类间稀疏的类簇结构,最终提高多源异构医疗数据的聚类效果。
附图说明
[0043]
图1是本发明提供的一种多源异构医疗数据多视图聚类方法的一个实施例的流程示意图;
[0044]
图2是本发明提供的一种多源异构医疗数据多视图聚类装置的一个实施例的结构示意图。
具体实施方式
[0045]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0046]
参见图1,是本发明提供的多源异构医疗数据多视图聚类方法的一个实施例的流程示意图,该方法包括步骤s1至s5,具体如下:
[0047]
s1,获取原始多源异构医疗数据;其中,所述原始多源异构医疗数据包括若干个视
图;
[0048]
s2,对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;
[0049]
优选地,所述对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示,具体包括:将每一所述视图分别输入至与每一所述视图一一对应的自编码器网络,得到各个所述自编码器网络一一对应输出的隐表示。
[0050]
示例性的,原始数据x经过各个视图(view)相互独立的自编码器网络(encoder)完成特征提取,得到各个视图的隐表示z={z
(1)
,...,z
(v)
},v=1,2,...,m。
[0051]
s3,对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;
[0052]
优选地,所述原始多源异构医疗数据包括m个视图;其中,m≥2;
[0053]
对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示,具体包括:选取第v个视图作为参考视图;其中,v=1,2,......,m;将每一所述隐表示输入至与所述参考视图对应的判别器,得到所述判别器输出的与每一所述隐表示一一对应的输出结果;根据所述输出结果和预设的轮换对抗损失函数进行一次计算,得到轮换对抗损失结果,并基于计算得到的轮换对抗损失结果对所述隐表示进行修正;判断所述轮换对抗损失结果是否满足预设的轮换对抗学习条件;其中,所述轮换对抗学习条件包括之前n次计算得到的轮换对抗损失结果均在预设的第一稳定区间内,n为预设正整数;若满足所述轮换对抗学习条件,则将修正后的隐表示重新确定为新的隐表示;
[0054]
若不满足所述轮换对抗学习条件,则:若(v+1)≤m,则将(v+1)作为新的v,以重新选取新的参考视图;若(v+1)》m,则将(v+1-m)作为新的v,以重新选取新的参考视图;根据新的参考视图重新计算得到新的轮换对抗损失结果并修正隐表示,直至满足所述轮换对抗学习条件,以使得所有视图分布达到对齐状态后进行一致性表示学习。
[0055]
作为上述方案的改进,所述轮换对抗损失函数为式(1):
[0056][0057]
其中,g为自编码器网络,d为判别器,m为视图的个数,r为参考视图,i为视图中除参考视图之外的视图,z
(v)
为与第v个视图对应的隐表示,e为数学期望。
[0058]
示例性的,对各个视图的隐表示z进行轮换对抗学习(alternate adversarial learning),以将学习结果反馈到前一步隐表示的生成过程。具体学习方式流程:

选取视图v为参考视图(reference view),其他视图为被参考视图(fake view)(开始时v为第一个)。

将所有视图的隐表示作为第v个判别器(discriminator)的输入,并且得到一个在[0,1]区间内的数字输出。其中,判别器(discriminator)输出数字靠近0时说明该判别器认为输入是被参考视图,反之靠近1说明是参考视图。

将参考视图切换为下一个视图v+1,如果v+1大于总视图数m,则用v+1对m取余。重复
①‑③
步骤,直至完成轮换对抗学习过程。
[0059]
需要说明的是,本技术可以在当前主流的深度学习框架上运行,而框架能够根据损失函数自动计算出基于对应模块(比如生成器、判别器)的梯度,从而利用梯度下降法对模块的参数进行更新。当判别器输出数字时,对应的轮换对抗损失函数会计算输出对应的值,进而能够对相应模块的参数进行更新,最终影响到隐表示的生成。
[0060]
s4,根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;
[0061]
优选地,根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示,具体包括:沿各个所述视图一一对应的特征维度,将所述视图进行拼接后输入至预设的权重学习网络,得到所述权重学习网络输出的权重向量w;其中,w=(w1,w2,......,wm),且w
t
为第t个视图的权重;将w
t
以及第t个视图的隐表示相乘,得到zt;计算得到所述一致性隐表示
[0062]
作为上述方案的改进,所述方法还包括:采用一致性隐表示学习损失函数对所述一致性隐表示学习进行迭代训练,直至满足预设的一致性隐表示学习条件,得到训练完成的一致性隐表示学习;其中,所述一致性隐表示学习条件包括迭代训练的次数达到预设的第二次数阈值,或所述一致性隐表示学习损失函数迭代计算得到的值在预设的第二稳定区间内;其中,所述一致性隐表示学习损失函数为式(2):
[0063][0064]
其中,k()是维度为n
×
n的矩阵,n为每次迭代训练时的样本数,zu为一致性隐表示,wv为第t个视图的权重,z
(v)
为与第v个视图对应的隐表示,代表矩阵的f范数;
[0065]
其中,n维矩阵k()的第i行第j列元素k
i,j
计算如下式(3):
[0066]ki,j
=exp(-||k()
i-k()j||2)/2σ2;
ꢀꢀ
(3)
[0067]
其中,k()i为矩阵k()的第i行,k()j为矩阵k()的第j行,σ为预设常量。
[0068]
示例性的,对各个视图的隐表示z进行一致性隐表示学习。具体学习方式流程:

将各个视图按照特征维度进行拼接后,作为权重学习网络(attention layer)的输入,即z
con


权重学习网络输出一个m维的向量w,向量w中某一维度wv取值在[0,1]区间内且代表了经过网络衡量后的第v个视图的重要程度。

每个视图wv与z
(v)
对应相乘并累和得到最终的一致性隐表示zu。
[0069]
s5,将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。
[0070]
优选地,所述聚类自监督损失函数为式(4):
[0071]
min d
cs
+l
ortho

ꢀꢀ
(4)
[0072]
其中,d
cs
为基于cs散度的类簇约束,l
ortho
为聚类正交约束;
[0073][0074]
l
ortho
=trisum(aa
t
);
[0075]
其中,c为预设的聚类数,a为聚类结果,αi为a的第i行,trisum()为上三角矩阵的元素和,k()是维度为n
×
n的矩阵,zu为一致性隐表示。
[0076]
相应地,本发明的实施例还提供一种多源异构医疗数据多视图聚类装置,能够实现上述实施例提供的多源异构医疗数据多视图聚类方法的所有流程。
[0077]
参见图2,是本发明提供的多源异构医疗数据多视图聚类装置的一个实施例的结构示意图。
[0078]
原始数据获取模块101,用于获取原始多源异构医疗数据;其中,所述原始多源异构医疗数据包括若干个视图;
[0079]
特征提取模块102,用于对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;
[0080]
轮换对抗学习模块103,用于对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;
[0081]
一致性隐表示学习模块104,用于根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;
[0082]
聚类模块105,用于将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。
[0083]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述的多源异构医疗数据多视图聚类方法的步骤。
[0084]
本发明实施例还提供了一种计算机设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述的多源异构医疗数据多视图聚类方法的步骤。
[0085]
该实施例的计算机设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如多源异构医疗数据多视图聚类程序。所述处理器执行所述计算机程序时实现上述各个多源异构医疗数据多视图聚类方法实施例中的步骤,例如图1所示的步骤s1至s5。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如101至105。
[0086]
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述计算机设备中的执行过程。
[0087]
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可包括,但不仅限于,处理器、存储器。
[0088]
所述处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分。
[0089]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接
式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0090]
其中,所述计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
[0091]
综上,本发明具有以下有益效果:
[0092]
采用本发明实施例,能够采用轮换对抗学习对多源异构医疗数据的各个视图进行分布对齐,并利用权重学习网络对分布对齐后的特征进行权重分配,解决了各个视图特征空间不对齐造成的难以融合的问题,从而实现更有效地特征融合,得到一致性隐表示,再引入基于cs散度的类簇约束和聚类正交约束的自监督损失,来引导特征学习,并得到类内更紧凑且类间稀疏的类簇结构,最终提高多源异构医疗数据的聚类效果。
[0093]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0094]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

技术特征:
1.一种多源异构医疗数据多视图聚类方法,其特征在于,包括:获取原始多源异构医疗数据;其中,所述原始多源异构医疗数据包括若干个视图;对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。2.如权利要求1所述的多源异构医疗数据多视图聚类方法,其特征在于,所述对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示,具体包括:将每一所述视图分别输入至与每一所述视图一一对应的自编码器网络,得到各个所述自编码器网络一一对应输出的隐表示。3.如权利要求1所述的多源异构医疗数据多视图聚类方法,其特征在于,所述原始多源异构医疗数据包括m个视图;其中,m≥2;对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示,具体包括:选取第v个视图作为参考视图;其中,v=1,2,
……
,m;将每一所述隐表示输入至与所述参考视图对应的判别器,得到所述判别器输出的与每一所述隐表示一一对应的输出结果;根据所述输出结果和预设的轮换对抗损失函数进行一次计算,得到轮换对抗损失结果,并基于计算得到的轮换对抗损失结果对所述隐表示进行修正;判断所述轮换对抗损失结果是否满足预设的轮换对抗学习条件;其中,所述轮换对抗学习条件包括之前n次计算得到的轮换对抗损失结果均在预设的第一稳定区间内,n为预设正整数;若满足所述轮换对抗学习条件,则将修正后的隐表示重新确定为新的隐表示;若不满足所述轮换对抗学习条件,则:若(v+1)≤m,则将(v+1)作为新的v,以重新选取新的参考视图;若(v+1)>,则将(v+1-)作为新的v,以重新选取新的参考视图;根据新的参考视图重新计算得到新的轮换对抗损失结果并修正隐表示,直至满足所述轮换对抗学习条件,以使得所有视图分布达到对齐状态后进行一致性表示学习。4.如权利要求3所述的多源异构医疗数据多视图聚类方法,其特征在于,所述轮换对抗损失函数为式(1):其中,g为自编码器网络,d为判别器,m为视图的个数,r为参考视图,i为视图中除参考视图之外的视图,z
(v)
为与第v个视图对应的隐表示,e为数学期望。5.如权利要求1所述的多源异构医疗数据多视图聚类方法,其特征在于,根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示,具体包括:沿各个所述视图一一对应的特征维度,将所述视图进行拼接后输入至预设的权重学习网络,得到所述权重学习网络输出的权重向量w;其中,w=(w1,w2,
……
,w
m
),且w
t
为第t个视
图的权重;将w
t
以及第t个视图的隐表示相乘,得到z
t
;计算得到所述一致性隐表示6.如权利要求5所述的多源异构医疗数据多视图聚类方法,其特征在于,所述方法还包括:采用一致性隐表示学习损失函数对所述一致性隐表示学习进行迭代训练,直至满足预设的一致性隐表示学习条件,得到训练完成的一致性隐表示学习;其中,所述一致性隐表示学习条件包括迭代训练的次数达到预设的第二次数阈值,或所述一致性隐表示学习损失函数迭代计算得到的值在预设的第二稳定区间内;其中,所述一致性隐表示学习损失函数为式(2):其中,k()是维度为n
×
n的矩阵,n为每次迭代训练时的样本数,z
u
为一致性隐表示,w
v
为第t个视图的权重,z
(v)
为与第v个视图对应的隐表示,代表矩阵的f范数;其中,n维矩阵k()的第i行第j列元素k
i,j
计算如下式(3):k
i,i
=exp(-||k()
i-k()
j
||2)/2σ2;
ꢀꢀ
(3)其中,k()
i
为矩阵k()的第i行,k()
j
为矩阵k()的第j行,σ为预设常量。7.如权利要求1所述的多源异构医疗数据多视图聚类方法,其特征在于,所述聚类自监督损失函数为式(4):mind
cs
+
ortho
;(4)其中,d
cs
为基于cs散度的类簇约束,l
ortho
为聚类正交约束;l
ortho
=risum(aa
t
);其中,c为预设的聚类数,a为聚类结果,α
i
为a的第i行,trisum()为上三角矩阵的元素和,k()是维度为n
×
n的矩阵,z
u
为一致性隐表示。8.一种多源异构医疗数据多视图聚类装置,其特征在于,包括:原始数据获取模块,用于获取原始多源异构医疗数据;其中,所述原始多源异构医疗数据包括若干个视图;特征提取模块,用于对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;轮换对抗学习模块,用于对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;一致性隐表示学习模块,用于根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;聚类模块,用于将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执
行时实现如权利要求1至7任一项所述的多源异构医疗数据多视图聚类方法。10.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的多源异构医疗数据多视图聚类方法。

技术总结
本发明公开了一种多源异构医疗数据多视图聚类方法、装置、介质及设备,所述方法包括:获取原始多源异构医疗数据;对每一所述视图的数据进行特征提取,得到与每一所述视图一一对应的隐表示;对所述隐表示进行轮换对抗学习,对齐隐表示的分布,以重新确定若干个新的隐表示;根据所述新的隐表示进行一致性隐表示学习,得到一致性隐表示;将所述一致性隐表示输入至聚类层,得到所述聚类层输出的聚类结果;其中,所述聚类层为采用聚类自监督损失函数训练得到的。本发明实施例解决了各个视图特征空间不对齐造成的难以融合的问题,能够实现更有效地特征融合,并得到类内更紧凑且类间稀疏的类簇结构,最终提高多源异构医疗数据的聚类效果。果。果。


技术研发人员:蔡宏民 杨思蕤
受保护的技术使用者:华南理工大学
技术研发日:2023.03.27
技术公布日:2023/7/21
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐