蛋白质和疾病关联关系的确定方法、装置、设备及介质与流程

未命名 10-18 阅读:112 评论:0


1.本发明涉及人工智能和医疗健康技术领域,尤其涉及一种蛋白质和疾病关联关系的确定方法、装置、设备及介质。


技术实现要素:

2.基于此,有必要针对现有技术的基于神经网络训练得到的模型预测的蛋白质和疾病的关联关系的准确性不高技术问题,提出了一种蛋白质和疾病关联关系的确定方法、装置、设备及介质。
3.第一方面,提供了一种蛋白质和疾病关联关系的确定方法,所述方法包括:
4.获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;
5.根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
6.第二方面,提供了一种蛋白质和疾病关联关系的确定装置,所述装置包括:
7.数据获取模块,用于获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;
8.预测模块,用于根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
9.第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述蛋白质和疾病关联关系的确定方法的步骤。
10.第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述蛋白质和疾病关联关系的确定方法的步骤。
11.本技术的蛋白质和疾病关联关系的确定方法,通过获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
附图说明
12.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
13.其中:
14.图1为一个实施例中蛋白质和疾病关联关系的确定方法的应用环境图;
15.图2为一个实施例中蛋白质和疾病关联关系的确定方法的流程图;
16.图3为一个实施例中蛋白质和疾病关联关系的确定装置的结构框图;
17.图4为一个实施例中计算机设备的结构框图;
18.图5为一个实施例中计算机设备的另一种结构框图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.本发明实施例提供的蛋白质和疾病关联关系的确定方法,可应用在如图1的应用环境中,其中,客户端110通过网络与服务端120进行通信。服务端120可以通过客户端110接收获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;服务端120根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
21.在本技术的另一个实施例中,服务端120从预设的存储空间获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵;服务端120将目标蛋白质与疾病关联关系矩阵发送给客户端110。
22.在本技术的另一个实施例中,客户端110从服务端获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵;客户端110将目标蛋白质与疾病关联关系矩阵发送给服务端120。服务端120将目标蛋白质与疾病关联关系矩阵进行存储,并响应其他应用的请求,将存储的目标蛋白质与疾病关联关系矩阵发送给请求对应的应用。
23.其中,客户端110可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面通过具体的实施例对本发明进行详细的描述。
24.请参阅图2所示,图2为本发明实施例提供的蛋白质和疾病关联关系的确定方法的一个流程示意图,包括如下步骤:
25.s1:获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;
26.具体而言,可以获取用户输入的获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,也可以从预设的存储空间获取获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,还可以从第三方应用获取获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,还可以获取客户端发送的获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵。
27.已知蛋白质与疾病关联关系矩阵,是医学上已经验证过的准确的蛋白质与疾病的关联关系的矩阵。若已知蛋白质与疾病关联关系矩阵的行对应蛋白质,已知蛋白质与疾病关联关系矩阵的列对应疾病,比如,已知蛋白质与疾病关联关系矩阵中第i行第j列的元素的值,是第i个蛋白质与第j个疾病的关联关系的值,若第i个蛋白质与第j个疾病有关联关系,则该值为1,若第i个蛋白质与第j个疾病没有关联关系,则该值为0。
28.可选的,疾病相似性矩阵,是医学上已经验证过的准确的疾病与疾病之间的相似性的矩阵。疾病相似性矩阵的横向和纵向均是疾病。疾病相似性矩阵中的第i行对应的疾病和疾病相似性矩阵中的第i列对应的疾病是同一个疾病。比如,疾病相似性矩阵中第i行第j列的元素的值,是第i个疾病与第j个疾病的相似性。
29.可选的,蛋白质相互作用关系矩阵,是医学上已经验证过的准确的蛋白质与蛋白质之间的相互作用关系的矩阵。蛋白质相互作用关系矩阵的横向和纵向均是蛋白质。蛋白质相互作用关系矩阵中的第i行对应的蛋白质和蛋白质相互作用关系矩阵中的第i列对应的蛋白质是同一个蛋白质。比如,蛋白质相互作用关系矩阵中第i行第j列的元素的值,是第i个蛋白质与第j个蛋白质的相互作用关系的值。
30.s2:根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白
质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
31.具体而言,根据所述蛋白质相互作用关系矩阵对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵,根据所述疾病相似性矩阵对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵,对第一矩阵和第二矩阵进行融合,将融合得到的矩阵作为目标蛋白质与疾病关联关系矩阵。其中,原始的所述已知蛋白质与疾病关联关系矩阵,是指步骤s1获取的所述已知蛋白质与疾病关联关系矩阵。
32.目标蛋白质与疾病关联关系矩阵的行对应蛋白质,目标蛋白质与疾病关联关系矩阵的列对应疾病,比如,目标蛋白质与疾病关联关系矩阵中第i行第j列的值,是第i个蛋白质与第j个疾病的关联关系的值,若第i个蛋白质与第j个疾病有关联关系,则该值为1,若第i个蛋白质与第j个疾病没有关联关系,则该值为0。
33.可选的,所述根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵的步骤之后,还包括:获取目标疾病;采用所述目标疾病,从所述目标蛋白质与疾病关联关系矩阵中找出存在关联关系的蛋白质,得到所述目标疾病对应的强相关蛋白质集合。比如,目标疾病是所述目标蛋白质与疾病关联关系矩阵对应的所有疾病中的第m个疾病,则将所述目标蛋白质与疾病关联关系矩阵中的第m列的值为1的元素对应的每个蛋白质,作为强相关蛋白质,将目标疾病对应的所有强相关蛋白质作为强相关蛋白质集合。
34.可选的,所述根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵的步骤之后,还包括:获取目标蛋白质;采用所述目标蛋白质,从所述目标蛋白质与疾病关联关系矩阵中找出存在关联关系的疾病,得到所述目标蛋白质对应的强相关疾病集合。比如,目标蛋白质是所述目标蛋白质与疾病关联关系矩阵对应的所有疾病中的第q个蛋白质,则将所述目标蛋白质与疾病关联关系矩阵中的第q行的值为1的元素对应的每个疾病,作为强相关疾病,将目标蛋白质对应的所有强相关疾病作为强相关疾病集合。
35.本实施例通过获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
36.在一个实施例中,所述根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵的步骤,包括:
37.s21:基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵;
38.具体而言,基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,以实现将蛋白质与蛋白质之间的相互作用关系的特征更新到原始的已知蛋白质与疾病关联关系矩阵中,将更新后的已知蛋白质与疾病关联关系矩阵作为第一矩阵。
39.标签传播方法,又称为标签传播算法,是基于标签的一种算法,是所有基于标签的算法的基础。标签传播算法最大的特色是简单、高效,缺点是每次迭代结果不稳定,准确率不高。在标签传播算法基础上改进的标签算法有copra、slpa等。标签传播算法,是一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息去预测未标记节点的标签信息。利用样本间的关系建立关系完全图模型,在完全图中,节点包括已标注和未标注数据,其边表示两个节点的相似度,节点的标签按相似度传递给其他节点。标签数据就像是一个源头,可以对无标签数据进行标注,节点的相似度越大,标签越容易传播。由于该算法简单易实现,算法执行时间短,复杂度低且分类效果好,引起了国内外学者的关注,并将其广泛地应用到多媒体信息分类、虚拟社区挖掘等领域中。
40.s22:基于所述标签传播方法,根据所述疾病相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵;
41.具体而言,基于标签传播方法,根据所述疾病相似性矩阵,对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,以实现将疾病与疾病之间的相似性的特征更新到原始的已知蛋白质与疾病关联关系矩阵中,将更新后的已知蛋白质与疾病关联关系矩阵作为第二矩阵。
42.s23:根据所述第一矩阵和所述第二矩阵进行蛋白质与疾病之间的关联关系的预测,得到所述目标蛋白质与疾病关联关系矩阵。
43.具体而言,对所述第一矩阵和所述第二矩阵进行融合,从而实现将已知的蛋白质与疾病之间的关联关系的特征、蛋白质与蛋白质之间的相互作用关系的特征、疾病与疾病之间的相似性的特征进行融合,以预测比所述已知蛋白质与疾病关联关系矩阵更多的蛋白质与疾病之间的关联关系,将预测得到的矩阵作为所述目标蛋白质与疾病关联关系矩阵。
44.本实施例实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了已知的蛋白质与疾病之间的关联关系的特征、蛋白质与蛋白质之间的相互作用关系的特征、疾病与疾病之间的相似性的特征以预测比所述已知蛋白质与疾病关联关系矩阵更多的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
45.在一个实施例中,所述基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵的步骤,包括:
46.s211:对所述蛋白质相互作用关系矩阵进行标准化计算,得到蛋白质标准化相互作用关系矩阵;
47.具体而言,对所述蛋白质相互作用关系矩阵进行标准化计算,将标准化后的所述蛋白质相互作用关系矩阵作为蛋白质标准化相互作用关系矩阵。
48.s212:基于所述标签传播方法,根据所述蛋白质标准化相互作用关系矩阵,对所述
已知蛋白质与疾病关联关系矩阵进行更新,得到所述第一矩阵;
49.其中,所述蛋白质标准化相互作用关系矩阵中的第i行第j列的计算公式pp
*
(i,j)表述为:
[0050][0051]
q是所述蛋白质相互作用关系矩阵中的蛋白质的数量,pp(i,j)是所述蛋白质相互作用关系矩阵中的第i行第j列的元素。
[0052]
具体而言,基于所述标签传播方法,根据所述蛋白质标准化相互作用关系矩阵,对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,以实现将蛋白质与蛋白质之间的相互作用关系的标准化特征更新到原始的已知蛋白质与疾病关联关系矩阵中,将更新后的已知蛋白质与疾病关联关系矩阵作为第一矩阵。
[0053]
本实施例基于所述标签传播方法,根据所述蛋白质标准化相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,通过将蛋白质与蛋白质之间的相互作用关系的标准化特征更新到原始的已知蛋白质与疾病关联关系矩阵中,提高了第一矩阵的标准化程度,从而有利于进一步提高蛋白质与疾病之间的关联关系的预测的准确性。
[0054]
在一个实施例中,第t+1次迭代之后的第一迭代矩阵的计算公式aq(t+1)表示为:
[0055]aq
(t+1)=α*pp
*
*aq(t)+(1-α)pd
[0056]
其中,t表示迭代次数,aq(t)表示第t次迭代之后的所述第一迭代矩阵,pd是所述已知蛋白质与疾病关联关系矩阵,在t为0时aq(0)等于所述已知蛋白质与疾病关联关系矩阵,α是0-1之间的小数,α是一个可调整的超参,pp
*
是所述蛋白质标准化相互作用关系矩阵;
[0057]
不断迭代计算所述第一迭代矩阵,直至|aq(t+1)-aq(t)|《μ,将aq(t+1)对应的所述第一迭代矩阵作为所述第一矩阵,其中,μ是一个预设常量,|aq(t+1)-aq(t)|是计算aq(t+1)-aq(t)的绝对值。
[0058]
可选的,μ设为10-8

[0059]
本实施例基于所述标签传播方法,根据所述蛋白质标准化相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,通过将蛋白质与蛋白质之间的相互作用关系的标准化特征更新到原始的已知蛋白质与疾病关联关系矩阵中,提高了第一矩阵的标准化程度,从而有利于进一步提高蛋白质与疾病之间的关联关系的预测的准确性。
[0060]
在一个实施例中,所述基于所述标签传播方法,根据所述疾病相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵的步骤,包括:
[0061]
s221:对所述疾病相似性矩阵进行标准化计算,得到疾病标准化相似性矩阵;
[0062]
具体而言,对所述疾病相似性矩阵进行标准化计算,将标准化后的所述疾病相似性矩阵作为疾病标准化相似性矩阵。
[0063]
s222:基于所述标签传播方法,根据所述疾病标准化相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到所述第二矩阵;
[0064]
其中,所述疾病标准化相似性矩阵中的第i行第j列的计算公式dd
*
(i,j)表述为:
[0065][0066]
x是所述疾病相似性矩阵中的疾病的数量,dd(i,j)是所述疾病相似性矩阵中的第i行第j列的元素。
[0067]
具体而言,基于所述标签传播方法,根据所述疾病标准化相似性矩阵,对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,以实现将疾病与疾病之间的相似性的标准化特征更新到原始的已知蛋白质与疾病关联关系矩阵中,将更新后的已知蛋白质与疾病关联关系矩阵作为第二矩阵。
[0068]
本实施例基于所述标签传播方法,根据所述疾病标准化相似性矩阵,对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,通过将疾病与疾病之间的相似性的标准化特征更新到原始的已知蛋白质与疾病关联关系矩阵中,提高了第二矩阵的标准化程度,从而有利于进一步提高蛋白质与疾病之间的关联关系的预测的准确性。
[0069]
在一个实施例中,第f+1次迭代之后的第二迭代矩阵的计算公式a
x
(f+1)表示为:
[0070]ax
(f+1)=β*dd
*
*a
x
(f)+(1-β)pd
t
[0071]
其中,f表示迭代次数,ad(f)表示第t次迭代之后的所述第二迭代矩阵,pd是所述已知蛋白质与疾病关联关系矩阵,在f为0时a
x
(0)等于所述已知蛋白质与疾病关联关系矩阵的转置矩阵,β是0-1之间的小数,β是一个可调整的超参,dd
*
是所述疾病标准化相似性矩阵;
[0072]
不断迭代计算所述第二迭代矩阵,直至|a
x
(f+1)-a
x
(f)|《μ,将a
x
(f+1)对应的所述第二迭代矩阵作为所述第二矩阵,其中,μ是一个预设常量,|a
x
(f+1)-a
x
(f)|是计算a
x
(f+1)-a
x
(f)的绝对值。
[0073]
本实施例基于所述标签传播方法,根据所述疾病标准化相似性矩阵,对原始的所述已知蛋白质与疾病关联关系矩阵进行更新,通过将疾病与疾病之间的相似性的标准化特征更新到原始的已知蛋白质与疾病关联关系矩阵中,提高了第二矩阵的标准化程度,从而有利于进一步提高蛋白质与疾病之间的关联关系的预测的准确性。
[0074]
在一个实施例中,所述根据所述第一矩阵和所述第二矩阵进行蛋白质与疾病之间的关联关系的预测,得到所述目标蛋白质与疾病关联关系矩阵的步骤,包括:
[0075]
s231:对所述第二矩阵进行转置计算,得到第三矩阵;
[0076]
s232:对所述第一矩阵和所述第三矩阵进行相同位置的元素的平均值计算,得到所述目标蛋白质与疾病关联关系矩阵。
[0077]
具体而言,对所述第一矩阵和所述第三矩阵进行相同位置的元素的平均值计算,将计算得到的平均值作为所述目标蛋白质与疾病关联关系矩阵。
[0078]
比如,将所述第一矩阵的第i行第j列的元素的值和所述第二矩阵的第i行第j列的元素的值进行平均值计算,将该平均值作为所述目标蛋白质与疾病关联关系矩阵的第i行第j列的元素的值。
[0079]
本实施例结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
[0080]
请参阅图3所示,在一实施例中,提供一种蛋白质和疾病关联关系的确定装置,所
述装置包括:
[0081]
数据获取模块801,用于获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;
[0082]
预测模块802,用于根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
[0083]
本实施例通过获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
[0084]
在一个实施例中,所述预测模块802的所述根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵的步骤,包括:
[0085]
基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵;
[0086]
基于所述标签传播方法,根据所述疾病相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵;
[0087]
根据所述第一矩阵和所述第二矩阵进行蛋白质与疾病之间的关联关系的预测,得到所述目标蛋白质与疾病关联关系矩阵。
[0088]
在一个实施例中,所述预测模块802的所述基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵的步骤,包括:
[0089]
对所述蛋白质相互作用关系矩阵进行标准化计算,得到蛋白质标准化相互作用关系矩阵;
[0090]
基于所述标签传播方法,根据所述蛋白质标准化相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到所述第一矩阵;
[0091]
其中,所述蛋白质标准化相互作用关系矩阵中的第i行第j列的计算公式pp
*
(i,j)表述为:
[0092][0093]
q是所述蛋白质相互作用关系矩阵中的蛋白质的数量,pp(i,j)是所述蛋白质相互
作用关系矩阵中的第i行第j列的元素。
[0094]
在一个实施例中,第t+1次迭代之后的第一迭代矩阵的计算公式aq(t+1)表示为:
[0095]aq
(t+1)=α*pp
*
*aq(t)+(1-α)pd
[0096]
其中,t表示迭代次数,aq(t)表示第t次迭代之后的所述第一迭代矩阵,pd是所述已知蛋白质与疾病关联关系矩阵,在t为0时aq(0)等于所述已知蛋白质与疾病关联关系矩阵,α是0-1之间的小数,α是一个可调整的超参,pp
*
是所述蛋白质标准化相互作用关系矩阵;
[0097]
不断迭代计算所述第一迭代矩阵,直至|aq(t+1)-aq(t)|《μ,将aq(t+1)对应的所述第一迭代矩阵作为所述第一矩阵,其中,μ是一个预设常量,|aq(t+1)-aq(t)|是计算aq(t+1)-aq(t)的绝对值。
[0098]
在一个实施例中,所述预测模块802的所述基于所述标签传播方法,根据所述疾病相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵的步骤,包括:
[0099]
对所述疾病相似性矩阵进行标准化计算,得到疾病标准化相似性矩阵;
[0100]
基于所述标签传播方法,根据所述疾病标准化相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到所述第二矩阵;
[0101]
其中,所述疾病标准化相似性矩阵中的第i行第j列的计算公式dd
*
(i,j)表述为:
[0102][0103]
x是所述疾病相似性矩阵中的疾病的数量,dd(i,j)是所述疾病相似性矩阵中的第i行第j列的元素。
[0104]
在一个实施例中,第f+1次迭代之后的第二迭代矩阵的计算公式a
x
(f+1)表示为:
[0105]ax
(f+1)=β*dd
*
*a
x
(f)+(1-β)pd
t
[0106]
其中,f表示迭代次数,ad(f)表示第t次迭代之后的所述第二迭代矩阵,pd是所述已知蛋白质与疾病关联关系矩阵,在f为0时a
x
(0)等于所述已知蛋白质与疾病关联关系矩阵的转置矩阵,β是0-1之间的小数,β是一个可调整的超参,dd
*
是所述疾病标准化相似性矩阵;
[0107]
不断迭代计算所述第二迭代矩阵,直至|a
x
(f+1)-a
x
(f)|《μ,将a
x
(f+1)对应的所述第二迭代矩阵作为所述第二矩阵,其中,μ是一个预设常量,|a
x
(f+1)-a
x
(f)|是计算a
x
(f+1)-a
x
(f)的绝对值。
[0108]
在一个实施例中,所述预测模块802的所述根据所述第一矩阵和所述第二矩阵进行蛋白质与疾病之间的关联关系的预测,得到所述目标蛋白质与疾病关联关系矩阵的步骤,包括:
[0109]
对所述第二矩阵进行转置计算,得到第三矩阵;
[0110]
对所述第一矩阵和所述第三矩阵进行相同位置的元素的平均值计算,得到所述目标蛋白质与疾病关联关系矩阵。
[0111]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包
括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种蛋白质和疾病关联关系的确定方法服务端侧的功能或步骤。
[0112]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种蛋白质和疾病关联关系的确定方法客户端侧的功能或步骤。
[0113]
在一个实施例中,提出了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0114]
获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;
[0115]
根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
[0116]
本实施例通过获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
[0117]
在一个实施例中,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0118]
获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;
[0119]
根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。
[0120]
本实施例通过获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵,根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。
[0121]
需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
[0122]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0123]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0124]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术特征:
1.一种蛋白质和疾病关联关系的确定方法,所述方法包括:获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。2.根据权利要求1所述的蛋白质和疾病关联关系的确定方法,其特征在于,所述根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵的步骤,包括:基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵;基于所述标签传播方法,根据所述疾病相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵;根据所述第一矩阵和所述第二矩阵进行蛋白质与疾病之间的关联关系的预测,得到所述目标蛋白质与疾病关联关系矩阵。3.根据权利要求2所述的蛋白质和疾病关联关系的确定方法,其特征在于,所述基于标签传播方法,根据所述蛋白质相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第一矩阵的步骤,包括:对所述蛋白质相互作用关系矩阵进行标准化计算,得到蛋白质标准化相互作用关系矩阵;基于所述标签传播方法,根据所述蛋白质标准化相互作用关系矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到所述第一矩阵;其中,所述蛋白质标准化相互作用关系矩阵中的第i行第j列的计算公式pp
*
(i,j)表述为:q是所述蛋白质相互作用关系矩阵中的蛋白质的数量,pp(i,j)是所述蛋白质相互作用关系矩阵中的第i行第j列的元素。4.根据权利要求3所述的蛋白质和疾病关联关系的确定方法,其特征在于,第t+1次迭代之后的第一迭代矩阵的计算公式a
q
(t+1)表示为:a
q
(t+1)=α*pp*a
q
(t)+(1-α)pd其中,t表示迭代次数,a
q
(t)表示第t次迭代之后的所述第一迭代矩阵,pd是所述已知蛋白质与疾病关联关系矩阵,在t为0时a
q
(0)等于所述已知蛋白质与疾病关联关系矩阵,α是0-1之间的小数,α是一个可调整的超参,pp
*
是所述蛋白质标准化相互作用关系矩阵;不断迭代计算所述第一迭代矩阵,直至|a
q
(t+1)-a
q
(t)|<μ,将a
q
(t+1)对应的所述第一
迭代矩阵作为所述第一矩阵,其中,μ是一个预设常量,|a
q
(t+1)-a
q
(t)|是计算a
q
(t+1)-a
q
(t)的绝对值。5.根据权利要求2所述的蛋白质和疾病关联关系的确定方法,其特征在于,所述基于所述标签传播方法,根据所述疾病相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到第二矩阵的步骤,包括:对所述疾病相似性矩阵进行标准化计算,得到疾病标准化相似性矩阵;基于所述标签传播方法,根据所述疾病标准化相似性矩阵,对所述已知蛋白质与疾病关联关系矩阵进行更新,得到所述第二矩阵;其中,所述疾病标准化相似性矩阵中的第i行第j列的计算公式dd
*
(i,j)表述为:x是所述疾病相似性矩阵中的疾病的数量,dd(i,j)是所述疾病相似性矩阵中的第i行第j列的元素。6.根据权利要求5所述的蛋白质和疾病关联关系的确定方法,其特征在于,第f+1次迭代之后的第二迭代矩阵的计算公式a
x
(f+1)表示为:a
x
(f+1)=β*dd*a
x
(f)+(1-β)pd
t
其中,f表示迭代次数,a
d
(f)表示第t次迭代之后的所述第二迭代矩阵,pd是所述已知蛋白质与疾病关联关系矩阵,在f为0时a
x
(0)等于所述已知蛋白质与疾病关联关系矩阵的转置矩阵,β是0-1之间的小数,β是一个可调整的超参,dd
*
是所述疾病标准化相似性矩阵;不断迭代计算所述第二迭代矩阵,直至|a
x
(f+1)-a
x
(f)|<μ,将a
x
(f+1)对应的所述第二迭代矩阵作为所述第二矩阵,其中,μ是一个预设常量,|a
x
(f+1)-a
x
(f)|是计算a
x
(f+1)-a
x
(f)的绝对值。7.根据权利要求2所述的蛋白质和疾病关联关系的确定方法,其特征在于,所述根据所述第一矩阵和所述第二矩阵进行蛋白质与疾病之间的关联关系的预测,得到所述目标蛋白质与疾病关联关系矩阵的步骤,包括:对所述第二矩阵进行转置计算,得到第三矩阵;对所述第一矩阵和所述第三矩阵进行相同位置的元素的平均值计算,得到所述目标蛋白质与疾病关联关系矩阵。8.一种蛋白质和疾病关联关系的确定装置,其特征在于,所述装置包括:数据获取模块,用于获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵,其中,所述已知蛋白质与疾病关联关系矩阵是蛋白质与疾病之间的关联关系的矩阵,所述疾病相似性矩阵是疾病与疾病之间的相似性的矩阵,所述蛋白质相互作用关系矩阵是蛋白质与蛋白质之间的相互作用关系的矩阵;预测模块,用于根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述蛋白质和疾病关联关系的确定方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述蛋白质和疾病关联关系的确定方法的步骤。

技术总结
本申请涉及医疗健康技术领域,揭示了一种蛋白质和疾病关联关系的确定方法、装置、设备及介质,其中方法包括:获取已知蛋白质与疾病关联关系矩阵、疾病相似性矩阵和蛋白质相互作用关系矩阵;根据所述已知蛋白质与疾病关联关系矩阵、所述疾病相似性矩阵和所述蛋白质相互作用关系矩阵进行蛋白质与疾病之间的关联关系的预测,得到目标蛋白质与疾病关联关系矩阵。从而实现在较少的数据下稳定有效地预测了潜在的与疾病有关的蛋白质;整个预测过程结合了蛋白质与蛋白质之间的相互作用关系、疾病与疾病之间的相似性、已知的蛋白质与疾病之间的关联关系,从而提高了预测得到的目标蛋白质与疾病关联关系矩阵的准确性。疾病关联关系矩阵的准确性。疾病关联关系矩阵的准确性。


技术研发人员:刘小双
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.06.28
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐