单细胞的发育轨迹重建方法、装置、电子设备及存储介质与流程
未命名
07-23
阅读:76
评论:0
1.本发明涉及计算机技术领域,尤其涉及一种单细胞的发育轨迹重建方法、装置、电子设备及存储介质。
背景技术:
2.随着单细胞测序技术的飞速发展和相应分析工具的大量出现,单细胞测序的应用逐渐走向成熟,能解决的生物学问题也越来越广泛。单细胞转录组测序可以在单个细胞维度研究细胞的功能和表型。
3.但是在相关技术中,当在给一个样本进行单细胞转录组测序之后,细胞就已经死亡了,因此无法追踪细胞后续的变化。细胞轨迹分析可以通过构建细胞间的变化轨迹来重塑细胞随着时间的变化过程,帮助人们从单细胞水平推断细胞之间的演化及分化过程。
4.因此,如何重建单细胞的发育轨迹,是目前亟待解决的问题。
技术实现要素:
5.针对现有技术存在的问题,本发明实施例提供一种单细胞的发育轨迹重建方法、装置、电子设备及存储介质。
6.本发明提供一种单细胞的发育轨迹重建方法,包括:
7.基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;
8.基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;
9.基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;
10.基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。
11.可选地,所述基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络,包括:
12.在所述基因调控网络为基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;
13.利用最小二乘算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络。
14.可选地,所述基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络,包括:
15.在所述基因调控网络为非基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;
16.基于单细胞对应的基因表达的稳态数据,利用目标算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络;所述目标算法包括以下至少
一项:随机参数搜索算法、粒子群算法、梯度下降算法。
17.可选地,所述稳态数据通过以下方式确定:
18.对所述单细胞的前体信使核糖核酸mrna和成熟mrna丰度之间的比值、胞质小rna计数矩阵进行perron聚类,确定所述单细胞的全局命运图,所述全局命运图中包括所述单细胞的至少一种细胞状态,所述细胞状态包括初始细胞状态、中间细胞状态及终端细胞状态;
19.基于所述全局命运图及所述单细胞达到每一种细胞状态的概率,确定所述稳态数据。
20.可选地,所述基于所述概率分布,确定所述单细胞的势能地貌图,包括:
21.基于所述概率分布,确定势函数,所述势函数用于构造所述单细胞的势能地貌图;
22.基于所述势函数,利用最小过渡路径算法,确定所述单细胞的势能地貌图。
23.可选地,在所述确定所述单细胞的势能地貌图之后,所述方法还包括:
24.基于所述稳态数据,确定所述势能地貌图的所有平衡点;
25.根据李雅普诺夫稳定性理论,确定各平衡点中所有的稳态,并对所述势能地貌图进行更新。
26.本发明还提供一种单细胞的发育轨迹重建装置,包括:
27.生成模块,用于基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;
28.第一确定模块,用于基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;
29.第二确定模块,用于基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;
30.建立模块,用于基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。
31.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述单细胞的发育轨迹重建方法。
32.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述单细胞的发育轨迹重建方法。
33.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述单细胞的发育轨迹重建方法。
34.本发明提供的单细胞的发育轨迹重建方法、装置、电子设备及存储介质,基于单细胞的数据集,生成单细胞对应的基因调控网络,基于基因调控网络,确定用于重建单细胞发育轨迹的非线性微分方程,然后基于微分方程,确定基因调控网络对应的概率分布,基于概率分布,可以将单细胞的每个细胞发育状态按照时间顺序排列在对应轨迹上,进而生成直观的用于反映单细胞的发育轨迹的势能地貌图,从而实现重建组织内单细胞的分化及发育轨迹。
附图说明
35.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术
描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本发明提供的单细胞的发育轨迹重建方法的流程示意图之一;
37.图2是本发明提供的单细胞的发育轨迹重建方法的流程示意图之二;
38.图3是本发明提供的单细胞的发育轨迹重建装置的结构示意图;
39.图4是本发明提供的电子设备的结构示意图。
具体实施方式
40.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.为了便于更加清晰地理解本技术各实施例,首先对一些相关的背景知识进行如下介绍。
42.随着单细胞测序技术的飞速发展和相应分析工具的大量出现,单细胞测序的应用逐渐走向成熟,能解决的生物学问题也越来越广泛。单细胞转录组测序可以在单个细胞维度研究细胞的功能和表型。
43.但因为其技术原因,当在给一个样本进行单细胞转录组测序之后,细胞就已经死亡了,因此无法追踪细胞后续的变化。细胞轨迹分析可以通过构建细胞间的变化轨迹来重塑细胞随着时间的变化过程,帮助人们从单细胞水平推断细胞之间的演化及分化过程。
44.随着代表干细胞命运调控关系的生物调控网络的大量出现,使得人们可以对细胞分化及发育细节进行分析。目前,生物分子网络动态建模后用动力学分析的思路解析分子之间的调控机制是重要的研究内容之一。
45.细胞轨迹分析可以通过构建细胞间的变化轨迹来重塑细胞随着时间的变化过程,帮助人们从单细胞水平推断细胞之间的演化及分化过程。推断依据主要来自于细胞间表达谱的相似性,以及细胞内同一转录本的前体(未剪接的)和成熟(剪接的)mrna丰度之间的比值。此类方法无法确定细胞分化的方向,对细胞分化和发育路径的轨迹选择,特别是这些改变的内在机制并不清楚。
46.因此本发明从系统的角度出发,基于非线性微分方程对调控网络动态建模,结合细胞的转录状态和前体(未剪接的)和成熟(剪接的)mrna丰度之间的比值,对其进行广义perron聚类分析,先检测出生物系统内的初始、中间和终端的细胞状态,获得全局命运图和相应到达每个状态的概率。通过时序数据,生物学已知的稳定状态表达数据或上述分析获得的不同稳态对应的表达数据定量拟合,获得动态模型参数。对其进行动力学分析和稳定状态的分析可以清楚不同时刻网络中每个因子的变化,解释细胞基因表达的内在机制,定义与揭示细胞的分化与发育轨迹。即,可以根据每个细胞的状态,将每个细胞按照拟时间排列在对应轨迹上,生成直观的细胞谱系发育树状图,从而重建组织内细胞的分化及发育轨迹。
47.同时,通过改变外界刺激或其他因素对应于模型的参数改变,可以清楚地分析和
重建系统对不同刺激做出的反应及基因表达的变化。
48.下面结合图1至图2对本发明提供的单细胞的发育轨迹重建方法进行具体描述。图1是本发明提供的单细胞的发育轨迹重建方法的流程示意图之一,参见图1所示,该方法包括步骤101-步骤104,其中:
49.步骤101、基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络。
50.首先需要说明的是,本发明的执行主体可以是能够实现对单细胞的发育轨迹进行建立的任何电子设备,例如可以为智能手机、智能手表、台式电脑、手提电脑等任何一种。
51.在本实施例中,为了对单细胞的发育轨迹进行重建,首先需要获取单细胞的基因数据集,在基因数据集中包括单细胞的行为基因。
52.将行为基因列为细胞的矩阵,进而可以构建单细胞对应的基因调控网络。
53.在实际应用中,基因调控网络(gene regulatory network),简称调控网络是一个抽象概念,指细胞内(或特定一个基因组内)基因和基因之间的相互作用关系所形成的网络,在众多相互作用关系之中,又特指基于基因调控所导致的基因间作用。
54.基因调控网络的类型包括多种,例如蛋白质互作网络、基因转录调控网络、转录后调控网络、信号传导网络等。
55.步骤102、基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹。
56.在生成单细胞对应的基因调控网络之后,需要基于基因调控网络构建微分方程。其中,微分方程可以通过以下公式(1)表示:
[0057][0058]
其中,xi表示基因调控网络的n个基因节点中第i个基因的基因表达量;fi表示对第i个基因的调控力;以及为其他基因对第i个基因的调控;a
ji
与b
ji
分别代表第j个节点对第i个节点的促进/抑制常数;kixi表示第i个因素本身的退化。
[0059]
公式(1)中的前三项未考虑其他因素的影响,比如噪声的干扰,外界因素的影响以及可能的基因泄露表达等,因此在这里加入第四项l0cixi以综合其他因素的表达。其中l0表示其他因素的影响,参数ci为一个二值变量,当外界因素对网络中的xi有作用时,ci=1,无作用时,ci=0。
[0060]
在不假设基因变量间是相互独立的情况下,基于调控网络中还可考虑相关的乘积项;在有因子的转录和翻译时滞的情况下,也可以考虑时滞参数τ,具体可在后续模型求解中得到验证。
[0061]
通过上述方法,可以对基因调控网络进行分析,从动力学角度通过非线性微分方程实现分析和重建组织内组织分化和发育的轨迹。
[0062]
步骤103、基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图。
[0063]
在本实施例中,由于一个基因调控网络的状态可由相应概率分布p(x1,...,xn,t)刻画,而扩散方程给出了一些特定状态的概率时间演化方程。但当系统的变量数n较大时,扩散方程是较难求解的。
[0064]
因此首先需要借助自洽场近似对概率分布进行乘积分解来较小系统的维度,乘积分解后的概率分布具体可以通过以下公式(2)表示:
[0065][0066]
然后,将矩方程近似为微分方程,即来推断基因调控网络的概率分布,此处选择多元高斯分布作为基因调控网络稳态概率分布的选择概率,具体通过以下公式(3)、(4)表示:
[0067][0068][0069]
其中,是平均值,σ(t)是协方差矩阵,矩阵a的元素被指定为d为扩散矩阵。
[0070]
步骤104、基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。
[0071]
在本实施例中,需要基于所述概率分布,利用最小过渡路径算法(the minimum action paths,maps)建立用于反映单细胞发育轨迹的势能地貌图。在势能地貌图中包括有用于反映单细胞发育轨迹的最小过渡路径,最小过渡路径是利用maps算法得到的。
[0072]
具体地,maps算法的解释如下:
[0073]
最小化原则上有许多以i开始以j结束的路径,但有不同动作,从过渡路径的定义s
t
[φ
ij
]上看,它实际上需要最小化沿路径的速度φ
ij
和驱动f(φ
ij
),由于移动总是遵循驱动的方向,那么它的行动将为最小的,因此利用最小化过渡路径来做分析,对单细胞不同细胞状态间的转移路径进行量化,了解单细胞关键状态的转化过程,解释细胞基因表达的内在机制,定义与揭示细胞的分化及发育轨迹。
[0074]
在本实施例另一种实现方式中,还可以对基因调控网络进行动力学理论中的分岔分析,通过改变系统的参量,会引起相空间的拓扑结构发生变化,此时的参数点为分岔点,可以清楚不同时刻基因调控网络中每个因子的变化,通过改变外界刺激或其他因素对应于基因调控网络的参数改变,清楚地分析和重建出基因调控网络对不同刺激做出的反应及基因表达的变化。
[0075]
本发明提供的单细胞的发育轨迹重建方法,基于单细胞的数据集,生成单细胞对应的基因调控网络,基于基因调控网络,确定用于重建单细胞发育轨迹的非线性微分方程,然后基于微分方程,确定基因调控网络对应的概率分布,基于概率分布,可以将单细胞的每个细胞发育状态按照时间顺序排列在对应轨迹上,进而生成直观的用于反映单细胞的发育轨迹的势能地貌图,从而实现重建组织内单细胞的分化及发育轨迹。
[0076]
可选地,在本实施例一种可能的实现方式中,所述基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络,具体可以通过以下步骤(1)-步骤(2)实现:
[0077]
步骤(1)、在所述基因调控网络为基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;
[0078]
步骤(2)、利用最小二乘算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络。
[0079]
在本实施例中,首先需要基于基因数据集,生成单细胞对应的初始基因调控网络,在初始基因调控网络中包括构成基因调控网络的基础参数,例如基因节点等。
[0080]
对于已知时间序列数据的基因调控网络,需要使用非线性最小二乘算法,通过模型预测的时间序列y和实际获得的时间序列x,得到误差平方和的最小值(y-x)2,通过上述方法估计初始基因调控网络中的可调参数,来寻求可调参数的最优解,基于可调参数最优解可以得到单细胞对应的基因调控网络。
[0081]
可选地,在本实施例另一种可能的实现方式中,所述基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络,具体可以通过以下步骤[1]-步骤[2]实现:
[0082]
步骤[1]、在所述基因调控网络为非基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;
[0083]
步骤[2]、基于单细胞对应的基因表达的稳态数据,利用目标算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络;所述目标算法包括以下至少一项:随机参数搜索算法、粒子群算法、梯度下降算法。
[0084]
在本实施例中,在基因调控网络为非基于时间序列的基因调控网络的情况下,即,对于不能获得时序数据但生物学上可以得知稳态且有稳态表达数据的基因调控网络,首先需要基于基因数据集,生成单细胞对应的初始基因调控网络,在初始基因调控网络中包括构成基因调控网络的基础参数,例如基因节点等;
[0085]
为了对初始基因调控网络的可调参数进行推断,在稳态数据的前提下,利用随机参数搜索或粒子群算法与梯度下降算法结合,通过最小化模型中细胞状态α的第i个基因的基因表达值y与实验中细胞状态α的第i个基因的基因表达值x,再获得误差平方和的最小值(y-x)2,从而寻求可调参数的最优解,基于可调参数最优解可以得到单细胞对应的基因调控网络。
[0086]
可选地,所述稳态数据通过以下步骤1)-步骤2)确定得到:
[0087]
步骤1)、对所述单细胞的前体信使核糖核酸mrna和成熟mrna丰度之间的比值、胞质小rna计数矩阵进行perron聚类,确定所述单细胞的全局命运图,所述全局命运图中包括所述单细胞的至少一种细胞状态,所述细胞状态包括初始细胞状态、中间细胞状态及终端细胞状态;
[0088]
步骤2)、基于所述全局命运图及所述单细胞达到每一种细胞状态的概率,确定所述稳态数据。
[0089]
在本实施例中,在基因调控网络为非基于时间序列的基因调控网络的情况下,即,对于不能获得时序数据但生物学上可以得知稳态且有稳态表达数据的基因调控网络,需要对单细胞的转录状态和前体mrna(未剪接的)和成熟mrna(剪接的)丰度之间的比值(又称rna速度),以及胞质小rna(scrna)计数矩阵,对其进行广义perron聚类分析,即可得到细胞的全局命运图;其中,scrna计数矩阵是从原始测序数据中生成的。
[0090]
然后基于全局命运图中单细胞的初始细胞状态、中间细胞状态及终端细胞状态,
以及单细胞达到每一种细胞状态的概率,来确定稳态数据。即,先检测出系统的初始、中间和终端的细胞状态,获得全局命运图,根据全局命运图中的不同的细胞状态和相应到达每个状态的概率,回溯到对应细胞状态的表达数据,对表达数据取平均值来获得稳态数据。
[0091]
可选地,所述基于所述概率分布,利用最小过渡路径算法,确定所述单细胞的势能地貌图,具体可以通过以下步骤[a]-步骤[b]实现:
[0092]
步骤[a]、基于所述概率分布,确定势函数,所述势函数用于构造所述单细胞的势能地貌图;
[0093]
步骤[b]、基于所述势函数,利用最小过渡路径算法,确定所述单细胞的势能地貌图。
[0094]
在本实施例中,势函数可以通过以下公式(5)计算得到:
[0095]
u(x)=-ln(p
ss
(x))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0096]
其中,u(x)表示势函数,p
ss
(x)表示基因调控网络对应的稳态概率分布。
[0097]
在确定出势函数之后,以此来构造潜在的势能地貌。
[0098]
在上述实施方式中,基于maps算法构造出的势能地貌图,可以反映出单细胞发育轨迹,清晰的反映出单细胞基于势能进行分化的曲线方向。
[0099]
可选地,在所述确定所述单细胞的势能地貌图之后,由于对于基因调控网络有3元以上难以可视化势能地貌的情况,因此需要结合李雅普诺夫稳定性方法以一种更直接的分析方式先对基因调控网络所有平衡态的稳定性进行理论上的分析和判断,判断出所有的稳态后,再一次指导画出势能地貌图。具体通过以下步骤[1]-步骤[2]实现:
[0100]
步骤[1]、基于所述稳态数据,确定所述势能地貌图的所有平衡点;
[0101]
步骤[2]、根据李雅普诺夫稳定性理论,确定各平衡点中所有的稳态,并对所述势能地貌图进行更新。
[0102]
在本实施例中,对于基因调控网络有3元以上难以可视化势能地貌的情况,结合李雅普诺夫稳定性方法以一种更直接的分析方式先对系统所有平衡态的稳定性进行理论上的分析和判断。
[0103]
具体地,求解上述微分方程模型的平衡点搜索数值解xe,计算基因调控网络的稳态,进而计算出势能地貌图中的所有平衡点,由于势能地貌图具有较强的非线性性质,因此先搜索出势能地貌图中所有的数值解。
[0104]
对动态系统来说,不是所有的平衡态都是稳定的,还有可能存在鞍点等情形。因此,首先用二阶泰勒展开式逼近原方程,用其二阶泰勒展开式是在x=xe时的雅可比矩阵,r(x)是高阶项。然后根据李雅普诺夫稳定性理论,将雅可比矩阵的特征值的实部与0比较,若特征值的实部小于0,则对应的平衡点为渐近稳定的,若小于0,则对应的平衡点为不稳定的,由此判断出所有的稳态,再以此为指导画出势能地貌图;其中,特征值是基于雅克比矩阵计算得到的。
[0105]
图2是本发明提供的单细胞的发育轨迹重建方法的流程示意图之二,参见图2所示,该方法包括步骤201-步骤211,其中:
[0106]
步骤201、基于基因数据集,生成单细胞对应的初始基因调控网络。
[0107]
步骤202、在基因调控网络为基于时间序列的基因调控网络的情况下,利用最小二乘算法对初始基因调控网络的可调参数进行优化,生成单细胞对应的基因调控网络。
[0108]
步骤203、在基因调控网络为非基于时间序列的基因调控网络的情况下,对单细胞的前体mrna和成熟mrna丰度之间的比值、scrna计数矩阵进行perron聚类,确定所述单细胞的全局命运图,全局命运图中包括单细胞的至少一种细胞状态,细胞状态包括初始细胞状态、中间细胞状态及终端细胞状态;
[0109]
步骤204、基于全局命运图及单细胞达到每一种细胞状态的概率,确定稳态数据。
[0110]
步骤205、基于单细胞对应的基因表达的稳态数据,利用目标算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络;其中,目标算法包括以下至少一项:随机参数搜索算法、粒子群算法、梯度下降算法。
[0111]
需要说明的是,步骤202与步骤203-步骤205的执行顺序不分先后。
[0112]
步骤206、基于基因调控网络,确定基因调控网络对应的微分方程,其中,微分方程用于重建单细胞的发育轨迹。
[0113]
步骤207、基于微分方程,确定基因调控网络对应的概率分布,其中,概率分布用于辅助建立单细胞的势能地貌图。
[0114]
步骤208、基于概率分布,确定势函数,其中,势函数用于构造单细胞的势能地貌图。
[0115]
步骤209、基于势函数,利用maps算法,确定单细胞的势能地貌图。
[0116]
步骤210、基于稳态数据,确定势能地貌图的所有平衡点。
[0117]
步骤211、根据李雅普诺夫稳定性理论,确定各平衡点中所有的稳态,并对势能地貌图进行更新。
[0118]
本发明提供的单细胞的发育轨迹重建方法,基于单细胞的数据集,生成单细胞对应的基因调控网络,基于基因调控网络,确定用于重建单细胞发育轨迹的非线性微分方程,然后基于微分方程,确定基因调控网络对应的概率分布,基于概率分布,利用最小过渡路径算法,可以将单细胞的每个细胞发育状态按照时间顺序排列在对应轨迹上,进而生成直观的用于反映单细胞的发育轨迹的势能地貌图,从而实现重建组织内单细胞的分化及发育轨迹。
[0119]
下面对本发明提供的单细胞的发育轨迹重建装置进行描述,下文描述的单细胞的发育轨迹重建装置与上文描述的单细胞的发育轨迹重建方法可相互对应参照。图3是本发明提供的单细胞的发育轨迹重建装置的结构示意图,如图3所示,该单细胞的发育轨迹重建装置300包括:生成模块301、第一确定模块302、第二确定模块303及建立模块304,其中:
[0120]
生成模块301,用于基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;
[0121]
第一确定模块302,用于基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;
[0122]
第二确定模块303,用于基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;
[0123]
建立模块304,用于基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌
图中的最小过渡路径用于反映所述单细胞的发育轨迹。
[0124]
本发明提供的单细胞的发育轨迹重建装置,基于单细胞的数据集,生成单细胞对应的基因调控网络,基于基因调控网络,确定用于重建单细胞发育轨迹的非线性微分方程,然后基于微分方程,确定基因调控网络对应的概率分布,基于概率分布,可以将单细胞的每个细胞发育状态按照时间顺序排列在对应轨迹上,进而生成直观的用于反映单细胞的发育轨迹的势能地貌图,从而实现重建组织内单细胞的分化及发育轨迹。
[0125]
可选地,所述生成模块301,进一步用于:
[0126]
在所述基因调控网络为基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;
[0127]
利用最小二乘算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络。
[0128]
可选地,所述生成模块301,进一步用于:
[0129]
在所述基因调控网络为非基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;
[0130]
基于单细胞对应的基因表达的稳态数据,利用目标算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络;所述目标算法包括以下至少一项:随机参数搜索算法、粒子群算法、梯度下降算法。
[0131]
可选地,所述稳态数据通过以下方式确定:
[0132]
对所述单细胞的前体信使核糖核酸mrna和成熟mrna丰度之间的比值、胞质小rna计数矩阵进行perron聚类,确定所述单细胞的全局命运图,所述全局命运图中包括所述单细胞的至少一种细胞状态,所述细胞状态包括初始细胞状态、中间细胞状态及终端细胞状态;
[0133]
基于所述全局命运图及所述单细胞达到每一种细胞状态的概率,确定所述稳态数据。
[0134]
可选地,所述建立模块304,进一步用于:
[0135]
基于所述概率分布,确定势函数,所述势函数用于构造所述单细胞的势能地貌图;
[0136]
基于所述势函数,利用最小过渡路径算法,确定所述单细胞的势能地貌图。
[0137]
可选地,所述装置还包括:
[0138]
第三确定模块,用于基于所述稳态数据,确定所述势能地貌图的所有平衡点;
[0139]
更新模块,用于根据李雅普诺夫稳定性理论,确定各平衡点中所有的稳态,并对所述势能地貌图进行更新。
[0140]
图4是本发明提供的电子设备的结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(communications interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行单细胞的发育轨迹重建方法,该方法包括:基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;基于所述概率分布,建立所述势能地貌图,其中,所述势
能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。
[0141]
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0142]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的单细胞的发育轨迹重建方法,该方法包括:基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。
[0143]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的单细胞的发育轨迹重建方法,该方法包括:基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。
[0144]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0145]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0146]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和
范围。
技术特征:
1.一种单细胞的发育轨迹重建方法,其特征在于,包括:基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;基于所述基因调控网络,确定所述基因调控网络对应的微分方程,所述微分方程用于重建所述单细胞的发育轨迹;基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。2.根据权利要求1所述的单细胞的发育轨迹重建方法,其特征在于,所述基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络,包括:在所述基因调控网络为基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;利用最小二乘算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络。3.根据权利要求1所述的单细胞的发育轨迹重建方法,其特征在于,所述基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络,包括:在所述基因调控网络为非基于时间序列的基因调控网络的情况下,基于所述基因数据集,生成所述单细胞对应的初始基因调控网络;基于单细胞对应的基因表达的稳态数据,利用目标算法对所述初始基因调控网络的可调参数进行优化,生成所述单细胞对应的基因调控网络;所述目标算法包括以下至少一项:随机参数搜索算法、粒子群算法、梯度下降算法。4.根据权利要求3所述的单细胞的发育轨迹重建方法,其特征在于,所述稳态数据通过以下方式确定:对所述单细胞的前体信使核糖核酸mrna和成熟mrna丰度之间的比值、胞质小rna计数矩阵进行perron聚类,确定所述单细胞的全局命运图,所述全局命运图中包括所述单细胞的至少一种细胞状态,所述细胞状态包括初始细胞状态、中间细胞状态及终端细胞状态;基于所述全局命运图及所述单细胞达到每一种细胞状态的概率,确定所述稳态数据。5.根据权利要求1至4中任一项所述的单细胞的发育轨迹重建方法,其特征在于,所述基于所述概率分布,确定所述单细胞的势能地貌图,包括:基于所述概率分布,确定势函数,所述势函数用于构造所述单细胞的势能地貌图;基于所述势函数,利用最小过渡路径算法,确定所述单细胞的势能地貌图。6.根据权利要求3或4所述的单细胞的发育轨迹重建方法,其特征在于,在所述确定所述单细胞的势能地貌图之后,所述方法还包括:基于所述稳态数据,确定所述势能地貌图的所有平衡点;根据李雅普诺夫稳定性理论,确定各平衡点中所有的稳态,并对所述势能地貌图进行更新。7.一种单细胞的发育轨迹重建装置,其特征在于,包括:生成模块,用于基于单细胞的基因数据集,生成所述单细胞对应的基因调控网络;第一确定模块,用于基于所述基因调控网络,确定所述基因调控网络对应的微分方程,
所述微分方程用于重建所述单细胞的发育轨迹;第二确定模块,用于基于所述微分方程,确定所述基因调控网络对应的概率分布;所述概率分布用于辅助建立所述单细胞的势能地貌图;建立模块,用于基于所述概率分布,建立所述势能地貌图,其中,所述势能地貌图中的最小过渡路径用于反映所述单细胞的发育轨迹。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述单细胞的发育轨迹重建方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述单细胞的发育轨迹重建方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述单细胞的发育轨迹重建方法。
技术总结
本发明提供一种单细胞的发育轨迹重建方法、装置、电子设备及存储介质,涉及计算机技术领域,方法包括:基于单细胞的基因数据集,生成单细胞对应的基因调控网络;基于基因调控网络,确定基因调控网络对应的微分方程;基于微分方程,确定基因调控网络对应的概率分布;基于概率分布,建立单细胞的势能地貌图。通过上述方法,基于基因调控网络,确定用于重建单细胞发育轨迹的非线性微分方程,基于微分方程,确定基因调控网络对应的概率分布,基于概率分布可以将单细胞的每个细胞发育状态按照时间顺序排列在对应轨迹上,进而生成直观的用于反映单细胞的发育轨迹的势能地貌图,从而实现重建组织内单细胞的分化及发育轨迹。建组织内单细胞的分化及发育轨迹。建组织内单细胞的分化及发育轨迹。
技术研发人员:董瑾欣 宫月 侯睿 杨家亮 田埂
受保护的技术使用者:北京元码医学检验实验室有限公司
技术研发日:2023.04.18
技术公布日:2023/7/21
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种多角度监控摄像头的制作方法 下一篇:一种耐高温的锻压夹子的制作方法
