一种基于定制化策略的肿瘤微小残留病灶检测方法与流程
未命名
08-15
阅读:170
评论:0
1.本发明属于生物检测技术领域,具体涉及一种基于定制化策略检测肿瘤中微小残留病灶的方法和应用。
背景技术:
2.微小残留病灶(minimal residual disease,mrd)为肿瘤根治性手术或新辅助/辅助治疗后体内残存的痕量肿瘤细胞。检测mrd在肿瘤术后复发风险预测,辅助治疗方案决策,药物临床实验患者富集和临床终点替代等方面均有应用。循环肿瘤dna(circulating tumor dna,ctdna)是反应mrd状态的重要指标,在肿瘤病灶无法被影像等传统检查方法发现时,ctdna在循环游离dna(circulating cell-free dna,cfdna)中的比例非常低,通过检测ctdna判断mrd状态对检测的灵敏度和准确性具有非常高的要求。
3.在基于定制化策略检测mrd的现有技术中,设计定制化panel阶段通过选取合适的突变提高mrd检测灵敏度的方法效果不够理想。同时,在区分真实突变和背景噪音时,背景噪音库的构建需要用到较多的额外健康人样本,所得背景噪音集合与待检测样本的背景噪音可能存在差异,限制了检测的准确性及其应用。另一方面,目前的检测技术在设计定制化panel时采用了固定数量的突变个数,或者仅使用较小的panel对肿瘤组织进行检测,识别的突变个数有限,这些都限制了检测的覆盖人群。
技术实现要素:
4.本发明的目的在于提供一种微小残留病灶检测方法,该方法通过在个性化panel设计阶段优先选取具有更低背景噪音的突变类型,同时利用待检测样本测序信号分类构建特异背景噪音库,实现了对突变信号及样本微小残留病灶状态更为灵敏和准确的检测。同时,全外显子测序为个性化panel设计提供足够的突变候选,且突变选取个数灵活,可以覆盖更多需要微小残留病灶检测的肿瘤患者人群。
5.在本发明的第一方面,提供一种ctdna的检测模型或检测系统,包括:肿瘤组织基因突变筛查模块、突变信号提取模块、背景噪音构建模块和ctdna判断模块;
6.所述肿瘤组织基因突变筛查模块用于;获取待测对象的样本测序数据,和利用所述测序数据构建的待测对象的体细胞突变图谱,以及,根据突变分类结果按照优先级顺序选取预设数量的突变,合并单核苷酸多态性(snp)位点,获得个性化panel;
7.所述突变信号提取模块用于:获取对同一待测对象的微小残余病灶术后监测点的样本游离dna的测序数据,根据个性化panel在测序数据中提取相应的检测信息;
8.所述背景噪音构建模块用于:对每一突变类型下的检测信息进行过滤,过滤后的检测信息构建所有突变类型的背景噪音库;
9.所述ctdna判断模块用于:将待检测突变与背景噪音库里同类型的背景噪音进行比较,判定ctdna的突变状态。
10.在一种或多种实施方案中,所述ctdna判断模块包括:
11.背景噪音调取模块,用于根据给定的待检测突变vi的位置信息和突变类型信息,调取该突变类型的背景噪音数据;
12.背景噪音频率期望生成模块,用于区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
;使用逆伽马分布对非零数值的背景噪音频率数据进行拟合得到背景噪音的频率分布,计算背景噪音频率期望e(vaf);
13.第一计算模块,用于根据负二项分布计算待测对象的待检测突变来自于噪音信号的概率pi,计算公式为:pi=p
vaf
×
nb(n≤ni|ni,e(vaf)),nb为负二项分布,ni为覆盖待检测突变vi的reads个数,ni为支持待检测突变vi的reads个数;
14.第一分析模块:用于根据pi数值,分析ctdna的突变状态;较佳的,当pi小于cutoff时判定待检测突变为阳性,否则判定为阴性,其中cutoff表示概率pi的阈值;更佳的,所述cutoff值为0.01。
15.在一种或多种实施方案中,所述肿瘤组织基因突变筛查模块中所述突变的分类标准包括:
16.a)突变为非同义突变或同义突变;
17.b)突变为主克隆突变或亚克隆突变;
18.c)突变是否为驱动突变;
19.d)突变为连锁突变(pv),插入缺失突变(indel)或单碱基突变(snv)。
20.在一种或多种实施方案中,所述肿瘤组织基因突变筛查模块中,所述突变优先级的顺序是:
21.a)非同义突变选择优先级大于同义突变;
22.b)主克隆突变选择优先级大于亚克隆突变;
23.c)驱动突变选择优先级大于pv,pv选择优先级大于indel,indel选择优先级大于snv。
24.在一种或多种实施方案中,所述肿瘤组织基因突变筛查模块中,所述样本是肿瘤组织样本和配对的外周血白细胞样本。
25.在一种或多种实施方案中,所述肿瘤组织基因突变筛查模块中,所述预设数量是指:体细胞突变数量为8,16,32,48或64。
26.在一种或多种实施方案中,所述肿瘤组织基因突变筛查模块中,所述突变类型包括snv、indel、pv中的任意一种、任意两种或全部。
27.在一种或多种实施方案中,所述snv包括12种snv中的一种、多种或全部(较佳地,所述snv为a》c,a》g,a》t,t》a,t》c,t》g,g》c,g》t,g》a,c》a,c》g,c》t);所述indel根据其长度进行区分;
28.和所述pv包括78种中的一种、多种或全部(较佳地所述pv为a》c+a》c,a》c+a》g,a》c+a》t,a》c+t》a,a》c+t》c,a》c+t》g,a》c+g》c,a》c+g》t,a》c+g》a,a》c+c》a,a》c+c》g,a》c+c》t,a》g+a》g,a》g+a》t,a》g+t》a,a》g+t》c,a》g+t》g,a》g+g》c,a》g+g》t,a》g+g》a,a》g+c》a,a》g+c》g,a》g+c》t,a》t+a》t,a》t+t》a,a》t+t》c,a》t+t》g,a》t+g》c,a》t+g》t,a》t+g》a,a》t+c》a,a》t+c》g,a》t+c》t,t》a+t》a,t》a+t》c,t》a+t》g,t》a+g》c,t》a+g》t,t》a+g》a,t》a+c》a,t》a+c》g,t》a+c》t,t》c+t》c,t》c+t》g,t》c+g》c,t》c+g》t,t》c+g》a,t》c+c》a,t》c+c》g,t》c+c》t,t》g+t》g,t》g+g》c,t》g+g》t,t》g+g》a,t》g+c》a,t》g+c》g,t》g+c》t,g》c+g》c,g》c+g》t,g》c+g》a,
g》c+c》a,g》c+c》g,g》c+c》t,g》t+g》t,g》t+g》a,g》t+c》a,g》t+c》g,g》t+c》t,g》a+g》a,g》a+c》a,g》a+c》g,g》a+c》t,c》a+c》a,c》a+c》g,c》a+c》t,c》g+c》g,c》g+c》t,c》t+c》t)。
29.在一种或多种实施方案中,所述snp位点包括如下表所述的29个位点中的一种、多种或全部:
30.染色体基因组位置1114515717;1233167706;286002303;2152236046;516769273;540955561;576734084;5176636882;633636907;711581134;776984572;868993013;868993014;869020496;8143742477;918950895;9104385712;1017188637;1019636869;10124610027;10128192985;126965194;1212240199;1544943757;1569238445;1842456653;1848333203;1910600442;2229446611。
31.在一种或多种实施方案中,所述突变信号提取模块中,所述样本为血液样本、血浆样本或全血样本。
32.在一种或多种实施方案中,所述背景噪音构建模块中,所述每一突变类型的检测信息包括突变位点的深度信息及频率信息。
33.在一种或多种实施方案中,所述背景噪音构建模块中,过滤检测信息的标准为:
34.去除待检测突变位点的数据;
35.去除深度不足的位点数据(位点有效深度<7000x)
36.去除突变频率非常高的位点数据(突变频率>1%)
37.去除胚系突变和克隆性造血突变(同一位点在血浆样本和配对白细胞样本中的突变频率均大于同类型突变所有位点突变频率的上95%分位数,且血浆样本和配对白细胞样本此位点的突变频率倍数差异在5倍以内)。
38.在本发明的第二方面,提供一种微小残留病灶的检测模型或检测系统,包括:本发明所述的ctdna的检测模型或检测系统,以及微小残留病灶的分析模块。
39.在一种或多种实施方案中,所述微小残留病灶的分析模块用于:综合ctdna的判断结果,分析微小残余病灶的状态。
40.在一种或多种实施方案中,所述微小残留病灶的分析模块包括:
41.第二计算模块,用于根据计算公式和第一计算模块获得的概率pi的数值,计算联合置信概率ps,其中m为个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数;
42.第二分析模块,用于根据ps数值,分析微小残留病灶的状态;较佳的,当ps小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性,其中cutoff表示联合置信概率ps的阈值;较佳的,所述cutoff值为0.05。
43.在本发明的第三方面,提供一种微小残留病灶的检测方法,包括以下步骤:
44.1)全外显子测序鉴定肿瘤组织突变:对待测对象的样本进行全外显子测序,获取体细胞突变图谱;
45.2)个性化基因组合panel的获得:根据1)中获取的该待测对象的体细胞突变图谱,进行突变的分类,根据分类结果按照优先级顺序选取预设数量的突变,合并固定的单核苷酸多态性(snp)位点,获得设计个性化panel;
46.3)个性化pane1捕获测序:采集1)中同一待测对象的样本,进行测序,提取测序数据中所有2)中所述的个性化panel所覆盖位点的检测信息;
47.4)分类构建内部背景噪音模型:根据突变类型进行分类,对每一突变类型下的检测信息进行过滤,保留所有符合要求的检测信息作为此种类型突变的背景噪音库;
48.5)判定单位点突变状态:选择某一突变,将该待检测突变与4)中背景噪音库里同类型的背景噪音进行比较,判定单位点的突变状态;
49.6)确定样本微小残留病灶结果:重复步骤5),直至2)所述个性化panel中的所有突变均已经判定结束,整合所有判定结果,确定样本微小残留病灶的状态。
50.在一种或多种实施方案中,步骤2)中,所述突变的分类标准包括:
51.a)突变为非同义突变或同义突变;
52.b)突变为主克隆突变或亚克隆突变;
53.c)突变是否为驱动突变;
54.d)突变为连锁突变(pv),插入缺失突变(indel)或单碱基突变(snv)。
55.在一种或多种实施方案中,步骤2)中,所述优先级的顺序是:
56.a)非同义突变选择优先级大于同义突变;
57.b)主克隆突变选择优先级大于亚克隆突变;
58.c)驱动突变选择优先级大于pv,pv选择优先级大于indel,indel选择优先级大于snv。
59.在一种或多种实施方案中,步骤2)中,所述snp位点包括如下表所述的29个位点中的一种、多种或全部:
60.染色体基因组位置1114515717;1233167706;286002303;2152236046;516769273;540955561;576734084;5176636882;633636907;711581134;776984572;868993013;868993014;869020496;8143742477;918950895;9104385712;1017188637;1019636869;10124610027;10128192985;126965194;1212240199;1544943757;1569238445;1842456653;1848333203;1910600442;2229446611。
61.在一种或多种实施方案中,步骤4)中,所述突变类型包括snv、indel、pv中的任意一种、任意两种或全部;
62.较佳地,所述snv包括12种中的一种、多种或全部(更佳地,所述snv为a》c,a》g,a》t,t》a,t》c,t》g,g》c,g》t,g》a,c》a,c》g,c》t);所述indel根据其长度进行区分;
63.和/或,所述pv包括78种中的一种、多种或全部(更佳地所述pv为a》c+a》c,a》c+a》
g,a》c+a》t,a》c+t》a,a》c+t》c,a》c+t》g,a》c+g》c,a》c+g》t,a》c+g》a,a》c+c》a,a》c+c》g,a》c+c》t,a》g+a》g,a》g+a》t,a》g+t》a,a》g+t》c,a》g+t》g,a》g+g》c,a》g+g》t,a》g+g》a,a》g+c》a,a》g+c》g,a》g+c》t,a》t+a》t,a》t+t》a,a》t+t》c,a》t+t》g,a》t+g》c,a》t+g》t,a》t+g》a,a》t+c》a,a》t+c》g,a》t+c》t,t》a+t》a,t》a+t》c,t》a+t》g,t》a+g》c,t》a+g》t,t》a+g》a,t》a+c》a,t》a+c》g,t》a+c》t,t》c+t》c,t》c+t》g,t》c+g》c,t》c+g》t,t》c+g》a,t》c+c》a,t》c+c》g,t》c+c》t,t》g+t》g,t》g+g》c,t》g+g》t,t》g+g》a,t》g+c》a,t》g+c》g,t》g+c》t,g》c+g》c,g》c+g》t,g》c+g》a,g》c+c》a,g》c+c》g,g》c+c》t,g》t+g》t,g》t+g》a,g》t+c》a,g》t+c》g,g》t+c》t,g》a+g》a,g》a+c》a,g》a+c》g,g》a+c》t,c》a+c》a,c》a+c》g,c》a+c》t,c》g+c》g,c》g+c》t,c》t+c》t)。
64.在一种或多种实施方案中,步骤1)中,所述样本是肿瘤组织样本和配对的外周血白细胞样本。
65.在一种或多种实施方案中,步骤2)中,所述预设数量是指:体细胞突变数量为8,16,32,48或64。
66.在一种或多种实施方案中步骤3)中,所述样本为血液样本、血浆样本或全血样本。
67.在一种或多种实施方案中,步骤4)中,所述检测信息包括突变位点的深度信息及频率信息。
68.在一种或多种实施方案中,步骤4)中,构建背景噪音库的过滤标准为:
69.去除待检测突变位点的数据;
70.去除深度不足的位点数据(位点有效深度<7000x)
71.去除突变频率非常高的位点数据(突变频率>1%)
72.去除胚系突变和克隆性造血突变(同一位点在血浆样本和配对白细胞样本中的突变频率均大于同类型突变所有位点突变频率的上95%分位数,且血浆样本和配对白细胞样本此位点的突变频率倍数差异在5倍以内)。
73.在一种或多种实施方案中,步骤5)中,判定单位点突变状态的判定方法为:
74.a)给定一个待检测突变vi,从4)中的模型里提取对应突变类型的背景噪音数据;
75.b)区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
;使用非零数值的背景噪音频率数据拟合背景噪音分布,计算背景噪音频率期望e(vaf);
76.c)根据负二项分布计算待检测突变来自背景噪音的概率pi,当pi小于cutoff时判定待检测突变为阳性,否则判定为阴性,其中cutoff表示概率pi的阈值;
77.较佳的,所述概率pi的计算公式为:pi=p
vaf
×
nb(n≤ni|ni,e(vaf)),其中,nb为负二项分布,ni为覆盖待检测突变vi的reads个数,ni为支持待检测突变vi的reads个数;
78.较佳的,所述cutoff值为0.01。
79.在一种或多种实施方案中,步骤6)中,确定样本微小残留病灶结果的步骤为:根据5)中判定后得到的单位点突变概率pi,计算联合置信概率ps,当ps小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性,其中cutoff表示联合置信概率ps的阈值;
80.较佳的,所述cutoff值为0.05;
81.较佳的,所述联合置信概率ps计算公式为:其中m为个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数。
82.在本发明的第四方面,提供一种ctdna的检测方法,其特征在于,所述检测方法包括如本发明所述的微小残留病灶检测方法中的步骤1)到步骤5)。
83.在本发明的第五方面,提供一种计算机程序产品或检测设备,其包括至少一个处理器,所述处理器能够执行存储于介质中的计算机程序指令,以实施如本发明所述的微小残留病灶检测方法,或实施如本发明所述的ctdna的检测方法;或,其包括如本发明所述的ctdna的检测模型或检测系统,或包括如本发明所述的微小残留病灶的检测模型或检测系统。
84.在本发明的第六方面,提供一种存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行如本发明所述的微小残留病灶检测方法,或执行如本发明所述的ctdna的检测方法。
85.在本发明的第七方面,提供选自以下的应用:
86.(1)本发明所述的ctdna的检测模型或检测系统的用途,用于检测样本中的ctdna;
87.(2)本发明所述的ctdna的检测模型或检测系统的用途,用于制备检测样本中微小残留病灶的产品;
88.(3)本发明所述的微小残留病灶的检测模型或检测系统的用途,用于检测样本中微小残留病灶;
89.较佳的,所述样本为待测对象的血液样本、血浆样本或全血样本。
90.本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
附图说明
91.图1、本发明所述的微小残留病灶检测方法的示意图。
具体实施方式
92.本发明人经过深入的研究,提供了一种微小残留病灶检测方法,该方法通过在个性化panel设计阶段优先选取具有更低背景噪音的突变类型,同时利用待检测样本测序信号分类构建特异背景噪音库,实现了对突变信号及样本微小残留病灶状态更为灵敏和准确的检测。同时,全外显子测序为个性化panel设计提供足够的突变候选,且突变选取个数灵活,可以覆盖更多需要微小残留病灶检测的肿瘤患者人群。
93.本发明的检测方法
94.本发明提供了一种微小残留病灶检测方法,包括:
95.1)全外显子测序鉴定肿瘤组织突变;
96.2)个性化基因组合panel设计;
97.3)个性化pane1捕获测序;
98.4)分类构建内部背景噪音模型;
99.5)利用4)中的模型,判定单位点突变状态;
100.6)确定样本微小残留病灶结果。
101.1)全外显子测序鉴定肿瘤组织突变
102.对某一患者的肿瘤组织样本和配对的外周血白细胞样本进行全外显子测序,获取该患者的体细胞突变图谱。
103.在一些具体的实施方式中,所述的肿瘤组织样本和外周血白细胞样本的取样时间
可以为肿瘤治疗术前、肿瘤治疗术中或新辅助治疗前。
104.在对患者的肿瘤组织和配对的外周白细胞的建库测序数据的过程中,本发明的实施例中不对具体的方法进行限定,本领域的技术人员可直接利用现有的方法完成。在一些具体的实施方式中,利用全外显子测序数据识别肿瘤组织体细胞突变所用流程为mc3突变检测流程。在该步骤中,通过对患者的肿瘤组织(体细胞)和配对的外周白细胞进行平行建库,主要是为了排除生殖变异引起的干扰,从而提高微小残余病灶的检测准确性。
105.2)个性化基因组合panel设计
106.将1)中获取的患者的体细胞突变,根据不同标准进行分类,根据分类结果按照优先级顺序选取预设数量的突变,合并固定的单核苷酸多态性(single nucleotide polymorphism,snp)位点设计个性化panel;
107.在一些具体的实施方式中,所述突变分类标准包括:
108.a)突变为非同义突变或同义突变;
109.b)突变为主克隆突变或亚克隆突变;
110.c)突变是否为驱动突变;
111.d)突变为连锁突变(phased variant,pv),插入缺失突变(insertion or deletion,indel)或单碱基突变(single nucleotide variant,snv)。
112.其中,标准a)中非同义突变与同义突变的定义为:mc3流程注释突变类型为silent的突变为同义突变,注释为其他突变类型的突变为非同义突变。
113.标准b)中突变克隆状态的确认方法为:使用sequenza软件计算得到肿瘤组织样本的纯度和全外显子panel覆盖区域的拷贝数信息,结合体细胞突变的突变频率数据,使用pyclone计算得到所有突变的肿瘤细胞占比(cancer cell fraction,ccf),定义ccf的95%置信区间上限大于0.95的突变为主克隆突变,其他突变为亚克隆突变。
114.标准c)中驱动突变定义为自定义驱动突变数据库中所包含的突变。
115.标准d)中pv定义为在同一cfdna分子上同时被检测到的两个及其以上的snv,同时需要满足以下条件:肿瘤样本中支持pv的cfdna分子有效深度≥100,pv的突变频率≥1%,配对白细胞中支持pv的cfdna分子个数为0。
116.在一些具体的实施方式中,所述预设数量是指:体细胞突变数量为8,16,32,48或64。
117.在一些具体的实施方式中,所述优先级顺序是:
118.a)非同义突变选择优先级大于同义突变
119.b)主克隆突变选择优先级大于亚克隆突变;
120.c)驱动突变选择优先级大于pv,pv选择优先级大于indel,indel选择优先级大于snv。
121.在一些具体的实施方式中,所述固定的单核苷酸多态性(single nucleotide polymorphism,snp)位点是指表2所述的29个位点。在一些更具体的实施方式中,当待检测样本中29个snp中至少28个snp基因型相同时,判定该样本来自于同一患者。
122.3)个性化pane1捕获测序
123.采集1)中同一患者的样本,进行测序,提取测序数据中2)中所述的个性化panel所覆盖位点的检测信息。
124.在一些实施方式中,在提取测序数据中2)中所述的个性化panel所覆盖位点的检测信息时,所提取的位点可以是与步骤2)中所述的个性化panel相同,也可以是所述的个性化panel的子集(即其中一种或多种的组合)。通过在样本中只特异性的追踪患者个性化panel中的突变,从而有效地排除了其他的噪音信号,大大提高了突变信号的可信程度。
125.在一些具体的实施方式中,所述样本可以为血液样本、血浆样本或全血样本;优选地采用经全血分离得的样本。
126.在一些具体的实施方式中,所述样本为血浆样本,血浆取样时间为肿瘤治疗术后或新辅助治疗后。
127.在一些具体的实施方式中,所述检测信息包括这些位点的深度信息及与给定突变类型相同变异的频率信息。
128.4)分类构建内部背景噪音模型
129.根据突变类型进行分类,对每一突变类型下的检测信息进行过滤,保留所有符合要求的检测信息作为此种类型突变的背景噪音库。
130.在一些具体的实施方式中,所述突变类型包括12种snv(a》c,a》g,a》t,t》a,t》c,t》g,g》c,g》t,g》a,c》a,c》g,c》t),不同长度的indel和78种pv(a》c+a》c,a》c+a》g,a》c+a》t,a》c+t》a,a》c+t》c,a》c+t》g,a》c+g》c,a》c+g》t,a》c+g》a,a》c+c》a,a》c+c》g,a》c+c》t,a》g+a》g,a》g+a》t,a》g+t》a,a》g+t》c,a》g+t》g,a》g+g》c,a》g+g》t,a》g+g》a,a》g+c》a,a》g+c》g,a》g+c》t,a》t+a》t,a》t+t》a,a》t+t》c,a》t+t》g,a》t+g》c,a》t+g》t,a》t+g》a,a》t+c》a,a》t+c》g,a》t+c》t,t》a+t》a,t》a+t》c,t》a+t》g,t》a+g》c,t》a+g》t,t》a+g》a,t》a+c》a,t》a+c》g,t》a+c》t,t》c+t》c,t》c+t》g,t》c+g》c,t》c+g》t,t》c+g》a,t》c+c》a,t》c+c》g,t》c+c》t,t》g+t》g,t》g+g》c,t》g+g》t,t》g+g》a,t》g+c》a,t》g+c》g,t》g+c》t,g》c+g》c,g》c+g》t,g》c+g》a,g》c+c》a,g》c+c》g,g》c+c》t,g》t+g》t,g》t+g》a,g》t+c》a,g》t+c》g,g》t+c》t,g》a+g》a,g》a+c》a,g》a+c》g,g》a+c》t,c》a+c》a,c》a+c》g,c》a+c》t,c》g+c》g,c》g+c》t,c》t+c》t)。
131.在一些具体的实施方式中,构建背景噪音库的过滤标准为:去除待检测突变位点的数据,去除深度不足的位点数据(位点有效深度<7000x),去除突变频率非常高的位点数据(突变频率>1%),去除胚系突变和克隆性造血突变(同一位点在血浆样本和配对白细胞样本中的突变频率均大于同类型突变所有位点突变频率的上95%分位数,且血浆样本和配对白细胞样本此位点的突变频率倍数差异在5倍以内)。
132.5)利用4)中的模型,判定单位点突变状态
133.在一些具体的实施方式中,利用4)中的模型,判定单位点突变状态的判定方法为:
134.a)给定一个待检测突变vi,从4)中的模型里提取对应突变的背景噪音数据。
135.b)区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
。使用非零数值的背景噪音频率数据拟合背景噪音的频率分布,计算背景噪音频率期望e(vaf)。
136.c)根据负二项分布计算待检测突变来自背景噪音的概率pi,当pi小于cutoff时判定待检测突变为阳性,否则判定为阴性,其中cutoff表示概率pi的阈值。
137.在一些具体的实施方式中,待检测突变来自背景噪音的概率pi的计算公式为:pi=p
vaf
×
nb(n≤ni|ni,e(vaf)),其中,nb为负二项分布,ni为覆盖待检测突变vi的reads个数,ni为支持待检测突变vi的reads个数。
138.在一些具体的实施方式中,所述cutoff值为0.01。
139.6)确定样本微小残留病灶结果
140.重复步骤5),直至将2)所述个性化panel中的所有基因突变均已经判定结束;根据5)中判定后得到的个性化panel的单位点突变状态,计算联合置信概率ps,当ps小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性,其中cutoff表示联合置信概率ps的阈值。
141.在同时追踪多个突变来判断ctdna是否存在的过程中,进行了多次的单位点突变状态的置信度分析,而该步骤是为了控制多重比较带来的假阳性问题,保证了微小残余病灶的检测的特异性,从而使得微小残余病灶的检测具有高的准确性。
142.在一些具体的实施方式中,所述cutoff值为0.05。
143.在一些具体的实施方式中,所述联合置信概率ps计算公式为:其中m为设计个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数。
144.本发明也提供了一种ctdna的检测方法,所述检测方法包括本发明所述的微小残留病灶检测方法中的步骤1)到步骤5)。
145.本发明也提供了一种ctdna的检测模型或检测系统,包括:肿瘤组织基因突变筛查模块、突变信号提取模块、背景噪音构建模块和ctdna判断模块。
146.在一些实施方式中,所述肿瘤组织基因突变筛查模块用于;获取患者的样本测序数据,和利用所述测序数据构建的患者体细胞突变图谱,以及,根据突变分类合并单核苷酸多态性(snp)位点设计的个性化panel。
147.在一些实施方式中,所述突变信号提取模块用于:获取对患者微小残余病灶术后监测点的样本游离dna的测序数据,根据个性化panel在测序数据中提取相应的检测信息。
148.在一些实施方式中,所述背景噪音构建模块用于:对每一突变类型下的检测信息进行过滤,保留所有符合要求的检测信息构建所有突变类型的背景噪音库。
149.在一些实施方式中,所述ctdna判断模块用于:将待检测突变与背景噪音库里同类型的背景噪音进行比较,判定ctdna的突变状态。
150.在一些具体的实施方式中,所述突变类型包括12种snv(a》c,a》g,a》t,t》a,t》c,t》g,g》c,g》t,g》a,c》a,c》g,c》t),不同长度的indel和/或78种pv(a》c+a》c,a》c+a》g,a》c+a》t,a》c+t》a,a》c+t》c,a》c+t》g,a》c+g》c,a》c+g》t,a》c+g》a,a》c+c》a,a》c+c》g,a》c+c》t,a》g+a》g,a》g+a》t,a》g+t》a,a》g+t》c,a》g+t》g,a》g+g》c,a》g+g》t,a》g+g》a,a》g+c》a,a》g+c》g,a》g+c》t,a》t+a》t,a》t+t》a,a》t+t》c,a》t+t》g,a》t+g》c,a》t+g》t,a》t+g》a,a》t+c》a,a》t+c》g,a》t+c》t,t》a+t》a,t》a+t》c,t》a+t》g,t》a+g》c,t》a+g》t,t》a+g》a,t》a+c》a,t》a+c》g,t》a+c》t,t》c+t》c,t》c+t》g,t》c+g》c,t》c+g》t,t》c+g》a,t》c+c》a,t》c+c》g,t》c+c》t,t》g+t》g,t》g+g》c,t》g+g》t,t》g+g》a,t》g+c》a,t》g+c》g,t》g+c》t,g》c+g》c,g》c+g》t,g》c+g》a,g》c+c》a,g》c+c》g,g》c+c》t,g》t+g》t,g》t+g》a,g》t+c》a,g》t+c》g,g》t+c》t,g》a+g》a,g》a+c》a,g》a+c》g,g》a+c》t,c》a+c》a,c》a+c》g,c》a+c》t,c》g+c》g,c》g+c》t,c》t+c》t)中的一种、多种或全部;所述snp位点包括如表2所述的29个位点中的一种、多种或全部。
151.在一些实施方式中,所述ctdna判断模块包括:背景噪音调取模块,背景噪音频率期望生成模块,第一计算模块和第一分析模块。
152.在一些实施方式中,所述背景噪音调取模块,用于根据给定的待检测突变vi的位置信息和突变类型信息,调取该突变类型的背景噪音数据。
153.在一些实施方式中,所述背景噪音频率期望生成模块,用于区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
。使用逆伽马分布对非零数值的背景噪音频率数据进行拟合得到背景噪音的频率分布,计算背景噪音频率期望e(vaf)。
154.在一些实施方式中,所述第一计算模块,用于根据负二项分布计算患者待检测突变来自于噪音信号的概率pi,计算公式为:pi=p
vaf
×
nb(n≤ni|ni,e(vaf)),nb为负二项分布,ni为覆盖待检测突变vi的reads个数,ni为支持待检测突变vi的reads个数。
155.在一些实施方式中,所述第一分析模块,用于根据pi数值,分析ctdna的突变状态;较佳的,当pi小于cutoff时判定待检测突变为阳性,否则判定为阴性,其中cutoff表示概率pi的阈值;更佳的,所述cutoff值为0.01。
156.本发明还提供了一种微小残留病灶的检测模型或检测系统,包括:本发明所述的ctdna的检测模型或检测系统,以及微小残留病灶的分析模块。
157.在一些实施方式中,所述微小残留病灶的分析模块用于:综合ctdna的判断结果,分析微小残余病灶的状态。
158.在一些实施方式中,所述微小残留病灶的分析模块包括:第二计算模块和第二分析模块。
159.在一些实施方式中,所述第二计算模块,用于根据计算公式和第一计算模块获得的概率pi的数值,计算联合置信概率ps,其中m为个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数。
160.在一些实施方式中,所述第二分析模块,用于根据ps数值,分析微小残留病灶的状态;较佳的,当ps小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性,其中cutoff表示联合置信概率ps的阈值;较佳的,所述cutoff值为0.05。
161.本发明还提供了一种计算机程序产品或检测设备,其包括至少一个处理器,所述处理器能够执行存储于介质中的计算机程序指令,以实施本发明所述的微小残留病灶检测方法,或实施本发明所述的循环肿瘤dna的检测方法;或,其包括本发明所述的ctdna的检测模型或检测系统,或本发明所述的微小残留病灶的检测模型或检测系统。
162.本发明还提供了一种存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行本发明所述的微小残留病灶检测方法,或执行本发明所述的ctdna的检测方法。
163.本发明还提供了选自以下的应用:
164.(1)本发明所述的ctdna的检测模型或检测系统的用途,用于检测样本中的ctdna;
165.(2)本发明所述的ctdna的检测模型或检测系统的用途,用于制备检测样本中微小残留病灶的产品;
166.(3)本发明所述的微小残留病灶的检测模型或检测系统的用途,用于检测样本中微小残留病灶。
167.在一些实施方式中,所述样本为患者的血液样本、血浆样本或全血样本。
168.本发明的积极效果在于:
169.本发明通过在个性化panel设计阶段优先选取具有更低背景噪音的突变类型,同时利用待检测样本测序信号分类构建属于自身的特异背景噪音库,实现了对突变信号及样本微小残留病灶状态更为灵敏和准确的检测。同时,全外显子测序为个性化panel的设计提供足够的突变候选,且突变选取个数灵活,可以覆盖更多需要微小残留病灶检测的肿瘤患
者人群。
170.下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。
171.实施例1、基于定制化策略的微小残留病灶检测方法
172.本实施例中,提供了一种基于定制化策略的微小残留病灶检测方法,主要步骤为:
173.1)以illumina测序法对患者的肿瘤组织样本和配对的外周血白细胞样本进行全外显子测序,根据肿瘤组织样本与外周血样本的测序比较,获取患者的体细胞突变图谱。本阶段中,所用的肿瘤组织样本及配对样本为所述患者治疗前的样本。依不同突变分类标准将突变分类,根据分类结果按照优先级顺序选取预设数量的突变,合并固定的单核苷酸多态性(single nucleotide polymorphism,snp)位点设计个性化检测panel;
174.2)获得同一患者经由抗肿瘤治疗后的血浆样本和配对的外周血白细胞样本,基于illumina测序法进行捕获测序;
175.3)针对前一步骤获得的该患者血浆样本测序数据,提取其中所有个性化panel覆盖位点的检测信号,分类构建背景噪音库(背景噪音模型);
176.4)将每个待检测突变与前述构建的背景噪音库中同类型的背景噪音进行比较,判定单突变的突变状态,整合所有突变的判定结果进一步确认样本的微小残留病灶状态。
177.具体地,步骤1)中利用全外显子测序数据识别肿瘤组织体细胞突变所用流程为mc3突变检测流程(参考"scalable open science approach for mutation calling of tumor exomes using multiple genomic pipelines".ellrott k,et al.cell syst.2018mar 28;6(3):271-281.e7.doi:10.1016/j.cels.2018.03.002.pubmed pmid:29596782)。
178.步骤1)中突变分类标准包括:
179.a)突变为非同义突变或同义突变;
180.b)突变为主克隆突变或亚克隆突变;
181.c)突变是否为驱动突变;
182.d)突变为连锁突变(phased variant,pv),插入缺失突变(insertion or deletion,indel)或单碱基突变(single nucleotide variant,snv)。
183.其中,标准a)中非同义突变与同义突变的定义为:mc3流程注释突变类型为silent的突变为同义突变,注释为其他突变类型的突变为非同义突变。
184.标准b)中突变克隆状态的确认方法为:使用sequenza软件计算得到肿瘤组织样本的纯度和全外显子panel覆盖区域的拷贝数信息,结合体细胞突变的突变频率数据,使用pyclone计算得到所有突变的肿瘤细胞占比(cancer cell fraction,ccf),定义ccf的95%置信区间上限大于0.95的突变为主克隆突变,其他突变为亚克隆突变。
185.标准c)中驱动突变定义为自定义驱动突变数据库中所包含的突变。
186.标准d)中pv定义为在同一cfdna分子上同时被检测到的两个及其以上的snv,同时需要满足以下条件:肿瘤样本中支持pv的cfdna分子有效深度≥100,pv的突变频率≥1%,配对白细胞中支持pv的cfdna分子个数为0。
187.依不同类型肿瘤的突变负荷,设计个性化panel选择的体细胞突变数量为8,16,
32,48或64。
188.选择的体细胞突变数量可以根据步骤1)中鉴定出的体细胞突变个数进行调整,默认选取48个突变,不足48个的情况下按照实际突变的最高个数选取。
189.选择的优先级顺序为:
190.a)非同义突变选择优先级大于同义突变
191.b)主克隆突变选择优先级大于亚克隆突变;
192.c)驱动突变选择优先级大于pv,pv选择优先级大于indel,indel选择优先级大于snv。
193.选取的个性化体细胞突变合并29个固定snp共同组成后续检测的个性化panel。29个固定snp是从1000genomes project数据库中筛选的高杂合snp,用于确认肿瘤组织样本及所有待检测血浆样本来自于同一患者,29个snp中至少28个snp基因型相同时判定样本来自于同一患者。
194.步骤3)中构建背景噪音模型的方法为:给定一种突变类型,确定个性化panel覆盖范围内与此突变相同参考碱基序列的所有位置,提取这些位点的深度信息及与给定突变类型相同变异的频率信息。对获取的位点数据进行过滤,保留所有符合要求的位点数据作为此种类型突变的背景噪音库。
195.背景噪音的突变类型可包括12种snv(a》c,a》g,a》t,t》a,t》c,t》g,g》c,g》t,g》a,c》a,c》g,c》t),不同长度的indel和78种pv(a》c+a》c,a》c+a》g,a》c+a》t,a》c+t》a,a》c+t》c,a》c+t》g,a》c+g》c,a》c+g》t,a》c+g》a,a》c+c》a,a》c+c》g,a》c+c》t,a》g+a》g,a》g+a》t,a》g+t》a,a》g+t》c,a》g+t》g,a》g+g》c,a》g+g》t,a》g+g》a,a》g+c》a,a》g+c》g,a》g+c》t,a》t+a》t,a》t+t》a,a》t+t》c,a》t+t》g,a》t+g》c,a》t+g》t,a》t+g》a,a》t+c》a,a》t+c》g,a》t+c》t,t》a+t》a,t》a+t》c,t》a+t》g,t》a+g》c,t》a+g》t,t》a+g》a,t》a+c》a,t》a+c》g,t》a+c》t,t》c+t》c,t》c+t》g,t》c+g》c,t》c+g》t,t》c+g》a,t》c+c》a,t》c+c》g,t》c+c》t,t》g+t》g,t》g+g》c,t》g+g》t,t》g+g》a,t》g+c》a,t》g+c》g,t》g+c》t,g》c+g》c,g》c+g》t,g》c+g》a,g》c+c》a,g》c+c》g,g》c+c》t,g》t+g》t,g》t+g》a,g》t+c》a,g》t+c》g,g》t+c》t,g》a+g》a,g》a+c》a,g》a+c》g,g》a+c》t,c》a+c》a,c》a+c》g,c》a+c》t,c》g+c》g,c》g+c》t,c》t+c》t)。
196.构建背景噪音集合所用位点的过滤标准为:去除待检测突变位点的数据,去除深度不足的位点数据(位点有效深度<7000x),去除突变频率非常高的位点数据(突变频率>1%),去除胚系突变和克隆性造血突变(同一位点在血浆样本和配对白细胞样本中的突变频率均大于同类型突变所有位点突变频率的上95%分位数,即,将血浆和白细胞中突变频率数据从小到大排序,当待测突变频率在血浆和白细胞中各自都至少有95%的数据小于或等于这个值时,去除这一突变),且血浆样本和配对白细胞样本此位点的突变频率倍数差异在5倍以内),剩余位点数据为构建背景噪音库的最终集合,最终集合包括12种snv,不同长度的indel和/或78种pv中的一种、多种或全部。
197.步骤4)中对于所有待检测突变中每个突变的判定方法为:
198.a)给定一个待检测突变vi,从上一步构建的背景噪音库中提取对应突变类型的背景噪音数据。
199.b)区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
。使用逆伽马分布对非零数值的背景噪音频率数据进行拟合得到背景噪音的频率分布,计算背景噪音
频率期望e(vaf)。其中,vaf表示突变频率。
200.c)根据负二项分布计算待检测突变来自背景噪音的概率pi,计算公式为:
201.pi=p
vaf
×
nb(n≤ni|ni,e(vaf))
202.nb为负二项分布,ni为覆盖待检测突变vi的reads个数,ni为支持待检测突变vi的reads个数。pi小于cutoff时判定待检测突变为阳性。其中,cutoff数值在分析性能验证时根据标准品已知结果进行确定,例如cutoff数值为0.01。
203.步骤4)中样本微小残留病灶状态的判定方法为:
204.根据公式计算个性化panel中所有待检测突变的联合置信概率ps,其中m为设计个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数。ps小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性。其中,cutoff数值在分析性能验证时根据标准品已知结果进行确定,例如cutoff数值为0.05。
205.实施例2、应用实施例1的方法检测样本
206.本实施例的检测样本包括稀释到不同浓度的菁良阳性标准品(gw-octm009,菁良基因公司),以及23例健康人的cfdna。其中,菁良阳性标准品根据已知突变的理论突变频率混合阴性标准品(gw-octm009,菁良基因公司)依次稀释到0.5%,0.2%,0.1%,0.05%,0.02%,0.01%,0.005%和0.002%共8个不同浓度,每个浓度3个技术重复,用于探索验证检测方法的灵敏度;健康人的cfdna样本用于验证检测方法的特异性。
207.根据本发明的方法,具体检测步骤如下:
208.1)使用1%浓度的菁良阳性标准品和配对的阴性标准品进行全外显子测序,其中阳性标准品上机测序数据量为50g,配对的阴性标准品上机测序数据量为10g(测序数据来源于illumina novaseq平台)。下机数据使用mc3流程识别阳性标准品中的体细胞突变,根据实施例1中的优先级顺序,从标准品全外显子测序识别的所有突变中选择了一共87个定制化突变位点,包括5个pv,15个indel和67个snv,87个突变的具体信息如表1所示(pv是由两个距离比较近的snv组成的,表1中相邻的两个突变类型标注为pv的突变,定义为1个pv)。
209.表1 87个突变具体信息
210.211.[0212][0213]
这些突变合并29个snp一起作为后续检测的定制化panel。29个snp的具体信息如表2所示。
[0214]
表2 29个固定snp具体信息
[0215]
[0216][0217]
其中,-表示缺失。
[0218]
2)所有浓度的阳性标准品及配对的阴性标准品,健康人的cfdna和配对的白细胞gdna均投入60ng建库,所有浓度的阳性标准品及配对的阴性标准品另外投入30ng单独建库。所得文库使用步骤1)中的panel进行捕获,捕获文库按照2g数据量进行上机测序。
[0219]
3)步骤2)下机数据中定制化panel覆盖区域的平均原始测序深度约60000x,根据umi去重后的起始dna投入量为60ng的文库平均有效深度约16000x,起始dna投入量为30ng的文库平均有效深度约10000x。每个检测样本使用去重之后的数据对不同类型突变分别构建背景噪音库,突变类型包括12种snv,不同长度的indel和78种pv。
[0220]
4)将87个待检测突变分别与背景噪音库中相同突变类型的背景噪音基线进行比较,计算突变来自于背景噪音的概率p,p小于0.01时判定突变检出为阳性。
[0221]
5)每个检测样本分别从表1的87个突变中随机抽取8,16,32,48或64个突变,不同的抽样个数再次区分只包含snv和同时包含indel或pv两种条件,相同抽样条件下随机重复抽样20次,每个浓度3个重复共抽样60次。根据每次抽样的所有突变来自于背景噪音的概率计算联合置信概率p,p小于0.05时判定样本微小残留病灶状态为阳性,否则为阴性。
[0222]
本实施例的检测结果如下:
[0223]
1)单突变检测灵敏度:定义95%以上突变的正确检出为稳定检出,0.5%和0.2%浓度样品中的突变可以被稳定检出,检出比例均为100%。0.1%浓度样品在dna投入量为60ng和30ng时检出比例分别为91.67%和87.5%。本检测方法单突变检测的灵敏度为0.2%。
[0224]
2)单突变检测特异性:23例健康人cfdna样本的检测结果中有4例样本各有一个突变被判定为阳性检出,本检测方法的特异性为99.80%。
[0225]
3)样本检测灵敏度:定义同一浓度样品的60次随机抽样中95%以上检出为稳定检出,任意一次检出为可以检出。
[0226]
dna投入量为60ng时:
[0227]
a)突变类型仅包含snv:0.5%,0.2%,0.1%,0.05%,0.02%和0.01%浓度样品可以被稳定检出;0.5%,0.2%,0.1%,0.05%,0.02%,0.01%和0.005%浓度样品可以被检出。
[0228]
b)突变类型包含indel或pv:0.5%,0.2%,0.1%,0.05%,0.02%和0.01%浓度样品可以被稳定检出;0.5%,0.2%,0.1%,0.05%,0.02%,0.01%,0.005%和0.002%浓度样品可以被检出。
[0229]
c)随机抽取突变个数为8、16时:0.5%,0.2%,0.1%和0.05%浓度样品可以被稳定检出;0.5%,0.2%,0.1%,0.05%,0.02%,0.01%和0.005%浓度样品可以被检出。
[0230]
d)随机抽取突变个数不低于32、48、64时:0.5%,0.2%,0.1%,0.05%,0.02%和0.01%浓度样品可以被稳定检出;0.5%,0.2%,0.1%,0.05%,0.02%,0.01%和0.005%浓度样品可以被检出。
[0231]
dna投入量为30ng时:
[0232]
随机抽取突变类型仅包含snv的情况下,0.5%,0.2%,0.1%,0.05%和0.02%浓度样品可以被稳定检出,0.5%,0.2%,0.1%,0.05%,0.02%和0.01%浓度样品可以被检出,其他结果与dna投入量为60ng时一致。
[0233]
4)样本检测特异性:23例健康人cfdna样本微小残留病灶状态均被判定为阴性,本检测方法的特异性为100%。
[0234]
实施例3、应用实施例1的方法检测临床样本
[0235]
本实施例中,应用实施例1所述的方法检测临床样本。检测样本为14例局限性晚期直肠癌患者样本。其中,组织样本为新辅助治疗(部分患者只接受了放化疗,另外一部分患者接受了放化疗+免疫治疗(所述免疫治疗为免疫检查点抑制剂治疗;具体地,免疫治疗为信迪利单抗免疫治疗;放化疗为rt+xelox)前的组织取样,血浆样本来自新辅助治疗结束后手术前采血。新辅助治疗的肿瘤残余通过手术病理进行确认,其中7例完全缓解无肿瘤残余,另7例未完全缓解存在肿瘤残余。
[0236]
1)14例患者的组织样本和配对白细胞对照分别进行全外显子测序,组织上机测序数据量为50g,配对白细胞上机测序数据量为10g。下机数据使用mc3流程识别阳性标准品中的体细胞突变,每例患者选择14-60个不等的定制化突变位点,如表3所示。这些突变合并表2中的29个snp一起作为后续检测的定制化panel。
[0237]
表3 14例患者选取的定制化突变
[0238]
患者编号突变位点个数pv个数indel个数snv个数1f6007532f6004563f60013474f6013565f60012486f6004567f1513118f144379f6011841
10f600194111f60155412f6015123313f60085214f6001050
[0239]
2)步骤1)中14例患者的组织样本和配对白细胞对照所建文库使用每例患者各自的定制化panel进行捕获,捕获文库按照1g数据量进行上机测序。
[0240]
3)步骤2)下机数据中定制化panel覆盖区域的去重后文库平均有效深度均大于3000x,基于此数据识别步骤1)中选择的定制化突变位点,验证所选择突变的真实性。如果某一突变经过步骤2)和步骤3),使用每例患者各自的定制化panel,能够再次检测到该组织样本中的突变,则验证通过;反之,则验证失败。所有患者中验证通过的突变个数从3-50不等,如表4所示。
[0241]
表4 14例患者通过验证的定制化突变
[0242]
患者编号突变位点个数pv个数indel个数snv个数1f4900492f4400443f4304394f5010495f4701466f4100417f80088f30129f39133510f39043511f47014612f38902913f46014514f410140
[0243]
4)14例患者的cfdna和配对的白细胞gdna按60ng投入建库(不足60ng的全部投入)。所得文库使用步骤3)中每例患者各自通过验证的定制化panel进行捕获,捕获文库按照4g数据量进行上机测序。
[0244]
5)步骤4)下机数据中定制化panel覆盖区域的平均原始测序深度约100000x,根据umi去重后的文库平均有效深度约20000x。每个检测样本使用去重后的数据对不同类型突变分别构建背景噪音库,突变类型包括12种snv,不同长度的indel和78种pv。
[0245]
6)将每位患者的所有待检测突变分别与背景噪音库中相同突变类型的背景噪音基线进行比较,计算突变来自于背景噪音的概率p,p小于0.01时判定突变检出为阳性。
[0246]
7)根据每个检测样本的所有突变来自于背景噪音的概率计算联合置信概率p,p小于0.05时判定样本微小残留病灶状态为阳性,否则为阴性。
[0247]
本实施例的检测结果如下:
[0248]
1)检测特异性:7例病理完全缓解患者全部检测为mrd阴性,本检测方法的特异性为100%。
[0249]
2)检测敏感性:7例病理未完全缓解患者4例检测为mrd阳性,3例检测为mrd阴性,本检测方法的敏感性为57.1%,显著高于同类研究(joana v,et.al.clin cancer res.2021;zhou j,et.al.clin cancer res.2021;wang yq,et.al.plos med.2021)公开报道的12.8-23.0%。
[0250]
3)检测准确率:14例检测患者中11例mrd结果与手术病理确认结果一致,3例结果不一致,检测准确率为78.6%。
[0251]
因此,本发明通过在个性化panel设计阶段优先选取具有更低背景噪音的突变类型,同时利用待检测样本测序信号分类构建属于自身的特异背景噪音库,实现了对突变信号及样本微小残留病灶状态更为灵敏和准确的检测。同时,全外显子测序为个性化panel的设计提供足够的突变候选,且突变选取个数灵活,可以覆盖更多需要微小残留病灶检测的肿瘤患者人群。
[0252]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。同时,在本发明提及的所有文献都在本技术中引用作为参考,就如同每一篇文献被单独引用作为参考那样。
技术特征:
1.一种ctdna的检测模型或检测系统,包括:肿瘤组织基因突变筛查模块,用于:获取待测对象的样本测序数据,和利用所述测序数据构建的待测对象的体细胞突变图谱,以及,根据突变分类结果按照优先级顺序选取预设数量的突变,合并单核苷酸多态性(snp)位点,获得个性化panel;突变信号提取模块,用于:获取对同一待测对象的微小残余病灶术后监测点的样本游离dna的测序数据,根据个性化panel在测序数据中提取相应的检测信息;背景噪音构建模块,用于:对每一突变类型下的检测信息进行过滤,过滤后的检测信息构建所有突变类型的背景噪音库;ctdna判断模块,用于:将待检测突变与背景噪音库里同类型的背景噪音进行比较,判定ctdna的突变状态。2.如权利要求1所述的ctdna的检测模型或检测系统,其特征在于,所述ctdna判断模块包括:背景噪音调取模块,用于根据给定的待检测突变v
i
的位置信息和突变类型信息,调取该突变类型的背景噪音数据;背景噪音频率期望生成模块,用于区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
;使用逆伽马分布对非零数值的背景噪音频率数据进行拟合得到背景噪音的频率分布,计算背景噪音频率期望e(vaf);第一计算模块,用于根据负二项分布计算待测对象的待检测突变来自于噪音信号的概率p
i
,计算公式为:p
i
=p
vaf
×
nb(n≤n
i
|n
i
,e(vaf)),nb为负二项分布,n
i
为覆盖待检测突变v
i
的reads个数,n
i
为支持待检测突变v
i
的reads个数;第一分析模块:用于根据p
i
数值,分析ctdna的突变状态;较佳的,当p
i
小于cutoff时判定待检测突变为阳性,否则判定为阴性,其中cutoff表示概率p
i
的阈值;更佳的,所述cutoff值为0.01。3.如权利要求1或2所述的ctdna的检测模型或检测系统,其特征在于,所述肿瘤组织基因突变筛查模块中所述突变的分类标准包括:a)突变为非同义突变或同义突变;b)突变为主克隆突变或亚克隆突变;c)突变是否为驱动突变;d)突变为连锁突变(pv),插入缺失突变(indel)或单碱基突变(snv);和/或,所述突变优先级的顺序是:a)非同义突变选择优先级大于同义突变;b)主克隆突变选择优先级大于亚克隆突变;c)驱动突变选择优先级大于pv,pv选择优先级大于indel,indel选择优先级大于snv。4.如权利要求1~3任一项所述的ctdna的检测模型或检测系统,其特征在于,所述肿瘤组织基因突变筛查模块中,所述样本是肿瘤组织样本和配对的外周血白细胞样本;和/或,所述肿瘤组织基因突变筛查模块中,所述预设数量是指:体细胞突变数量为8,16,32,48或64;和/或,所述突变信号提取模块中,所述样本为血液样本、血浆样本或全血样本;和/或,
所述背景噪音构建模块中,所述每一突变类型的检测信息包括突变位点的深度信息及频率信息。5.如权利要求1~4任一项所述的ctdna的检测模型或检测系统,其特征在于,所述背景噪音构建模块中,过滤检测信息的标准为:去除待检测突变位点的数据;去除深度不足的位点数据(位点有效深度<7000x)去除突变频率非常高的位点数据(突变频率>1%)去除胚系突变和克隆性造血突变(同一位点在血浆样本和配对白细胞样本中的突变频率均大于同类型突变所有位点突变频率的上95%分位数,且血浆样本和配对白细胞样本此位点的突变频率倍数差异在5倍以内)。6.一种微小残留病灶的检测模型或检测系统,包括:如权利要求1~5任一项所述的ctdna的检测模型或检测系统,以及微小残留病灶的分析模块;较佳的,所述微小残留病灶的分析模块用于:综合ctdna的判断结果,分析微小残余病灶的状态。7.如权利要求6所述的微小残留病灶的检测模型或检测系统,其特征在于,所述微小残留病灶的分析模块包括:第二计算模块,用于根据计算公式和第一计算模块获得的概率p
i
的数值,计算联合置信概率p
s
,其中m为个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数;第二分析模块,用于根据p
s
数值,分析微小残留病灶的状态;较佳的,当p
s
小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性,其中cutoff表示联合置信概率p
s
的阈值;较佳的,所述cutoff值为0.05。8.一种微小残留病灶的检测方法,包括以下步骤:1)全外显子测序鉴定肿瘤组织突变:对待测对象的样本进行全外显子测序,获取体细胞突变图谱;2)个性化基因组合panel的获得:根据1)中获取的该待测对象的体细胞突变图谱,进行突变的分类,根据分类结果按照优先级顺序选取预设数量的突变,合并固定的单核苷酸多态性(snp)位点,获得设计个性化panel;3)个性化pane1捕获测序:采集1)中同一待测对象的样本,进行测序,提取测序数据中所有2)中所述的个性化panel所覆盖位点的检测信息;4)分类构建内部背景噪音模型:根据突变类型进行分类,对每一突变类型下的检测信息进行过滤,保留所有符合要求的检测信息作为此种类型突变的背景噪音库;5)判定单位点突变状态:选择某一突变,将该待检测突变与4)中背景噪音库里同类型的背景噪音进行比较,判定单位点的突变状态;6)确定样本微小残留病灶结果:重复步骤5),直至2)所述个性化panel中的所有突变均已经判定结束,整合所有判定结果,确定样本微小残留病灶的状态。9.如权利要求8所述的微小残留病灶的检测方法,其特征在于,步骤2)中,所述突变的分类标准包括:a)突变为非同义突变或同义突变;
b)突变为主克隆突变或亚克隆突变;c)突变是否为驱动突变;d)突变为连锁突变(pv),插入缺失突变(indel)或单碱基突变(snv);和/或,所述优先级的顺序是:a)非同义突变选择优先级大于同义突变;b)主克隆突变选择优先级大于亚克隆突变;c)驱动突变选择优先级大于pv,pv选择优先级大于indel,indel选择优先级大于snv。10.如权利要求8或9所述的微小残留病灶的检测方法,其特征在于,步骤1)中,所述样本是肿瘤组织样本和配对的外周血白细胞样本;和/或,步骤2)中,所述预设数量是指:体细胞突变数量为8,16,32,48或64;和/或,步骤3)中,所述样本为血液样本、血浆样本或全血样本;和/或,步骤4)中,所述检测信息包括突变位点的深度信息及频率信息;和/或,步骤4)中,构建背景噪音库的过滤标准为:去除待检测突变位点的数据;去除深度不足的位点数据(位点有效深度<7000x)去除突变频率非常高的位点数据(突变频率>1%)去除胚系突变和克隆性造血突变(同一位点在血浆样本和配对白细胞样本中的突变频率均大于同类型突变所有位点突变频率的上95%分位数,且血浆样本和配对白细胞样本此位点的突变频率倍数差异在5倍以内)。11.如权利要求8~10任一项所述的检测方法,其特征在于,步骤5)中,判定单位点突变状态的判定方法为:a)给定一个待检测突变v
i
,从4)中的模型里提取对应突变类型的背景噪音数据;b)区分背景噪音频率数据中的零值和非零数值,其中非零数值占比p
vaf
;使用非零数值的背景噪音频率数据拟合背景噪音分布,计算背景噪音频率期望e(vaf);c)根据负二项分布计算待检测突变来自背景噪音的概率p
i
,当p
i
小于cutoff时判定待检测突变为阳性,否则判定为阴性,其中cutoff表示概率p
i
的阈值;较佳的,所述概率p
i
的计算公式为:p
i
=p
vaf
×
nb(n≤n
i
|n
i
,e(vaf)),其中,nb为负二项分布,n
i
为覆盖待检测突变v
i
的reads个数,n
i
为支持待检测突变v
i
的reads个数;较佳的,所述cutoff值为0.01;和/或,步骤6)中,确定样本微小残留病灶结果的步骤为:根据5)中判定后得到的单位点突变概率p
i
,计算联合置信概率p
s
,当p
s
小于cutoff时判定样本微小残留病灶状态为阳性,否则判定为阴性,其中cutoff表示联合置信概率p
s
的阈值;较佳的,所述cutoff值为0.05;较佳的,所述联合置信概率p
s
计算公式为:其中m为个性化panel选择的体细胞突变个数,k为判定为阳性的待检测突变个数。12.一种ctdna的检测方法,其特征在于,所述检测方法包括如权利要求8~11任一项所述的微小残留病灶检测方法中的步骤1)到步骤5)。13.一种计算机程序产品或检测设备,其包括至少一个处理器,所述处理器能够执行存储于介质中的计算机程序指令,以实施如权利要求8~11任一项所述的微小残留病灶检测
方法,或实施如权利要求12所述的ctdna的检测方法;或,其包括如权利要求1~5任一项所述的ctdna的检测模型或检测系统,或包括如权利要求6或7所述的微小残留病灶的检测模型或检测系统。14.一种存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求8~11任一项所述的微小残留病灶检测方法,或执行如权利要求12所述的ctdna的检测方法。15.选自以下的应用:(1)如权利要求1~5任一项所述的ctdna的检测模型或检测系统的用途,用于检测样本中的ctdna;(2)如权利要求1~5任一项所述的ctdna的检测模型或检测系统的用途,用于制备检测样本中微小残留病灶的产品;(3)如权利要求6或7所述的微小残留病灶的检测模型或检测系统的用途,用于检测样本中微小残留病灶;较佳的,所述样本为待测对象的血液样本、血浆样本或全血样本。
技术总结
本发明提供了一种微小残留病灶检测方法,该方法通过在个性化panel设计阶段优先选取具有更低背景噪音的突变类型,同时利用待检测样本测序信号分类构建特异背景噪音库,实现了对突变信号及样本微小残留病灶状态更为灵敏和准确的检测。同时,全外显子测序为个性化panel设计提供足够的突变候选,且突变选取个数灵活,可以覆盖更多需要微小残留病灶检测的肿瘤患者人群。患者人群。患者人群。
技术研发人员:杨春鹤 杨爽 郭瑞坚 赵静波 洪强 郑方克 郑立谋 罗捷敏
受保护的技术使用者:厦门艾德生物医药科技股份有限公司
技术研发日:2023.05.15
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
