检测癌症复发的方法与流程

未命名 08-14 阅读:100 评论:0

检测癌症复发的方法
1.本技术是国际申请日为2016年8月26日,中国国家申请号为201680062714.2,发明名称为“检测癌症复发的方法”的发明专利申请的分案申请。
2.相关申请
3.本技术要求于2015年8月26日提交的题为“检测癌症复发的方法”的澳大利亚临时申请号2015903456的优先权,其全部内容通过引用整体并入本文。
技术领域
4.本发明一般涉及检测癌症复发可能性的方法。更具体地,本发明涉及鉴定与癌症复发可能性相关的核酸标记(signature)的方法,以及使用这种标记的方法。


背景技术:

5.本说明书对任何在先出版物(或从其衍生信息)或对任何已知事物的引用不是、也不应该被认为是认可或承认或任意形式的暗示在先出版物(或从其衍生信息)或已知事物形成本说明书所涉及领域中公知常识的一部分。
6.人类基因组已经进化为编码许多能够在转录过程中使单链dna(ssdna)或双链(dsrna)构象脱氨的酶。这些脱氨酶构成强大的抗病毒反应,因为很少病毒能够在如此高的突变率下存活。然而,当dna和rna脱氨酶活性的调节被破坏时,这些酶会在转录过程中攻击正常体细胞组织中的核酸。结果是积累不必要的从头突变,这可能最终导致疾病,例如癌症(参见paz等人,2007;honjo等人,2008;steele和lindley.,2010;以及lindley和steele.,2013)。
7.存在两种不同的脱氨酶家族:胞苷脱氨酶和腺苷脱氨酶。胞苷脱氨酶酶家族构成一组差异表达的酶,其能够使ssdna中的胞嘧啶脱氨(实际上,将胞嘧啶替换为尿嘧啶)。研究最广泛的胞苷脱氨酶是活化诱导的脱氨酶(aid)。尽管aid主要在经受免疫球蛋白(ig)体细胞超突变(shm)和ig类别转换重组的活化b细胞中表达,但早已在大多数体细胞组织中鉴定出aid活性。它参与早期致突变事件,导致非淋巴细胞癌症(参见okazaki等人,2003),并且已经显示它在转录过程中靶向细胞核ssdna的转录链(ts)和非转录链(nts)(参见maul和gearheart,2010;basu等人,2011;和lindley 2013)。实验还证明,雌激素受体复合物与aid启动子区域结合(参见pauklin 2009),引发aid信使rna表达增加,导致乳腺和卵巢组织中aid产生增加超过20倍。因此,雌激素拮抗剂,如处方广泛使用的他莫昔芬,可有效抑制体细胞组织中的aid产生。
8.载脂蛋白b mrna编辑酶-催化多肽样胞苷脱氨酶(apobec)形成11个或更多个直系同源胞苷脱氨酶的家族。已知这一酶家族有助于许多癌症的发展(参见roberts,2013),并且大多数是组织特异性的(参见conticello 2008,表2)。例如,在小肠中发现有高浓度的apobec1,在骨骼和心脏肌肉中发现有显著水平的apobec2,在睾丸中发现有apobec4,在血液、胸腺和甲状腺中发现有apobec3h。
9.人类apobec3脱氨酶具有一系列的功能,包括针对一系列基于dna的寄生虫(包括
逆转录病毒和dna病毒)提供先天免疫,并且在转录期间提供具有易感性cdna中间体的裸露dna。它们与aid和apob mrna编辑酶apobec1有关,甚至可能是其进化前体。
10.研究最多的apobec3脱氨酶是apobec3g和apobec3b。这两种酶都在许多(如果不是全部的)体细胞组织中以显著水平表达。apobec3g是一种进化上保守的胞苷脱氨酶,可有效限制反转录转座子和其他病毒。它被首次鉴定为参与hiv限制的主要因素(参见sheehy,2002)。几项研究表明,apobec3b催化的脱氨作用是一系列癌症中大部分突变的原因(参见leonard等人,2013;和sasaki,2014),并且该过程在卵巢癌(参见burns等人,2013a)和乳腺癌(参见burns 2013b)中提供了dna损伤的慢性来源。
11.腺苷脱氨酶与完全或部分双链rna(dsrna)结合并将腺苷转化为肌苷(实际上,将a替换为i)。在翻译过程中,肌苷编码为鸟苷(参见bass 2002)。已经在人类中鉴定了adar1、adar2和adar3基因。虽然已经很清楚地知道,每个adar都有不同的剪接变体,但不清楚每个剪接变体是否或如何表现出用于靶向的不同脱氨酶结合结构域(dbd)(参见farajollahi和maas,2010)。许多具有多态性的变体adar物种在一系列体细胞组织中有表达(参见george等人,2005)。
12.已经显示两种免疫相关形式的adar1存在于许多体细胞组织中(参见george和samuel,1999)。adar2存在于许多组织中,在人脑中浓度尤其高。除了在细胞核和细胞质之间穿梭的adar1之外,大多数adar蛋白定位于细胞核中。尽管腺苷脱氨酶已被认为在肿瘤发生中起作用,但它们如此做的机制尚未确定。
13.由adar介导的编辑驱动真核生物中rna和蛋白质多样化的产生,并且其rna编辑作用在高等生物中更重要。其作用包括通过逆转录rna中的编辑位点来重编码外显子,编辑反转录转座子衍生的重复元件和mrna序列修饰(参见farajollahi和maas,2010)。鉴于adar编辑对基因表达的影响范围不同,adar1和adar2构象和表达的失调与癌症表型有关。rna编辑活性的普遍降低与疾病进展有关(参见gallo和galardi,2008),adar1已被鉴定为一种肿瘤促进因子,adar2被鉴定为一种肿瘤抑制因子(参见chan等人,2014)。由前mrna中编码蛋白质的外显子的a至i编辑异常而产生的多样性因此能显著改变人类癌症中的基因表达。
14.目前广泛认同胞苷和腺苷脱氨酶活性异常与致癌过程密切相关。然而,尚未阐明适合于检测癌症的特定生物标志物。以前的工作使我们开始明白,脱氨酶的靶向优先性比以前认为的更具有特异性。对在乳腺癌突变汇集数据中出现的tp53突变的研究证实,参与产生靶向体细胞突变(targeted somatic mutation)的分子机制依赖于在转录过程中在ssdna水平上感知密码子阅读框架结构的能力,以及区分非转录链(nts)上的胞嘧啶和转录链(ts)上的胞嘧啶的能力(参见lindley 2013)。
15.仅在美国,每年约有24,000名妇女被诊断为卵巢癌,平均5年存活率仅为44%左右(参见howlader等人,2013)。大多数卵巢癌患者接受积极手术治疗(aggressive surgery),然后接受铂-紫杉烷化疗。在接受治疗的患者中,在6个月内约有25%的患者出现铂类耐药性癌症复发。(参见miller,2009)。由于大多数死亡是晚期诊断的结果,因此了解参与的遗传因素是开发新筛查策略的重要步骤。
16.本领域特别需要的是一种鉴定卵巢癌和其他癌症的生物标志物的手段,所述生物标志物可用在遗传测定中以预测干预(即通过手术、放疗、药物或其他手段)后疾病的复发或进展。


技术实现要素:

17.本发明部分基于以下确定:靶向体细胞突变(tsm)现象使得有可能对作为癌症发生期间出现的许多体细胞突变来源的个体脱氨酶结合结构域(dbd)进行鉴定。这种鉴定导致发现随疾病进展产生新的dbd。因此,本文公开的方法用于对定义dbd同种型(isoform)的核苷酸基序进行鉴定,所述dbd同种型与疾病进展指标(称为“癌症进展相关性标记”(c-pas))相关。在一个方面,本发明提供了一种新型遗传测定,其使用一种或多种c-pas来预测受试者中癌症复发(或进展)的可能性。
18.在其最广泛的形式中,本发明提供了用于确定受试者将复发癌症的可能性的方法,所述方法包括:(a)分析从所述受试者中获得的生物样品中的核酸分子的序列,从而对于在被诱变剂识别或靶向的一个或多个基序处的突变类型的多个突变,确定这些突变的密码子上下文(codon context),从而鉴定核酸分子中多个突变密码子中的每一个的突变位置和突变类型,其中通过确定单个突变发生在相应突变密码子的三个位置中的哪个位置来确定单个突变的密码子上下文;以及(b)当在多个突变密码子中的三个位置之一处的突变类型的突变水平高于与癌症复发相关的预定阈值时,确定所述受试者复发癌症的可能性。
19.该方法的一个优点是,它允许基于癌症将要复发的可能性的确定,为患有或患过癌症的受试者指定治疗方案。例如,如果确定受试者可能复发癌症,则受试者可以继续进行繁重疗程的抗癌疗法。相反,如果确定受试者不太可能复发癌症,则受试者可以停止、减少或改变现有的抗癌疗法。
20.在此类型的一些实施方案中,核酸分子存在于从受试者中获得的生物样品中。优选地,生物样品从受试者受癌症影响或之前受癌症影响的组织中获得。通过使用从受癌症影响的组织或已知发展为癌症的风险升高的组织中获得的生物样品,可以鉴定组织特异性dbd,以创建具有更高特异性和敏感性的诊断/预后测试。
21.在一些实施方案中,引起tsm的诱变剂选自包括、由或基本上由aid、apobec和adar的组成的组。在一些实施方案中,评估由单一诱变剂引起的靶向体细胞突变。在其他实施方案中,评估由2、3、4、5、6、7、8、9、10或超过10种诱变剂引起的靶向体细胞突变。
22.作为说明性实例,当样品是卵巢组织样品并且诱变剂是aid的致癌同种型时,当存在于生物样品中的核酸分子的mc-1位点处的wrcgss基序中c至t突变的水平超过预定阈值时,将做出癌症可能复发的确定。
23.在另一个实例中,当样品是卵巢组织样品并且诱变剂是apobec3b时,当存在于生物样品中的核酸分子的mc-1位点或mc-3位点处的tcga基序中c至t突变的水平超过预定阈值时;或者当存在于生物样品中的核酸分子的mc-3位点处的atcs基序中c至t突变的水平超过预定阈值时,会做出癌症可能复发的确定。
24.在另一个实例中,当样品是卵巢组织样品并且诱变剂是apobec3g时,当存在于生物样品中的核酸分子的mc-1位点处的gcggc基序中c至t突变的水平超过预定阈值时;存在于生物样品中的核酸分子的mc-1位点处的ccgx基序中c至t突变的水平超过预定阈值时;当存在于生物样品中的核酸分子的mc-1位点处的zccs基序中c至t突变的水平超过预定阈值时;当存在于生物样品中的核酸分子的mc-1位点处的sggrr基序中g至a突变的水平超过预定阈值时;当存在于生物样品中的核酸分子的mc-1位点处的tccg基序中c至t突变的水平超过预定阈值时;当存在于生物样品中的核酸分子的mc-2位点处的gcgc基序中g至a突变的水
平超过预定阈值时;或者当存在于生物样品中的核酸分子的mc-2位点处的ccggc基序(即,c-pas)中g至a突变的水平超过预定阈值时,会做出癌症可能复发的确定。
25.在又一个实例中,当样品是卵巢组织样品并且诱变剂是adar致癌同种型,如adar1时,当存在于生物样品中的核酸分子的mc-1位点处的rawa基序中a至t突变的水平超过预定阈值时;当存在于生物样品中的核酸分子的mc-1位点处的wtaw基序中a至g突变的水平超过预定阈值时;当存在于生物样品中的核酸分子的mc-1位点处的sara基序中a至g突变的水平超过预定阈值时;或者当存在于生物样品中的核酸分子的mc-2位点或mc-3位点处的twty基序中t至c突变的水平超过预定阈值时,会做出癌症可能复发的确定。
26.在本发明的另一个说明性实例中,受试者患有急性骨髓性白血病(aml)或有发展成急性骨髓性白血病(aml)的风险。例如,当样品是血液样品并且诱变剂是apobec致癌同种型时,当来自生物样品的核酸分子的mc-1位点处的ccz基序中c至t突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-2位点处的swcs基序中c至t突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-3位点处的xngns基序中g至a突变超过预定阈值时;或者当来自生物样品的核酸分子的mc-2位点处的gsa基序中g至a突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-1位点处的sgxw基序中g至a突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-3位点处的cxgs基序中g至a突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-3位点处的yxgnx基序中g至a突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-3位点处的yygnx基序中g至a突变的水平超过预定阈值时;或者当来自生物样品的核酸分子的mc-1位点处的wngnz基序中g至a突变的水平超过预定阈值时,将做出癌症可能复发的确定。
27.在优选的实施方案中,核酸分子的特征在于由一种或多种诱变剂靶向的多个确定基序中的靶向体细胞突变水平。例如,在一些实施方案中,确定2、3、4、5、6、7、8、9、10或多于10个基序中的靶向体细胞突变。
28.在一些实施方案中,如果tsm的水平(即,如在c-pas中鉴定的)高于预定阈值,则癌症被评估为可能复发。预定阈值可以通过适用于区分受试者组的任意方法来定义。就此而言,预定阈值可以是每个样品的靶向体细胞突变的固定数目,其设定为适当的值以区分可能复发的癌症和不太可能复发的癌症。例如,如实施例4(参见例如表7)清楚地显示的,已证明,已知已成功克服卵巢癌且没有复发的受试者的样品中具有最多一个归因于任意单一诱变剂的c-pas。因此,作为非限制性实例,用于确定卵巢癌复发可能性增加的预定阈值可以是一个c-pas。在该实例中,核酸分子中具有多于一个c-pas的任意受试者将被认为具有高癌症复发可能性。类似地,核酸分子中具有少于一个c-pas的个体将被确定为不太可能癌症复发。
29.或者,当预定阈值是指指示tsm的样品突变频率时,预定阈值可以是当特定突变随机发生时所预期的突变频率。因此,如果在存在于生物样品中的核酸分子中观察到高于预期的突变频率,则可以做出以下确定:已经发生了tsm,c-pas可以被鉴定,并且癌症有可能复发。
30.在一些实施方案中,所述方法适用于确定任意癌症复发的可能性。例如,癌症可以选自卵巢癌,乳腺癌,前列腺癌,肝癌,结肠癌,胃癌,胰腺癌,皮肤癌,甲状腺癌,子宫颈癌,淋巴癌,造血系统癌,膀胱癌,肺癌,肾癌,直肠癌,子宫癌和头颈癌。典型地,生物样品由其
中存在癌症的组织制备。例如,如果受试者患有卵巢癌或处于发展为卵巢癌的风险,则由卵巢细胞或组织制备生物样品。类似地,如果受试者患有乳腺癌或处于发展为乳腺癌的风险,则由乳腺细胞或组织制备生物样品。适用于执行本发明方法的其他生物样品包括但不限于前列腺、肝、结肠、胃、胰腺、皮肤、甲状腺、子宫颈、淋巴、造血系统、膀胱、肺、肾、直肠、子宫和头部或颈部组织或细胞。
31.另一方面,本发明提供了鉴定癌症进展相关性标记(“c-pas”)的方法,所述癌症进展相关性标记指示受试者复发癌症的可能性,所述方法包括:分析第一受试者组的核酸序列,从而对于在被诱变剂识别或靶向的一个或多个基序处的突变类型的多个突变,确定这些突变的密码子上下文,从而鉴定核酸序列中多个突变密码子中的每一个的突变位置和突变类型,其中通过确定单个突变发生在相应突变密码子的三个位置中的哪个位置来确定单个突变的密码子上下文,其中第一受试者组由已经有癌症复发的受试者组成;当在多个突变密码子中三个位置之一处的突变类型的突变水平高于当突变随机发生且独立于密码子上下文时所预期产生的水平时,确定已发生靶向体细胞突变(tsm);以及,当tsm或包括tsm的核酸序列能够区分第二受试者组和第三受试者组时,将tsm鉴定为是c-pas的一部分,其中第二受试者组由具有癌症或已知癌症复发的受试者组成,并且第三受试者组由已知癌症不复发的受试者组成。
32.在又一方面,本发明提供了治疗受试者中的癌症或抑制受试者中癌症复发的方法,所述方法包括:(i)通过上文和本文别处所述的方法鉴定受试者中存在癌症的组织的c-pas;(ii)从所述受试者中获得生物样品,其中所述生物样品含有具有癌症或具有发展为癌症的风险的细胞组织;(iii)分析生物样品中的核酸分子是否存在c-pas,以确定癌症或肿瘤是否有可能复发;以及(iv)在确定受试者可能复发癌症的基础上,使受试者接受治疗。
33.在又一方面,本发明提供了向患有癌症的受试者或其中癌症可能复发的受试者施用治疗方案或疗法的方法。在一些实施方案中,所述方法包括根据上文和本文其他地方描述的鉴定和确定方法确定癌症是否可能复发,并且基于癌症复发的可能性,使所述受试者接受最适合所述受试者的治疗方案。用于治疗癌症的合适治疗方案在本领域中是公知的,并且在下面详细描述。在一些实施方案中,所述疗法或治疗方案包括放疗,手术,化疗,激素消融疗法,促凋亡疗法和/或免疫疗法。
34.当确定受试者可能复发癌症时,受试者将被指定一种适当的治疗方案并使其接受该治疗方案。本发明方法的优点在于,一旦确定了生物样品中核酸分子中的tsm,就可根据受试者的个体tsm特征来指定个性化治疗方案。例如,如果在生物样品中tsm被鉴定为由aid的异常或失调引起,则化疗可以是aid抑制剂、apobec3g抑制剂的形式。在其他实例中,取决于在获自受试者的生物样品中观察到的个体tsm,apobec1抑制剂或apobec3h抑制剂、adar抑制剂可能更合适。
35.当确定受试者不太可能复发癌症时,受试者可能已经接受的现有治疗方案可以停止、减少或改变。目前本领域用于治疗癌症(例如卵巢癌或aml)的标准治疗方案具有许多不希望的副作用。因此,在确定癌症不太可能复发时中止和/或减少受试者所接受的治疗方案是有益的。
附图说明
36.现在将参考附图来描述本发明的实施例,其中:-37.图1显示的图表显示随着限定靶基序的核苷酸数目从三个核苷酸递增至六个核苷酸,g至a突变的靶向特异性是如何增加的。突变密码子内第二核苷酸位点(mc-2,从5'端(5')向3'端(3')阅读)的g至a突变数目与g至c和g至t相比的图,并且从与aid脱氨活性相关的众所周知的gyw基序开始。关于基序,w=a/t;s=c/g;并且y=t/c。所有选定基序均显示优先靶向突变密码子内的第二位置(即mc-2位点),并且所得优势突变为g至a。显示了mc-2位点处由g突变的各类型的百分比。包括各基序的靶向体细胞突变(tsm)3
×
3表,并显示了突变密码子内的所有可能的突变和靶位点。mc-1、mc-2和mc-3是指突变密码子(mc)内的突变位置(从5'端(5')向3'端(3')阅读)。最右栏按每种基序的突变密码子内的类型和位置显示了偏离预期突变分布的统计显著性(《0.001,8df)的卡方水平(chi square level)。
38.图2提供了卡普兰-迈耶(kaplan-meier)图,其预测了癌症进展相关性标记(c-pas)测试结果为阳性或阴性的110个高级别浆液性卵巢腺癌样品的存活概率。
39.图3是使用处理系统检测核酸分子中靶向体细胞突变的过程示意图。
具体实施方式
40.1.定义
41.除非另有定义,否则本文使用的所有技术和科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。尽管在本发明的实践或测试中可以使用与本文描述的方法和材料相似或等同的任意方法和材料,但是描述了优选的方法和材料。出于本发明的目的,以下术语定义如下。
42.冠词“一个”和“一种”(“a”和“an”)在本文中用于指一个或多于一个(即,至少一个)物品的语法对象。举例来说,“一种糖类生物标志物”是指一种糖类生物标志物或多于一种糖类生物标志物。
43.如本文所使用的,“和/或”是指并且涵盖一个或多个相关的所列项目的任意和所有可能的组合,以及当以替代方式(或)解释时的不组合。
44.如本文所用,术语“约”意指近于(approximately)、在其左右(in the region of)、粗略地(roughly)或大约(around)。当术语“约”与数值范围结合使用时,它通过延伸边界至所述数值之上和之下来修改该范围。一般而言,术语“约”在本文中用于修改数值至高于和低于所述值的10%的差异。因此,约50%意指在45%-55%的范围内。本文通过端点记载的数值范围包括该范围内的所有数字和分数(例如,1至5包括1、1.5、2、2.75、3、3.90、4和5)。还应该理解的是,所有的数字及其分数都被假定为由术语“约”修饰。
45.如本文所用的术语“生物样品”是指可以从受试者或患者中提取、不经处理、经处理、稀释或浓缩的样品。合适地,生物样品选自患者身体的任意部分,包括但不限于头发、皮肤、指甲、组织或体液如唾液和血液。
46.如本文所用,关于突变的术语“密码子上下文”是指密码子内发生突变的核苷酸位置。为了本发明的目的,突变密码子(mc;即含有突变的密码子)内核苷酸位置被标注为mc-1、mc-2和mc-3,并且当密码子的序列从5'至3'读取时,分别指第一、第二和第三核苷酸位置。因此,短语“确定突变的密码子上下文”或类似短语意指确定突变密码子内的哪个核酸
位置发生了突变,即mc-1、mc-2或mc-3。
47.在整个说明书和随后的权利要求书中,除非上下文另有要求,否则词语“包括”以及变体将被理解为暗示包括所述整数或步骤或整数步骤的组,但不排除任何其他整数或步骤或整数或步骤的组。“由...组成”意指包括并限于短语“由...组成”之后的任何内容。因此,短语“由...组成”表示列出的元素是必需的或强制性的,并且不存在其他元素。“基本上由...组成”意指包括该短语之后列出的任意元素,并且限于其他元素,所述其他元素不干扰或有助于本公开关于所列元素指定的活性或作用。
48.如在本发明的背景中所用,术语“对照受试者”可以指已知受癌症影响的受试者(阳性对照),或已知未受癌症病况影响或诊断未患有癌症病况的受试者(阴性对照)。应该注意的是,已知健康的对照受试者,即未患癌症的受试者,可能患有另一种未测试/未知的疾病。还应理解的是,对照受试者和健康对照包括作为标准获得和使用的数据,即它可以一遍又一遍用于多个不同的受试者。换句话说,例如,当将受试者样品与对照样品进行比较时,来自对照样品的数据可能在一组不同的实验中获得,例如,它可以是获自一些健康受试者的平均值,并且实际上并没有在获取受试者数据的同时获得。
49.术语“相关联(correlating)”通常指确定一种数据类型与另一种类型或与状态之间的关系。在各种实施方案中,将tsm与癌症的存在或不存在相关联包括确定患有癌症的受试者中,或已知无癌症的人中tsm的水平。在具体的实施方案中,使用受试者工作特征(receiver operating characteristic,roc)曲线来使tsm的水平与癌症的复发相关联。
[0050]“基因”意指占据基因组上特定基因座的遗传单位,并且包括转录和/或翻译调控序列和/或编码区和/或非翻译序列(即内含子、5'和3'非翻译序列)。
[0051]
如本文所用,基于给定数学模型,术语“可能性”被用作tsm是否已经发生的量度,和含有靶向体细胞突变的核酸分子的受试者是否会经历癌症复发的量度。可能性增加,例如可能是相对的或绝对的,并且可以定性或定量表示。例如,基于先前的群体研究,受试者将发展癌症的可能性或风险增加可能表示为简单地确定靶向体细胞突变的数目(如本文所教导的)并且将测试受试者置于“可能性或风险增加”类别中。
[0052]
在一些实施方案中,所述方法包括比较靶向体细胞突变的数目或百分比与预选或阈值数目或百分比。可以选择这样的阈值:其提供可接受的预测诊断、可能性或预后风险的能力。在说明性实例中,通过绘制两个群体中变量的值对其相对频率的图来计算受试者工作特征(roc)曲线,其中第一群体具有第一状况或风险且第二群体具有第二状况或风险(任意地称为,例如“健康状况”和“癌症”,或“低风险”和“高风险”)。
[0053]
对于经历复发和没有经历复发的受试者,突变数目的分布可能会重叠。在这样的情况下,一项测试并不能以100%的准确度绝对区分复发癌症和不会复发的癌症。选择这样的阈值:高于该阈值时,测试被认为是“阳性”,低于该阈值时,测试被认为是“阴性”。roc曲线下面积(auc)提供了c-统计量,其是所见测量能正确鉴定病况的概率的量度(参见例如hanley等,radiology 143:29-36(1982))。术语“曲线下面积”或“auc”是指受试者工作特征(roc)曲线的曲线下面积,这两者在本领域中都是公知的。auc测量对于比较分类器(classifier)在整个数据范围内的准确性很有用。具有较高auc的分类器在两个目标组(例如,健康状况突变状态和癌症突变状态)之间正确分类未知事件的能力更强。roc曲线对于绘制一个特定特征在区分或分辨两个群体(例如,患有癌症的病例和不患癌症的对照)中的
表现是有用的。通常,基于单个特征的值,按升序排序整个群体(例如,病例和对照)的特征数据。然后,针对该特征的每个值,计算数据的真阳性和假阳性率。通过计算高于该特征的值的病例数,然后除以总案例数来确定灵敏度。通过计数低于该特征的值的对照数目,然后除以对照的总数来确定特异性。尽管这个定义是指与对照相比病例中的特征提高的情况,但是这个定义也适用于与对照相比病例中的特征较低的情况(在这种情况下,对低于该特征的值的样品进行计数)。可以针对单个特征以及针对其他单个输出生成roc曲线,例如,两个或更多个特征的组合可以在数学上组合(例如,相加、相减、相乘等)以产生单一值,并且这个单一值可以绘制在roc曲线中。此外,可以在roc曲线中绘制多个特征的任意组合(例如,一个或多个其他表观遗传标记),其中该组合导出单一输出值。这些特征的组合可以包括一项测试。roc曲线是测试的灵敏度针对测试的特异性的图,其中灵敏度通常在垂直轴上,特异性通常在水平轴上。因此,“auc roc值”等于分类器使随机选择的阳性实例排序为高于随机选取的阴性实例的概率。auc roc值可以被认为等同于曼-惠特尼u检验(mann-whitney u test)或威尔科克森秩检验(wilcoxon test of ranks),所述曼-惠特尼u检验检验在两个组(考虑具有连续数据的两个组)中获得的得分之间的中位数差异。
[0054]
或者或另外,可以通过获得来自同一患者的较早期突变状态结果来建立阈值,较后期结果可以与较早期突变状态结果进行比较。在这些实施方案中,个体实际上充当其自己的“对照组”。在另一个实施方案中,可以通过分析来自患者的非患病或健康组织的核酸分子中靶向体细胞突变的数目来建立阈值,并且将其与来自患病组织或癌组织的核酸分子中靶向体细胞突变的数目进行比较。
[0055]
如在本发明的上下文中使用的术语“诊断”是指确定癌症复发可能性的过程。存在于来自受试者的生物样品中的核酸分子中tsm的确定与受试者复发癌症的可能性相关。
[0056]
如本文所用,“健康”受试者是不具有癌症且不太可能复发癌症的受试者。
[0057]
如本文所用,关于tsm的“水平”是指存在于生物样品中的核酸分子中的tsm的数目、百分比或量。tsm的数目、百分比或量可以是绝对的或者可以是相对的,并且可以使用本领域中已知的任意方法来确定。
[0058]
术语“诱变剂”是指可引起dna或rna突变形成的内源性(即,对于含有该dna的细胞来说是内源性的或由含有该dna的细胞产生的剂)剂。
[0059]
如本文所用,“突变类型”是指具体的核苷酸取代,其包括突变,并且选自c至t,c至a,c至g,g至t,g至a,g至c,a至t,a至c,a至g,t至a,t至c和t至g突变。因此,例如,c至t的突变类型指其中靶向或突变核苷酸c被替换核苷酸t替代的突变。
[0060]
如本文中使用的“核酸”表示dna,cdna,mrna,rna,rrna或crna。该术语通常指长度大于30个核苷酸残基的多核苷酸。
[0061]
如本文所用,术语“复发”等是指在施用针对癌症或肿瘤的初步治疗后,受试者中肿瘤或癌性细胞的再生长。肿瘤可能在原来的位点或身体的其他部位复发。在一个实施方案中,复发的肿瘤与受试者治疗的原始肿瘤类型相同。例如,如果受试者患有卵巢癌肿瘤,接受治疗并随后发展了另一种卵巢癌肿瘤,则肿瘤已复发。另外,癌症可以在与其最初发生的器官或组织不同的器官或组织中复发,或转移至不同的器官或组织。
[0062]
如本文所用,术语“灵敏度”是指当生物样品为阳性时,例如具有预测的诊断结果,本发明的诊断或预测方法或试剂盒给出阳性结果的概率。灵敏度以真阳性结果的数目除以
真阳性和假阴性的总和计算。灵敏度基本上是本发明如何很好地从那些不具有预测的诊断结果的受试者中正确地鉴定出具有预测的诊断结果的受试者的量度。可以对统计方法和模型进行选择以使得灵敏度至少为约60%,并且可以是,例如,至少约65%,70%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%。
[0063]
术语“体细胞突变”是指在受孕后发生的体细胞(即,非生殖细胞)的dna中的突变。因此“体细胞诱变”是指发生体细胞突变的过程。
[0064]
如本文所用,术语“特异性”是指当生物样品不是阳性时,例如不具有预测的诊断结果,本发明的诊断或预测方法或试剂盒给出阴性结果的概率。特异性以真阴性结果的数目除以真阴性和假阳性的总和来计算。特异性基本上是本发明如何很好地从那些具有预测的诊断结果的受试者中排除不具有预测的诊断结果的受试者的量度。可以对统计方法和模型进行选择以使得特异性至少为约60%,并且可以是,例如,至少约65%,70%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%
[0065]
本文可互换使用的术语“受试者”、“个体”或“患者”是指任意动物受试者,特别是哺乳动物受试者。作为说明性的实例,合适的受试者是人类。在一些实施方案中,受试者呈现出本文定义的病况的临床体征。如本文所用,术语“临床体征”或简称“体征”是指受试者中存在疾病的客观证据。与本文提及的疾病相关的症状和/或体征以及这些体征的评估是常规的并且是本领域已知的。疾病体征的实例因疾病而异。癌症的体征可能包括肿瘤发生、转移和血管生成。通常,可以通过评估与疾病相关的体征来确定受试者是否患有疾病,以及受试者是否对治疗有反应。
[0066]
如本文所用,术语“靶向体细胞突变形成”和“tsm”是指由一种或多种诱变剂引起的体细胞突变形成的过程,其中突变形成发生在基序内的靶核苷酸处,靶核苷酸存在于密码子内的特定位置(例如,从5'至3'阅读时突变的密码子的第一、第二或第三位置,分别注释为mc-1、mc-2和mc-3),并且靶核苷酸被突变为特定的取代核苷酸(即,突变是特定的突变类型,例如,c至t,而不是c至a或c至g)。因此,确定tsm正在发生需要分析突变的类型(例如,c至t)、发生突变的基序(例如,wrc)和突变的密码子上下文,即密码子内发生突变的位置(例如,mc-1、mc-2或mc-3)。因此“靶向体细胞突变”是指由tsm引起的突变。
[0067]
除非另有说明,否则本文使用的术语“治疗”是指治疗性治疗和预防性(prophylactic)或防御性(preventative)措施,其中目的是部分或完全抑制,缓解或减缓(减轻)靶病况或病症(例如癌症)或与其相关的一种或多种症状的复发。这些术语在本文中也用于表示延迟癌症特别是癌症或肿瘤的发作,抑制(例如,降低或阻止其生长)、减轻其影响,或延长患有癌症特别是癌症或肿瘤的患者的寿命。需要治疗的受试者包括那些被诊断患有该病症的受试者,那些怀疑患有该病症的受试者,那些易患该病症的受试者以及那些要预防该病症的受试者。因此,本文中待治疗的受试者可能已经被诊断为患有该病症或者可能是易患该病症或对该病症敏感。在一些实施方案中,治疗是指根据本发明的方法,由一种或多种治疗剂的施用引起的原发性、区域性或转移性癌症组织的根除、去除、改变或控制。在其他实施方案中,这些术语是指最小化或延迟癌症的扩散,其由向具有这种疾病的受试者施用一种或多种治疗剂引起。在其他实施方案中,这些术语是指消除引起疾病的细胞。
除非另有说明,否则本文使用的术语“治疗”是指治疗行为。
[0068]
如本文所用,术语“治疗方案”是指预防性和/或预防性方案(即,在癌症或肿瘤发作之前)或指治疗方案(即,在癌症发作之后)。术语“治疗方案”包括天然物质和药剂(即“药物”)以及任意其他治疗方案,包括但不限于化疗,放疗,质子疗法,免疫疗法,激素疗法,光疗,冷冻疗法,冷冻手术,毒素疗法或促细胞凋亡疗法,高强度聚焦超声波,饮食治疗,物理疗法或运动疗法,手术干预及其组合。
[0069]
本领域的技术人员将认识到,除了具体描述的那些以外,本文描述的方面和实施方案易于变化和修改。应该理解,本公开包括所有这些变化和修改。本公开还单独地或共同地包括在本说明书中提及或指示的所有步骤、特征、组合物和化合物,以及任意两个或更多个所述步骤或特征的任意和所有组合。
[0070]
2.缩写
[0071]
在整个申请中使用以下缩写:
[0072]
adar=作用于rna的腺苷脱氨酶
[0073]
aid=活化诱导的胞苷脱氨酶
[0074]
apobec=载脂蛋白b mrna编辑酶,催化多肽样(apobec)胞苷脱氨酶
[0075]
dbd=脱氨酶结合结构域
[0076]
nts=非翻译链
[0077]
shm=体细胞超突变
[0078]
tsm=靶向体细胞突变
[0079]
nt=核苷酸
[0080]
nts=多个核苷酸
[0081]
aa=(多个)氨基酸
[0082]
kb=(多个)千碱基或(多个)千碱基对
[0083]
kda=(多个)千道尔顿
[0084]
ds=双链
[0085]
ss=单链
[0086]
d=天
[0087]
h=小时
[0088]
s=秒
[0089]
表2
[0090]
iupac核苷酸符号
[0091][0092][0093]
3.参与体细胞突变形成的诱变剂
[0094]
本发明部分基于以下意想不到的发现:与tsm相关的一种或多种特定突变与受试者复发癌症的可能性相关。本发明包括鉴定这些突变的方法以及通过检测那些突变来确定受试者复发癌症的可能性的方法。
[0095]
内源性因子(例如酶)可以作为引起体细胞突变形成或在体细胞突变形成中起作用的诱变剂。内源性因子包括但不限于,胞苷脱氨酶(例如活化诱导的胞苷脱氨酶(aid)和载脂蛋白b mrna编辑酶和催化多肽样(apobec)胞苷脱氨酶),腺苷脱氨酶(例如作用于rna的腺苷脱氨酶)和易错dna聚合酶如dna聚合酶η。值得注意的是,许多这些脱氨酶具有特定同种型,其存在于每种组织类型中。
[0096]
3.1活化诱导的胞苷脱氨酶(aid)
[0097]
活化诱导的胞苷脱氨酶(aid)是适应性免疫中重要的酶,参与体细胞超突变(shm)和b细胞中免疫球蛋白基因的类别转换重组。aid通过将胞苷脱氨为尿嘧啶(c至u)来引发shm以使免疫球蛋白可变区基因(vdj)多样化并产生新的抗原结合位点。按照惯例,c的突变(例如c至t)是在非转录链(nts)上发生的胞嘧啶脱氨的结果。相反,g的突变(例如g至a)是在转录链(ts)上发生的胞嘧啶脱氨的结果。
[0098]
在本发明的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,aid靶向包括核酸序列wrcg/cgyw(其中w=a/t;r=a/g;并且y=t/c)的基序。具体而言,如果在来自生物样品的核酸分子的非转录链(nts)中的mc-1和/或mc-3位点处的wrcg基序中观察到高于预期水平的c至t突变,则很有可能已经发生tsm。如果在来自生物样品的核酸分子的(ts)中的mc-2位点处的cgyw基序中观察到高于预期水平的g至a突变,则也很有可能已经发生tsm。
[0099]
3.2载脂蛋白b mrna编辑酶,催化多肽样(apobec)胞苷脱氨酶
[0100]
除aid之外,人类基因组编码多种同源apobec胞苷脱氨酶,已知其参与先天免疫和rna编辑(smith等人.(2012),semin.cell.dev.biol.23:258-268)。在人类中,至少apobec1,apobec3a,apobec3b,apobec3c,apobec3d,apobec3f,apobec3g和apobec3h参与提供先天免疫和/或细胞mrna编辑。
[0101]
在本发明的一些实施方案中,癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,apobec3b靶向包括核酸序列tcg/cga的基序。具体而言,如果在来自生物样品的核酸分子的mc-1和/或mc-3位点处的tcg基序中观察到高于预期水平的c至t突变,则很有可能已经发生tsm。此外,如果在来自生物样品的核酸分子的mc-1位点处的cga基序中观察到高于预期水平的g至a突变,则很有可能已经发生tsm。
[0102]
在本发明的一些实施方案中,apobec3g靶向包括核酸序列ccg的基序。具体而言,如果在来自生物样品的核酸分子的mc-1位点处的ccg基序中观察到高于预期水平的c至t突变,则很有可能已经发生tsm。
[0103]
在本发明的一些实施方案中,apobec3g靶向包括核酸序列cgg的基序。具体而言,如果在来自生物样品的核酸分子的mc-2位点处的cgg基序中观察到高于预期水平的g至a突变,则很有可能已经发生tsm。
[0104]
在其他实施方案中,癌症是白血病(例如,急性骨髓性白血病(aml))并且生物样品包括外周血。在aml中,由apobec同种型引起的tsm增加表明癌症复发或进展的风险增加。作为这种类型的说明性实例,如果在核酸分子中观察到至少一种以下突变高于预期水平,则很有可能已经发生tsm:mc-1位点处的ccz基序中的c至t突变;mc-2位点处的swcs基序中的c至t突变;mc-3位点处的xngns基序中的g至a突变;mc-2位点处的gsa基序中的g至a突变;mc-1位点处的sgxw基序中的g至a突变;mc-3位点处的cxgs基序中的g至a突变;mc-3位点处的yxgnx基序中的g至a突变;mc-3位点处的yygnx基序中的g至a突变;和mc1位点处的wngnz基序中的g至a突变。
[0105]
3.3作用于rna的腺苷脱氨酶(adar)
[0106]
rna编辑是一种转录后加工机制,其产生与由基因组dna编码的rna序列不同的rna序列,从而使基因产物和功能多样化。在高等真核生物中最普遍的rna编辑类型通过双链
rna特异性腺苷脱氨酶或adar酶的作用,将双链rna(dsrna)中的腺苷残基转换为肌苷(a至i编辑)。
[0107]
adar是由人类adar基因编码的一种酶。adar1酶通过将腺苷转化为肌苷来使dsrna不稳定。adar1酶修饰细胞和病毒rna,包括编码和非编码rna。adar1是一种rna编辑酶,是造血功能所必需的。adar1
+/-嵌合胚胎由于在造血系统中有缺陷而在胚胎第14天之前死亡。调节adar1表达水平对于肝脏中胚胎红细胞生成至关重要。adar基因突变与遗传性对称性色素异常有关。已经表征了编码不同同种型的备选转录剪接变体。
[0108]
在本发明的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,adar1靶向包括核酸序列way的基序。具体而言,如果在来自生物样品的核酸分子的mc-2位点处的way基序中观察到高于预期水平的a至g突变,则很有可能已经发生tsm。
[0109]
在这种类型的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,adar1靶向包括核酸序列rawa的基序。具体而言,如果在来自生物样品的核酸分子的mc-1位点处的rawa基序中观察到高于预期水平的a至t突变,则很有可能已经发生tsm。
[0110]
在本发明的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,adar1靶向包括核酸序列wtaw的基序。具体而言,如果在来自生物样品的核酸分子的mc-1位点处的wtaw基序中观察到高于预期水平的a至g突变,则很有可能已经发生tsm。
[0111]
在本发明的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,adar1靶向包括核酸序列sara的基序。具体而言,如果在来自生物样品的核酸分子的mc-1位点处的sara基序中观察到高于预期水平的a至g突变,则很有可能已经发生tsm。
[0112]
在本发明的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,adar1靶向包括核酸序列twty的基序。具体而言,如果在来自生物样品的核酸分子的mc-2位点处的twty基序中观察到高于预期水平的t至c突变,则很有可能已经发生tsm。
[0113]
在本发明的一些实施方案中,其中癌症是卵巢癌(例如,浆液性卵巢腺癌)并且生物样品包括卵巢细胞和/或组织,adar1靶向包括核酸序列twty的基序。具体而言,如果在来自生物样品的核酸分子的mc-3位点处的twty基序中观察到高于预期水平的t至c突变,则很有可能已经发生tsm。
[0114]
4.用于检测tsm的方法
[0115]
如本文所证明的,一些诱变剂不仅在一个或多个特定基序处引起核苷酸的突变,而且在密码子上下文内对基序和突变的核苷酸进行识别,即,突变核苷酸处于密码子结构内的特定位置,例如突变密码子中的第一、第二或第三核苷酸(从5'至3'阅读)。对于替代或替换核苷酸也有明显的优先性。本文将这种经由诱变剂的基序特异性和密码子上下文特异性靶向的组合称为tsm。作为非限制性实例,并且如表5中所示,核酸分子非转录链中的wrcg基序处的c突变可优先发生在突变密码子的第一位置处(mc-1),并且是突变为t(即c至t)。因此,可以通过分析核酸分子序列来确定核酸分子是否已发生靶向体细胞突变的可能性,
以确定在一个或多个特定基序(例如wrcgss基序)处的突变类型(例如,c至t)的突变的密码子上下文。如果在该基序处该突变类型的突变位置上没有密码子偏好性(即,突变基本上均匀地分布在密码子中的每个位置上),那么很可能突变是偶然发生的,而不是由诱变剂引起的tsm的结果。然而,如果在核酸分子中的密码子的一个特定位置处(例如,mc-1、mc-2或mc-3位点)该突变类型的突变百分比或数目较高,则这表明已经发生或者可能已经发生了tsm。
[0116]
上述突变的“预期数目或百分比”是如果突变独立于其他突变和密码子上下文(即,突变在密码子的每个位置中每个靶核苷酸处的分布基本上是均等的)所预期的突变的数目或百分比。因此,例如,当评估在mc-1、mc-2和mc-3位置或位点中出现的突变时,预期在三个位点中的任意一个位点处的核苷酸(例如c)突变为其他三种核苷酸中的任意一种核苷酸(例如,g、a或t)的突变将在每9次突变中发生1次(即,c有1/3的机会突变成g、a或t中的任意一种,并且有1/3的机会发生在任意位点,相当于总共有1/9的机会),或大约有11%的机会。当评估突变密码子中仅两个核苷酸位置中出现的突变时,例如mc-1和mc-2位点,预期在两个位点中的任意一个位点(例如,mc-1或mc-2)处的核苷酸(例如c)突变为其他核苷酸中的任何一种核苷酸(例如,g、a或t)的突变将在每6次突变中发生1次或大约有17%的机会(即,c有1/3的机会突变成g、a或t中的任意一种,并且有1/2的机会发生在任意位点,相当于总共有1/6的机会)。类似地,当评估仅一个位点(例如,mc-1)中的突变时,预期核苷酸(例如c)突变为其他核苷酸中的任何一种核苷酸(例如,g、a或t)的突变将在每3次突变中发生1次或大约有33%的机会。
[0117]
通常,当tsm由于一种或多种诱变剂的活性而发生并且在密码子的三个位点(例如,mc-1、mc-2和mc-3)间进行评估时,观察到与诱变剂相关的特定突变的机会为至少或约20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%或更多。当在两个位点(例如,mc-1和mc-2;mc-1和mc-3;或mc-2和mc-3)间进行评估时,通常观察到与诱变剂相关的特定突变的机会为至少或约30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%或更多。当仅对一个位点(例如,mc-1;mc-2;或mc-3)进行评估时,通常观察到与诱变剂相关的特定突变的机会为至少或约50%,55%,60%,65%,70%,75%,80%,85%,90%,95%或更多。
[0118]
4.1由aid、apobec和adar引起的tsm
[0119]
如上文和本文其他地方所述,在卵巢癌中,已发现aid能特异性靶向基序wrcg/cgyw,其中加下划线的核苷酸被突变。如本文所证明的,在mc-2位点处靶向g具有显著优先性,导致g至a突变。因此,核酸分子mc-2位点处cgyw基序的g至a突变高于预期的数目或百分比表明aid是核酸tsm的可能原因,并且aid在从中获得生物样品的卵巢细胞和/或组织中有活性。如本文中还证明的,再次使用卵巢癌作为非限制性实例,在mc-1位点处靶向c具有显著优先性,导致c至t突变。因此,核酸分子mc-1位点处wrcg基序的c至t突变高于预期的数目或百分比表明核酸可能已经发生tsm,并且aid在从中获得核酸分子的细胞和/或组织中可能有活性。
[0120]
同样在卵巢癌中,已发现apobec3g特异性靶向cgg/ccg基序。本文描述的研究表明,在mc-2位点处靶向g具有显著优先性,导致g至a突变。因此,核酸分子mc-2位点处cgg基序的g至a突变高于预期的数目或百分比表明核酸可能已经发生tsm,并且apobec3g在从中获得核酸的细胞和/或组织中可能有活性。在mc-1和/或mc-3位点处靶向c也有显著优先性,
导致c至t突变。因此,核酸分子mc-1和/或mc-3位点处ccg基序的c至t突变高于预期的数目或百分比表明核酸可能已经发生体细胞突变,并且apobec3g在从中获得核酸分子的细胞和/或组织中可能有活性。
[0121]
已发现apobec3b能特异性靶向卵巢癌样品中的tcg/cga基序。本文描述的研究表明,在mc-1和/或mc-3位点处靶向c具有显著优先性,导致c至t突变。因此,核酸分子mc-1和/或mc-3位点处tcg基序的c至t突变高于预期的数目或百分比表明核酸可能已经发生tsm,并且apobec3g在从中获得核酸分子的细胞和/或组织中可能有活性。在mc-1位点处靶向g也具有显著优先性,导致g到a的突变。因此,核酸分子mc-1位点处cga基序的c至t突变高于预期的数目或百分比表明核酸可能已经发生体细胞突变,并且apobec3g在从中获得核酸分子的细胞和/或组织中可能有活性。
[0122]
最后,已知adar1靶向卵巢癌中的way基序。本文描述的研究表明,在mc-2位点处靶向a具有显著优先性,导致a至g突变。因此,核酸分子非转录链中mc-2位点处way基序的a至g突变高于预期的数目或百分比表明核酸可能已经发生tsm,并且adar在从中获得核酸分子的细胞和/或组织中可能有活性。
[0123]
4.2鉴定其他诱变剂的基序
[0124]
如本文清楚表明的,诱变剂可以靶向特定密码子上下文内基序中的核苷酸。因此,由这些试剂引起的靶向体细胞突变通常在密码子结构内的一个位置(例如,mc-1而非mc-2或mc-3)和一个基序(例如ccg)处导致一种类型的突变(例如,c至t而非是c至g或c至a)。如上所述,通过分析基序处和特定密码子上下文内特定突变类型的核酸序列,比仅检测基序处的突变发生率,能更准确地指示tsm是否已经发生。
[0125]
密码子上下文的这种偏好性可用于鉴定其他诱变剂的基序。通过分析核酸分子中已知与诱变剂相关的突变类型(例如g至t)的体细胞突变发生率,以及评估突变的密码子上下文和突变的侧翼核苷酸,可以鉴定诱变剂的基序。当特定突变(例如,g至t)在密码子内特定位置处(例如,mc-3)发生的频率比随机发生更频繁,即,存在发生突变的优选核苷酸位置时,则该位置的突变可能是由于诱变剂引起的靶向体细胞突变而导致的。通过分析优选核苷酸位置(例如,mc-3)处突变的侧翼核苷酸,可以鉴定突变共有的并因此被诱变剂靶向的任意基序。
[0126]
因此,本发明还提供了用于鉴定被诱变剂靶向的基序的方法。所述方法涉及分析核酸分子的序列以确定与诱变剂相关的突变类型是否主要发生在密码子的一个位置或位点处(例如,mc-1、mc-2或mc-3)。如果存在一致的(co-incidence)突变类型和位点,则对位于突变核苷酸侧翼的核苷酸进行鉴定,从而鉴定包括突变核苷酸在内的共有基序。更具体地说,所述方法涉及分析核酸分子的序列以鉴定已知与诱变剂相关联的突变类型的体细胞突变,确定突变的密码子上下文以鉴定突变以高于预期频率发生的优选核苷酸位置,并鉴定优选核苷酸位置处突变的侧翼核苷酸以鉴定该突变共有的基序。
[0127]
当与诱变剂相关的突变类型尚未可知时,也可以应用类似的过程。在这种情况下,首先分析核酸分子的序列以鉴定体细胞突变,并且还鉴定符合以下条件的任意突变类型(例如g至t):该突变类型以高于突变随机发生时所预期的频率发生在一个密码子内的一个位置处(例如,mc-3)(即,在优选核苷酸位置)。然后评估优选核苷酸位置处突变的侧翼序列,以确定是否存在该突变共有的基序。如果有,则这个基序可能是诱变剂的靶标。
[0128]
在其他实例中,可以进一步分析诱变剂的已知基序以确定突变类型的密码子偏好性和优先性。可以如本文所述对核酸序列进行评估,如实施例1中所述,以确定与基序处的突变相关的密码子上下文和突变类型,以评估对于密码子中的核苷酸位置处的突变类型是否存在优先性。例如,认为apobec3a,apobec3b,apobec3f和apobec3h能靶向tc基序或更严格的tcw基序。可以对一个或多个核酸分子序列进行分析以确定其中在基序处发生突变的密码子上下文,即,c是在mc-1、mc-2还是mc-3处,以及发生了什么类型的突变(例如,c至a、c至t或c至g)。一旦鉴定出一致的突变类型、基序和密码子上下文,就可以使用这套标准或诊断规则来更准确地确定核酸分子中是否发生了tsm,并且从而还确定在从中获得核酸分子的细胞中哪些诱变剂具有活性。
[0129]
为了使用上述方法来鉴定基序和/或诊断规则,被分析的核酸分子通常是已知或疑似与诱变剂接触过的核酸,或是从已知或疑似与诱变剂接触过的细胞中获得的核酸。例如,在对核酸序列进行分析之前,可以将包括核酸分子的细胞体外暴露于诱变剂。在其他实例中,核酸分子可以从受试者的组织或细胞中获得,已知所述受试者已经暴露于诱变剂。可以使用多个生物样品进行多项研究以验证所述发现。
[0130]
4.3鉴定其他组织类型的基序
[0131]
如实施例所示,表征个体脱氨酶同种型的dbd对特定组织类型具有特异性。因此,从一种特定组织类型获得的生物样品中tsm的预测水平仅对该组织类型具有特异性。因此,在优选的实施方案中,在衍生自已知受癌症影响的组织的生物样品中鉴定tsm基序,并且将其与相应的健康组织(例如,已知不存在癌症并且不处于发展癌症风险的组织)进行比较。
[0132]
作为实例,生物样品可以包括组织、血液和/或细胞。在一些实例中,生物样品是活检组织。此外,生物样品可以来自身体的任意部位,并且可以包括任意类型的细胞或组织,例如乳腺、前列腺、肝细胞、结肠、胃、胰腺、皮肤、甲状腺、子宫颈、淋巴、造血系统、膀胱、肺、肾、直肠、卵巢、子宫和头或颈部组织或细胞,或来自外周血或脑脊髓液的细胞。在一些情况下,核酸分子获自疑似患有癌症或处于患癌症风险的受试者的细胞或组织样品,或者获自患有癌症的受试者的细胞或组织样品。
[0133]
4.4为tsm评估核酸分子
[0134]
本领域已知用于获得和评估核酸分子序列的任意方法都可用于本发明的方法中。使用本发明的方法分析的核酸分子可以是任意核酸分子,但通常是dna(包括cdna)。通常,核酸分子是哺乳动物核酸分子,例如人核酸分子。如上所述,核酸分子可以获自任意生物样品。
[0135]
核酸分子可以含有一个基因的一部分或全部,或者两个或更多个基因的一部分或全部,并且根据本发明的方法分析的是该一个基因或多个基因的序列。例如,核酸分子可以包括tp53,pik3ca,erbb2,diras3,tet2或一氧化氮合酶(nos)基因的全部或部分。在一些情况下,核酸分子包括全基因组或全外显子组,并且在本发明的方法中分析的是该全基因组或全外显子组的序列。
[0136]
当使用本发明的方法时,可能已经预先确定了核酸分子的序列。例如,该序列可以存储在数据库或其他存储介质中,并且根据本发明的方法分析的是该序列。在其他情况下,必须在使用本发明的方法之前首先确定核酸分子的序列。在特定的实例中,也必须首先从生物样品中分离该核酸分子。
[0137]
用于获取核酸和/或对核酸进行测序的方法是本领域熟知的,并且任意这些方法都可以用于本文所述的方法。在一些情况下,所述方法包括在测序之前扩增分离的核酸,并且合适的核酸扩增技术是本领域普通技术人员熟知的。核酸测序技术在本领域中是熟知的,并且可以应用于单个或多个基因,或全外显子组或基因组。这些技术包括,例如,依赖于“sanger测序”(sanger等人,(1977)proc.natl.acad.sci.usa 74:5463

5467)的毛细管测序方法(即,涉及链终止测序的方法),以及“下一代测序”技术,其有利于一次对数千至数百万个分子进行测序。这些方法包括但不限于,焦磷酸测序法,其利用萤光素酶来读出信号,因为向dna模板中添加了各个核苷酸;“通过合成测序”技术(illumina),其使用了可逆染料终止子技术,在每个循环中向dna模板添加单个核苷酸;和solid
tm
测序(通过寡核苷酸连接和检测测序;life technologies),其通过固定长度寡核苷酸的优先连接来进行测序。这些新一代测序技术对测序全外显子组和基因组特别有用。
[0138]
一旦获得了核酸分子序列,然后就鉴定单点体细胞突变。通过将该序列与对照序列进行比较,可以鉴定单点突变。对照序列可以是获自对照个体生物样品的核酸分子序列,所述对照个体例如是未患疾病的健康个体;获自对照样品的核酸分子序列,所述对照样品例如是来自健康、未患病的组织的样品;或者可以是被理解为不含有体细胞突变的共有序列。在一些情况下,对照序列可以是在之前的时间点从受试者的生物样品获得的核酸分子序列。例如,对照样品可以在受试者接受治疗方案之前或期间获取,并且可以对待分析的样品进行后处理(以确定受试者是否对治疗有反应,并确定癌症或肿瘤复发的可能性)。除了鉴定单点突变之外,还鉴定了含有该突变的密码子和该密码子内的突变位置(mc-1、mc-2或mc-3)。还鉴定了侧翼5'和3'密码子中的核苷酸以鉴定基序。通常,对于本发明的方法,分析了核酸分子非转录链的序列(等同于cdna序列)。在一些情况下,分析了转录链的序列。
[0139]
如本文所证明的,使用本发明的方法,仅需要分析基序处的少量突变来统计显著性地确定tsm是否由于特定诱变剂的活性而发生。在一些情况下,使用本发明的方法分析的特定基序处的突变数目可以少至2种突变。例如,如果发现明显健康的患者在所分析的核酸中仅具有2种体细胞突变,并且这两种突变都是在mc-2位点处gyw基序中的g至a突变,那么该模式偶然发生的概率是0.04238(p《95%,使用卡方检验(chisquare test),9-1=9df)。或者,每个突变偶然发生的概率可以说是1/9(即,如上所述,1/3的机会发生g至a突变,1/3的机会突变发生在mc-2位点),因此在这种模式中2个突变中有2个发生的概率是1/81(或0.012346)。然而,如本领域技术人员将会理解的那样,当对特定基序处的更多突变进行分析时,可以提高统计显著性。因此,在一些情况下,使用本发明的方法分析的特定基序处的突变数目可以是至少20个。许多来自治疗之前或之后的受试者的含有核酸的生物样品具有40个或更多个突变,一些携带多达400个或更多的突变。因此,使用本发明的方法分析的特定基序处的突变数目可以是至少或约2,3,4,5,6,7,8,9,10,15,20,25,30,40,50,60,70,80,90,100,150,200,250,300或更多。
[0140]
5.癌症进展相关性标记(c-pas)
[0141]
本发明还公开,tsm子集与癌症复发的可能性相关(本文称为“癌症进展相关性标记”(c-pas))。可以通过由检测诱变剂(例如aid、apobec、adar等)特异性靶向的个体核酸序列来鉴定c-pas,并且c-pas指示癌症的复发。
[0142]
5.1鉴定c-pas
[0143]
在一些实施方案中,本发明包括鉴定存在于患有或患过癌症的受试者的生物样品中的核酸中的c-pas。有两条规则可以被视为c-pas。首先,在c-pas中鉴定出的由诱变剂引起的单核苷酸置换必须显示出显著的靶向优先性(即,具有单一类型和密码子上下文)。这确保了核酸基序与单一脱氨酶的诱变活性相关,并且所得到的tsm模式(即c-pas)不是偶然单独发生的。核酸基序被认为是c-pas的第二个标准是,在来自复发癌症的样品和没有复发癌症的样品之间,每个样品在c-pas中的靶向突变的平均数目必须增加。
[0144]
因此,用于鉴定c-pas的方法涉及分析核酸分子序列以确定与诱变剂相关的突变类型是否主要发生在密码子的一个位置或位点处(例如,mc-1、mc-2或mc-3)。如果存在一致的突变类型和位点,则对位于突变核苷酸侧翼的核苷酸进行鉴定,从而鉴定包括突变核苷酸在内的共有基序。更具体地说,所述方法涉及分析核酸分子的序列以鉴定已知与诱变剂相关联的突变类型的体细胞突变,确定突变的密码子上下文以鉴定突变以高于预期频率发生的优选核苷酸位置,并鉴定优选核苷酸位置处突变的侧翼核苷酸以鉴定突变共有的基序。然后进行分析以确定c-pas中的tsm是否能够使用本领域熟知的用于确定统计学显著性的方法来区分可能复发的癌症和不太可能复发的癌症。
[0145]
为了使用上述方法鉴定基序和/或诊断规则,所分析的核酸通常是从受试者的细胞或组织中获得的核酸,所述受试者已知患有或疑似患有已复发的癌症,或以前患有过癌症但尚未复发。可以进行使用多个生物样品的多项研究以验证该发现。
[0146]
就此而言,并且通过非限制性示例,表3中提供了适用于确定受试者复发癌症(例如,卵巢癌、aml等)的可能性的c-pas。
[0147]
表3
[0148]
鉴定的c-pas和密码子上下文
[0149]
[0150][0151]
c-pas的特定鉴定和表征允许快速确定核酸分子中是否发生了tsm。此外,通过进一步确定诱变剂(例如脱氨酶)特异性靶向的位点,预期将使确定受试者复发癌症的可能性的特异性和敏感性更高。在这方面,c-pas的鉴定和表征必须在待评估的特定癌症组织样品中进行。如表3中所示,在各组织类型或目标癌症中鉴定出不同的c-pas,并且在进行本文所述的c-pas鉴定方法之前,不可能预测这些序列。
[0152]
作为上文和本文别处所述方法的说明性实例,如果确定核酸中c-pas的tsm水平高于发生随机(即非靶向)突变时所预期的水平,则受试者可能复发癌症。相反,如果c-pas中tsm的水平类似于或低于发生随机(即非靶向)突变时所预期的水平,那么受试者可能不会复发癌症或肿瘤。
[0153]
6.用于检测tsm和c-pas的试剂盒和系统
[0154]
检测受试者中的tsm并进一步鉴定癌症或肿瘤可能复发的可能性所需的所有基本材料和试剂,以及本文所述的相关方法可以一起组装成试剂盒。例如,当本发明的方法包括首先分离待分析的核酸和/或对待分析的核酸进行测序时,可以设想包括促进分离和/或测序的试剂的试剂盒。这样的试剂可以包括,例如,用于扩增dna的引物,聚合酶,dntp(包括标记的dntp),阳性和阴性对照以及缓冲液和溶液。通常,这样的试剂盒还以合适的方式包括每种单独试剂的不同容器。试剂盒还可以具有各种装置,和/或使用该试剂盒的印刷说明书。
[0155]
在一些实施方式中,至少部分地通过处理系统,例如适当编程的计算机系统,来执行本文一般性描述的方法。可以使用独立计算机,其中微处理器执行允许执行上述方法的应用软件。或者,可以至少部分地由作为分布式架构的一部分进行操作的一个或多个处理系统来执行该方法。例如,处理系统可以用来鉴定一个或多个核酸序列内的突变类型、突变的密码子上下文和/或基序。在一些实例中,由用户输入到处理系统的命令帮助处理系统做出这些确定。
[0156]
在一个实例中,处理系统包括至少一个微处理器,一个存储器,一个输入/输出设备,例如键盘和/或显示器,以及一个外部接口,其经由总线互连。外部接口可用于将处理系统连接到外围设备,例如通信网络、数据库或存储设备。微处理器可以执行存储器中存储的应用软件形式的指令,以允许执行本发明的方法,以及执行任意其他所需处理,例如与计算机系统通信。应用软件可以包括一个或多个软件模块,并且可以在合适的执行环境中执行,例如操作系统环境等。
[0157]
在另一个实例中,处理系统可以用来上传序列信息和来自数据库或其他来源的其他相关数据。被设计为适合于本文公开的方法的算法可以应用于数据,如图3所示。在该实例中,上传输入数据[1]和测试参数(例如待使用的基序)[2]或将其输入进系统。然后生成目标基因组区域内突变的碱基替换表,比对数据并将其与突变关联,将密码子上下文数据和其他信息与样品详情和核苷酸序列关联[3,4,5]。下一步包括鉴定密码子内每个核苷酸位置上每个基序处每种突变类型的一致发生[6]。对数据进行制表以记录每个基序的每种突变类型的一致发生与密码子上下文[7],包括每次诊断的相对可能性等级与置信度[8]。将结果联合起来以确定可能参与产生突变的诱变剂(或分子结构)和生化过程,和相关临床信息[8]。根据作为输入的服务请求信息生成输出报告[9]并生成可读输出[10]
[0158]
7.诊断和治疗性应用
[0159]
本文所述的用于检测是否发生了靶向体细胞突变,以及鉴定和表征c-pas的方法,具有许多有用的诊断性和治疗性应用。已知体细胞突变与许多癌症的存在相关。同样,已知一些诱变剂与许多癌症的发展和进展有关。使用本文所述的方法(例如,由一种或多种诱变剂引起的tsm的存在和/或程度),可以确定受试者癌症复发的可能性。这样的确定可以有助于为患有癌症或患有过癌症的受试者规定治疗方案。例如,所述确定可以帮助决定当前的治疗方案是应该继续、减少还是停止。另外,持续评估归因于一种或多种诱变剂的靶向体细胞突变可用来评估癌症是否正在进展或退化和/或治疗方案的成功或失败。例如,在相同受试者中,在样品(如活检组织)的核酸中检测到的靶向体细胞突变的数目随时间而增加可表明癌症恶化或对治疗方案无反应,而突变数目稳定或减少可表明病况缓解或对治疗方案有成功反应。
[0160]
在特定情况下,本发明的方法可以延伸至诊断受试者中的癌症或确定受试者复发癌症的可能性。例如,可以通过分析来自受试者的生物样品的核酸分子,从而确定是否发生了由一种或多种诱变剂引起的tsm,来评估受试者复发癌症的可能性。如果发生了tsm,则可以确定受试者可能复发癌症。
[0161]
在一些实例中,利用上述诊断规则来确定受试者复发癌症的可能性。例如,如上文针对aid,apobec3g,apobec3h和adar所述的,当在核酸分子mc-1位点处的tcga基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-3位点处的atcs基序中观察到
的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的gcggc基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的ccgx基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的zccg基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的sggrr基序中观察到的g至a突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的tccg基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-2位点处的gcgc基序中观察到的g至a突变的数目或百分比高于预期时;当在核酸分子mc-2位点处的ccggc基序中观察到的g至a突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的rawa基序中观察到的a至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的wtaw基序中观察到的a至g突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的sara基序中观察到的a至g突变的数目或百分比高于预期时;当在核酸分子mc-2位点处的twty基序中观察到的t至c突变的数目或百分比高于预期时;和/或当在核酸分子mc-3位点处的twty基序中观察到的t至c突变的数目或百分比高于预期时,癌症将被确定为可能复发。在其他实例中,使用本文所述的方法为其他诱变剂确定的诊断规则被用于检测受试者复发癌症的可能性。
[0162]
在一些情况下,当在样品中检测到靶向体细胞突变时,所述样品含有来自受试者特定区域或位置的细胞或组织,例如乳腺、前列腺、肝、结肠、胃、胰腺、皮肤、甲状腺、宫颈、淋巴、造血系统、膀胱、肺、肾、直肠、卵巢、子宫和头或颈部组织或细胞,那么做出以下确定:受试者患有或可能发展为涉及该组织或细胞的癌症。因此,例如,可以做出以下确定:受试者患有或可能发展为乳腺癌、前列腺癌、肝癌、结肠癌、胃癌、胰腺癌、皮肤癌、甲状腺癌、子宫颈癌、淋巴癌、造血系统癌、膀胱癌、肺癌、肾癌、直肠癌、卵巢癌、子宫癌或头颈部癌。
[0163]
在具体实例中,用于检测特定类型癌症复发可能性的生物样品与癌症的类型相匹配。举例来说,如果受试者患有或患有过卵巢癌,那么被鉴定tsm的样品来源于卵巢组织或细胞。
[0164]
除了用于确定癌症复发的可能性之外,tsm的程度(即,核酸中归因于诱变剂的靶向体细胞突变的总数)还可用于帮助确定癌症是否正在进展或退化,和/或治疗方案是否有效。如上所述,tsm的数目越高,受试者复发癌症的可能性越高。此外,如果受试者中靶向体细胞突变的数目随时间而增加,则癌症进展的可能性和/或受试者对癌症或肿瘤不应答的可能性越高。相反,如果受试者中靶向体细胞突变的数目随时间而减少,则癌症退化的可能性和/或受试者成功响应治疗方案的可能性越高。
[0165]
本发明的方法还延伸至治疗性或预防性方案。在确定癌症不太可能复发的情况下,可以对方案进行修改以降低治疗强度,或使受试者完全免除治疗方案。在确定癌症可能复发的情况下,可以设计降低这种可能性的方案并应用于受试者。例如,可以为受试者设计适当的治疗方案并施用。这可以包括,例如,放疗,手术,化疗,激素消融疗法,促凋亡疗法和/或免疫疗法。在一些实例中,可以进行进一步的诊断测试以在治疗之前确认诊断结果。
[0166]
放疗包括诱发dna损伤的辐射和波,例如γ照射,x射线,uv照射,微波,电子发射,放射性同位素等。通过用上述辐射形式照射局部肿瘤部位可以实现治疗。很可能所有这些因素都会产生大范围的损伤dna、影响dna前体、dna的复制和修复以及染色体的组装和维持。
[0167]
x射线的剂量范围从50至200伦琴的每日剂量,持续长时间(3-4周),到2000至6000
伦琴的单剂量。放射性同位素的剂量范围差别很大,取决于同位素的半衰期、所发射的辐射的强度和类型以及肿瘤细胞的摄取。
[0168]
放疗的非限制性实例包括适形外束放疗(conformal external beam radiotherapy)(50-100grey 4-8周分量给予),单次激发或分次,高剂量率近距离放疗(high dose rate brachytherapy),永久性间质近距离放疗(permanent interstitial brachytherapy),系统放射性同位素(例如,锶89)。在一些实施方案中,放疗可以与放射增敏剂组合施用。放射增敏剂的说明性实例包括但不限于:乙丙昔罗(efaproxiral),依他硝唑(etanidazole),全氟化碳(fluosol),米索硝唑(misonidazole),尼莫拉唑(nimorazole),替莫泊芬(temoporfin)和替拉扎明(tirapazamine)。
[0169]
化疗剂可选自以下类别中的任意一种或多种:
[0170]
(i)用于医学肿瘤学的抗增殖/抗肿瘤药物及其组合,例如烷化剂(例如顺铂,卡铂,环磷酰胺,氮芥,美法仑,苯丁酸氮芥,白消安和亚硝基脲);抗代谢物(例如叶酸拮抗剂,例如氟吡啶,如5-氟尿嘧啶和替加氟,雷替曲塞,甲氨蝶呤,阿糖胞苷和羟基脲;抗肿瘤抗生素(例如蒽环类抗生素,如阿霉素,博来霉素,多柔比星,道诺霉素,表柔比星,伊达比星,丝裂霉素-c,放线菌素和光神霉素);抗有丝分裂剂(例如长春花生物碱如长春新碱(vincristine)、长春碱(vinblastine)、长春地辛(vindesine)和长春瑞滨(vinorelbine)以及紫杉烷类如紫杉醇和多西他赛);以及拓扑异构酶抑制剂(例如表鬼臼毒素,如依托泊苷和替尼泊苷,安吖啶,拓扑替康和喜树碱);
[0171]
(ii)细胞抑制剂(cytostatic agent),例如抗雌激素剂(例如他莫昔芬,托瑞米芬,雷洛昔芬,屈洛昔芬和吲哚昔芬(iodoxyfene)),雌激素受体下调剂(例如氟维司群),抗雄激素剂(例如比卡鲁胺,氟他胺,尼鲁米特和醋酸环丙孕酮),uh拮抗剂或lhrh激动剂(例如戈舍瑞林,亮丙瑞林和布舍瑞林),孕激素(例如醋酸甲地孕酮),芳香酶抑制剂(例如阿那曲唑,来曲唑,伏氯唑(vorazole)和依西美坦)以及5α-还原酶抑制剂如非那雄胺;
[0172]
(iii)抑制癌细胞浸润的剂(例如金属蛋白酶抑制剂,如马立马司他和尿激酶纤溶酶原激活物受体功能抑制剂)
[0173]
(iv)生长因子功能抑制剂,例如这种抑制剂包括生长因子抗体,生长因子受体抗体(例如抗erbb2抗体曲妥珠单抗[herceptin
tm
]和抗erbb1抗体西妥昔单抗[c225]),法尼基转移酶抑制剂,mek抑制剂,酪氨酸激酶抑制剂和丝氨酸/苏氨酸激酶抑制剂,例如表皮生长因子家族的其他抑制剂(例如其他egfr家族酪氨酸激酶抑制剂,如n-(3-氯-4-氟苯基)-7-甲氧基-6-(3-吗啉代丙氧基)喹唑啉-4-胺(吉非替尼,azd1839),n-(3-乙炔基苯基)-6,7-双(2-甲氧基乙氧基)喹唑啉-4-胺(埃罗替尼,osi-774)和6-丙烯酰胺基-n-(3-氯-4-氟苯基)-7-(3-吗啉代丙氧基)喹唑啉-正-4-胺(ci 1033)),例如血小板衍生生长因子家族的抑制剂和例如肝细胞生长因子家族的抑制剂;
[0174]
(v)抗血管生成剂,例如抑制血管内皮生长作用的那些试剂(例如抗血管内皮细胞生长因子抗体贝伐单抗[avastin
tm
],国际专利申请wo 97/22596、wo 97/30035、wo 97/32856和wo 98/13354中公开的那些化合物),以及通过其他机制起作用的化合物(例如,利诺安(linomide),整联蛋白αvβ3功能抑制剂和血管抑制素);
[0175]
(vi)血管破坏剂,例如考布他汀a4(combretastatin a4)和国际专利申请wo 99/02166、wo00/40529、wo 00/41669、wo01/92224、wo02/04434和wo02/08213中公开的化合物;
[0176]
(vii)反义疗法,例如针对上文列出的靶标的那些,例如isis 2503,其是一种抗ras反义链;以及
[0177]
(viii)基因疗法,包括例如置换异常基因例如异常p53或异常gdept的方法(基因定向酶前体药物疗法),例如使用胞苷脱氨酶、胸苷激酶或细菌硝基还原酶的方法,和增加患者对化疗或放疗耐受性的方法,例如多重耐药基因疗法。
[0178]
免疫疗法包括,例如,增加患者肿瘤细胞免疫原性的离体和体内方法,例如用细胞因子如白细胞介素2、白细胞介素4或粒细胞-巨噬细胞集落刺激因子转染,降低t细胞无能(anergy)的方法,使用转染的免疫细胞如细胞因子转染的树突细胞的方法,使用细胞因子转染的肿瘤细胞系的方法和使用抗独特型抗体的方法。这些方法通常依赖于使用免疫效应细胞和分子以靶向并破坏癌细胞。免疫效应子可以是,例如,对恶性细胞表面上的一些标志物具有特异性的抗体。单独的抗体可以作为疗法的效应子,或者它可以招募其他细胞来实际促进细胞杀伤。抗体还可以与药物或毒素(化学治疗剂、放射性核素、蓖麻毒素a链、霍乱毒素、百日咳毒素等)缀合并仅用作靶向剂。或者,效应子可以是淋巴细胞,所述淋巴细胞携带与恶性细胞靶标直接或间接相互作用的表面分子。各种效应细胞包括细胞毒性t细胞和nk细胞。
[0179]
其他癌症疗法的实例包括光疗、冷冻疗法、毒素疗法或促凋亡疗法。本领域技术人员将会知道,该列表并不是可用于癌症和其他增生性病变的治疗模式类型的穷举。
[0180]
在一些情况下,其中引起靶向体细胞突变的诱变剂的可能的身份被确定,疗法或预防性措施可包括向受试者施用该诱变剂的抑制剂。抑制剂可以包括,例如,sirna,mirna,蛋白质拮抗剂(例如,诱变剂的显性负突变体),小分子抑制剂,抗体及其片段。例如,商业上可获得的专门针对apobec胞苷脱氨酶和aid的sirna和抗体是广泛可得和本领域技术人员已知的。apobec3g抑制剂的其他实例包括由li等人描述的小分子(acs.chem.biol.,(2012)7(3):506-517),其中许多含有儿茶酚部分,已知其在氧化成邻醌后具有巯基反应性。apobec1抑制剂还包括但不限于,apobec1显性负突变体多肽,例如mu1(h61k/c93s/c96s)突变体(oka等人,(1997)j.biol.chem.272:1456-1460)。
[0181]
通常,治疗剂将与药学上可接受的载体一起以药物组合物的形式并以有效量施用以达到其预期目的。向受试者施用的活性化合物的剂量应该足以随时间而在受试者中获得有益的反应,例如,癌症症状减少或缓解,和/或肿瘤或癌症细胞减少、消退或消除。待施用的药物活性化合物的量可取决于待治疗的受试者,包括其年龄、性别、体重和一般健康状况。就此而言,用于施用的活性化合物的精确量将取决于医师的判断,并且本领域技术人员无需过度实验就可以容易地确定治疗剂的合适剂量和合适的治疗方案。
[0182]
本发明可以在预测医学领域中实施,以诊断或监测受试者中癌症或肿瘤的存在或发展,和/或监测对疗效的反应。
[0183]
为了使本发明易于理解并付诸实践,现在将通过以下非限制性实施例来描述特定的优选实施方式。
[0184]
实施例
[0185]
实施例1
[0186]
突变链偏好性(strand-bias)模式类似其他癌症
[0187]
以前的研究表明,在重排的免疫球蛋白可变区基因座处观察到的体细胞超突变
(shm)参考模式的特征在于对于所有沃森-克里克(watson-crick)互补物都有显著的链偏好性(参见,例如steele和lindley,2010)。目前的研究提供了第一个证据,即在肺腺癌、肺小细胞癌、乳腺导管癌、鳞状细胞癌和恶性黑色素瘤中发生的体细胞突变也观察到了显著的shm样链偏好性模式。因此,确定了tcga浆液性卵巢腺癌突变数据集的链偏好性模式是否也表现出这种链偏好性。结果强烈表明,在许多癌症中,异常ig shm与体细胞点突变的发生之间存在因果关系。这反过来表明涉及到了参与shm的潜在靶标,例如aid和adar1,以及调节转录偶联修复(tcr)途径的过程。
[0188]
表4中显示的链偏好性突变数据部分或全部与发生在非淋巴组织中的大量其他癌症的链偏好性模式明显相似。即,在浆液性卵巢腺癌中所观察到的突变的可能根本原因与在其他体细胞组织的肿瘤中的突变所观察到的相同。该结果为采用涉及aid/apobec和adar脱氨酶家族的靶向体细胞突变(tsm)方法来分析选定的194个浆液性卵巢腺癌样品的突变数据提供了正当理由。
[0189]
表4
[0190]
外显子组突变中的体细胞突变模式
[0191][0192]
材料和方法
[0193]
数据来源
[0194]
体细胞突变数据源自一组由the cancer genome atlas(tcga 2013)存档的429个临床注释的ii-iv期浆液性卵巢腺癌样品。kanchi等人(2014)对这些样品的先前分析是第一次使用匹配的种系和肿瘤组织样品的全外显子组(exome-wide)测序的大规模研究。
[0195]
肿瘤和种系组织的来源由tcga-xx-xxx-yyy-zzz(cancer genome atlas research network,2013)中第三个连字符后面的代码表示。例如,yyy区域中的以下代码表示来源如下:10表示血液来源正常;11表示固体组织正常;12表示颊细胞正常。在测序之前,对许多原始样品进行扩增。代替zzz的字母代码表示使用的扩增方法。例如,d表示dna(无全基因组扩增);g表示使用genomeplex(rubicon)dn产生的全基因组扩增(wga);w表示使用repli-g(qiagen)dna产生的全基因组扩增(wga)。
[0196]
通过外显子组捕获,然后在illumina或solid平台上进行测序,来对dna进行测序。使用bwa 0.5.9将来自配对的肿瘤和种系样品的序列数据与ncbi build 36人类参照进行比对,并使用picard 1.29去重复(参见kanchi等人,2014中的方法部分)。
[0197]
样品选择
[0198]
使用educational research in codon-context(eric)1.6版分析dna突变数据。此应用程序是作为研究支持工具而开发的。它用excel vba脚本编写,来自动操作分析和编
译dna突变数据的过程用于分析。程序例程使用ensembl基因转录本(cunningham等人,2015)来鉴定每个突变周围的核苷酸序列上下文,并确定突变密码子(mc)的核苷酸结构内的每个突变的位置。
[0199]
一旦将该数据添加到已编译的突变数据集中,eric就可以用来调用落在预定义的目标基序上并由3-6个核苷酸组成的突变,并对其制表。一旦选定基序的核苷酸被输入进配置设置中,然后列出选定基序的所有突变的表格,以揭示突变在3
×
3tsm表格内的分布(参见lindley 2013)。得到的tsm表显示突变(例如,g至a、g至c或g至t)的分布,及其相对于突变密码子内三个可能的核苷酸位置的位置(即mc-1、mc-2或mc-3,从5'向3'读取)。
[0200]
数据分析
[0201]
作为第一步,对合并的突变数据集进行链偏好性突变分析。然后将该链偏好性模式与其他组织类型中一系列癌症的链偏好性模式进行比较。通过在4
×
4表格中列出每种突变类型的相对百分比来创建合并数据的链偏好性突变模式(如steele和lindley,2010;和lindley和steele,2013中所述)。
[0202]
一旦分析了链偏好性突变数据模式,下一步就是验证aid/apobec3g/apobec3b和adar脱氨酶家族是许多突变的可能来源。为了完成这一步骤,列出了以前发现的与关键脱氨酶相关的基序的tsm表。非重叠靶向优先性('基序')包括aid的wrcg/cgyw和apobec3g的ccg/cgg(参见beale,2004)。对于adar活性,选择了基序way,对于apobec3b,使用了基序tcg/cga(参见burns等人,2013a)。应该注意的是,先前已经显示apobec3b突变在浆液性卵巢癌中显著上调,并且已经在浆液性卵巢癌中鉴定出了几种优选的三核苷酸靶基序(参见leonard等人,2013)。
[0203]
由于已知所有aid/apobec/adar家族成员具有多个活性dbd,因此使用以下研究方法来验证关键脱氨酶的嵌合性质。
[0204]
这通过以下步骤完成:首先从转录链(ts)上的aid优选靶基序gyw开始,分析5端(5')和3端(3')核上下文变化的影响。使用eric v.1.6,并从三核苷酸基序gyw开始,我们逐步将核苷酸数量从三个核苷酸增加到六个核苷酸。对于每个延伸,我们选择了额外的核苷酸,这些核苷酸不改变突变密码子结构内的靶向优先性,或者由此导致的显性突变类型。
[0205]
第二步,构建一个表来研究对于aid和adar家族的不同基序的靶向优先性的5端(5')和3端(3')上下文变化可能如何改变突变类型和突变密码子的三核苷酸结构内突变的优选靶位点中的任意一种或两种。这是为了调查这些脱氨酶的多态性质,为了了解5'端(5')或3'端(3')核苷酸上下文的变化可能如何改变突变密码子(mc)中的优选靶位点和/或所产生的突变类型。
[0206]
包括这两个步骤以确保tsm分析方法能够鉴定dbd的不同同种型,并且指示限定任何一种同种型的结合结构域的高特异性靶基序的可能的最佳长度。
[0207]
实施例2
[0208]
tsm特征指示aid/apobec3g/apobec3b和adar1脱氨酶活性
[0209]
针对aid(wrcg/cgyw,其中w=a/t;y=t/c;和r=a/g)、apobec3g(ccg/cgg)、apobec3b(tcg/cga)和adar1(way,其中w=a/t;y=t/c)的选定基序的tsm特征示于表5中。各基序突变偏离预期的统计学显著性卡方水平示于3
×
3数据集中。所有3
×
3数据集均显示对特定类型的突变和优选的靶位置有强烈的优先性,显著水平p《0.001(8df)。重要的是要
注意,尽管已知每种脱氨酶都存在dbd的同种型,但是选择了每种脱氨酶的优势dbd的基序以确保所选择的脱氨酶之间无重叠。
[0210]
表5
[0211]
鉴定的c-pas和密码子上下文
[0212]
[0213][0214][0215]
表5中的数据揭示了高度显著的密码子偏好性模式,这对于浆液性卵巢腺癌样品
先前未有报道。在每种情况下,所观察到的与零假设的偏差非常显著。对于aid和apobec3g基序,对于nts上的胞苷脱氨基作用的统计学显著的mc-1偏好性导致c至t转变占优势数量,对于ts上的胞苷脱氨基作用的mc-2偏好性导致g至a转变占优势数量。对于三核苷酸adar基序way,优势突变类型是优先靶向mc-2位点的g至a转变。这些体细胞突变靶标与之前对于汇集的乳腺癌突变数据的tp53基因突变的研究一致(参见lindley,2013)。
[0216]
此外,图1提供了关于以下的图解表示,即,随着核苷酸数目从三个核苷酸逐渐增加至六个核苷酸,基序对aid催化结构域的靶向特异性增加。图1a的图表显示了随着每个基序的靶向优先性增加,背景突变的相对数目是如何减少的。发生在mc-2位点的g至a突变的数目从对于三个核苷酸基序gyw的所有鸟苷突变的52%,增加到六个核苷酸基序scgyww的所有鸟苷突变的91%。包括如下表格:该表格显示了关于鸟苷的可能突变范围(g至a/c/t)和mc结构内靶位点的3
×
3tsm突变分布(参见图1b)。示出了各基序突变偏离预期的统计显著性卡方水平,显著性水平p《0.001(8df)。
[0217]
从这些数据得出的主要结论是,aid结合结构域的靶向优先性最好由四个或更多个核苷酸的基序限定。即,靶向突变位点的生物化学结合机制具有高度特异性,并且其涉及比先前研究所提示的更多的核苷酸。该实例使用众所周知的aid的三核苷酸基序作为起点,还验证了使用tsm分析作为一种可用的方法,来表征其他脱氨酶中可能范围的靶向优先性的变体同构性质。因此,tsm方法学还提供了一种有用的概念工具来测试关于参与脱氨作用的潜在的三维生物分子相互作用的性质的新预测。
[0218]
实施例3
[0219]
dbd的不同同种型导致靶标位点不同
[0220]
为了验证adar dbd的不同同种型可能会导致靶向优先性转变,对具有wa或aw碱基组成的一系列adar基序的靶标优先性进行了鉴定和比较。我们还使用三核苷酸碱基基序wrc/gyw为aid脱氨酶结构域的可能同种型鉴定了mc核苷酸结构内的优选靶核苷酸位置的位置转变。结果示于表6中。各基序突变偏离预期的统计学显著性卡方水平示于3
×
3数据集中,显著性水平p《0.001(8df)。
[0221]
表6
[0222]
鉴定的c-pas和密码子上下文
[0223][0224][0225]
参考表6,可以看出,不同dbd的体细胞靶向优先性可能导致产生的优势突变类型改变,或者mc核苷酸结构内优选靶位点的转变,或这两者均有可能。
[0226]
使用浆液性卵巢腺癌样品作为实例,表6显示了观察到关于adar脱氨酶活性关闭cwa基序的优势tsm模式,其导致在mc-2位点处的a至g突变(p=5.21e-55;8df)。类似地,对于aid脱氨酶活性关闭scgyw基序,在mc-2位点处的g至a突变占优势数目(p=1.13e-91;
8df)。在与aid脱氨酶活性相关的dbd同种型关闭gyw基序的情况下,scgyw导致靶向mc-2位点的g至a突变占优势数目(p=1.13e-91,8df)。然而,通过引入c至a的单核苷酸变化,sagyw基序导致靶向mc-3位点的g至c突变占优势数目(p=6.13e-05,8df)。类似地,通过引入c至g的单核苷酸变化,wggyw基序导致靶向mc-1位点的g至t突变占优势数目(p=4.77e-08,8df)。核上下文的其他变化也表明,针对突变类型和/或mc内靶位点产生了靶位点区分。可以得出结论,tsm方法可以用于鉴定限定单个脱氨酶的催化结合结构域的可能同种型的不同靶向优先性。
[0227]
这些数据清楚地表明,选择和转换机制在体细胞组织中的脱氨酶靶位点选择中起作用,并且shm样变化的启动参与致癌过程。这意味着,本文描述的tsm方法可用于表征肿瘤发生期间dbd的差异,并确定它们对靶位点优先性和产生的突变类型的影响。因此,我们试图使用浆液性卵巢腺癌数据作为训练数据集来鉴定可能与疾病进展相关的特定dbd。
[0228]
实例4:
[0229]
鉴定c-pas及其在预测复发/预后中的用途
[0230]
使用tsm方法,我们在浆液性卵巢腺癌样品中鉴定了几种与疾病进展指标相关的dbd。这些dbd符合上述关键选择标准(参见实施例1),并且随后在本文被称为癌症进展相关性标记(c-pas)。本文鉴定的c-pas由其各自基序的核苷酸序列限定,从而鉴定负责引入新生突变(de novo mutation)的特定脱氨酶结合位点。可获得临床信息的疾病进展指标包括疾病阶段和无病存活时间。表7显示了与aid,apobec3g,apobec3b和adar脱氨酶活性相关的脱氨酶靶基序,发现其与这些癌症进展指标相关。这些脱氨酶中的每一种都是无处不在的,因为已知它们在肿瘤发生中起作用,并且它们存在于所有(或几乎所有)体细胞组织类型中。
[0231]
参照表7,对于在初次诊断后60个月内没有疾病复发的存活患者队列,每个样品的关闭c-pas的平均突变数为0.50。对于从初次诊断后60个月内复发过的患者队列,每个样品的平均突变数增加3倍以上至1.87。对各队列每个样品的c-pas平均突变数目进行比较,皮尔逊积差相关系数(pearson product moment correlation)(r)为0.68(在p《0.001水平显著)。这些数据表明,c-pas能够用于确定疾病在初始诊断后五年内复发的可能性。
[0232]
表7针对复发和预后的c-pas
[0233]
[0234]
[0235][0236]
当通过癌症或肿瘤阶段来比较每个样品的平均突变数目时,发现iia-iiib期每个样品的平均突变数目是3.1。iiic期每个样品鉴定的c-pas的平均突变数为4.1,并且iv期为3.2。在将iia-iiib期的每个样品的平均突变数与iiic期进行比较时,皮尔逊积差相关系数r为0.28(在p n《0.05水平不显著)。然而,当将iiic期的每个样品的平均突变数与iv期样品进行比较时,皮尔逊积差相关系数r为0.69(在p《0.001水平有显著性)。
[0237]
出乎意料的是,与iiic期样品相比,iv阶段的本研究中所包括的一组c-pas的平均突变数目显著更低。这种下降可以由用来调用单核苷酸变体(snv)的组织取样方法来解释。在明显正常或健康的组织中的体细胞基因组变异可影响肿瘤发生,尽管这如何发生知之甚少。tomasetti等人(2013)已经表明,在肿瘤发展之前,癌症中可能已经出现了半数或更多单点突变。最近,martincorena等人(2015)发现超过四分之一的表面上健康的人类表皮皮肤细胞具有致癌体细胞突变。一旦tsm过程在表面上正常的组织中变得活跃,那么组织中的个体体细胞就很可能具有多种多样的遗传变化。iv期晚期癌症中的表面上健康的组织可能具有许多与在iiic期鉴定的c-pas相关的突变。因此,tcga用于调用snv的组织匹配方法可能会排除在两个样品中都鉴定出来的那些变体。这意味着许多与c-pas相关的突变可能会从所产生的突变数据集中排除,并可能部分地解释这种下降。然而,总体而言,这些结果及其意义支持以下概念:在iiic期晚期癌症中shm样“切换机制(switching mechanism)”可能被激活,并触发新dbd的产生。
[0238]
根据表6中的结果,使用已鉴定的c-pas来探测其在预后测定中的功效,以预测哪些患者的疾病可能复发或进展。虽然用于调用snv的方法存在一些局限性,但是c-pas的训练数据集被用作“首次通过(first pass)”参考测试,以试图区分那些在初始诊断五年内将发生复发的患者和那些不会复发的患者。
[0239]
对于每个样品,对每个已鉴定的c-pas的基序处发生的突变数目进行制表。如果在任意已鉴定的c-pas中未发生突变,则记录为阴性测试结果,如果存在一个或多个突变,则记录为阳性。未提供每个样品的突变数据和测试结果。
[0240]
图2示出了卡普兰-迈耶图,其预测具有阳性测试结果的高级别浆液性卵巢腺癌样品的无病存活时间,并与具有阴性测试结果的那些进行比较。两个队列之间的测试结果差异非常显著。cox p值为1.57e-05,log-rank p值为7.86e-07。图2中还包括灵敏度和特异性量度。收集以下数据:在最后一次访问时所记录的无进展存活时间小于60个月的52个样本,无进展存活数据缺失的31个样本,和来自一名个体的一个样本,该名个体因未知死亡原因已故,从这些分析中去除。参考图2,仅有12%的阳性测试结果患者在30个月后没有疾病复发。60个月后,96名阳性测试结果患者中仅有一名患者没有疾病复发。结果证明了tsm分析方法在预测疾病复发概率方面的潜在临床效用。参照图2所示的测试的灵敏度和特异性量
度,灵敏度量度为95%,特异性为90%。
[0241]
该实施例证明,含有一个或多个核苷酸变化的dbd同种型将导致靶位点不同,并且所得到的转化可用于鉴定肿瘤发生过程中出现的新的dbd同种型。还证明,已鉴定的c-pas为开发新型基因测试方法以预测疾病进展的可能性提供了基础。本实施例中公开的方法为我们提供了基本上全新的基因组分析工具包(toolkit),用于鉴定在肿瘤发生期间个体中出现的同构形式的dbd中的一些重要差异。tsm分析可用于提供重要信息,用于诊断与脱氨酶活性异常相关的疾病。
[0242]
实施例5:
[0243]
鉴定急性髓性白血病(aml)中的c-pas
[0244]
为了进一步证明本发明应用的概念实例,评估了从影响不同组织类型的癌症样品(即急性骨髓性白血病(aml))中获得的样品的临床相关c-pas。表8提供了样品数目的总结,为此公开提供了临床记录和匹配序列数据。
[0245]
表8
[0246]
备选癌症样品的临床数据
[0247]
癌症类型无肿瘤复发/进展总计使用总样品卵巢癌10100110197aml1686102103
[0248]
从tcga突变文档中提取vcf格式的单核苷酸变体(突变)信息。忽略了其他变体,如插入/删除或结构变体。使用专有的在线密码子参考信息系统(codon reference information system)(或“cris”处理器)分析符合组选择标准的样品。使用.vcf数据文件的基因组坐标确定了snv的外显子环境。如果snv在外显子的ensembl hg38编码序列(cds)内具有三个碱基对或更多碱基对,则报告编码序列的链和相。分析由内含子/外显子边界区域的三个碱基对限定的区域内的snv的密码子上下文,以避免结合基序的不确定性。如果鉴定出多于一个外显子,则选择规范转录本顺序的外显子。
[0249]
在snv位置附近分析9个碱基的基因组窗口以鉴定各密码子的三个核苷酸结构内snv任一侧的碱基。完整的三个密码子是在第一、第二或第三核苷酸位置(从5-端(5')向5-端(3')阅读,并分别标注为mc-1、mc-2和mc-3)含有突变的突变密码子(mc),在突变密码子两旁的5'和3'密码子。如果snv位于基因的负链上,则提取三个密码子的反向互补序列。
[0250]
cris处理器用来进行基序搜索,以搜索已知与脱氨酶的dna/rna靶向优先性相关的主要靶基序(例如,aid(wrc/gyw),adar1(wa/tw),apobec3g(cc/gg)和apobec3b(tca/tga))。延伸至4-5个nt的标准和非重叠基序也用于搜索用于snv的aid,adar1,apobec3g和apobec3b基序。针对每个密码子和每种突变类型列出结果。
[0251]
更具体地,该实施例公开了突变数据分析的代表性计算机(in silico)方法:(i)鉴定在急性骨髓性白血病(aml)肿瘤发生期间出现的突变的可能来源;以及(ii)鉴定新型突变标记用于预测无进展存活。如上所述,在从最初诊断时开始不到60个月内疾病进展或复发的患者队列中,所鉴定的用于预测无进展存活的新c-pas的数量显著更高。也就是说,在本实施例中被鉴定出来并用作测定开发基础的新型突变标记是那些apobec/adar dbd同系物,其对60个月以上的存活的阴性预测是决定性的。c-pas的子集被用作测试来区分那些在60个月内病情进展(或复发)的病人与那些无病的病人。
[0252]
在这个实施例中,描述了一种方法,其使用经鉴定的c-pas的一个子集来开发预测癌症复发可能性的测定法。本研究使用的临床信息通过查询单个癌症研究获自cbioportal网站(www.cbioportal.org/data_sets.jsp;2015年12月20日访问)。选择了tcga aml(参见,tcga,new eng.j.med.res.,2013)。在这项研究中,使用全基因组测序(50例)或全外显子组测序(150例)以及rna和microrna测序和dna甲基化分析,对200例临床注释的新发aml成人病例的基因组进行了分析。在2016年2月4-8日,访问并下载了tcga样品和患者id、每个患者的相应cosmic.vcf突变数据文件。
[0253]
选择针对样品的一个子集的选择标准以纳入本研究,使用以下选择标准:(i)临床数据表的可用性,其包括:tcga标识符,最后一次访视时的疾病状态,存活状态(存活/已死亡),无病状态(无病/复发或进展)和无病月数;以及(ii)匹配tcga标识符的cosmic.vcf突变数据文件的可用性。临床数据还可以用于包括以下两队中任意一队的患者:保持无病状态超过60个月并且“存活”的患者;以及在60个月或更短时间内癌症复发和/或进展的患者。
[0254]
表9显示使用先前描述的方法从aml突变数据集中鉴定c-pas。在这个实施例中,显示了具有至少一个或多个c-pas突变的患者数目,而不是每个比较队列的突变数目。c-pas由突变类型、靶标基序和其密码子上下文指示,其中mc1-3指示突变核苷酸的位置(从5
’‑
端向3
’‑
端阅读)。
[0255]
表9
[0256]
显示了每个c-pas的突变数目的制表结果
[0257]
[0258][0259]
表9示出了样品的一个子集的制表结果,其表示了各样品中发现的每个c-pas的总突变数目。选定的c-pas小组用于开发一种预测性测试,来预测aml在60个月时间框架内的复发或进展。如果在指示与疾病进展或复发相关的c-pas的位点处存在突变,则认为测试结果为阳性结果。也就是说,阳性测试结果表示疾病将在60个月内复发和/或进展的可能性很高。如果在已知与癌症进展和/或复发相关的位点处没有发现突变(或等于或少于当突变随机发生时所预期的),则报告为阴性测试结果。
[0260]
本文引用的每个专利、专利申请和出版物的公开内容在此通过引用整体并入本文。
[0261]
本文任何参考文献的引用不应被解释为承认这种参考文献可作为本技术的“现有技术”。
[0262]
在整个说明书中,目的是为了描述本发明的优选实施方案,而非将本发明限制于特征的任何一种实施方案或特定集合。因此,本领域技术人员将认识到,鉴于本公开,可以在示例性特定实施方案中进行各种修改和改变而不脱离本发明的范围。所有这些修改和变化都包括在所附权利要求的范围内。
[0263]
参考文献
[0264]
bass,rna editing by adenosine deaminases that act on rna,ann.rev.biochem.,71:817-846.2002
[0265]
basu,u.,meng,f.l.,keim,c.,grinstein,v.,pefanis,e.,eccleston,j.,zhang,t.,myers,d.,wasserman,c.r.,wesemann,d.r.,januszyk,k.,gregory,r.i.,deng,h.,lima,c.d.,the rna exosome targets the aid cytidine deaminase to both strands of transcribed duplex dna substrates,cell,2011,144(3):353-63.
[0266]
beale,r.c.,petersen-mahrt,s.k.,watt,i.n.,harris,r.s.,rada,c.,neuberger,m.s.,comparison of the differential context-dependence of dna deamination by apobec enzymes:correlation with mutation spectra in vivo,j.mol.biol.,2004,337(3):585-96.
[0267]
burns,m.b.,lackey,l.,carpenter,m.a.,rathore,a.,land,a.m.,leonard,b.,refsland,e.w.,kotandeniya,d.,tretyakova,n.,nikas,j.b.,yee,d.,temiz,n.a.,donohue,d.e.,mcdougle,r.m.,brown,w.l.,law,e.k.,harris,r.s.,apobec3bis an enzymatic source of mutation in breast cancer,nature,2013,494(7437):366-70.
[0268]
burns,m.b.,temiz,n.a.,harris,r.s.,evidence for apobec3b mutagenesis inmultiple human cancers,nat genet.,2013,45(9):977-83.
[0269]
chan,t.h.,lin,c.h.,qi,l.,fei,j.,li,y.,yong,k.j.,liu,m.,song,y.,chow,r.k.,ng,v.h.,yuan,y.f.,tenen,d.g.,guan,x.y.,chen,l.,a disrupted rna editingbalance mediated by adars(adenosine deaminases that act on rna)in humanhepatocellular carcinoma,2014,gut,63(5):832-43.
[0270]
contilcello,s.g.,the aid/apobec family of nucleic acid mutators,
genes,dnarepair(amst),2010,9(6):600-3.
[0293]
tomasetti c.,vogelstein b.,parmigiani g.,half or more of the somatic mutations incancers of self-renewing tissues originate prior to tumour initiation,proc.natl.acad.sci.usa.,2013。

技术特征:
1.一种用于确定受试者将复发癌症的可能性的处理系统,所述处理系统包括微处理器、存储器、输入/输出设备,以及一个外部接口,其经由总线互连,其中,所述微处理器执行所述存储器中存储的应用软件形式的指令,以执行以下处理:分析从受试者获得的生物样品中的核酸分子的序列,从而对于在被诱变剂识别或靶向的一个或多个基序处的突变类型的多个突变,确定这些突变的密码子上下文,从而鉴定核酸分子中多个突变密码子中的每一个的突变位置和突变类型,其中通过确定单个突变发生在相应突变密码子的三个位置中的哪个位置来确定单个突变的密码子上下文;以及当在多个突变密码子中的三个位置之一处的突变类型的突变水平高于与癌症复发相关的预定阈值时,确定所述受试者可能复发癌症,其中所述诱变剂选自由aid、aprobec3b、apobec3g和adar组成的组,所述基序是癌症进展相关性标记(c-pas),并且所述突变类型是构成所述突变的具体的核苷酸取代,其中在以下情况下癌症被确定为可能复发:当在核酸分子mc-1位点处的tcga基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-3位点处的atcs基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的gcggc基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的ccgx基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的zccg基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的sggrr基序中观察到的g至a突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的tccg基序中观察到的c至t突变的数目或百分比高于预期时;当在核酸分子mc-2位点处的gcgc基序中观察到的g至a突变的数目或百分比高于预期时;当在核酸分子mc-2位点处的ccggc基序中观察到的g至a突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的rawa基序中观察到的a至t突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的wtaw基序中观察到的a至g突变的数目或百分比高于预期时;当在核酸分子mc-1位点处的sara基序中观察到的a至g突变的数目或百分比高于预期时;当在核酸分子mc-2位点处的twty基序中观察到的t至c突变的数目或百分比高于预期时;和/或当在核酸分子mc-3位点处的twty基序中观察到的t至c突变的数目或百分比高于预期
时。2.根据权利要求1所述的处理系统,其中所述adar是adar1或adar2。3.根据权利要求1或权利要求2所述的处理系统,其中所述生物样品含有这样的组织:该组织具有癌症或肿瘤,或处于发展为癌症或肿瘤的风险。4.根据权利要求1至3中任意一项所述的处理系统,其中所述癌症是卵巢癌。5.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的wrcgss基序中c至t突变的水平超过预定阈值时,确定癌症可能复发。6.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的tcga基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。7.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-3位点处的atcs基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。8.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的gcggc基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。9.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的ccgx基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。10.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的zccs基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。11.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的sggrr基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。12.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的tccg基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。13.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-2位点处的gcgc基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。14.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-2位点处的ccggc基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。15.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的rawa基序中a至t突变的水平超过预定阈值时,做出癌症可能复发的确定。16.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的wtaw基序中a至g突变的水平超过预定阈值时,做出癌症可能复发的确定。17.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-1位点处的sara基序中a至g突变的水平超过预定阈值时,做出癌症可能复发的确定。18.根据权利要求4所述的处理系统,其中当所述核酸分子的mc-2位点处的twty基序中t至c突变的水平超过预定阈值时,做出癌症可能复发的确定。19.根据权利要求3所述的处理系统,其中当所述核酸分子的mc-3位点处的twty基序中t至c突变的水平超过预定阈值时,做出癌症可能复发的确定。20.根据权利要求1至3中任意一项所述的处理系统,其中所述癌症是急性骨髓性白血病(aml)。21.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-1位点处的ccz基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。
22.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-2位点处的swcs基序中c至t突变的水平超过预定阈值时,做出癌症可能复发的确定。23.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-3位点处的xngns基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。24.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-2位点处的gsa基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。25.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-1位点处的sgxw基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。26.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-3位点处的cxgs基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。27.根据权利要求19所述的处理系统,其中当来自生物样品的核酸分子的mc-3位点处的yxgnx基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。28.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-3位点处的yygnx基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。29.根据权利要求20所述的处理系统,其中当来自生物样品的核酸分子的mc-1位点处的wngnz基序中g至a突变的水平超过预定阈值时,做出癌症可能复发的确定。30.根据权利要求1至29中任一项所述的处理系统,其中所述生物样品具有大于1.87个突变意味着癌症或肿瘤可能会复发。31.根据权利要求30所述的处理系统,其中所述复发将可能在60个月内发生。32.根据权利要求1至3中任一项所述的处理系统,其中所述生物样品从受癌症影响的组织类型中获得。33.根据权利要求32所述的处理系统,其中所述生物样品含有是卵巢、乳腺、前列腺、肝、结肠、胃、胰腺、皮肤、甲状腺、子宫颈、淋巴、造血系统、膀胱、肺、肾、直肠、子宫和头部或颈部组织或细胞。34.根据权利要求1至3中任一项所述的处理系统,其中所述癌症选自乳腺癌、前列腺癌、肝癌、结肠癌、胃癌、胰腺癌、皮肤癌、甲状腺癌、宫颈癌、淋巴癌、造血系统癌、膀胱癌、肺癌、肾癌、直肠癌、卵巢癌、子宫癌和头颈癌。35.一种鉴定癌症进展相关性标记(c-pas)的处理系统,所述癌症进展相关性标记指示受试者复发癌症的可能性,所述处理系统包括微处理器、存储器、输入/输出设备,以及一个外部接口,其经由总线互连,其中,所述微处理器执行所述存储器中存储的应用软件形式的指令,以执行以下处理:分析第一受试者组的核酸序列,从而对于在被诱变剂识别或靶向的一个或多个基序处的突变类型的多个突变,确定这些突变的密码子上下文,从而鉴定核酸序列中多个突变密码子中的每一个的突变位置和突变类型,其中通过确定单个突变发生在相应突变密码子的三个位置中的哪个位置来确定单个突变的密码子上下文,其中第一受试者组由患有或先前患有癌症的受试者组成;当在多个突变密码子中三个位置之一处的突变类型的突变水平高于当突变随机发生且独立于密码子上下文时所产生的预期数目时,确定已发生靶向体细胞突变(tsm);以及当tsm或包括tsm的核酸序列能够区分第二受试者组和第三受试者组时,将tsm鉴定为
是c-pas基序的一部分,其中第二受试者组由患有癌症或已知癌症复发的受试者组成,并且第三受试者组由已知癌症没有复发的受试者组成;其中,所述诱变剂选自由aid、apobec3b、apobec3g和adar组成的组;并且所述突变类型是构成所述突变的具体的核苷酸取代。

技术总结
公开了检测癌症复发可能性的方法。更具体地,本发明公开了鉴定与癌症复发可能性相关的核酸标记的方法,以及使用这种标记的方法。以及使用这种标记的方法。以及使用这种标记的方法。


技术研发人员:罗宾
受保护的技术使用者:GMDX私人有限公司
技术研发日:2016.08.26
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐