植物调控元件及其用于自动切除的用途的制作方法

未命名 08-05 阅读:83 评论:0

植物调控元件及其用于自动切除的用途
1.相关申请的引用
2.本技术要求2020年10月20日提交的美国临时申请第63/093,893号的权益,所述临时申请以引用的方式整体并入本文。
3.序列表的并入
4.名称为“mons512wo_st25.txt”的文件中包含的序列表为111,683字节(如在microsoft中测量),创建于2021年10月18日,将其以电子提交方式一起提交并通过引用并入本文。
发明领域
5.本发明涉及植物分子生物学和植物基因工程领域。更具体地说,本发明涉及用于调节植物中的位点特异性重组酶基因表达的dna分子。


背景技术:

6.调控元件是通过调节可操作连接的可转录dna序列的转录来调控基因活性的遗传元件。这样的元件可包括启动子、前导序列、内含子和3'非翻译区,可用于植物分子生物学和植物基因工程领域。
7.转基因技术的使用为农业目的提供了许多有益性状,但也遇到了一些挑战。一个关注与转基因作物植物中赋予抗生素或除草剂抗性的标记基因的存在有关。另外,可以有其他转基因盒或dna序列,它们是为特定目的设计的,并且存在于初始转化中,但在最终的转基因产品中并不需要。在植物生物技术领域中,非常希望去除这样的标记基因以及其他不需要的表达盒和dna序列。
8.已经设计了许多策略,用于生成无标记的转基因植物。例如,可以使用双t-dna转化系统或位点特异性重组酶系统进行标记基因表达盒的去除。
9.双t-dna转化系统利用包含两个独立t-dna的二元植物转化载体(双t-dna转化系统)。一个t-dna包含标记基因表达盒。另一个t-dna包含预期保留在转基因植物中的感兴趣的基因的表达盒。可以通过土壤杆菌介导的转化进行植物细胞转化。可以将每个t-dna整合到转化的植物细胞基因组的独立染色体中。在转化和植物再生之后,使r0植物自交,产生r1后代。选择具有包含预期用于最终转基因产物的表达盒的t-dna但缺乏包含标记基因表达盒的t-dna的r1后代植物(参见,例如,komari,t.等人,(1996)vectors carrying two separate t-dnas for co-transformation of higher plants mediated by agrobacterium tumefaciens and segregation of transformants free from selection mark ers,the plant journal,10(1):165-174)。双t-dna转化系统在效率方面有一些缺点。在双t-dna转化系统中,转化体r0植物可以具有一个或两个t-dna的一个以上的拷贝,其可能必须被排除,并且仅具有每个t-dna的一个拷贝的通过选择的植物的百分比可能是低的。
10.从转基因植物去除标记基因表达盒的另一种系统依赖于通过使用位点特异性重
组酶进行的切除。可以使用许多位点特异性重组酶,比如cre-重组酶、flp-重组酶(lyznik,l.等人,(2000)gene transfer mediat ed by site-specific recombination systems,plant molecular biology manual n1,1-26)、r-重组酶(machida,c.等人,(2000)use of the r-rs site-specific recombination system in plants,plant molecular biol ogy manual n2,1-23)或gin-重组酶(maeser,s.等人,(1991)。噬菌体mu的gin重组酶可以催化植物原生质体中的位点特异性重组,mol gen genet,230:170-176)。实质上,在诸如t-dna插入的构建体中,标记基因表达盒的两侧是位点特异性重组酶识别序列,使得在位点特异性重组酶识别序列之间的构建体序列可以通过表达所述重组酶而被切除。预期在切除之后保留在转基因植物中的表达盒存在于构建体中,在所述构建体的位点特异性重组酶识别序列之外。
11.可以使用杂交策略或通过自动切除来完成两侧为位点特异性重组酶识别序列的表达盒的去除。在杂交策略中,将对于构建体的存在而言优选纯合的植物(例如,r1后代)与用用于表达位点特异性重组酶的表达盒转化的另一转基因植物系杂交。然后针对构建体的存在选择所得的f1后代,所述构建体已使得两侧为位点特异性重组酶识别序列的表达盒被切除。在自动切除的情况下,编码位点特异性重组酶的另一个表达盒存在于构建体中,其中其他表达盒将在位点特异性重组酶识别序列之间或两侧被切除,使得所有这样的表达盒被位点特异性重组酶切除。在特定类型的细胞或组织中,启动子通常对于驱动表达具有偏好或特异性。并非所有启动子和表达元件都适合于有效的自动切除,需要大量实验来鉴定驱动重组酶表达的正确启动子以及调节重组酶表达的另外的表达元件,比如内含子和3

utr,以实现希望的切除频率和结果。
12.需要在作物植物中驱动有效自动切除的表达元件。本公开提供了通过多年实验鉴定的几种表达元件,这些表达元件可用于转化后在许多作物物种中驱动重组酶的表达并产生标记和/或重组酶转基因以及可能的其他表达盒的有效自动切除。


技术实现要素:

13.本发明提供了用于植物中驱动位点特异性重组酶的基因调控元件,其将导致标记基因表达盒以及用于基因组编辑的表达盒的有效自动切除。本发明还提供了包含所述调控元件的重组dna分子构建体。本发明还提供了包含所述调控元件的构建体。在一个实施方案中,所述调控元件可操作地连接至位点特异性重组酶。在某些实施方案中,所述调控元件是减数分裂启动子。在其他实施方案中,所述调控元件包含在包含至少三个转基因盒的构建体中。本发明还提供了使用调控元件以及制备和使用包含所述调控元件的重组dna分子和构建体的方法。
14.因而,在一个方面,本发明提供了一种重组dna分子,其包含选自由以下组成的组的dna调控序列:(a)与seq id no:1-26、59-62和64-66中任一个具有至少约80%序列同一性的序列;(b)包含seq id no:1-26、59-62和64-66中任一个的序列;以及(c)(i)seq id no:1-26、59-62和64-66中任一个或(ii)与seq id no:1-26、59-62和64-66中任一个具有至少80%序列同一性的任何序列的片段,其中所述片段具有基因调控活性;其中所述序列可操作地连接至编码位点特异性重组酶的异源可转录dna序列。在特定实施方案中,重组dna分子包含与seq id no:1-26、59-62和64-66中任一个的dna序列具有至少约80%、至少约
81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的dna调控序列。在具体实施方案中,dna调控序列包括具有基因调控活性的调控元件。在一些实施方案中,调控元件包括启动子。仍然在其他实施方案中,调控元件包括内含子。仍然在其他实施方案中,调控元件包括3

utr。仍然在其他实施方案中,dna调控序列是种系偏好启动子。在其他实施方案中,种系偏好启动子选自由以下组成的组:seq id no:2、seq id no:5、seq id no:7、seq id no:10、seq id no:13、seq id no:14、seq id no:17、seq id no:21和seq id no:65。在其他实施方案中,种系偏好启动子是cdc45启动子。在又进一步的实施方案中,cdc45启动子选自由以下组成的组:seq id no:2、seq id no:5和seq id no:10,以及与seq id no:2、5、7、10、13、14、17、21和65中任一个具有至少80%序列同一性的序列。仍然在其他实施方案中,dna调控序列是胚偏好启动子。在其他实施方案中,dna调控序列是seq id no:60或与seq id no:60具有至少80%序列同一性的序列。仍然在其他实施方案中,异源可转录dna序列包含编码位点特异性重组酶的基因。在其他实施方案中,位点特异性重组酶选自由以下组成的组:cre-重组酶、flp-重组酶、r-重组酶和gin-重组酶。在又另一个实施方案中,位点特异性重组酶是cre-重组酶。
15.在另一方面,重组dna构建体进一步包含以下表达盒中的一种或两种:选择标记转基因;和/或有农艺学利益的转基因。在另一个实施方案中,重组dna构建体进一步包含位于编码位点特异性重组酶和/或选择标记转基因的一个或两个可转录dna序列两侧的一对位点特异性重组位点序列,其中所述位点特异性重组位点可以被所述位点特异性重组酶切割。在进一步的实施方案中,重组dna构建体的选择标记转基因赋予对除草剂或抗生素的抗性。在其他实施方案中,重组dna构建体的位点特异性重组位点序列各自选自由以下组成的组:loxp、lox.tata-r9、frt、rs和gix。在具体实施方案中,重组dna构建体的位点特异性重组位点序列各自是loxp或lox.tata-r9位点。在其他实施方案中,重组dna构建体的位点特异性重组位点序列各自包含seq id no:44或seq id no:45。
16.在另一方面,重组dna构建体的有农艺学利益的转基因在植物中赋予除草剂耐受性。在一些实施方案中,重组dna构建体的有农艺学利益的转基因在植物中赋予抗虫性或抗病性。在进一步的实施方案中,重组dna构建体的有农艺学利益的转基因在植物中赋予增加的产率或胁迫耐受性。仍然在其他实施方案中,重组dna构建体的有农艺学利益的转基因编码dsrna、mirna或sirna。
17.在另一方面,重组dna构建体进一步包含以下一种或两种:编码指导rna的表达盒;和/或编码位点特异性核酸酶的表达盒。重组dna构建体还包含位于编码所述位点特异性重组酶的一个或多个可转录dna序列两侧的位点特异性重组位点序列、选择标记转基因、编码所述指导rna的表达盒和/或编码所述位点特异性核酸酶的表达盒,其中所述位点特异性重组位点可以被所述位点特异性重组酶切割。在进一步的实施方案中,指导rna包含靶向序列,其靶向真核细胞基因组中的序列以进行基因组编辑或位点特异性整合。在另一个实施方案中,真核细胞是植物细胞。在又另一个实施方案中,重组dna构建体包含两个或更多个编码两个或更多个指导rna的表达盒。在一个另外的实施方案中,重组dna构建体包含两个、三个、四个、五个、六个、七个、八个、九个或十个不同的编码指导rna的表达盒。在进一步的
实施方案中,位点特异性核酸酶是rna指导的核酸内切酶或crispr相关核酸酶。在另一个实施方案中,所述rna指导的核酸内切酶或crispr相关核酸酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、cpf1、cys1、cys2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、casx和casy。在具体实施方案中,所述rna指导的核酸内切酶或crispr相关核酸酶是cpf1或cas9。
18.在另一方面,本文提供了包含重组dna构建体的dna分子或载体。在另一个实施方案中,dna转化载体包含重组dna构建体和以左边界和右边界为界的t-dna区段。在进一步的实施方案中,编码位点特异性重组酶的可转录dna序列位于dna转化载体内的t-dna区段的左边界和右边界之间。在又另一个实施方案中,dna转化载体包含重组dna构建体和具有左边界和右边界的t-dna区段,其中编码位点特异性重组酶的可转录dna序列、选择标记转基因和/或有农艺学利益的转基因中的一种或多种位于t-dna区段的左边界和右边界之间。在进一步的实施方案中,dna转化载体包含重组dna构建体和具有左边界和右边界的t-dna区段,其中编码位点特异性重组酶的可转录dna序列、选择标记转基因、有农艺学利益的转基因、编码指导rna的表达盒和/或编码位点特异性核酸酶的表达盒中的一种或多种位于t-dna区段的左边界和右边界之间。
19.在另一方面,本文提供了包含重组dna构建体的转基因植物、植物部分或植物细胞。将重组dna构建体稳定转化到转基因植物、植物部分或植物细胞的基因组中。转基因植物、植物部分或植物细胞是玉米、大豆、棉花或芥花植物、植物部分或植物细胞。本文还提供了包含重组dna构建体或转化载体的细菌细胞。
20.在另一方面,本文提供了一种用于产生转基因植物或植物部分的方法,其包括(a)用包含重组dna构建体的dna分子或载体转化外植体的植物细胞以产生一个或多个转化的植物细胞,其包含稳定转化到所述一个或多个转化的植物细胞的基因组中的所述重组dna构建体;(b)从外植体再生或产生转基因植物,其中所述转基因植物包含稳定转化到所述转基因植物的一个或多个细胞的基因组中的重组dna构建体。在一个实施方案中,经由土壤杆菌介导的转化或根瘤菌介导的转化来转化植物细胞。在另一个实施方案中,经由微粒介导的转化或粒子轰击介导的转化来转化植物细胞。在又另一个实施方案中,转基因植物和植物细胞分别是玉米、大豆、棉花或芥花植物和植物细胞。在又另一个实施方案中,所述方法进一步包括:(c)从所述转基因植物分离或收获植物部分。
21.在另一方面,本文提供了一种从转基因植物的基因组切除表达盒的方法,所述方法包括:(a)用包含权利要求13-30中任一项所述的重组dna构建体的dna分子或载体转化植物细胞,以产生一个或多个转化的植物细胞,其包含稳定转化到所述一个或多个转化的植物细胞的基因组中的重组dna构建体;(b)至少部分地从所述一个或多个稳定转化的植物细胞再生或产生转基因植物;(c)使所述转基因植物与其自身或另一植物杂交;和(d)选择一个或多个后代植物,在所述一个或多个后代植物中编码位点特异性重组酶的可转录dna序列和/或在重组dna构建体的位点特异性重组位点序列对之间的选择标记转基因中的一种或两种被切除并且不再存在于所述后代植物的基因组中。在所述方法的进一步实施方案中,重组dna构建体进一步包含位于所述重组dna构建体的位点特异性重组位点序列对之间
的以下表达盒的一种或两种:编码指导rna的表达盒和/或编码位点特异性核酸酶的表达盒,并且其中选择一个或多个后代植物,在所述一个或多个后代植物中编码位点特异性重组酶的可转录dna序列、选择标记转基因、编码指导rna的表达盒和/或编码重组dna构建体的位点特异性核酸酶的表达盒中的一种或多种被切除并且不再存在于所述后代植物的基因组中。在具体实施方案中,转基因植物和植物细胞分别是玉米、大豆、棉花或芥花植物和植物细胞。在另一个实施方案中,所述方法进一步包括(e)从后代植物中的一个或多个分离或收获植物部分。在又另一个实施方案中,所述方法进一步包括(f)使后代植物中的一个或多个与自身或另一植物杂交。
22.序列简述
23.seq id no:1是调控表达元件组(exp)exp-zm.cdc45-1+zm.dna k:1:1的dna序列,其包含启动子(p-zm.cdc45-1:8),所述启动子可操作地连接至前导序列(l-zm.cdc45-1:1)的5

,所述前导序列可操作地连接至内含子(i-zm.dnak:1)的5


24.seq id no:2是启动子(p-zm.cdc45-1:8)的dna序列。
25.seq id no:3是前导序列(l-zm.cdc45-1:1)的dna序列。
26.seq id no:4是exp(exp-os.cdc45-1:1:1)的dna序列,其包含启动子(p-os.cdc45-1-1:1:1),所述启动子可操作地连接至前导序列(l-os.cdc45-1-1:1:1)的5


27.seq id no:5是启动子(p-os.cdc45-1-1:1:1)的dna序列。
28.seq id no:6是前导序列(l-zm.cdc45-1:1)的dna序列。
29.seq id no:7是exp(exp-at.mei1)的dna序列,其由启动子和前导序列组成。
30.seq id no:8是3

utr(t-at.mei1-1:2:1)的dna序列。
31.seq id no:9是exp(exp-at.cdc45:1:1)的dna序列,其包含启动子(p-at.cdc45-1:1:1),所述启动子可操作地连接至前导序列(l-at.cdc45-1:1:1)的5


32.seq id no:10是启动子(p-at.cdc45-1:1:1:1)的dna序列。
33.seq id no:11是前导序列(l-at.cdc45-1:1:1)的dna序列。
34.seq id no:12是3

utr(t-at.cdc45:1)的dna序列。
35.seq id no:13是exp(exp-at.swi1)的dna序列,其由启动子和前导序列组成。
36.seq id no:14是exp(exp-at.swi1a)的dna序列,其由启动子和前导序列组成。
37.seq id no:15是3

utr(t-at.swi1-1:2:1)的dna序列。
38.seq id no:16是exp(exp-at.asy1:1:1)的dna序列,其包含启动子(p-at.asy1-1:1:1),所述启动子可操作地连接至前导序列(l-at.asy1-1:1:1)的5


39.seq id no:17是启动子(p-at.asy1-1:1:1)的dna序列。
40.seq id no:18是前导序列(l-at.asy1-1:1:1)的dna序列。
41.seq id no:19是3

utr(t-at.asy1-1:1:1)的dna序列。
42.seq id no:20是exp(exp-gm.rsp-1:1)的dna序列,其包含启动子(p-gm.rsp-1-1:1:1),所述启动子可操作地连接至前导序列(l-gm.rsp-1-1:1:1)的5


43.seq id no:21是启动子(p-gm.rsp-1-1:1:1)的dna序列。
44.seq id no:22是前导序列(l-gm.rsp-1-1:1:1)的dna序列。
45.seq id no:23是3

utr(t-at.cdc45:3)的dna序列。
46.seq id no:24是3

utr(t-at.cdc45:4)的dna序列。
47.seq id no:25是exp(exp-gm.rsp-1+gm.rsp-1+at.atpe:1)的dna序列,其包含启动子(p-gm.rsp-1-1:1:1),所述启动子可操作地连接至前导序列(l-gm.rsp-1-1:1:1)的5

,所述前导序列可操作地连接至内含子(i-at.atpe:1)的5


48.seq id no:26是内含子(i-at.atpe:1)的dna序列。
49.seq id no:27是exp(exp-zm.cdc45-2+zm.dnak:1:2)的dna序列,其包含启动子(p-zm.cdc45-2-1:1:3),所述启动子可操作地连接至前导序列(l-zm.cdc45-2-1:1:1)的5

,所述前导序列可操作地连接至内含子(i-zm.dnak:1)的5


50.seq id no:28是启动子(p-zm.cdc45-2-1:1:3)的dna序列。
51.seq id no:29是前导序列(l-zm.cdc45-2-1:1:1)的dna序列。
52.seq id no:30是exp(exp-zm.zm13:2)的dna序列,其包含启动子(p-zm.zm13:2),所述启动子可操作地连接至前导序列(l-zm.zm13:2)的5


53.seq id no:31是启动子(p-zm.zm13:2)的dna序列。
54.seq id no:32是前导序列(l-zm.zm13:2)的dna序列。
55.seq id no:33是exp(exp-zm.waxy+zm.dnak:1:5)的dna序列,其包含启动子(p-zm.waxy-1:1:9),所述启动子可操作地连接至前导序列(p-zm.waxy-1:1:1)的5

,所述前导序列可操作地连接至内含子(i-zm.dnak:1)的5


56.seq id no:34是启动子(p-zm.waxy-1:1:9)的dna序列。
57.seq id no:35是前导序列(l-zm.waxy-1:1:1)的dna序列。
58.seq id no:36是exp(exp-syn1)的dna序列,其由启动子和前导序列组成。
59.seq id no:37是exp(exp-syn1a)的dna序列,其由启动子和前导序列组成。
60.seq id no:38是3

utr(t-at.syn1-1:2:1)的dna序列。
61.seq id no:39是内含子(i-zm.dnak:1)的dna序列。
62.seq id no:40是exp(exp-at.dmc1+zm.dnak:1:1)的dna序列,其包含启动子(p-at.dmc1:1),所述启动子可操作地连接至前导序列(l-at.dmc1-1:1:1)的5

,所述前导序列可操作地连接至内含子(i-zm.dnak:1)的5


63.seq id no:41是启动子(p-at.dmc1:1)的dna序列。
64.seq id no:42是前导序列(l-at.dmc1-1:1:1)的dna序列。
65.seq id no:43是cre-重组酶(cre)的编码序列,其具有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子。
66.seq id no:44是cre-重组酶位点特异性重组位点(rs-p1.lox1:1)的dna序列。
67.seq id no:45是cre-重组酶位点特异性重组位点(rs-p1.lox.ta ta-r9-1:1:1)的dna序列。
68.seq id no:46是exp(exp-os.act1:1:1)的dna序列,其由启动子、前导序列和源自水稻肌动蛋白1基因的内含子组成。
69.seq id no:47是质体靶向的epsps(cp4)的编码序列,其赋予对除草剂草甘膦的耐受性。
70.seq id no:48是3

utr(t-agrtu.nos:13)的dna序列。
71.seq id no:49是exp(exp-os.act1+camv.35s.2xa1-b3+ta.lhc b1:1:1)的dna序列,其由增强的启动子和前导序列组成。
72.seq id no:50是β-葡糖醛酸酶(gus)的编码序列,其具有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子。
73.seq id no:51是3

utr(t-st.pis4-1:4:1)的dna序列。
74.seq id no:52是exp(exp-os.tuba-3:1)的dna序列,其由启动子、前导序列和源自水稻微管蛋白基因的内含子组成。
75.seq id no:53是exp(exp-at.act7:2)的dna序列,其由启动子、前导序列和源自拟南芥肌动蛋白7基因的内含子组成。
76.seq id no:54是质体靶向的goi-at.shkg-ctp2+ec.aada-spc/str:1:1的编码序列,其赋予对抗生素大观霉素的抗性。
77.seq id no:55是exp(exp-camv.35s-enh:1:2)的dna序列,其由增强的启动子和前导序列组成。
78.seq id no:56是启动子(p-br.snap2-1:1:20)的dna序列。
79.seq id no:57是编码叶绿体转运肽的dna序列(ts-ps.rbcs-3c-1:3:1)。
80.seq id no:58是编码crtb基因(cr-panag.crtb.nno-1:4:1)的dn a编码序列。
81.seq id no:59是3

utr(t-br.snap2-1:3:6)的dna序列。
82.seq id no:60是exp(exp-vf.usp88-enh:1:1)的dna序列,其由增强子、嵌合启动子(p-vf.usp88-嵌合体)和前导序列组成。
83.seq id no:61是嵌合启动子p-vf.usp88-嵌合体的dna序列,其由以下元件组成:源自vf.usp88启动子的增强子,所述增强子可操作地连接至vf.usp88启动子的5


84.seq id no:62是前导序列(l-vf.usp-1:1:1)的dna序列。
85.seq id no:63是编码spla基因(cr-agrtu.spla-c58:1:3)的dna编码序列。
86.seq id no:64是exp(exp-gm.nmh7:1)的dna序列,其由以下元件组成:启动子(p-gm.nmh7-1:1:12),所述启动子可操作地连接至前导序列(l-gm.nmh7:1)的5


87.seq id no:65是启动子(p-gm.nmh7-1:1:12)的dna序列。
88.seq id no:66是前导序列(l-gm.nmh7:1)的dna序列。
89.seq id no:67是3

utr(t-gb.e6-3b:1:1)的dna序列。
具体实施方式
90.本发明提供了用于植物中驱动位点特异性重组酶表达的基因调控元件,所述位点特异性重组酶将导致标记基因盒的有效自动切除。本发明还提供了包含所述调控元件的构建体和重组dna分子。本发明还提供了通过使用包含转基因盒的构建体从转基因植物的基因组自动切除至少两个转基因表达盒的方法,其中本文所述的基因调控元件可操作地连接至位点特异性重组酶基因。
91.为本文使用的某些术语和短语提供以下定义。除非在本公开中另有定义,否则本文中使用的术语和短语应根据它们的常规含义由相关领域的有技术和知识的人员理解。
92.位点特异性重组酶和dna区段的切除
93.如本文所用的,“位点特异性重组酶”是与特定dna识别序列结合并催化dna切割、dna链交换和两个位点特异性重组酶位点序列之间的dna的重新连接的酶。“位点特异性重组”或“位点特异性重组酶系统”或“位点特异性重组酶技术”或“定点重组”或“定点重组酶
系统”或“定点重组酶技术”描述了各种专门的重组过程,这些过程涉及在限定的dna位点之间的相互交换。如本文所用的,术语“两侧”是指位于一个或多个特定基因座/基因位点、基因、序列、转基因或表达盒任一侧的两个或更多个序列,比如位点特异性重组位点序列。可以相对于包含重组将在其下发生的表达盒的dna区段(即,位于dna的区段两侧)的5'和3',将位点特异性重组位点序列克隆到重组dna构建体中。取决于亲本位点特异性重组位点的初始排列,位点特异性重组具有三种可能结果之一:整合(插入外来dna区段)、切除(去除dna区段)或倒位(在重新连接两个末端片段之前旋转dna区段180度)。整合由不同dna分子上的位点之间重组引起(前提是至少一条亲本染色体是环状的),并且以唯一限定的方向发生。
94.对于位于同一dna分子或染色体上的重组位点,所述结果可取决于它们的相对方向。虽然dna区段的倒位可由倒置(头对头)位点之间的交换引起,但切除可由头对尾方向的位点之间的重组引起(nigel等人(2006年)mechanisms of site-specific recombination.annu.rev.bioche m,75:567-605)。许多位点特异性重组酶可用于切除两个位点特异性重组酶识别位点之间的dna,比如识别lox位点的cre-重组酶、识别fr t位点的flp-重组酶(参见,例如,lyznik,l.等人,(2000)gene transf er mediated by site-specific recombination systems,plant molecular biology manual n1,1-26)、识别rs位点的r-重组酶(参见,例如,ma chida,c.等人,(2000)use of the r-rs site-specific recombination sy stem in plants,plant molecular biology manual n2,1-23)或识别gix位点的gin-重组酶(参见,例如,maeser,s.等人,(1991)the gin reco mbinase of phage mu can catalyze site-specific recombination in plant protoplasts,mol gen genet,230:170-176)。每个上述位点特异性重组酶系统均已显示在植物中起作用。cre/lox位点特异性重组酶系统是植物生物技术中最常依赖的标记切除系统。
95.位点特异性重组酶可用于植物生物技术中,以从转基因植物去除标记基因表达盒以及其他表达盒和dna区段。通常,用包含多个表达盒的重组dna构建体或载体转化植物。表达盒可用于表达为植物提供有利特性的转基因以及用作标记以选择转化的植物细胞的转基因,比如抗生素抗性基因、除草剂耐受基因或在选择过程中有用的其他转基因。用于标记基因的转基因盒的两侧是一对位点特异性重组酶识别位点。在转化和选择之后,使再生的转化植物生长。然后可以通过各种杂交策略(通过与植物的位点特异性重组酶表达系杂交或通过自动切除)去除标记基因的切除。
96.使用植物的位点特异性重组酶表达系的杂交通常如下进行。使r0转化植物自交。然后针对重组dna构建体的存在选择r1后代植物。然后使选择的r1后代植物自交,并且选择对于重组dna构建体插入而言是纯合的r2后代植物。然后使纯合的r2后代植物与表达重组酶的另一个系杂交。作为这种杂交的结果,重组酶切除两侧为位点特异性重组酶识别序列的标记基因表达盒,产生包含期望的表达盒但标记基因表达盒从基因组切除的f1后代植物。然后使所得的f1后代自交,并选择缺乏重组酶但对于现在修饰的重组dna构建体插入而言是纯合的f2后代植物。
97.另一种去除标记基因表达盒的策略借助于自动切除。与上述切除方法相似,表达的重组酶用于切除标记基因表达盒,但不是使转化的植物与表达重组酶的另一个系杂交,重组酶基因表达盒位于相同的重组dna构建体中并且其两侧是位点特异性重组酶位点序列
以及标记基因表达盒。预期在自动切除之后保留在转基因植物中的表达盒存在于重组dna构建体中,在所述位点特异性重组酶位点序列之外。转化和植物再生之后,生成了含有重组dna构建体的r0植物。然后可以使那些r0植物自交,并且可以针对其中所述标记基因表达盒和重组酶表达盒已被切除的改变的重组dna构建体的存在选择所得的r1后代植物。自动切除系统的优势在于,与其中使用需要与表达位点特异性重组酶的另一个系杂交的位点特异性重组酶切除系统相比,人们可以借助于更少的世代去除标记基因表达盒。
98.在自动切除以产生无标记的r1后代植物的开发过程中,自动切除的一个复杂因素是找到在正确时间提供位点特异性重组酶表达的表达元件。一种方法是使用在植物的种系或胚期活跃的表达元件,但并非所有种系偏好或胚偏好的表达元件都会为有效发生自动切除提供成功的结果。一些种系偏好或胚偏好的表达元件可能在它们的表达中存在漏洞,并且一些不能以足够的水平表达位点特异性重组酶以有效切除标记和/或重组酶基因。另外,种系或胚表达元件可能仅在特定的作物物种(比如玉米、大豆或棉花)中但并非在所有这三种作物中提供有效的自动切除。
99.dna分子
100.如本文所用的,术语“dna”或“dna分子”是指基因组或合成来源的双链dna分子,即,脱氧核糖核苷酸碱基的聚合物或dna分子。如本文所用的,术语“dna序列”是指从5'(上游)端到3'(下游)端读的dna分子的核苷酸序列。
101.如本文所用的,“重组dna分子”或“重组dna构建体”是这样的dna分子或构建体,其分别包含在没有人为干预的情况下非天然地一起存在的dna序列的组合。例如,重组dna分子可包含彼此异源的至少两个dna序列:来源于自然界中存在的dna序列的dna序列、合成dna序列和/或通过遗传转化、基因组编辑或位点特异性整合已掺入到宿主细胞的基因组dna中的dna序列。
102.在本技术中,提及“分离的dna分子”或等效术语或短语旨在表示所述dna分子是单独存在或与其他成分组合存在但在其天然环境中不存在的dna分子。例如,天然存在于生物体基因组中的核酸元件,比如编码序列、内含子序列、非翻译序列、前导序列、启动子序列、转录终止序列等,只要所述元件对于生物体的基因组而言是天然的并且处于其在基因组内天然存在的位置,其不被认为是“分离的”。然而,只要所述元件不在其天然基因组内和/或处于其在基因组内天然存在的位置,这些元件中的每一个以及这些元件的子部分在本公开的范围内将是“分离的”。出于本公开的目的,任何转基因核苷酸序列,即,插入植物或细菌细胞的基因组中或存在于染色体外载体中的dna的核苷酸序列,将被认为是分离的核苷酸序列,无论它是存在于植物或细菌的基因组内用于转化细胞的质粒或相似载体内,还是以可检测量存在于源自植物或细菌的组织、后代、生物样品或商品产品中。
103.如本文所用的,术语“序列同一性”是指两个最佳比对的多核苷酸序列或两个最佳比对的多肽序列相同的程度。通过比对两个序列,例如参考序列和另一个序列,以使具有适当的内部核苷酸插入、缺失或空位的序列比对中的核苷酸匹配的数目最大化,产生了两个序列的最佳序列比对。如本文所用的,术语“参考序列”可以指包含seq id no:1-26、59-62和64-66中的一个或多个的dna序列。
104.如本文所用的,术语“序列同一性百分比”或“同一性百分比”或“同一性%”是两个最佳比对序列的同一性分数乘以100。与参考序列最佳比对的序列的“同一性分数”是最佳
比对中的核苷酸匹配数除以参考序列中的核苷酸总数(即,全长的整个参考序列中的核苷酸总数)。因而,本公开的一些实施方案提供了包含调控序列的dna分子,当与诸如seq id no:1-26、59-62和64-66之一的参考序列进行最佳比对时,所述调控序列与所述参考序列具有至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性。根据本发明实施方案,所述调控序列可以可操作地连接至可以编码位点特异性重组酶的可转录dna序列。
105.调控元件
106.调控元件,比如启动子、前导序列(也称为5'utr)、增强子、内含子和转录终止区(或3

utr),在活细胞中基因的整体表达中起着不可或缺的作用。如本文所用的,术语“调控元件”是指具有基因调控活性的dna分子或序列或dna区段。如本文所用的,术语“基因调控活性”是指影响可操作连接的可转录dna分子表达的能力,例如通过影响可操作连接的可转录dna分子的转录和/或翻译。在植物中起作用的调控元件,比如启动子、前导序列、增强子、内含子和3

utr,可用于通过基因工程修饰植物表型。根据本公开的实施方案,调控元件是启动子,所述启动子具有包含seq id no:2、5、10、17、21、61或65的序列,或与seq id no:2、5、10、17、21、61或65具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列,或任何前述序列的功能片段或部分。根据本公开的实施方案,调控元件是前导序列,所述前导序列具有包含seq id no:3、6、11、18、22、61或66的序列,或与seq id no:3、6、11、18、22、61或66具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列,或可以影响可操作连接的可转录dna序列的表达的任何前述序列的功能片段或部分。
107.如本文所用的,启动子(或启动子序列)或调控元件的“片段”分别包含启动子(或启动子序列)或调控元件的片段或部分,并且,启动子(或启动子序列)或调控元件的“功能片段”分别包含启动子(或启动子序列)或调控元件的片段或部分,其影响、调节或驱动可操作连接的可转录dna序列的表达。根据一些实施方案,启动子(或启动子序列)或调控元件的“功能片段”以与启动子(或启动子序列)或调控元件相似的方式影响、调节或驱动可操作连接的可转录dna序列的表达。
108.如本文所用的,“调控表达元件组”或“exp”序列是指一组两个或更多个可操作连接的调控元件,比如增强子、启动子、前导序列和内含子。这样的两个或更多个可操作连接的调控元件通常可以一起存在于同一构建体中并且各自可操作地连接至可转录dna序列。例如,调控表达元件组可以由例如可操作地连接至前导序列的5'的启动子组成。用于实践本发明实施方案的exp可以包含seq id no:1、4、7、9、13、14、16、20、25、60或64,以及与seq id no:1、4、7、9、13、14、16、20、25、60或64具有至少80%同一性、至少85%同一性、至少86%
同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列。
109.调控元件的特征可以在于它们在植物、植物组织和植物细胞中的相关基因表达模式,例如,它们对表达的正面和/或负面作用,比如组成型表达或特定的表达模式,比如时间、空间、发育、组织、环境、生理、病理或细胞周期表达,和/或化学反应或诱导型表达,及其任何组合,以及表达的定量或定性指示或模式。如本文所用的,“基因表达模式”是可操作连接的dna分子转录成转录rna分子的任何模式,其导致转录rna分子在发育过程中的各种植物组织和细胞中的相对水平和丰度。调控元件可包括增强子、启动子、前导序列、5'utr、内含子和/或3’utr。本公开的调控元件可包括种系偏好或胚偏好的调控元件或启动子。
110.如本文所用的,术语“启动子”通常是指参与识别和结合rna聚合酶ii和其他蛋白质(比如反式作用转录因子)以启动或调控转录的dna分子、区段或序列。启动子可以从基因的基因组拷贝的上游或5'非翻译区(5'utr)初步分离。可替代地,启动子可以是合成产生的或工程化的dna分子。启动子也可以是嵌合的。通过两个或更多个异源dna分子的融合产生嵌合启动子。用于实践本发明实施方案的启动子可包括启动子元件,所述启动子元件包含seq id no:2、5、10、17、21、61或65;或在seq id no:1、4、7、9、13、14、16、20、25、60和64中的任何一个内的序列;或与seq id no:2、5、10、17、21、61或65具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列;或与seq id no:1、4、7、9、13、14、16、20、25、60和64中的任何一个内的序列具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列;或任何前述序列的功能片段或部分。在具体实施方案中,如本文所述的dna分子及其任何变体、片段、部分或衍生物被进一步定义为包含启动子活性,即,能够在宿主细胞中比如在转基因植物中充当启动子。在更进一步的具体实施方案中,可将启动子序列的片段定义为展示从其来源的起始启动子分子所具有的启动子活性,或者片段可包含提供基础转录水平并且是由tata盒或等效的dna序列组成的“最小启动子”,用于识别和结合用于启动转录的rna聚合酶ii复合物。
111.在一个实施方案中,提供了本文公开的启动子序列的片段。启动子片段可包含如上所述的启动子活性,并且可单独使用或与其他启动子和/或启动子片段组合使用,例如用于构建嵌合启动子,或与其他表达或调控元件和表达或调控元件片段组合使用。在具体实施方案中,提供了启动子片段,其包含如本文公开的启动子、启动子序列或具有启动子活性的dna分子的至少约50个、至少约75个、至少约95个、至少约100个、至少约125个、至少约150个、至少约175个、至少约200个、至少约225个、至少约250个、至少约275个、至少约300个、至少约500个、至少约600个、至少约700个、至少约750个、至少约800个、至少约900个、或至少约1000个或更长的连续核苷酸。
112.例如,使用本领域已知的方法修饰或改变表达,例如通过去除可能对表达具有正
面或负面作用的元件或元件部分或非功能性间隔序列;复制对表达有正面或负面作用的元件;插入对表达有正面或负面作用的元件;和/或复制或去除对表达具有组织特异性、发育或细胞特异性作用的元件,可以产生包含启动子或调控元件的重组dna分子或构建体,所述启动子或调控元件来源于如seq id no:2、5、10、17、21、61和65提供的任何启动子元件,或来自seq id no:1、4、7、9、13、14、16、20、25、60和64中的任何一个内的任何序列,比如内部或截短序列或具有5'缺失的序列。可以例如使用包含启动子或调控元件的任何重组dna构建体或分子来制备增强子元件,所述启动子或调控元件来源于如seq id no:2、5、10、17、21、61或65提供的任何启动子元件,或来自seq id no:1、4、7、9、13、14、16、20、25、60或64内的任何序列,包含3'缺失,其中tata盒元件或其等效序列和下游序列被去除。可以进行进一步的缺失以去除对表达具有正面或负面;组织特异性;细胞特异性;或时间特异性(比如但不限于,昼夜节律或发育时间)作用的元件。如seq id no:2、5、10、17、21、61和65提供的或包含在seq id no:1、4、7、9、13、14、16、20、25、60和64中的任何一个内的任何启动子元件以及来源于其的片段或增强子,可用于制备嵌合转录调控元件组合物。
113.根据本发明,可以针对已知的启动子元件(即,dna序列特征,比如tata盒和其他已知的转录因子结合位点基序)的存在来分析启动子或启动子片段。本领域技术人员可以使用这样的已知启动子元件的鉴定来设计具有与原始启动子相似表达模式的启动子变体。
114.如本文所用的,将“种系偏好启动子”定义为驱动可操作连接的基因(或转基因)主要在植物的一个或多个种系细胞中表达但也可驱动可操作连接的基因(或转基因)在植物的其他细胞或组织中表达的启动子。“种系”用作这些细胞的统称,所述细胞为配子细胞或配子细胞祖细胞,分化成配子细胞或配子细胞祖细胞,或具有为配子细胞或配子细胞祖细胞的至少一个后代细胞。种系细胞中的遗传修饰可通过源自或遗传自这样的种系细胞的配子传递给后代植物。驱动位点特异性重组酶表达的种系偏好启动子的使用允许去除种系细胞中位于位点特异性重组酶识别序列两侧的标记和/或重组酶基因,在所述种系细胞中所述位点特异性重组酶被表达。所得的配子将具有改变的转基因,其中标记基因表达盒和/或重组酶表达盒不再存在,然后可以将这种改变的转基因传递给后代植物。通过使用种系偏好启动子来驱动用于自动切除的位点特异性重组酶的表达,可以在来自r0亲本植物的自交或异交的r1代中完成标记和/或重组酶基因的去除,这与在可能通过与具有重组酶表达构建体的不同系杂交来引入位点特异性重组酶的情况下的后一代相反。
115.取决于其中预期进行自动切除的作物种类,有效驱动植物中的自动切除的种系偏好启动子不相同。例如,虽然拟南芥dcm1启动子已被证明驱动拟南芥种系细胞中的gus标记基因的切除(参见,例如,van ex等人(2009)“evaluation of seven promoters to achieve germline directed cre-lox recombination in arabidopsis thaliana”plant cell rep.28:1509-1520),但是这种启动子在稳定转化的大豆植物中不驱动自动切除(参见,例如,下面的实施例4)。其他拟南芥来源的种系偏好启动子可以驱动转基因大豆植物中的自动切除,比如包含seq id no:10或seq id no:17的启动子序列,以及在seq id no:7、seq id no:13或seq id no:14内的启动子序列(参见,例如,实施例3)。源自植物的种系偏好的cdc45基因的启动子经证明能够驱动作物植物中的自动切除。显示拟南芥cdc45启动子seq id no:10驱动了转基因大豆(实施例3)和棉花植物(实施例5)中的有效自动切除。显示玉米(seq id no:2)和水稻(seq id no:5)的cdc45-1启动子驱动了转基因玉米植物中的有
效自动切除(实施例2)。虽然显示大豆rsp1启动子(seq id no:21)驱动了大豆植物中的自动切除,但是rsp1启动子需要可操作地连接至rsp1启动子和前导序列的内含子(i-at.atpe:1,seq id no:26)来驱动转基因棉花植物中的有效自动切除。然而,将i-at.atpe内含子可操作地连接至rsp1启动子和前导序列在转基因大豆中未能驱动有效自动切除。显示大豆rsp1启动子和p-gm.nmh7-1:1:12(seq id no:65)驱动了四个转基因盒的自动切除:cre-重组酶;标记基因、cpf1和指导rna表达盒。
116.如本文所用的,将“胚偏好启动子”定义为驱动可操作连接的基因(或转基因)主要在种胚的一个或多个细胞中表达但也可驱动可操作连接的基因(或转基因)在种子或植物的其他细胞或组织中表达的启动子。显示胚偏好的嵌合启动子p-vf.usp88-嵌合体(seq id no:61)驱动了转基因芥花植物中的自动切除。
117.如本文所用的,术语“前导序列”是指从基因的非翻译5'区(5'utr)中分离的dna分子,并且通常定义为在转录起始位点(tss)和蛋白质编码序列起始位点之间的核苷酸区段。可替代地,前导序列可以是合成产生的或工程化的dna元件。前导序列可用作用于调节可操作连接的可转录dna序列表达的5

调控元件。前导序列可与异源启动子或其天然启动子一起使用。用于实践本发明实施方案的前导序列可包括seq id no:3、6、11、18、22、62或66;或与seq id no:3、6、11、18、22、62或66具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列;或任何前述序列的功能片段或部分;或包含在seq id no:1、4、7、9、13、14、16、20、25、60和64中任何一个内或在与seq id no:1、4、7、9、13、14、16、20、25、60和64具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的任何序列内的任何前导元件,或其功能片段或部分。在具体实施方案中,可以将这样的dna序列定义为能够在包括例如转基因植物细胞在内的宿主细胞中充当前导序列。在一个实施方案中,将这样的序列定义为包含前导序列活性。
118.呈现为seq id no:3、6、11、18、22、62和66的前导序列(也称为5

utr);或包含在seq id no:1、4、7、9、13、14、16、20、25、60和64中任何一个内的任何前导元件可以由调控元件组成,并且/或者可以采用可调节或影响可操作连接的可转录dna序列的转录或翻译的二级结构。可以根据本公开使呈现为seq id no:3、6、11、18、22、62和66或其任何片段的前导序列;或包含在seq id no:1、4、7、9、13、14、16、20、25、60和64中任何一个或其任何片段内的任何前导序列元件,以制备影响可操作连接的可转录dna序列的转录或翻译的嵌合调控元件。
119.如本文所用的,术语“内含子”是指可从基因中分离或鉴定的dna分子或序列,并且通常可定义为在翻译前的信使rna(mrna)加工过程中剪接出来的区域。可替代地,内含子可以是合成产生的或工程化的dna元件。内含子可以含有影响可操作连接的基因或可转录dna序列的转录的增强子元件。内含子可用作用于调节可操作连接的可转录dna序列表达的调控元件。构建体可以包含内含子,并且所述内含子相对于所述可转录dna序列可以是或可以
不是异源的。本领域内含子的实例包括水稻肌动蛋白内含子和玉米hsp70内含子。
120.在植物中,相对于缺乏内含子的构建体,基因构建体中包含一些内含子导致mrna和蛋白质积累增加。这种作用被称为基因表达的“内含子介导的增强”(ime)。已经在玉米基因(例如,tuba1、adh1、sh1和ubi1)、水稻基因(例如,tpi)和双子叶植物基因如来自矮牵牛(例如rbcs)、马铃薯(例如,st-ls1)和来自拟南芥(例如,ubq3和pat1)的那些基因中鉴定了已知在植物中刺激表达的内含子。已经表明,在内含子的剪接位点内的缺失或突变降低了基因表达,表明剪接对于ime可能是需要的。然而,已通过来自拟南芥的pat1基因的剪接位点内的点突变显示出双子叶植物中的ime。已显示在一种植物中多次使用同一内含子表现出缺点。在那些情况下,有必要收集基本控制元件来构建适当的重组dna元件。用于实践本发明的示例性内含子呈现为seq id no:26和39。
121.如本文所用的,术语“3'转录终止序列”、“3'非翻译区”或“3’utr”是指转录到mrna分子的3'部分内的非翻译区中的dna序列,正如本领域通常理解的。可以通过特异性切割和3’多聚腺苷酸化(也称为polya尾的形成)生成mrna分子的3'非翻译区。3’utr可以可操作地连接至可转录dna序列的rna或蛋白质编码部分并且位于其下游,并且可以包括多聚腺苷酸化信号和其他能够影响转录、mrna加工和/或基因表达的调控元件或信号。polya尾被认为在mrna稳定性和翻译起始中起作用。本领域中3'转录终止分子的实例是胭脂碱合酶3'区、小麦hsp17 3'区、豌豆rubisco小亚基3'区、棉花e6 3'区和薏苡辛3’utr。
[0122]3′
utr通常在特异性dna分子的重组表达方面找到有益的用途。弱的3

utr有可能生成通读,这可能影响位于相邻表达盒中的dna分子的表达。转录终止的适当控制可以防止通读到位于下游的dna序列(例如,其他表达盒)中,并且可以进一步允许rna聚合酶的有效再循环,以提高基因表达。转录的有效终止(从dna释放rna聚合酶ii)是重新启动转录的先决条件,因此直接影响整体转录水平。转录终止后,从合成位点释放出成熟mrna,并且模板被转运到细胞质中。真核mrna在体内以poly(a)形式积累,使得难以通过常规方法检测转录终止位点。然而,通过生物信息学方法难以预测功能性和有效的3

utr,因为没有允许轻松预测有效的3

utr的保守dna序列。
[0123]
通过3

utr调节基因功能是一个相对较新的领域,因为只有最近的测序技术才为我们提供了跨物种和细胞类型的3

utr的全景观。在测序技术可用之前,仅在少数3’utr模型上进行详细的功能和机制研究。虽然这些模型3’utr给我们对3’utr生物学的理解做出了重大贡献,但关于它们的调控功能得出的结论是有限的,并且更多地集中在mrna稳定性上。(mayr,christine(2017)regulation by 3
′‑
untranslated regions.annual review of genetics,51:171-194)全基因组计算机分析揭示3

utr中的基序主要在一条链上是保守的,这与3

utr在转录后水平上调控基因表达的作用一致(xie,x.等人,(2005)systematic discovery of regulatory motifs in human promoters and 3

utrs by comparison of several mammals,nature 434:338-345)。3

utr通过调控mrna稳定性和主要由富含au的元件和mirna介导的翻译来决定蛋白质水平。3

utr还通过调控mrna定位实现局部翻译。可以通过选择性切割和多聚腺苷酸化调控3

utr的长度。3

utr介导蛋白质-蛋白质相互作用(ppi),对蛋白质复合物的形成、蛋白质定位和蛋白质功能具有广泛的影响。3

utr通过结合rna结合蛋白(rbp)调控基因表达。rbp与3

utr顺式元件结合,并通过募集效应蛋白介导3

utr功能。rbp与其他结合的rbp合作以实现体内功能特异性。在给定时刻与3

utr结合的rbp
的组成是动态的,并且可以根据局部环境而变化,例如,通过添加翻译后修饰、其他rbp的局部表达以及与膜和细胞骨架丝的相互作用。rbp结合也受到二级和三级rna结构形成的影响,所述结构形成调控3

utr的可及性(mayr,christine(2017)regulation by 3
′‑
untranslated regions.annual review of genetics,51:171-194)。
[0124]
一系列腺苷碱基添加至rna分子的3'端产生poly(a)尾。这为mr na提供了针对一类称为poly(a)结合蛋白(pabp)的调控因子的结合位点,所述调控因子在基因表达的调控中发挥作用,包括mrna输出、稳定性和衰变以及翻译。mrna的5

帽结构和poly-a尾协同作用以控制mrna翻译。pabp与poly(a)尾的结合促进了与结合至5

帽结构的eif4f的相互作用,从而导致促进翻译起始的mrna环化,并确保核糖体再循环和有效翻译。这种相互作用还允许通过结合至3

utr的抑制剂蛋白抑制翻译(barret,l等人(2012)regulation of eukaryotic gene ex pression by the untranslated regions and other non-coding elements.cell.mol.life sci.69:3613-3634)。
[0125]
从实际的角度来看,通常是有益的是,表达盒中使用的3

utr具有以下特征。首先,3

utr应该能够高效且有效地终止转基因的转录,并防止将转录物通读到在多个表达盒位于一个构建体的情况下可以由另一个表达盒组成的任何相邻的dna序列中,或其中插入所述构建体的相邻染色体dna中。其次,3

utr不应该引起用于驱动dna序列表达的启动子、前导序列、增强子和内含子所赋予的转录活性的降低。最后,在植物生物技术中,3

utr通常用于引发从转化植物中提取的逆转录rna的扩增反应,并用于:(1)一旦表达盒整合到植物染色体中,评估其转录活性或表达;(2)评估植物dna中插入的拷贝数;和(3)评估在育种之后所得种子的接合性。3

utr还用于从转化植物中提取的dna的扩增反应,以表征插入盒的完整性。可用于实践本发明的3’utr呈现为seq id no:12、15、19、23、24和59。
[0126]
如本文所用的,术语“嵌合”是指通过使第一dna分子与第二dna分子融合而产生的单个dna分子,其中在该构型(即与另一个融合)中通常既没有发现第一dna分子也没有发现第二dna分子。因而,嵌合dna分子是新的dna分子,通常原本在自然界中未发现。如本文所用的,术语“嵌合启动子”是指通过对dna分子的这种操作产生的启动子。嵌合启动子可以组合两个或更多个dna片段,例如,启动子与增强子元件融合。因而,本发明包括根据本文公开的方法的用于调节可操作连接的可转录dna分子的表达的嵌合启动子的设计、构建和用途。用于实践本发明的嵌合启动子呈现为seq id no:61。
[0127]
嵌合调控元件可以被设计为包含各种组成元件,这些元件可以通过本领域已知的各种方法可操作地连接,比如限制性内切酶消化和连接、不依赖于连接的克隆、在扩增过程中pcr产物的模块化组装、或调控元件的直接化学合成,以及本领域已知的其他方法。所得的各种嵌合调控元件可以由相同的组成元件或相同的组成元件的变体组成,但在dna序列或包含连接dna序列的dna序列或允许组成部分可操作地连接的序列方面不相同。在本发明中,如seq id no:1-26、59-62和64-66提供的dna序列可以提供调控元件参考序列,其中包含所述参考序列的组成元件可以通过本领域已知的方法连接并且可以包含在细菌和植物细胞转化中天然存在的一个或多个核苷酸的取代、缺失和/或插入或突变。
[0128]
如本文所用的,术语“变体”是指第二dna分子,比如调控元件,其组成与第一dna分子相似但不相同,并且其中,例如通过或多或少等效的转录活性,所述第二dna分子仍然保持第一dna分子的一般功能,即,相同或相似的表达模式。变体可以是第一dna分子的更短或
截短的形式,或第一dna分子的序列的改变形式,比如具有不同限制酶位点和/或内部缺失、取代或插入的变体。“变体”还可以涵盖具有包含参考序列的一个或多个核苷酸的取代、缺失或插入的核苷酸序列的调控元件,其中衍生的调控元件具有比相应的亲本调控分子更多或更少或等效的转录或翻译活性。调控元件“变体”还将包括由在细菌和植物细胞转化中自然发生的突变引起的变体。在本发明中,如seq id no:1-26、59-62和64-66提供的多核苷酸序列可用于产生在组成上相似但与原始调控元件的dna序列不相同但是仍保持原始调控元件的一般功能(即,相同或相似的表达模式)的变体。根据本公开,本发明这样的变体的产生完全在本领域的普通技术范围内,并且包含在本发明的范围内。
[0129]
如本文所用的,“可转录dna序列”是当可操作地连接至启动子时可以转录成rna的任何dna序列。由可操作地连接至本文提供的调控元件的可转录dna序列编码的转录rna分子可以被翻译以产生蛋白质分子或者可以提供反义或其他功能性或调控性rna分子,比如双链发夹rna(dsrna)、转移rna(trna)、核糖体rna(rrna)、微小rna(mirna)、小干扰rna(sirna)等。
[0130]
如本文所用的,术语“蛋白质表达”是将转录rna分子翻译成蛋白质分子的任何模式。蛋白质表达的特征在于其时间、空间、发育或形态学性质,以及其定量或定性指征或表达模式。
[0131]
可以在稳定和瞬时植物测定(例如本文工作实施例中所述的那些)中凭经验测试本文所述的修饰、重复或缺失对特定转基因的期望表达方面的功效,从而验证结果,所述结果可以不同,其取决于在起始dna分子方面所做的改变和改变的目的。
[0132]
构建体
[0133]
如本文所用的,术语“构建体”表示任何dna分子或载体,或dna分子、载体或染色体的区段或部分,其源自任何一种或多种来源并且能够转染或基因组整合,包含以功能操作方式相互连接的至少两个dna序列。例如,构建体可包含两个可操作连接的序列,比如可操作连接至编码序列或可转录dna序列的调控元件或启动子。构建体可以是重组dna构建体。作为线性重组dna区段的构建体的实例是t-dna。如本文所用的,“载体”是指可以含有或包含本公开的构建体的dna分子,例如质粒、粘粒、病毒、噬菌体或其他线性或环状dna分子,并且“dna转化载体”表示包含重组dna构建体的任何dna分子或载体,其可用于转化目的-即,用于将重组dna分子或构建体引入到诸如植物细胞的宿主细胞中。根据一些实施方案,dna转化载体可包含以左和/或右边界序列为界的t-dna片段,其可用于细菌介导的转化,比如根瘤菌介导的或土壤杆菌介导的转化。构建体通常包括一个或多个表达盒、可操作地连接至诸如启动子等的一个或多个调控序列的基因编码序列或可转录dna序列。如本文所用的,“表达盒”是指包含可操作地连接至一个或多个调控元件(通常至少一个启动子和一个3’utr)的至少一个可转录dna序列的dna序列。
[0134]
如本文所用的,术语“可操作地连接”是指包含第一和第二dna序列的dna分子、构建体、载体或染色体的两个或更多个物理连接的dna序列之间的功能关系,所述第一和第二dna序列的排列使得第一dna序列影响第二dna序列的功能或表达。这两个dna序列可以是也可以不是单个连续dna分子的一部分,并且可以相邻也可以不相邻。例如,如果启动子调节细胞中感兴趣的可转录dna序列的转录,则启动子可操作地连接至可转录dna序列。例如,当前导序列能够影响dna序列的转录或翻译时,它可操作地连接至可转录dna序列。
[0135]
在一个实施方案中,本发明的构建体可以提供为双肿瘤诱导(ti)质粒边界构建体,其具有从包含t-dna的土壤杆菌属种(例如,根癌土壤杆菌或发根土壤杆菌)分离的ti或ri质粒的右边界(rb或agrtu.rb)和左边界(lb或agrtu.lb)区域,所述t-dna连同由土壤杆菌细胞提供的转移分子允许t-dna整合到植物细胞的基因组中(参见,例如,美国专利6,603,061)。构建体还可以含有在细菌细胞中提供复制功能和抗生素选择的质粒骨架dna区段,例如,大肠杆菌复制起点,比如ori322;广泛宿主范围的复制起点,比如oriv或oriri(参见,例如,ye等人,transgenic research 20(4):773-86,2011);以及选择标记的编码区,比如编码赋予对大观霉素或链霉素的抗性的tn7氨基糖苷腺苷酸转移酶(aada)的spec/strp;或庆大霉素(gm,gent)选择标记基因。对于植物转化,宿主细菌菌株通常为根癌土壤杆菌abi、c58或lba4404,然而,植物转化领域中的技术人员已知的其他菌株也可以在本发明中起作用。
[0136]
以可转录dna分子被转录成功能性mrna分子的这种方式组装构建体并将其引入细胞中的方法是本领域已知的,所述功能性mrna分子被翻译并表达为蛋白质。对于本发明的实践,用于制备和使用构建体和宿主细胞的常规组合物和方法是本领域技术人员熟知的。用于在高等植物中表达核酸的典型载体是本领域熟知的,并且包括来源于根癌土壤杆菌的ti质粒的载体和pcamvcn转移对照载体。
[0137]
构建体中可包括各种调控元件,包括本文提供的那些中的任何一个。可以提供任何这样的调控元件,与其他调控元件组合。可以设计或修改这样的组合,以产生期望的调控特征。在一个实施方案中,本发明的构建体包含可操作地连接至可转录dna分子的至少一个调控元件,所述可转录dna分子可操作地连接至3’utr。
[0138]
本发明的构建体可以包括本文提供的或本领域已知的任何启动子或前导序列。例如,本发明的启动子可以可操作地连接至异源的非翻译5'前导序列,比如源自热休克蛋白基因的前导序列。可替代地,本发明的前导序列可以可操作地连接至异源启动子,比如花椰菜花叶病毒35s转录物启动子。
[0139]
表达盒还可以包括编码肽的转运肽编码序列,所述肽可用于可操作连接的蛋白质的亚细胞靶向,特别是靶向至叶绿体、白色体或其他质体细胞器;线粒体;过氧化物酶体;空泡;或细胞外位置。许多叶绿体定位蛋白以前体方式从核基因表达,并且通过叶绿体转运肽(ctp)靶向输送至叶绿体。这样的分离的叶绿体蛋白的实例包括但不限于与核酮糖-1,5,-二磷酸羧化酶的小亚基(ssu)、铁氧还蛋白、铁氧还蛋白氧化还原酶、光捕获复合蛋白i和蛋白ii、硫氧还蛋白f、烯醇丙酮酰莽草酸磷酸合酶(epsps)相关的那些蛋白质。叶绿体转运肽描述于例如美国专利第7,193,133号。已经证明,通过表达可操作地连接至编码非叶绿体蛋白的转基因的异源ctp,非叶绿体蛋白可以靶向至叶绿体。
[0140]
可转录dna序列
[0141]
如本文所用的,术语“可转录dna序列”是指能够被转录成rna分子的任何dna序列,包括但不限于具有蛋白质编码序列的那些和产生具有用于基因抑制的序列的rna分子的那些。dna序列的类型可以包括但不限于来自同一植物的dna序列、来自另一植物的dna序列、来自不同生物的dna序列或合成dna序列,比如含有基因的反义信息的dna序列,或编码人工、合成或其他修饰形式的转基因的dna序列。用于并入本发明构建体的示例性可转录dna序列包括,例如,来自与其中掺入该dna序列的物种不同的物种的dna序列或基因,或源自或
存在于相同物种但通过基因工程方法而不是经典育种技术将其整合到受体细胞中的基因。
[0142]“转基因”是指至少就其在宿主细胞基因组中的位置而言与宿主细胞异源的可转录dna序列和/或人工掺入当前或任何前代宿主细胞的细胞基因组中的可转录dna序列。
[0143]
调控元件,比如本发明的启动子,可以可操作地连接至相对于所述调控元件异源的可转录dna序列。如本文所用的,术语“异源”是指两个或更多个dna分子的组合,此时这样的组合通常未发现于自然界中。例如,两个dna分子可以来自不同物种并且/或者两个dna分子可以来自不同基因,例如,来自相同物种的不同基因或来自不同物种的相同基因。因而,如果这样的组合通常未发现于自然界中,那么调控元件相对于可操作连接的可转录dna分子是异源的,即,可转录dna分子序列并非自然发生可操作地连接至调控元件。关于“异源可转录dna序列”,表示可转录dna序列相对于与之可操作连接的多核苷酸序列是异源的。
[0144]
可转录dna序列通常可以是需要表达转录物的任何dna序列。转录物的这种表达可导致所得mrna分子的翻译,从而导致蛋白质表达。可替代地,例如,可以设计可转录dna序列以最终引起特定基因或蛋白质的表达降低。在一个实施方案中,这可以通过使用以反义方向定向的可转录dna序列来实现。使用这样的反义技术是本领域的普通技术人员熟悉的。任何基因都可以这种方式受到负调控,并且在一个实施方案中,可转录dna序列可以被设计为通过dsrna、sirna或mirna分子的表达来抑制特异性基因。
[0145]
因而,本发明的一个实施方案是包含本发明调控元件的重组dna分子,比如提供为seq id no:1-26、59-62和64-66的那些或其片段,或与seq id no:1-26、59-62和64-66中的任何一个具有至少80%同一性、至少85%同一性、至少86%同一性、至少87%同一性、至少88%同一性、至少89%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性或100%同一性的序列或其片段,其可操作地连接至异源可转录dna序列,以便在所述构建体整合在转基因植物细胞的基因组中时以期望的水平或以期望的模式调节所述可转录dna序列的转录。在一个实施方案中,可转录dna序列包含基因的蛋白质编码区,而在另一个实施方案中,可转录dna序列包含基因的反义区或引起特异性靶基因抑制的任何其他可转录dna序列。
[0146]
有农艺学利益的基因
[0147]
可转录dna序列可以是有农艺学利益的基因。如本文所用的,术语“有农艺学利益的基因”或“有农艺学利益的转基因”是指当其在特定植物组织、细胞或细胞类型中表达时赋予期望的特征或性状的可转录dna序列。有农艺学利益的基因或转基因的产物可以在植物中起作用,从而对植物形态学、生理学、生长、发育、产量、籽粒组成、营养概况、疾病或抗虫性和/或环境或化学耐受性产生影响,或可以作为以植物为食的害虫的饮食中的杀虫剂。在本发明的一个实施方案中,将本发明的调控元件掺入构建体中,使得所述调控元件可操作地连接至可转录dna序列,所述序列是有农艺学利益的基因或转基因。在含有这种构建体的转基因植物中,有农艺学利益的基因的表达可以赋予有益的农艺性状。有益的农艺性状可以包括,例如但不限于,除草剂耐受性、昆虫控制、改良或增加的产量、抗病性、病原体抗性、改良的植物生长和发育、改良的淀粉含量、改良的含油量、改良的脂肪酸含量、改良的蛋白质含量、改良的果实成熟度、增强的动物和人营养、生物聚合物生产、环境胁迫耐受性或抗性、药用肽、改进的加工质量、改进的风味、杂交种子生产效用、改进的纤维生产和理想的
生物燃料生产。
[0148]
本领域已知的有农艺学利益的基因(或转基因)的非限制性实例包括针对以下项的那些基因:除草剂抗性(美国专利第6,803,501号;第6,448,476号;第6,248,876号;第6,225,114号;第6,107,549号;第5,866,775号;第5,804,425号;第5,633,435;和第5,463,175号)、产量增加(美国专利第usre38,446号;第6,716,474号;第6,663,906号;第6,476,295号;第6,441,277号;第6,423,828号;第6,399,330号;第6,372,211号;第6,235,971号;第6,222,098号;和第5,716,837号)、昆虫控制(美国专利第6,809,078号;第6,713,063号;第6,686,452号;第6,657,046号;第6,645,497号;第6,642,030号;第6,639,054号;第6,620,988号;第6,593,293号;第6,555,655号;第6,538,109号;第6,537,756号;第6,521,442号;第6,501,009号;第6,468,523号;第6,326,351号;第6,313,378号;第6,284,949号;第6,281,016号;第6,248,536号;第6,242,241号;第6,221,649号;第6,177,615号;第6,156,573号;第6,153,814号;第6,110,464号;第6,093,695号;第6,063,756号;第6,063,597号;第6,023,013号;第5,959,091号;第5,942,664号;第5,942,658,5,880,275号;第5,763,245号;和第5,763,241号)、真菌疾病抗性(美国专利第6,653,280号;第6,573,361号;第6,506,962号;第6,316,407号;第6,215,048号;第5,516,671号;第5,773,696号;第6,121,436号;第6,316,407号;和第6,506,962号)、病毒抗性(美国专利第6,617,496号;第6,608,241号;第6,015,940号;第6,013,864号;第5,850,023;和第5,304,730号)、线虫抗性(美国专利第6,228,992号)、细菌疾病抗性(美国专利第5,516,671号)、植物生长和发育(美国专利第6,723,897号和第6,518,488号)、淀粉产量(美国专利第6,538,181号;第6,538,179号;第6,538,178号;第5,750,876号;第6,476,295号)、改进的油产量(美国专利第6,444,876号;第6,426,447号;第6,380,462号)、高油产量(美国专利第6,495,739号;第5,608,149号;第6,483,008和第6,476,295号)、改进的脂肪酸含量(美国专利第6,828,475号;第6,822,141号;第6,770,465号;第6,706,950号;第6,660,849号;第6,596,538号;第6,589,767号;第6,537,750号;第6,489,461;和第6,459,018号)、高蛋白质产量(美国专利第6,380,466号)、果实成熟度(美国专利第5,512,466号)、增强的动物和人营养(美国专利第6,723,837号;第6,653,530号;第6,5412,59号;第5,985,605;和第6,171,640号)、生物聚合物(美国专利第usre37,543号;第6,228,623号;和第5,958,745号和第6,946,588号)、环境胁迫抗性(美国专利第6,072,103号)、药用肽和可分泌肽(美国专利第6,812,379号;第6,774,283号;第6,140,075;和第6,080,560号)、改进的加工性状(美国专利第6,476,295号)、改善的可消化性(美国专利第6,531,648号)、低棉子糖(美国专利第6,166,292号)、工业酶生产(美国专利第5,543,576号)、改善的味道(美国专利第6,011,199号)、氮固定(美国专利第5,229,114号)、杂交种子生产(美国专利第5,689,041号)、纤维产量(美国专利第6,576,818号;第6,271,443号;第5,981,834号;和第5,869,720号)和生物燃料生产(美国专利第5,998,700号)。
[0149]
可替代地,有农艺学利益的基因或转基因可以通过编码引起内源基因的基因表达的靶向调节的rna分子影响上述植物特征或表型,例如通过反义(参见,例如美国专利第5,107,065号);抑制性rna(“rnai”,包括通过mirna-、sirna-、反式作用sirna-和阶段性srna介导的机制调节基因表达,例如,如在公开的申请u.s.2006/0200878和u.s.2008/0066206在以及美国专利申请11/974,469中所述);或共抑制介导的机制。rna也可以是催化性rna分子(例如,核酶或核糖开关;参见,例如,us 2006/0200878),将其工程改造为切割期望的内
源性mrna产物。以可转录dna序列被转录成rna分子的方式构建构建体并将其引入细胞中的方法是本领域已知的,所述rna分子能够引起基因抑制。
[0150]
选择标记
[0151]
还可以将选择标记转基因与本发明的调控元件一起使用。如本文所用的,术语“选择标记转基因”是指其在转基因植物、组织或细胞中的表达或缺乏表达可以某种方式进行筛选或评分的任何可转录dna序列。用于实践本发明的选择标记基因及其相关的选择和筛选技术在本领域是已知的,所述选择标记基因包括但不限于编码β-葡糖醛酸酶(gus)、绿色荧光蛋白(gfp)、赋予抗生素抗性的蛋白质和赋予除草剂耐受性的蛋白质的可转录dna序列。选择性标记转基因的实例提供为用于通过草甘膦选择来选择转化的植物细胞的goi-at.shkg-ctp2+agrtu.aroa-cp4.nat:1(seq id nos:47)、用于通过大观霉素选择来选择转化的植物细胞的goi-at.shkg-ctp2+ec.aada-spc/str:1:1(seq id no:54),以及用于在以下实施例中的转基因表达盒中的gus报告基因的goi-ec.ui da+st.ls1:3(seq id no:50),其旨在在自动切除之后保留在整合构建体中以证明所述表达盒的保留并确定接合性。
[0152]
位点特异性核酸酶
[0153]
如本文所用的,术语“基因组编辑”是指通过在靶位点或其附近的dna序列的缺失、取代和/或插入(可以使用位点特异性核酸酶生成)修饰活生物体或细胞的dna分子或基因组或染色体(比如农业作物的基因组)中的靶位点的遗传序列。“位点特异性整合”或“定点整合”是指将dna序列或构建体插入到活生物体或细胞的基因组或染色体中的靶位点的术语。如本文所用的,术语“位点特异性核酸酶”是指在dna分子、染色体或基因组的特定靶位点或位置处或附近产生双链断裂或切口的dna切割核酸酶。如本文所用的,用于基因组编辑的“靶位点”是指植物基因组内的多核苷酸序列的位置,所述位置被位点特异性核酸酶结合和切割,从而向所述多核苷酸序列的核酸骨架和/或其互补dna链中引入双链断裂(或单链切口)。在做出断裂或切割之后,经由非同源末端连接(nhej)或同源定向修复,细胞的dna修复机制可以识别和修复所述断裂或切口,并可能在靶位点引入突变和/或插入,如在本领域中理解的。
[0154]
本文提供的位点特异性核酸酶可选自由以下组成的组:锌指核酸酶(zfn)、大范围核酸酶、rna指导的核酸内切酶,比如crispr相关核酸酶、tale核酸内切酶(talen)、重组酶、转座酶或可能的任何其他核酸内切酶。参见,例如,khandagale,k.等人,“genome editing for targeted improvement in plants,”plant biotechnol rep 10:327-343(2016);以及gaj,t.等人,"zfn,talen and crispr/cas-based methodsfor genome engineering,"trends biotechnol.31(7):397-405(2013),将所述文献的内容和公开通过引用并入本文。本文提供的表达盒可以编码位点特异性核酸酶。这样的表达盒可包含可操作地连接至植物可表达启动子的编码位点特异性核酸酶的可转录dna序列。在另一方面,本文提供的重组dna构建体可以包含编码一种或多种位点特异性核酸酶的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、或至少十个表达盒。
[0155]
根据本公开的实施方案,重组酶可以是连接至dna识别基序的丝氨酸重组酶、连接至dna识别基序的酪氨酸重组酶或本领域已知的其他重组酶。重组酶或转座酶可以是连接至dna结合结构域的dna转座酶或重组酶。连接至dna识别基序的酪氨酸重组酶可选自由以下组成的组:cre重组酶、flp重组酶和tnp 1重组酶。根据一些实施方案,本文所提供的cre
重组酶或gin重组酶栓系至锌指dna结合结构域。在另一个实施方案中,本文所提供的与dna识别基序连接的丝氨酸重组酶选自由以下组成的组:phic31整合酶、r4整合酶和tp-901整合酶。在另一个实施方案中,本文提供的连接至dna结合结构域的dna转座酶选自由tale-piggybac和tale-mutator组成的组。
[0156]
根据本公开的实施方案,rna指导的核酸内切酶或crispr相关核酸酶可选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(也称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、cpf1、casx、casy以及它们的同源物或修饰形式、argonaute(argonaute蛋白的非限制性实例包括嗜热栖热菌(thermus thermophilus)argonaute(ttago)、激烈火球菌(pyrococcus furiosus)argo naute(pfago)、格氏嗜盐碱杆菌(natronobacterium gregoryi)argonaute(ngago)以及它们的同源物或修饰形式。根据一些实施方案,rna指导的核酸内切酶可以是cas9或cpf1酶。在另一方面,本文提供的位点特异性核酸酶选自由cas9或cpf1酶组成的组。
[0157]
对于rna指导的核酸内切酶或crispr相关核酸酶,可能需要指导rna(grna)分子,以通过碱基配对或杂交将所述核酸内切酶导向至植物的dna分子、染色体或基因组中的靶位点,从而在靶位点处或附近引起dsb或切口。可以将grna作为重组dna构建体转化或引入到植物细胞或组织中(可能与核酸酶或编码核酸酶的dna构建体一起),所述重组dna构建体包含可操作地连接至植物可表达启动子的编码指导rna的可转录dna序列。如本领域理解的,“指导rna”可包括,例如,crispr rna(crrna)、单链指导rna(sgrna)或可将核酸内切酶指导或导向至基因组中的特定靶位点的任何其他rna分子。“单链指导rna”(或“sgrna”)是包含通过接头序列共价连接tracrrna的crrna的rna分子,其可表达为单个rna转录物或分子。指导rna包含与dna分子、染色体或植物基因组内的靶位点相同或互补的指导或靶向序列。原型间隔序列相邻基序(pam)可存在于基因组中、紧邻与指导rna的靶向序列互补的基因组靶位点序列的5’端且在其上游-即,紧邻基因组靶位点的有义(+)链的下游(3’)(相对于指导rna的靶向序列),如本领域已知的。参见,例如,wu,x.等人,“target specificity of the crispr-cas9 system,”quant biol.2(2):59-70(2014),将所述文献的内容和公开内容通过引用并入本文。在与靶位点(相对于指导rna的靶向序列)相邻的有义(+)链上的基因组pam序列可包含5
’‑
ngg-3’。然而,指导rna的对应序列(即,紧邻指导rna的靶向序列的下游(3’))通常可不与基因组pam序列互补。指导rna通常可以是不编码蛋白质的非编码rna分子。指导rna的指导序列的长度可以是至少10个核苷酸,比如长度为12-40个核苷酸、12-30个核苷酸、12-20个核苷酸、12-35个核苷酸、12-30个核苷酸、15-30个核苷酸、17-30个核苷酸、或17-25个核苷酸,或长度为约12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个核苷酸。指导序列可与靶位点处的dna序列的至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个或更多个连续核苷酸具有至少95%、至少96%、至少97%、至少99%或100%同一性或互补性。本文提供的表达盒可编码指导rna。这样的表达盒可包含可操作地连接至植物可表达启动子的编码指导rna的可转录dna序列。在另一方面,本文提供的重组dna构建体可以包含编码一个或多个指导
rna的至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、或至少十个表达盒。
[0158]
锌指核酸酶(zfn)是合成蛋白质,由与切割结构域(或切割半结构域)融合的工程化锌指dna结合结构域组成,其可源自限制性核酸内切酶(例如,fok1)。dna结合结构域可以是典型的(c2h2)或非典型的(例如,c3h或c4)。取决于靶位点,dna结合结构域可包含一个或多个锌指(例如,2个、3个、4个、5个、6个、7个、8个、9个或更多个锌指)。dna结合结构域中的多个锌指可通过一个或多个接头序列分开。zfn可被设计成通过锌指dna结合结构域的修饰来切割双链dna的几乎任何链段。zfn由包括与dna结合结构域融合的非特异性dna切割结构域(例如,源自foki核酸酶)的单体形成二聚体,所述dna结合结构域包括被工程改造以结合靶位点dna序列的锌指阵列。zfn的dna结合结构域通常可由3-4个(或更多个)锌指组成。在相对于促成与靶位点的位点特异性结合的锌指α-螺旋的起点而言的-1、+2、+3和+6位置处的氨基酸可以改变和定制,以适应特定靶序列。其他氨基酸可形成共有骨架,以生成具有不同序列特异性的zfn。用于设计靶向和结合至特定靶序列的zfn的方法和规则是本领域已知的。参见,例如,美国专利申请号2005/0064474、2009/0117617和2012/0142062,将所述专利申请的内容和公开通过引用并入本文。fok1核酸酶结构域可能需要二聚化,以便切割dna,并且因此需要具有其c端区域的两个zfn来结合切割位点的相反dna链(分开5-7个bp)。如果双zf结合位点是回文的,那么zfn单体可以切割所述靶位点。如本文所用,zfn是广义的并且包括单体zfn,所述单体zfn可在没有另一个zfn帮助的情况下切割双链dna。术语zfn还可用于指被工程改造成共同作用为在同一位点处切割dna的一对zfn的一个或两个成员。
[0159]
不受任何科学理论的限制,因为可以使用各种方法中的一种将锌指结构域的dna结合特异性重新工程改造,因此定制的zfn在理论上可被构建成靶向几乎任何靶序列(例如,在植物基因组中的ga氧化酶基因处或附近)。用于工程改造锌指结构域的可公开获得的方法包括背景依赖的组装(context-dependent assembly(coda))、寡聚化池工程化(oligomerized pool engineering(open))和模块化组装。在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种zfn。在另一方面,本文提供的zfn能够生成靶向dsb或切口。在一个方面,通过本领域已知的转化方法(例如但不限于,病毒转染、粒子轰击、peg介导的原生质体转染或土壤杆菌介导的转化)向细胞提供了包含编码一种或多种、两种或更多种、三种或更多种、四种或更多种、或五种或更多种zfn的多核苷酸的载体。zfn可作为zfn蛋白、作为编码zfn蛋白的多核苷酸和/或作为蛋白质和编码蛋白质的多核苷酸的组合引入。
[0160]
通常在微生物中鉴定的大范围核酸酶,诸如归巢核酸内切酶的laglidadg家族,是具有高活性和导致靶dna的位点特异性消化的长识别序列(》14bp)的独特的酶。天然存在的大范围核酸酶的工程化形式通常具有延长的dna识别序列(例如,14至40个bp)。根据一些实施方案,大范围核酸酶可包含选自由以下组成的组的支架或基础酶:i-crei、i-ceui、i-msoi、i-seei、i-anii和i-dmoi。大范围核酸酶的工程化可能比zfn和talen更具挑战性,因为大范围核酸酶的dna识别和切割功能在单个结构域中交织在一起。已经使用专门的诱变和高通量筛选方法来产生识别独特序列并具有改进的核酸酶活性的新型大范围核酸酶变体。因而,大范围核酸酶可被选择或工程改造为结合植物中的基因组靶序列。在一个方面,本文提供的方法和/或组合物包含一种或多种、两种或更多种、三种或更多种、四种或更多
种或五种或更多种大范围核酸酶。在另一方面,大范围核酸酶能够生成靶向的切口或断裂。
[0161]
锌指核酸酶(zfn)和tal效应核酸酶(talen)是组合核酸酶和dna结合结构域的嵌合酶。talen是一类序列特异性核酸酶,可用于在植物或其他生物的基因组中的特定靶序列处产生双链断裂。talen是通过将转录激活因子样效应物(tale)dna结合结构域与核酸酶结构域(例如,foki)融合而生成的限制酶。当talen对的每个成员都与靶位点两侧的dna位点结合时,foki单体二聚化并在靶位点引起双链dna断裂。除野生型foki切割结构域之外,已经设计了具有突变的foki切割结构域的变体以改进切割特异性和切割活性。foki结构域作为二聚体起作用,其需要具有针对靶基因组中有适当取向和间距的位点的独特dna结合结构域的两个构建体。talen dna结合结构域和foki切割结构域之间的氨基酸残基的数量以及两个单独talen结合位点之间的碱基的数量均是实现高活性水平的参数。talen是通过将转录激活因子样效应物(tale)dna结合结构域与核酸酶结构域融合而生成的人工限制酶。在一些方面,核酸酶选自由以下组成的组:pvuii、muth、tevi、foki、alwi、mlyi、sbfi、sdai、stsi、cledorf、clo051和pept071。当talen对的每个成员都与靶位点两侧的dna位点结合时,foki单体二聚化并在所述靶位点引起双链dna断裂。如本文所用的,术语talen是广义的并且包括可以在没有另一个talen帮助的情况下切割双链dna的单体talen。术语talen还指在同一位点处共同作用以切割dna的一对talen的一个或两个成员。
[0162]
可以将转录激活因子样效应物(tale)工程改造为实际上结合比如在植物中的ga氧化酶基因的基因组基因座处或附近的任何dna序列。tale具有由13-28个具有33-34个氨基酸的重复单体组成的中心dna结合结构域。除了在第12和13位的高变氨基酸残基之外,每个单体的氨基酸是高度保守的。tal效应物的dna结合结构域可以含有33-35个氨基酸序列重复,其中包括在残基12和13处的重复可变双残基(rvd),其决定了它们在dna结合中的特异性。每个重复结合特定的核苷酸,所述核苷酸通过选择含有适当rvd的重复区段的组合促进了特定dna结合结构域的工程化。rvd序列的重复数量决定了将被识别的靶序列的长度和序列(podevin等人,(2013)trends in biotechnology31(6):375-383)。将两个可变氨基酸称为重复可变双残基(rvd)。rvd的氨基酸对优先识别某些核苷酸碱基,并且rvd的调节可以识别连续的dna碱基。在氨基酸序列和dna识别之间的这种简单关系允许通过选择含有适当rvd的重复区段的组合将特定的dna结合结构域工程化。
[0163]
除野生型foki切割结构域之外,已经设计了具有突变的foki切割结构域的变体以改进切割特异性和切割活性。foki结构域作为二聚体起作用,其需要具有针对靶基因组中有适当取向和间距的位点的独特dna结合结构域的两个构建体。talen dna结合结构域和foki切割结构域之间的氨基酸残基的数量以及两个单独talen结合位点之间的碱基的数量均是实现高活性水平的参数。pvuii muth和tevi切割结构域是用于与tale一起使用的foki和foki变体的有用替代物。当与tale偶联时,pvuii作为高度特异性的切割结构域起作用(参见yank等人2013.plos one.8:e82539)。muth能够在dna中引入链特异性切口(参见gabsalilow等人,2013.nucleic acids research.41:e83)。tevi在靶向位点处在dna中引入双链断裂(参见beurdeley等人,2013.nature comm.4:1762)。在氨基酸序列与tale结合结构域的dna识别之间的关系允许可设计的蛋白质。可以使用诸如dna works的软件程序来设计tale构建体。设计tale构建体的其他方法是本领域技术人员已知的。参见doyle等人,nucleic acids research(2012)40:wl 17-122.;cermak等人,nucleic acids research
(2011).39:e82;和tale-nt.cac.comell.edu/about。在一个方面,本文提供的重组dna构建体包含一种或多种、两种或更多种、三种或更多种、四种或更多种或五种或更多种talen。在另一方面,本文所提供的talen能够在靶位点生成靶向切口或断裂。
[0164]
锌指核酸酶(zfn)包含锌指dna结合结构域和双断裂诱导结构域。识别位点特异性由锌指结构域赋予,其可以包含两个、三个或四个锌指,例如具有c2h2结构,尽管其他锌指结构是已知的并且已经被工程化。锌指结构域适合用于设计特异性结合选择的多核苷酸识别序列的多肽。zfn由连接至非特异性核酸内切酶结构域(例如来自iis型核酸内切酶的核酸酶结构域,比如foki)的工程化dna结合锌指结构域组成。其他功能性可以融合至锌指结合结构域,包括转录激活因子结构域、转录抑制子结构域和甲基化酶。在一些实例中,核酸酶结构域的二聚化对于切割活性是必需的。每个锌指识别靶dna中的三个连续碱基对。例如,三指结构域识别具有核酸酶的二聚化要求的九个连续核苷酸的序列,使用两组锌指三联体来结合十八个核苷酸的识别序列(gaj等人,(2013)trends biotechnology,31(7):397-405;和urnov等人,(2010)nature reviews genetics,11:636-646)。
[0165]
细胞转化
[0166]
本发明还涉及一种产生转化细胞和植物的方法,所述转化细胞和植物包含可操作地连接至可转录dna序列的一个或多个调控元件。
[0167]
术语“转化”是指将dna分子引入受体宿主中。如本文所用的,术语“宿主”是指细菌、真菌或植物,包括细菌、真菌或植物的任何细胞、组织、器官或后代。特别感兴趣的植物组织和细胞包括原生质体、愈伤组织、根、块茎、种子、茎、叶、幼苗、胚和花粉。
[0168]
如本文所用的,术语“转化的”是指已经向其中引入外来dna分子(比如构建体)的细胞、组织、器官或生物体。可以使引入的dna分子整合到受体细胞、组织、器官或生物体的基因组dna中,使得引入的dna分子被随后的后代继承。“转基因的”或“转化的”细胞或生物还可以包括细胞或生物的后代以及从育种计划产生的后代,所述育种计划采用这样的转基因生物作为杂交的亲本,并表现出因外来dna的存在而导致的改变的表型。还可以将引入的dna分子瞬时引入到受体细胞中,使得所述引入的dna分子不被随后的后代遗传。术语“转基因的”是指含有一个或多个异源dna分子的细菌、真菌或植物。
[0169]
有许多本领域技术人员熟知的用于向植物细胞引入dna分子和转化植物细胞的方法。该过程通常包括以下步骤:选择适合的宿主细胞或外植体,用分子或载体转化所述细胞或外植体,和获得转化细胞。在本发明的实践中,通过将植物构建体引入植物基因组中来转化植物细胞的方法和材料可以包括任何熟知的和经证明的方法。适合的方法包括但不限于细菌感染(例如,土壤杆菌)、二元bac载体、dna的直接递送(例如,通过peg介导的转化、干燥/抑制介导的dna摄取、电穿孔、通过用碳化硅纤维搅拌和通过dna包被颗粒的加速)、基因编辑(例如crispr-cas系统)等。根据某些实施方案,转化方法包括土壤杆菌或根瘤菌介导的转化或粒子轰击或微粒介导的转化。
[0170]
宿主细胞可以是任何细胞或生物体,比如植物细胞、藻类细胞、藻类、真菌细胞、真菌、细菌细胞或昆虫细胞。在具体实施方案中,宿主细胞和转化细胞可包括来自作物植物的细胞。
[0171]
随后可以从本发明的转基因植物细胞再生转基因植物。使用常规育种技术或自花授粉,可以从这种转基因植物产生种子。这样的种子和从这样的种子长出的后代植物将含
有本发明的重组dna分子,并且因此将是转基因的。
[0172]
本发明的转基因植物可以自花授粉从而为本发明的纯合转基因植物(对于重组dna分子而言是纯合的)提供种子,或者可以与非转基因植物或不同的转基因植物杂交,从而为本发明的杂合转基因植物(对于重组dna分子而言是杂合的)提供种子。这样的纯合和杂合转基因植物在本文中都称为“后代植物”。后代植物是遗传自原始转基因植物并且含有本发明的重组dna分子的转基因植物。可以收获使用本发明的转基因植物产生的种子并用于培养转基因植物的世代,即,本发明的后代植物,其包含本发明的构建体并表达有农艺学利益的基因。通常用于不同作物的育种方法的描述可以在几本参考书之一中找到,参见,例如,al lard,principles of plant breeding,john wiley&sons,ny,u.of ca,davis,ca,50-98(1960);simmonds,principles of crop improveme nt,longman,inc.,ny,369-399(1979);sneep和hendriksen,plant breeding perspectives,wageningen(编辑),center for agricultural publis hing and documentation(1979);fehr,soybeans:improvement,product ion and uses,第2版,monograph,16:249(1987);fehr,principles of variety development,theory and technique,(第1卷)和crop species soybean(第2卷),iowa state univ.,macmillan pub.co.,ny,360-376(1987)。
[0173]
可以分析转化的植物中感兴趣的一个基因或多个基因的存在以及由本发明的调控元件赋予的表达水平和/或谱。本领域的技术人员将知晓众多的可用于分析转化植物的方法。例如,用于植物分析的方法包括但不限于southern印迹或northern印迹、基于pcr的方法、生物化学分析、表型筛选方法、田间评价和免疫诊断测定。可以使用如制造商描述的(applied biosystems,foster city,ca)试剂和方法来测量可转录dna序列的表达,并使用testing matrix确定pcr循环次数。可替代地,可以使用如制造商描述的(third wave technologies,madison,wi)试剂和方法来评价转基因表达。
[0174]
本发明还提供了本发明植物的部分。植物部分包括但不限于叶、茎、根、块茎、种子、胚乳、胚珠和花粉。本发明的植物部分可以是能存活的、不能存活的、可再生的和/或不可再生的。本发明还包括并且提供了包含本发明dna分子的转化的植物细胞。本发明的转化或转基因的植物细胞包括可再生和/或不可再生的植物细胞。
[0175]
本发明还提供了从含有本发明的重组dna分子的转基因植物或其部分产生的商品产品。本发明的商品产品含有可检测量的dna,所述dna包含选自由以下组成的组的dna序列:seq id no:1-26、59-62和64-66。如本文所用的,“商品产品”指任何组合物或产品,其由来源于含有本发明的重组dna分子的转基因植物、种子、植物细胞或植物部分的材料组成。商品产品包括但不限于经加工的种子、籽粒、植物部分和粗粉。本发明的商品产品将含有可检测量的对应于本发明的重组dna分子的dna。可以使用样品中一个或多个这种dna的检测来确定商品产品的含量或来源。可以使用任何标准的dna分子检测方法,包括本文公开的检测方法。
[0176]
通过参考以下实施例可以更容易地理解本发明,这些实施例以说明的方式提供,并且不旨在限制本发明,除非另有说明。本领域技术人员应当理解,以下实施例中公开的技术代表发明人发现的在本发明的实践中发挥良好作用的技术。然而,根据本公开,本领域技术人员应当理解,可以在公开的具体实施方案中做出许多变化,并且仍然获得相似或类似的结果,而不脱离本发明的精神和范围,因此,所阐述的所有事项都应被解释为说明性的而
不是限制性的意义。
[0177]
实施例
[0178]
实施例1
[0179]
能够驱动作物植物中的自动切除的调控元件的鉴定
[0180]
本实施例提供了经过多年实验鉴定的能够驱动在转基因玉米、大豆和棉花中的有效的自动切除的调控元件。
[0181]
通过结合文献检索以及公共及专有数据库检索,首次鉴定了有可能驱动转基因作物植物中的有效自动切除的调控元件。已使用cre/lox重组酶系统对包含不同调控元件和组合的七十种大豆、二十种棉花和一百种玉米二元转化载体构建体测定了有效的自动切除。从这些研究中,鉴定了提供有效的自动切除的少量调控元件,并呈现在下表1中。
[0182]
表1.在作物植物中提供有效的自动切除的调控元件。
[0183]
[0184][0185][0186]
实施例2
[0187]
玉米和水稻cdc45-1启动子驱动稳定转化的玉米植物中的自动切除
[0188]
用重组dna分子特别是包含驱动cre-重组酶表达的不同调控元件的植物转化构建体转化玉米植物,以评估在不同调控元件控制下表达的cre-重组酶驱动cre-重组酶表达盒和标记基因表达盒的自动切除的能力和效率。
[0189]
用包含以下三个转基因表达盒的二元植物转化构建体转化玉米植物:选择标记基因表达盒和cre-重组酶表达盒,两者的两侧都有两个loxp位点(rs-p1.lox1:1,seq id no:44),以及位于loxp位点之外的第三个表达盒,其表达β-葡糖醛酸酶(gus)转基因。cre-重组酶表达盒用于测定不同的exp,以测试它们驱动位于loxp位点之间的cre-重组酶表达盒和标记基因表达盒的有效自动切除的能力。cre-重组酶表达盒由以下元件组成:待测试的exp,所述待测试的exp可操作地连接至编码cre-重组酶的合成编码序列(例如,为在植物细胞中表达而重新设计的密码子)(goi-p1.cre-st.ls1:1:1,seq id no:43)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述内含子可操作地连接至3

终止或3’utr(t-agrtu.nos:13,seq id no:48)的5

。每个植物转化构建体包含两个不同的标记基因表达盒之一,命名为“标记-1”和“标记-2”。标记-1标记基因表达盒包含以下元件:组成型exp(exp-os.act1:1:1(seq id no:46)),所述组成型exp可操作地连接至编码提供对除草剂草甘膦的耐受性的质体靶向的cp4编码序列(goi-at.shkg-ctp2+agrtu.aroa-cp4.nat:1,seq id no:47)的合成编码序列的5

,所述合成编码序列可操作地连接至3

终止区t-agrtu.nos:13(seq id no:48)的5

。标记-2基因表达盒包含以下元件:组成型exp(exp-os.tuba-3:1(seq id no:52)),所述组成型exp可操作地连接至编码提供对除草剂草甘膦的耐受性的质体靶向的cp4编码序列(goi-at.shkg-ctp2+agrtu.aroa-cp4.nat:1,seq id no:47)的合成编码序列的5

,所述合成编码序列可操作地连接至3

终止区
[0190]
t-agrtu.nos:13(seq id no:48)的5


[0191]
标记基因表达盒和cre-重组酶表达盒的两侧是在相同头对尾方向的两个loxp cre-重组酶识别序列(rs-p1.lox1:1,seq id no:44)。如果自动切除有效,则预期cre-重组酶在转化的植物细胞内的表达会导致两个盒的切除。gus表达盒被克隆到loxp cre-重组酶识别序列之外并且包含如下元件:包含嵌合启动子和前导序列的exp(exp-os.act1+camv.35s.2xa1-b3+ta.lhcb1:1:1,seq id no:49),其可操作地连接至编码β-葡糖醛酸酶的合成编码序列(goi-ec.uida+st.ls1:3,seq id no:50)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-st.pis4-1:4:1,seq id no:51)的5


[0192]
将源自玉米和水稻cdc45基因同源物的三个exp可操作地连接至编码cre重组酶的可转录dna序列,并测定它们在稳定转化的玉米植物中驱动自动切除的能力。exp-zm.cdc45-1+zm.dnak:1:1(seq id no:1)包含启动子(p-zm.cdc45-1:8,seq id no:2),所述启动子可操作地连接至合成前导序列(l-zm.cdc45-1:1,seq id no:3)的5

,所述合成前导序列可操作地连接至内含子(i-zm.dnak:1,seq id no:39)的5

。ex p-os.cdc45-1:1:1(seq id no:4)包含启动子(p-os.cdc45-1-1:1:1,seq id no:5),所述启动子可操作地连接至前导序列(l-os.cdc45-1-1:1:1,seq id no:6)的5

。exp-zm.cdc45-2+zm.dnak:1:2(seq id no:27)包含启动子(p-zm.cdc45-2-1:1:3,seq id no:28),所述启动子可操作地连接至前导序列(l-zm.cdc45-2-1:1:1,seq id no:29)的5

,所述前导序列可操作地连接
至内含子(i-zm.dnak:1,seq id no:39)的5


[0193]
还将两个另外的exp可操作地连接至编码cre重组酶的可转录dn a序列,并测定它们在稳定转化的玉米植物中驱动自动切除的能力。源自在花粉中表达的种系偏好基因的exp-zm.zm13:2(seq id no:30)包含启动子(p-zm.zm13:2,seq id no:31),所述启动子可操作地连接至前导序列(l-zm.zm13:2,seq id no:32)的5

。源自胚乳偏好基因的exp-zm.waxy+zm.dnak:1:5(seq id no:33)包含启动子(p-zm.waxy-1:1:9,seq id no:34),所述启动子可操作地连接至前导序列(l-zm.wax y-1:1:1,seq id no:35)的5

,所述前导序列可操作地连接至内含子(i-zm.dnak:1,seq id no:39)的5


[0194]
通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化玉米植物细胞,其中每个待测试的上述exp可操作地连接至编码cre重组酶的可转录dna序列。用于土壤杆菌介导的转化的方法是本领域熟知的。在草甘膦选择下,将得到的转化植物细胞再生为玉米植物。
[0195]
选择具有单拷贝事件的r0植物并允许自花授粉。然后使用taqm测定法分析所得r1种子的cre、cp4和gus转基因的存在。还使用gus转基因的测定法确定r1种子对于整合构建体的接合性。按照每个选定的r0事件的自交,测定了四十一粒r1种子。那些产生对于gus而言是纯合的且缺乏cre和cp4转基因的至少两粒r1种子的事件被认为成功地自动切除了cre和cp4转基因表达盒。下表2显示了针对每个exp的结果。对应于两种不同的cp4标记转基因盒(标记-1和标记-2)的数据也呈现在表2中。仅仅cp4转基因盒之一用于exp-zm.zm13:2(标记-1)和exp-zm.waxy+zm.dnak:1:5(标记-2)。在表2中,“纯合事件/分析的41粒种子百分比”一栏表示产生至少两粒r1种子的事件的百分比,所述种子对于gus而言是纯合的并且缺乏cre和cp4转基因。在括号中,第一个数字表示产生至少两粒r1种子的r0事件的数量,所述种子对于gus而言是纯合的并且缺乏cre和cp4转基因,第二个数字表示其中每个事件分析了41粒种子的r0事件的数量。
[0196]
表2.证明在具有玉米和水稻cdc45-1启动子驱动的自动切除的稳定转化的玉米植物中的有效的自动切除的r0事件百分比。
br.snap2-1:3:6,seq id no:59)的5

。crtb基因在种子中的表达产生橙色着色的种子,并且是由于自动切除之后未能切除所述转基因盒而在loxp位点之间保留所述盒的指示。转化aada选择标记盒由以下元件组成:exp(exp-at.act7:2,seq id no:53),所述exp可操作地连接至编码叶绿体靶向的tn7腺苷酰转移酶的编码序列(goi-at.shkg-ctp2+ec.aada-spc/str:1:1,seq id no:54)的5

,所述腺苷酰转移酶赋予大观霉素抗性并用于选择转化的植物细胞,所述编码序列可操作地连接至3

终止区(t-agrtu.nos:13,seq id no:48)的5

。gus转基因表达盒包含增强的花椰菜花叶病毒35s启动子和前导序列(exp-camv.35s-enh:1:2,seq id no:55),其可操作地连接至编码β-葡糖醛酸酶的合成编码序列(goi-ec.uida+st.ls1:3,seq id no:50)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-agrtu.nos:13,seq id no:48)的5'。
[0203]
将源自具有种系偏好表达的拟南芥基因的七个exp可操作地连接至编码cre重组酶的可转录dna序列,并测定它们在稳定转化的大豆植物中驱动自动切除的能力。参见下表3。每个cre-重组酶表达盒还包含对应于exp所来源的基因的天然3

终止区(也呈现在表3中)。exp中的两个,即,exp-at.swi1(seq id no:13)和exp-at.swi1s(seq id no:14),是源自相同种系偏好基因的不同长度的变体,并且包含可操作地连接至前导序列的启动子。3

utr,即,t-at.swi1-1:2:1(seq id no:14)用于两个exp-at.swi1表达盒中。同样,另外两个exp,即,exp-syn1(seq id no:36)和exp-syn1a(seq id no:37),是源自相同种系偏好基因的不同长度的变体,并且包含可操作地连接至前导序列的启动子。3

utr,即,t-at.syn1-1:2:1(seq id no:38)用于两个exp-at.syn1表达盒中。
[0204]
通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化大豆植物细胞,其中每个待测试的上述exp可操作地连接至编码cre重组酶的可转录dna序列。用于土壤杆菌介导的转化的方法是本领域熟知的。在大观霉素选择下,使所得的转化植物细胞再生为大豆植物。
[0205]
选择具有单拷贝事件的r0植物并允许自花授粉。然后使用测定法分析所得r1种子的gus转基因的存在。根据由保留的crtb表达盒赋予给种子的橙色的缺乏,推断出在loxp位点之间的cre、aada和crtb表达盒的成功自动切除。下表3显示了针对每个exp/3

utr组合的结果。
[0206]
表3.在稳定转化的大豆植物中产生无标记r1种子的r0事件的百分比。
[0207]
[0208][0209]
如上表3中可以看出,本实验中的所有exp(exp-syn1和exp-syn1a除外)都能够在稳定转化的大豆植物中驱动自动切除。源自拟南芥cdc45基因的exp和3

utr组合(exp-at.cdc45:1:1,seq id no:9和t-at.cdc45:1,seq id no:12)提供了最高百分比的产生无标记r1种子的r0事件。源自拟南芥swi1基因的两个变体exp(exp-at.swi1,seq id no:13和exp-at.swi1a,seq id no:14)和相同的对应的3

utr(t-at.swi1-1:2:1,seq id no:15)也提供了高百分比的产生无标记r1种子的r0事件。
[0210]
实施例4
[0211]
大豆rsp-1启动子在稳定转化的大豆植物中驱动自动切除
[0212]
将大豆植物用构建体特别是包含驱动cre-重组酶表达的测试调控元件的植物二元转化构建体进行转化,并用于评估cre-重组酶表达盒和标记基因表达盒的自动切除的能力和效率。
[0213]
用包含以下三个转基因表达盒的二元植物转化构建体转化大豆植物:cre-重组酶表达盒和用于选择转化的大豆细胞的选择标记表达盒(aada),其两侧是两个loxp位点(rs-p1.lox1:1,seq id no:44);以及在loxp位点之外的第三表达盒,其用于表达β-葡糖醛酸酶(gus)转基因。cre-重组酶表达盒用于测定不同的exp的它们驱动cre-重组酶表达盒和标记基因表达盒的有效自动切除的能力。cre-重组酶表达盒由以下元件组成:测试exp,其可操作地连接至编码cre-重组酶的合成编码序列(goi-p1.cre-st.ls1:1:1,seq id no:43)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-at.cd c45:1,
seq id no:12)的5

。转化选择标记盒aada由以下元件组成:exp(exp-at.act7:2,seq id no:54),其可操作地连接至编码叶绿体靶向的tn7腺苷酰转移酶的编码序列(goi-at.shkg-ctp2+ec.aada-spc/str:1:1,seq id no:54)的5

,所述腺苷酰转移酶赋予大观霉素抗性并用于选择转化的植物细胞,所述编码序列可操作地连接至3

终止区(t-agrtu.nos:13,seq id no:48)的5

。gus转基因表达盒由以下元件组成:增强的花椰菜花叶病毒35s启动子和前导序列(exp-camv.35s-enh:1:2,seq id no:55),其可操作地连接至编码β-葡糖醛酸酶的合成编码序列(goi-ec.uida+st.ls1:3,seq id no:50)的5',所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-agrtu.nos:13,seq id no:48)的5


[0214]
exp-gm.rsp-1:1在稳定转化的大豆植物中驱动有效的自动切除。
[0215]
用如上所述的二元构建体转化大豆植物,其中exp(exp-gm.rsp-1:1(seq id no:20))驱动cre-重组酶转基因的表达。cre-重组酶表达盒由exp(exp-gm.rsp-1:1(seq id no:20))组成,所述exp由以下元件组成:启动子(p-gm.rsp-1-1:1:1,seq id no:21),所述启动子可操作地连接至前导序列(l-gm.rsp-1-1:1:1,seq id no:22)的5

,所述前导序列可操作地连接至编码cre-重组酶的合成编码序列的5

,所述合成编码序列可操作地连接到至3

终止区(t-at.cdc45:1,seq id no:12)的5


[0216]
如本领域熟知的,通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化大豆植物细胞。在大观霉素选择下诱导所得的转化植物细胞形成完整的大豆植物。
[0217]
允许五十个r0单拷贝事件自花授粉。然后使用测定法分析所得r1植物的cre、aada和gus转基因的存在。也使用的cre、aada和gus转基因的存在。也使用测定法确定了gus转基因盒的接合性。将针对五十个r0事件中每一个的gus阳性(gus+)和无标记(aada-)r1后代的百分比呈现在下表4中。
[0218]
表4.在具有exp-gm.rsp-1:1驱动的自动切除的稳定转化的大豆植物中gus阳性(gus+)和无标记(aada-)r1后代的百分比
[0219]
[0220]
[0221]
[0222][0223]
从上表4中可以看出,除了一个r0事件(事件-26)之外,所有事件在自花授粉之后都产生了无标记r1后代。一些r0事件提供了很大比例的无标记r1后代植物,其中许多对于gus标记表达盒而言是纯合的,比如事件-12、事件-15、事件-18、事件-20、事件-37、事件-41、事件-44、事件-46和事件-48。包含在exp-gm.rsp-1:1(seq id no:20)中的p-gm.rsp-1-1:1:1启动子(seq id no:21)在稳定转化的大豆植物中提供了有效的自动切除。
[0224]
种系偏好的dmc1启动子在稳定转化的大豆植物中未驱动有效的自动切除。
[0225]
已证明拟南芥种系偏好的dmc1启动子在转化的拟南芥植物中驱动有效的自动切除。为了看到这种启动子是否能够在稳定转化的大豆植物中驱动自动切除,构建了如上所述的二元植物转化载体,其中exp(exp-at.dmc1+zm.dnak:1:1(seq id no:40))可操作地连接至编码cre-重组酶的合成编码序列的5


[0226]
如本领域熟知的,通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化大豆植物细胞。在大观霉素选择下诱导所得的转化植物细胞形成完整的大豆植物。
[0227]
允许选择的r0单拷贝事件自花授粉。然后使用测定法分析所得r1植物的cre、aada和gus转基因的存在。也使用测定法确定了gus转基因盒的接合性。将针对选择的r0事件中每一个的gus阳性(gus+)和无标记(aada-)r1后代的百分比呈现在下表5中。
[0228]
表5.在具有dmc1启动子驱动的自动切除的稳定转化的大豆植物中gus阳性(gus+)和无标记(aada-)r1后代的百分比。
genomes.nucleic acids research,36(3):861-871),可操作地连接至exp-gm.rsp-1:1(exp-gm.rsp-1:1+kozak)的3


[0234]
如上所述类似地构建了四种二元植物转化构建体,每种包含可操作地连接至编码cre-重组酶的合成编码序列的5

的exp-gm.rsp-1:1(seqid no:20)。一种构建体还包含可操作地连接至exp-gm.rsp-1:1(ex p-gm.rsp-1:1+kozak)的3

小的kozak共有序列。另外两个构建体包含t-at.cdc45:1(seq id no:12)、t-at.cdc45:3(seq id no:23)和t-at.cd c45:4(seq id no:24)的截短变体。在loxp位点之外的gus表达盒被取代为表达除草剂耐受性基因的表达盒。
[0235]
如本领域熟知的,通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化大豆植物细胞。在大观霉素选择下诱导所得的转化植物细胞形成完整的大豆植物。
[0236]
允许选择的r0单拷贝事件自花授粉。然后使用测定法分析所得r1植物的cre、aada和除草剂耐受性转基因的存在。也使用测定法确定了除草剂耐受性(ht)转基因盒的接合性。将针对选择的r0事件中每一个的纯合的ht阳性和无标记r1后代的百分比呈现在下表6中。
[0237]
表6.稳定转化的大豆植物中纯合的ht阳性和无标记r1后代的百分比。
[0238][0239]
如上表6中可以看出,将kozak共有序列引入exp-gm.rsp-1:1的3

对稳定转化的大豆植物中的自动切除的效率具有最小影响(23%,相对于没有kozak共识序列的29%)。t-at.cdc45:1 3

utr的截短变体降低了自动切除的效率。然而,对于t-at.cdc45:1的两种截短变体,自动切除仍然发生。
[0240]
将内含子引入exp-gm.rsp-1:1的3

显著降低了稳定转化的大豆植物中的自动切除。
[0241]
本领域已知内含子改善转基因的表达。为了评估内含子在自动切除中的作用,将内含子i-at.atpe:1(seq id no:26)克隆至类似于上面描述那些的二元植物转化构建体中的exp-gm.rsp-1:1的3

。除了cre、aada和gus转基因盒外,将第三转基因盒克隆在loxp位点之间,用于表达蔗糖磷酸化酶基因;视觉标记。当种子中存在spla表达盒时,种子将出现皱缩。这种视觉标记允许快速评估未通过自动切除去除的标记基因盒的存在。表达盒由以下元件组成:种子增强的exp(exp-vf.usp88-enh:1:1(seq id no:60)),所述exp可操作地连
接至编码蔗糖磷酸化酶的编码序列(cr-agrtu.spla-c58:1:3,seq id no:61)的5

,所述编码序列可操作地连接至3

终止区(t-agrtu.nos:13,seq id no:48)的5

。允许选择的r0单拷贝事件自花授粉。使用测定法确定gus转基因盒的存在和gus转基因盒的接合性。通过目视检查r1后代种子并观察皱缩种子表型的缺乏,确定cre、aada和spla表达盒的缺乏。推断那些具有皱缩种子外观的种子仍然包含cre、aada和spla表达盒。将针对选择的r0事件中每一个的gus阳性(gus+)和无标记(aada-)r1后代的百分比呈现在下表7中。
[0242]
表7.在具有exp-gm.rsp-1:1和i-at.atpe:1驱动的自动切除的稳定转化的大豆植物中gus阳性(gus+)和无标记(aada-)r1后代的百分比。
[0243][0244][0245]
如上表7中可以看出,相比于没有内含子的结果(见上表4),向exp-gm.rsp-1:1的3'添加内含子i-at.atpe:1(seq id no:26)显著降低了稳定转化的大豆植物中的自动切除的效率。少数r0事件产生纯合的gus阳性的无标记事件。相反,正如下面的实施例5中所见,将i-at.atpe:1内含子引入到exp-gm.rsp-1:1的3

增强了exp-gm.rsp-1:1有效地驱动棉花植物中的自动切除的能力。
[0246]
实施例5
[0247]
当大豆rsp-1启动子可操作地连接至内含子i-at.atpe:1时驱动稳定转化的棉花植物中的自动切除
[0248]
如以前的实施例中所述,用包含克隆至exp-gm.rsp-1:1的3'的内含子i-at.atpe:
1(seq id no:26)的相同二元植物转化构建体转化棉花植物。允许选择的r0单拷贝事件自花授粉。使用测定法确定gus转基因盒的存在和gus转基因盒的接合性。通过目视检查r1后代种子并观察皱缩种子表型的缺乏,确定cre、aada和spla表达盒的缺乏。将针对选择的r0事件中每一个的gus阳性(gus+)和无标记(aada-)r1后代的百分比呈现在下表8中。
[0249]
表8.在具有exp-gm.rsp-1:1和i-at.atpe:1驱动的自动切除的稳定转化的棉花植物中gus阳性(gus+)和无标记(aada-)r1后代的百分比。
[0250][0251]
如上表8中可以看出,与在大豆中使用相同的二元植物转化构建体获得的结果相比,将i-at.atpe:1(seq id no:26)内含子克隆至exp-gm.rsp-1:1的3'导致在稳定转化的棉花植物中的有效自动切除。除一个事件(事件-3)外,所有事件均提供无标记的r1后代种子和纯合的gus阳性的无标记的阴性r1后代种子。
[0252]
实施例6
[0253]
拟南芥cdc45启动子在稳定转化的棉花植物中驱动自动切除
[0254]
将棉花植物用构建体特别是包含在实施例3中呈现的exp(exp-at.cdc45:1:1(seq id no:9))的驱动cre-重组酶表达的植物二元转化构建体进行转化,并用于评估cre-重组酶表达盒和标记基因表达盒的自动切除的能力和效率。
[0255]
使用本领域熟知的方法克隆如实施例4中所述的二元植物转化构建体。将exp(exp-at.cdc45:1:1(seq id no:9))可操作地连接至编码cre-重组酶的合成编码序列(goi-p1.cre-st.ls1:1:1,seq id no:43)的5

,所述合成编码序列可操作地连接至3

终止区(t-at.cdc45:1,seq id no:12)的5


[0256]
通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化棉花植物细胞。在
大观霉素选择下,诱导所得的转化植物细胞形成完整棉花植物。
[0257]
允许选择的r0单拷贝事件自花授粉。然后使用测定法分析所得r1植物的cre、aada和gus转基因的存在。也使用测定法确定了gus转基因盒的接合性。将针对选择的r0事件中每一个的gus阳性(gus+)和无标记(aada-)r1后代的百分比呈现在下表9中。
[0258]
表9.在具有拟南芥cdc45启动子驱动的自动切除的稳定转化的棉花植物中gus阳性(gus+)和无标记(aada-)r1后代的百分比。
[0259][0260][0261]
如上表9中可以看出,除一个r0事件(事件-14)外,所有事件均产生gus阳性(gus+)和无标记(aada-)r1后代。一些r0事件产生了很大比例的无标记的和纯合的无标记事件,比如事件-2、事件-7和事件-11。包含在exp-at.cdc45:1:1(seq id no:9)中的cdc45启动子(p-at.cdc45-1:1:1,seq id no:10)能够在稳定转化的棉花植物中有效驱动自动切除。
[0262]
实施例7
[0263]
嵌合的p-vf.usp88-嵌合体启动子在稳定转化的芥花植物中驱动有效的自动切除
[0264]
将芥花植物用构建体特别是包含exp(exp-vf.usp88-enh:1:1(seq id no:60))以驱动cre-重组酶表达的植物二元转化构建体进行转化,并用于评估cre-重组酶表达盒和标记基因表达盒的自动切除的能力和效率。exp(exp-vf.usp88-enh:1:1(seq id no:60))由以下元件组成:嵌合启动子p-vf.usp88-嵌合体(seq id no:61),所述启动子可操作地连接
至前导序列l-vf.usp-1:1:1(seq id no:62)的5


[0265]
用包含以下三个转基因表达盒的二元植物转化构建体转化芥花植物:cre-重组酶表达盒和用于选择转化的大豆细胞的选择标记表达盒(aada),其两侧是两个loxp位点(rs-p1.lox1:1,seq id no:44);以及在loxp位点之外的第三表达盒,其用于表达β-葡糖醛酸酶(gus)转基因。cre-重组酶表达盒由以下元件组成:exp(exp-vf.usp88-enh:1:1(seq id no:60)),其可操作地连接至编码cre-重组酶的合成编码序列(goi-p1.cre-st.ls1:1:1,seq id no:43)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3'终止区(t-br.snap2-1:3:6,seq id no:59)的5

。转化选择标记盒aada由以下元件组成:exp(exp-at.act7:2,seq id no:53),其可操作地连接至编码叶绿体靶向的tn7腺苷酰转移酶的编码序列(goi-at.shkg-ctp2+ec.aada-spc/str:1:1,seq id no:54)的5

,所述腺苷酰转移酶赋予大观霉素抗性并用于选择转化的植物细胞,所述编码序列可操作地连接至3

终止区(t-agrt u.nos:13,seq id no:48)的5

。gus转基因表达盒由以下元件组成:增强的花椰菜花叶病毒35s启动子和前导序列(exp-camv.35s-enh:1:2,seq id no:55),其可操作地连接至编码β-葡糖醛酸酶的合成编码序列(goi-ec.uida+st.ls1:3,seq id no:50)的5',所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-ag rtu.nos:13,seq id no:48)的5


[0266]
如本领域熟知的,通过土壤杆菌介导的转化,使用上述二元植物转化构建体转化芥花植物细胞。在大观霉素(aada)选择下,诱导所得的转化植物细胞形成完整芥花植物。
[0267]
允许选择的r0单拷贝事件自花授粉。然后使用测定法分析所得r1种子的aada和gus转基因的存在。还使用gus转基因的测定法确定r1种子对于整合构建体的接合性。按照每个选定的r0事件的自交,测定了八十八粒r1种子。下表10显示了对每个事件种子样品观察到的半合子的和纯合子的gus+/aada-事件的数量。
[0268]
表10.在具有嵌合的p-vf.usp88-嵌合体启动子驱动的自动切除的稳定转化的芥花植物中取样的半合子的和纯合子的gus+/aada-r1后代种子的数量和百分比。
[0269]
[0270][0271]
如上表9中可以看出,除一个r0事件(事件-3)外,所有事件均产生纯合的gus阳性(gus+)和无标记(aada-)r1后代。事件-3可以是嵌合事件,其中一些细胞未被转化,正如在植物转化中偶尔发生一样。一些r0事件产生了很大比例的半合子的无标记事件,比如事件-2、事件-4、事件-5、事件-7和事件-8。包含嵌合启动子p-vf.usp88-嵌合体(seq id no:61)的exp(exp-vf.usp88-enh:1:1(seq id no:61))能够在稳定转化的芥花植物中有效驱动自动切除。
[0272]
实施例8
[0273]
exp-gm.rsp-1:1驱动选择标记和基因组编辑转基因盒在稳定转化的大豆植物中的自动切除
[0274]
将大豆植物用构建体特别是包含驱动cre-重组酶表达的exp(exp-gm.rsp-1:1(seq id no:20))的植物二元转化构建体进行转化,并用于评估cre-重组酶表达盒、标记基因表达盒和用于大豆基因组编辑的表达盒的自动切除的能力和效率。
[0275]
用包含以下五个转基因表达盒的二元植物转化构建体转化大豆植物;cre-重组酶表达盒;用于选择转化的大豆细胞的选择标记表达盒(aada);用于表达cpf1 crispr相关核酸酶的表达盒;用于表达指导rn a的表达盒,其两侧是两个loxp位点(rs-p1.lox1:1,seq id no:44);以及位于loxp位点之外的第五表达盒,其用于表达有农艺学利益的基因。cre-重组酶表达盒由以下元件组成:exp(exp-gm.rsp-1:1(seq id no:20)),其可操作地连接至编码cre-重组酶的合成编码序列(goi-p1.cre-st.ls1:1:1,seq id no:43)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-at.cdc45:3,se q id no:23)的5

。转化选择标记盒aada由以下元件组成:exp(exp-at.act7:2,seq id no:54),其可操作地连接至编码叶绿体靶向的tn7腺苷酰转移酶的编码序列(goi-at.shkg-ctp2+ec.aada-spc/str:1:1,seq id no:54)的5

,所述腺苷酰转移酶赋予大观霉素抗性并用于选择转化的植物细胞,所述编码序列可操作地连接至3

终止区(t-agrtu.nos:13,seq id no:48)的5

。cpf1表达盒由以下元件组成:提供组成型表达的exp,所述exp可操作地连接至核靶向的cpf1编码序列的5',所述编码序列可操作地连接至3

植物终止区的5

。指导rna表达盒由以下元件组成:rna聚合酶iii启动子,所述启动子可操作地连接至指导rna编码序列的5

,所述编码序列可操作地连接至3

rna聚合酶iii终止区的5

。所有四个表达盒的两侧为loxp位点。第五转基因表达盒由以下元件组成:植物组成型exp,所述exp可操作地连接至编码有农艺学利益的基因的编码序列的5

,所述编码序列可操作地连接至3

植物终止区的5


[0276]
指导rna转基因盒包含这样的指导rna,所述指导rna被设计为提供构建体在大豆
基因组内的特定位置的位点特异性整合。所述构建体被设计为在将所述构建体整合到r1代大豆种子的大豆基因组的特定区域中之后提供cre、aada、cpf1和指导rna转基因表达盒的自动切除。自动切除后,在r1代转基因大豆植物中应当仅保留用于表达有农艺学利益基因的第五转基因表达盒。
[0277]
测定了所有r0转基因事件的转基因拷贝数。还使用侧翼pcr测定法分析了它们的位点特异性整合,其中进行了跨靶位点连接的扩增。使选定的r0转基因事件自交,以产生r1代种子。测定了r1代种子的随机样品是否存在标记和基因组编辑盒。下表11显示了源自八个选定事件的无半合子和纯合子标记和基因组编辑盒的种子的数量和百分比。
[0278]
表11.从具有exp-gm.rsp-1:1驱动的自动切除的稳定转化的大豆植物取样的无半合子和纯合子标记和基因组编辑盒的r1后代种子的数量和百分比。
[0279][0280]
如上表11中可以看出,exp(exp-gm.rsp-1:1(seq id no:20))能够驱动标记和基因组编辑盒的自动切除,其效率与上文实施例4中展示的相似。
[0281]
实施例9
[0282]
exp-gm.nmh7:1驱动选择标记和基因组编辑转基因盒在稳定转化的大豆植物中的自动切除
[0283]
将大豆植物用构建体特别是包含驱动cre-重组酶表达的exp(exp-gm.nmh7:1(seq id no:64))的植物二元转化构建体进行转化,并用于评估cre-重组酶表达盒、标记基因表达盒和用于大豆基因组编辑的表达盒的自动切除的能力和效率。
[0284]
用包含五个转基因表达盒的二元植物转化构建体转化大豆植物;cre-重组酶表达盒;用于选择转化的大豆细胞的选择标记表达盒(aada);用于表达cpf1 crispr相关核酸酶的表达盒;用于表达指导rna的表达盒,其两侧是两个loxp位点(rs-p1.lox1:1,seq id no:
44);以及位于loxp位点之外的第五表达盒,其用于表达有农艺学利益的基因。所有表达盒都与前面实施例7中描述的那些相似。所述cre-重组酶表达盒由以下元件组成:exp(exp-gm.nmh7:1(seq id no:64)),其可操作地连接至编码cre-重组酶的合成编码序列(goi-p1.cre-st.ls1:1:1,seq id no:43)的5

,所述合成编码序列含有源自马铃薯光诱导组织特异性st-ls1基因(genbank登录号:x04753)的可加工内含子,所述合成编码序列可操作地连接至3

终止区(t-gb.e6-3b:1:1,seq id no:67)的5

。在转化中使用了两种不同的构建体。每个构建体包含驱动cpf1 crispr相关核酸酶表达的不同的组成型启动子。
[0285]
测定了所有r0转基因事件的转基因拷贝数。还使用侧翼pcr测定法分析了它们的位点特异性整合,其中进行了跨靶位点连接的扩增。使选定的r0转基因事件自交,以产生r1代种子。测定了r1代种子的随机样品是否存在标记和基因组编辑盒。下表12显示了源自八个选定事件的无半合子和纯合子标记和基因组编辑盒的种子的数量和百分比。
[0286]
表12.从具有exp-gm.nmh7:1驱动的自动切除的稳定转化的大豆植物取样的无半合子和纯合子标记和基因组编辑盒的r1后代种子的数量和百分比。
[0287][0288][0289]
如上表12中可以看出,源自使用每种构建体的转化的两个事件产生了无半合子标记和基因组编辑盒的r1后代。源自使用构建体-1的转化的事件2甚至产生了几个无纯合标记和基因组编辑盒的r1后代。
[0290]
实施例10
[0291]
在使用玉米和水稻cdc45-1启动子驱动自动切除的稳定转化的玉米植物中选择标记和基因组编辑转基因盒的自动切除
[0292]
用构建体特别是包含驱动cre-重组酶表达的exp-zm.cdc45-1+zm.dnak:1:1(seq id no:1)或exp-os.cdc45-1:1:1(seq id no:4)的植物二元转化构建体转化玉米植物。
[0293]
用包含至少五个表达盒的构建体转化玉米植物。所述构建体包含cre-重组酶表达
盒、至少一个选择标记盒、用于表达诸如cpf1的crisp r相关核酸酶的表达盒、至少一个指导rna盒;所有这些盒都位于lo xp位点的两侧。所述构建体还包含用于表达有农艺学利益的基因的在loxp位点之外的至少一个表达盒。每个构建体包含类似于实施例2中描述的cre-重组酶表达盒,其中exp-zm.cdc45-1+zm.dnak:1:1(seq id no:1)或exp-os.cdc45-1:1:1(seq id no:4)用于驱动cre-重组酶表达。
[0294]
用两种构建体中的任一种转化玉米植物,并使用分子测定法选择r0转基因事件以确定拷贝数、插入片段完整性。如果将构建体设计为提供所述构建体的位点特异性整合;则通过插入位点连接的扩增来证实玉米基因组内的插入位置确认。使选定的r0转基因事件自交,以生成r1代种子。分析种子或发芽的后代的cre、标记、cpf1和指导rna盒的去除。还分析了它们一个或多个有农艺学利益的基因的一个或多个表达盒的存在。
[0295]
已经说明并描述了本发明的原理,本领域的技术人员应当清楚的是,可以在布置和细节方面修改本发明而不背离这样的原理。我们主张所有这些修改均在权利要求的精神和范围之内。本文中引证的所有出版物和已公开的专利文件均通过引用并入本文,其程度如同每个单独的出版物或专利申请被确切地并单独地指明通过引用而并入本文。

技术特征:
1.一种包含dna调控序列的重组dna构建体,所述dna调控序列包括:a.与seq id no:1-26、59-62和64-66中任一个具有至少80%序列同一性的序列;b.包含seq id no:1-26、59-62和64-66中任一个的序列;以及c.(i)seq id no:1-26、59-62和64-66中任一个或(ii)与seq id no:1-26、59-62和64-66中任一个具有至少80%序列同一性的任何序列的片段,其中所述片段具有基因调控活性;其中所述dna调控序列可操作地连接至编码位点特异性重组酶的异源可转录dna序列。2.根据权利要求1所述的重组dna分子,其中所述dna调控序列与seq id no:1-26、59-62和64-66中任一个的dna序列具有至少90%序列同一性。3.根据权利要求1或2所述的重组dna分子,其中所述dna调控序列与seq id no:1-26、59-62和64-66中任一个的dna序列具有至少95%序列同一性。4.根据权利要求1、2或3所述的重组dna分子,其中所述dna调控序列具有基因调控活性。5.根据权利要求1-4中任一项所述的重组dna分子,其中所述dna调控序列是种系偏好启动子。6.根据权利要求1-5中任一项所述的重组dna分子,其中所述种系偏好启动子选自由以下组成的组:seq id no:2、seq id no:5、seq id no:7、seq id no:10、seq id no:13、seq id no:14、seq id no:17、seq id no:21和seq id no:65,或与seq id no:2、5、7、10、13、14、17、21和65中任一个具有至少80%序列同一性的序列。7.根据权利要求1-6中任一项所述的重组dna分子,其中所述种系偏好启动子是cdc45启动子。8.根据权利要求1-7中任一项所述的cdc45启动子,其中所述cdc45启动子选自由以下组成的组:seq id no:2、seq id no:5和seq id no:10,或与seq id no:2、5和10中任一个具有至少80%序列同一性的序列。9.根据权利要求1-5中任一项所述的重组dna分子,其中所述dna调控序列是seq id no:60或与seq id no:60具有至少80%序列同一性的序列。10.根据权利要求1-9中任一项所述的重组dna分子,其中所述位点特异性重组酶选自由以下组成的组:cre-重组酶、flp-重组酶、r-重组酶和gin-重组酶。11.根据权利要求1-10中任一项所述的重组dna分子,其中所述位点特异性重组酶是cre-重组酶。12.根据权利要求1-11中任一项所述的重组dna构建体,其进一步包含以下表达盒中的一种或两种:选择标记转基因;和/或有农艺学利益的转基因。13.根据权利要求1-12中任一项所述的重组dna构建体,其进一步包含位于编码所述位点特异性重组酶和/或所述选择标记转基因的一个或两个可转录dna序列两侧的一对位点特异性重组位点序列,其中所述位点特异性重组位点可以被所述位点特异性重组酶切割。14.根据权利要求13所述的重组dna构建体,其中所述位点特异性重组位点序列对以头对尾排列定向。15.根据权利要求13或14所述的重组dna构建体,其中所述选择标记转基因赋予对除草剂或抗生素的抗性。
16.根据权利要求13、14或15中任一项所述的重组dna构建体,其中所述位点特异性重组位点序列对各自选自由以下组成的组:loxp、lox.tata-r9、frt、rs和gix。17.根据权利要求12-16中任一项所述的重组dna构建体,其中所述位点特异性重组位点序列对各自是loxp或lox.tata-r9位点。18.根据权利要求12-17中任一项所述的重组dna构建体,其中所述位点特异性重组位点序列对各自包含seq id no:44或seq id no:45。19.根据权利要求12-18中任一项所述的重组dna构建体,其中所述有农艺学利益的转基因在植物中赋予除草剂耐受性。20.根据权利要求12-18中任一项所述的重组dna构建体,其中所述有农艺学利益的转基因在植物中赋予抗虫性或抗病性。21.根据权利要求12-18中任一项所述的重组dna构建体,其中所述有农艺学利益的转基因在植物中赋予增加的产率或胁迫耐受性。22.根据权利要求12-21中任一项所述的重组dna构建体,其中所述有农艺学利益的转基因编码dsrna、mirna或sirna。23.根据权利要求1-22中任一项所述的重组dna构建体,其进一步包含以下一种或两种:编码指导rna的表达盒;和/或编码位点特异性核酸酶的表达盒。24.根据权利要求23所述的重组dna构建体,其进一步包含一对位于编码所述位点特异性重组酶的一个或多个可转录dna序列两侧的位点特异性重组位点序列、选择标记转基因、编码所述指导rna的表达盒和/或编码所述位点特异性核酸酶的表达盒,其中所述位点特异性重组位点可以被所述位点特异性重组酶切割。25.根据权利要求23或24所述的重组dna构建体,其中所述指导rna包含靶向序列,所述靶向序列靶向真核细胞基因组中的序列以进行基因组编辑或位点特异性整合。26.根据权利要求25所述的重组dna构建体,其中所述真核细胞是植物细胞。27.根据权利要求23-26中任一项所述的重组dna构建体,其包含编码两个或更多个指导rna的两个或更多个表达盒。28.根据权利要求23-27中任一项所述的重组dna构建体,其中存在两个、三个、四个、五个、六个、七个、八个、九个或十个不同的编码指导rna的表达盒。29.根据权利要求23-28中任一项所述的重组dna构建体,其中所述位点特异性核酸酶是rna指导的核酸内切酶。30.根据权利要求23-29中任一项所述的重组dna构建体,其中所述rna指导的核酸内切酶选自由以下组成的组:cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9、cas10、cpf1、cys1、cys2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、casx和casy。31.根据权利要求30所述的重组dna构建体,其中所述rna指导的核酸内切酶是cas9或cpf1。32.一种dna分子或载体,其包含权利要求1-31中任一项所述的重组dna构建体。33.一种dna转化载体,其包含权利要求1-31中任一项所述的重组dna构建体和以左边界和右边界为界的t-dna区段。
34.根据权利要求33所述的dna转化载体,其中编码所述位点特异性重组酶的所述可转录dna序列位于所述t-dna区段的左边界和右边界之间。35.一种dna转化载体,其包含权利要求12-31中任一项所述的重组dna构建体以及具有左边界和右边界的t-dna区段,其中编码所述位点特异性重组酶的所述可转录dna序列、所述选择标记转基因和/或所述有农艺学利益的转基因中的一种或多种位于所述t-dna区段的左边界和右边界之间。36.一种dna转化载体,其包含权利要求23-31中任一项所述的重组dna构建体以及具有左边界和右边界的t-dna区段,其中编码所述位点特异性重组酶的所述可转录dna序列、所述选择标记转基因、所述有农艺学利益的转基因、编码所述指导rna的所述表达盒和/或编码所述位点特异性核酸酶的所述表达盒中的一种或多种位于所述t-dna区段的左边界和右边界之间。37.一种转基因植物、植物部分或植物细胞,其包含权利要求1-31中任一项所述的重组dna构建体。38.根据权利要求37所述的转基因植物、植物部分或植物细胞,其中所述重组dna构建体被稳定转化到所述转基因植物、植物部分或植物细胞的基因组中。39.根据权利要求37或38所述的转基因植物、植物部分或植物细胞,其中所述转基因植物、植物部分或植物细胞是玉米、大豆、棉花或芥花植物、植物部分或植物细胞。40.一种细菌细胞,其包含权利要求1-31中任一项所述的重组dna构建体、权利要求32所述的dna分子或载体、或权利要求33-36中任一项所述的转化载体。41.一种产生转基因植物或植物部分的方法,其包括:a.用包含权利要求1-30中任一项所述的重组dna构建体的dna分子或载体转化外植体的植物细胞,以产生一个或多个转化的植物细胞,所述转化的植物细胞包含稳定转化到所述一个或多个转化的植物细胞的基因组中的所述重组dna构建体;b.从所述外植体再生或发育转基因植物,其中所述转基因植物包含稳定转化到所述转基因植物的一个或多个细胞的基因组中的所述重组dna构建体。42.根据权利要求41所述的方法,其中经由土壤杆菌介导的转化或根瘤菌介导的转化来转化所述植物细胞。43.根据权利要求41所述的方法,其中经由微粒介导的转化或粒子轰击介导的转化来转化所述植物细胞。44.根据权利要求41所述的方法,其中所述转基因植物和植物细胞分别是玉米、大豆、棉花或芥花植物和植物细胞。45.根据权利要求41所述的方法,其进一步包括:a.从所述转基因植物分离或收获植物部分。46.一种用于从转基因植物的基因组切除表达盒的方法,其包括:a.用包含权利要求13-29中任一项所述的重组dna构建体的dna分子或载体转化植物细胞,以产生一个或多个转化的植物细胞,所述转化的植物细胞包含稳定转化到所述一个或多个转化的植物细胞的基因组中的所述重组dna构建体;b.至少部分地从所述一个或多个稳定转化的植物细胞再生或发育转基因植物;c.使所述转基因植物与其自身或另一植物杂交;和
d.选择一个或多个后代植物,其中编码所述位点特异性重组酶的所述可转录dna序列和/或在所述重组dna构建体的位点特异性重组位点序列对之间的选择标记转基因中的一种或两种被切除并且不再存在于所述后代植物的基因组中。47.根据权利要求46所述的方法,其中所述重组dna构建体进一步包含位于所述重组dna构建体的dna位点特异性重组位点序列对之间的以下表达盒的一种或两种:编码指导rna的表达盒和/或编码位点特异性核酸酶的表达盒,并且其中选择一个或多个后代植物,其中编码所述位点特异性重组酶的所述可转录dna序列、所述选择标记转基因、编码所述指导rna的所述表达盒和/或编码所述重组dna构建体的所述位点特异性核酸酶的所述表达盒中的一种或多种被切除并且不再存在于所述后代植物的基因组中。48.根据权利要求46所述的方法,其中所述转基因植物和植物细胞分别是玉米、大豆、棉花或芥花植物和植物细胞。49.根据权利要求46所述的方法,其进一步包括:a.从所述后代植物中的一个或多个分离或收获植物部分。50.根据权利要求46所述的方法,其进一步包括:a.使所述后代植物中的一个或多个与自身或另一植物杂交。

技术总结
提供了用于调节植物中的基因表达的重组DNA分子和构建体。通过表达由重组DNA分子或构建体编码的重组酶,借助于所述重组DNA分子或构建体中的侧翼位点特异性重组位点的存在,可以从转化后的转基因植物切除重组DNA分子或构建体的一个或多个表达盒。可以使用这样的重组酶系统从用所述重组DNA构建体或载体转化的植物去除这样的表达盒。可以将重组酶转基因可操作地连接至组织偏好或组织特异性启动子,用于在转化的植物中自动切除,而不用与表达所述重组酶的不同转基因系杂交。还提供了引起转基因植物以及含有或转化有本公开的重组DNA分子或构建体的植物和细胞中的一个或多个表达盒的自动切除的方法。自动切除的方法。


技术研发人员:P
受保护的技术使用者:孟山都技术公司
技术研发日:2021.10.19
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐