一种复制型引导编辑器介导的高效精准多基因编辑系统

未命名 08-05 阅读:165 评论:0


1.本发明涉及生物技术领域,具体涉及一种复制型引导编辑器介导的高效精准多基因编辑系统。


背景技术:

2.近年来,规律成簇间隔短回文重复序列及其相关蛋白(crispr/cas)系统的发展极大地推动了基因组编辑技术的发展。以crispr/cas9为代表的基因编辑技术通过非同源末端连接(nhej)和同源直接修复(hdr)两种途径对dsb进行修复从而实现基因编辑的功能。nhej通路产生随机的插入或缺失(indel)修复dsb,无法实现基因精准编辑,hdr通路依赖于外源的dna供体模板可精准实现基因编辑,但效率普遍低于5%,且只发生在分裂细胞s/g2期。单碱基编辑系统通过在cas9蛋白上融合表达脱氨酶可高效实现碱基转换编辑,但单碱基编辑存在编辑副产物多、编辑位置受到pam的局限,rna水平脱靶较高和无法实现碱基颠换等缺陷。
3.引导编辑系统极大地弥补了传统的crispr/cas9技术和单碱基技术的不足,可以在不形成dna双链断裂和供体dna模板的情况下精确实现小片段插入、删除以及碱基转换和颠换。然而引导编辑系统在动植物细胞中的编辑效率较低,极大的阻碍了引导编辑系统的广泛应用。延长基因编辑的时间可提高基因编辑的效率,利用病毒系统将基因编辑蛋白和sgrna整合到基因组中会引起插入突变、免疫反应等风险。附加体元件orip-ebna1可使外源基因不整合到基因组中实现稳定长期表达,但还未见报道应用于提高引导编辑系统的效率。
4.人类疾病以及动植物经济性状都是由多基因调控的,同时精准编辑多基因对于多基因复杂疾病的治疗以及动植物优良经济性状聚合育种具有重要意义。目前可通过共转多个pegrna表达载体或串联u6启动子的策略来实现多基因编辑,但也存在编辑效率低、构建难度大、周期长等不足。目前一步法进行多基因精准编辑的研究还未报道过。csy4蛋白是来源于细菌的一种核糖核酸酶,它可以通过识别csy4位点将长转录本切开,可应用于多基因编辑领域。


技术实现要素:

5.本发明的目的是提供一种复制型引导编辑器介导的高效精准多基因编辑系统。
6.第一方面,本发明要求保护一种用于多基因编辑的载体。
7.本发明所要求保护的用于多基因编辑的载体,为复制型引导编辑系统载体,所述载体能够表达如下(a1)-(a3),并含有如下(a4)和(a5);
8.(a1)由a1)和a2)融合而成的融合蛋白;a1)cas9切刻酶或其变体;a2)反转录酶或其变体;
9.(a2)ebna1蛋白或其突变体ebna1
mut

10.(a3)csy4蛋白(即csy4核糖核酸内切酶);
11.(a4)orip元件;
12.(a5)用于插入pegrna编码序列的区域;所述用于插入pegrna编码序列的区域含有插入位点和位于所述插入位点上游的启动子。所述启动子启动所述pegrna编码序列的转录。
13.所述载体可为环形载体。
14.在(a1)中,所述cas9切刻酶可为cas9(h840a)。所述反转录酶可为m-mlv rt(d200n,t306k,w313f,t330p,l603w)。
15.进一步地,所述cas9(h840a)的氨基酸序列如seq id no.1的第1-1367位所示。所述m-mlv rt(d200n,t306k,w313f,t330p,l603w)的氨基酸序列如seq id no.1的第1401-2091位所示。
16.在(a1)中,在所述融合蛋白中,a1)和a2)之间可由linker连接。
17.进一步地,所述linker的氨基酸序列如seq id no.1的第1368-1400位所示。
18.在(a1)中,所述融合蛋白的氨基酸序列如seq id no.1所示。
19.在(a2)中,所述ebna1蛋白的氨基酸序列如seq id no.2所示;所述ebna1
mut
蛋白的氨基酸序列为将seq id no.2的第96-232位缺失后所得序列。
20.在(a3)中,所述csy4蛋白的氨基酸序列如seq id no.4所示;
21.在(a5)中,所述用于插入pegrna编码基因的区域中的所述启动子为ⅱ型启动子或ⅲ型启动子。
22.进一步地,所述ⅲ型启动子如u6启动子或cbh启动子;所述ⅱ型启动子如ef1α启动子。
23.在(a5)中,所述pegrna与sgrna相比,在3’端多出两段序列(即rt序列和pbs序列),依次由间隔序列(spacer)、grna骨架序列、rt序列和pbs序列组成。所述间隔序列(spacer)用于识别靶基因上的靶点。所述rt序列为基因组上靶点后的一段反向互补序列,且在其中引入目标突变,作为反转录酶的反转录模板,反转录出dna序列,然后作为修复模板,对基因组dna进行修复。所述pbs序列为引物结合位点,可与断裂的靶dna链3’末端互补以起始逆转录过程。所述rt序列和所述pbs序列的设计方法或原理可参照现有技术中已报道的有关于引导编辑技术(prime editing,pe)中与pegrna的rt序列和pbs序列相关的设计方法或原理。
24.在(a1)中,所述cas9(h840a)的编码基因可如seq id no.5的第715-4815位所示。所述m-mlv rt(d200n,t306k,w313f,t330p,l603w)的编码基因可如seq id no.5的第4915-6987位所示。
25.进一步地,所述融合蛋白的编码基因可如seq id no.5的第715-6987位所示。
26.更进一步地,所述融合蛋白的编码基因存在于表达盒1中,所述表达盒1的序列可如seq id no.5的第1-7287位所示。
27.在(a2)中,所述ebna1蛋白的编码基因如seq id no.5的第12136-14241位的反向互补序列所示。
28.在(a3)中,所述csy4蛋白的编码基因如seq id no.5的第16248-16811位所示。
29.在(a4)中,所述orip元件的序列可如seq id no.5的第10224-12013位所示。
30.在(a5)中,所述用于插入pegrna编码序列的区域的序列可如seq id no.5的第
14883-15707位所示。
31.通常情况下,所述载体中还含有药物筛选基因和/或报告基因。
32.进一步地,所述csy4蛋白的编码基因、所述药物筛选基因和所述报告基因存在于同一表达盒中(记为表达盒2)。
33.在所述表达盒2中,所述csy4蛋白的编码基因、所述药物筛选基因和所述报告基因三者之间由自切割寡肽编码基因连接。
34.所述自切割寡肽可为来源于病毒基因组的2a自切割寡肽。如来自于口蹄疫病毒(fmdv)的f2a肽、来自于马a型鼻炎病毒(erav)的e2a肽、来自于明脉扁刺蛾β四体病毒(thosea asigna virus)的t2a肽、来自于猪捷申病毒-1(ptv-1)的p2a肽、来自于泰勒病毒2a肽或者来自心肌炎病毒的2a肽。
35.在本发明的具体实施方式中,所述csy4蛋白的编码基因和所述药物筛选基因之间的所述自切割寡肽编码基因具体为p2a肽编码基因。所述药物筛选基因和所述报告基因之间的所述自切割寡肽编码基因具体为t2a肽编码基因。
36.在本发明的具体实施方式中,所述药物筛选基因为puromycin抗性基因(简称puror基因)。所述报告基因为zsgreen报告基因。
37.进一步地,所述puror基因的序列如seq id no.5的第16899-17495位所示。所述zsgreen报告基因的序列如seq id no.5的第17574-18269位所示。
38.更进一步地,所述表达盒2的序列如seq id no.5的第15723-18269位所示。
39.在本发明的具体实施方式中,所述载体的全序列如seq id no.5所示或者为将seq id no.5的第14634-14874位所示的u6启动子序列替换为ef1α启动子序列或者cbh启动子序列。其中,所述ef1α启动子序列如seq id no.7的第1-212位所示;所述cbh启动子序列如seq id no.10的第1-794位所示。
40.第二方面,本发明要求保护含有前文第一方面所述载体的重组菌或转基因细胞系。
41.第三方面,本发明要求保护前文第一方面所述载体在如下任一中的应用:
42.(b1)对生物体或生物细胞进行多基因编辑;
43.(b2)制备用于对生物体或生物细胞进行多基因编辑的产品;
44.(b3)提高对生物体或生物细胞的多基因编辑效率;
45.(b4)制备用于提高对生物体或生物细胞的多基因编辑效率的产品。
46.第四方面,本发明要求保护一种对生物体或生物细胞进行多基因编辑的方法。
47.本发明要求保护的对生物体或生物细胞进行多基因编辑的方法,可包括如下步骤:
48.(c1)将针对不同靶基因的多个pegrna编码序列的5’和3’端分别添加cys4蛋白的识别序列后首尾相连,然后插入到前文第一方面所述载体的所述用于插入pegrna编码序列的区域中的所述插入位点处,得到重组载体;
49.(c3)将所述重组载体导入生物体或生物细胞,从而实现对生物体或生物细胞基因组中所述不同靶基因的编辑。
50.在(c1)中,所述cys4蛋白的识别序列可如seq id no.6的第1-20位所示。
51.在(c1)中,所述多个pegrna可为两个以上pegrna。优选15个以下pegrna,如10个
pegrna。
52.在上述各方面中,所述基因编辑具体可为碱基的定点替换、缺失或插入。包括单碱基的替换、多碱基的替换、单碱基的缺失、多碱基的缺失、单碱基的插入、多碱基的插入。
53.在上述各方面中,所述多基因可为两个以上基因。优选15个以下基因,如10个基因。
54.在本发明的具体实施方式中,所述pegrna和所述基因具体见实施例。
55.本发明提供了一种基于复制型引导编辑器(epipe2)结合csy4核糖核酸内切酶系统的基因编辑载体构建方法及其在多基因精确编辑中的应用。将csy4基因序列插入到复制型引导编辑器(epipe2)载体中,并在不同pegrna的5’和3’端分别添加20bp的csy4识别序列,即可利用一个启动子启动多个pegrna同时转录,然后在csy4蛋白作用下形成单个pegrna,从而实现多基因同时精确编辑。复制型引导编辑器(epipe2)质粒借助附加体元件orip-ebna1可在细胞内进行复制的特性可使pe2蛋白和pegrna持续表达,进而实现多基因同时编辑。相比于传统方法,该技术可一次性精确高效编辑多个基因,在基因治疗、多基因动物疾病模型的构建、基因设计育种以及聚合精准育种等领域具有广泛的应用前景。
56.本发明主要优势:
57.1、常规基因编辑技术无法实现精确多基因编辑;
58.2、常规方法借助串联u6启动子驱动载体构建难度大,本方案载体仅用一个启动子驱动相对较小,更有利于后期转染。
59.3、与复制型pe2高效编辑器技术结合,可实现多基因的高效任意编辑,目前还没有相应技术能够实现。
附图说明
60.图1为epipe2载体图谱。
61.图2为epipe2-u6-csy4载体图谱。
62.图3为epipe2-u6-csy4-3pegrs载体图谱。
63.图4为多个pegrna串联的结构组成示意图。
64.图5为epipe2-ef1α-csy4-3pegrs载体图谱。
65.图6为epipe2-u6-csy4-10pegrs载体图谱。
66.图7为epipe2-ef1α-csy4-10pegrs载体图谱。
67.图8为epipe2-cbh-csy4-10pegrs载体图谱。
68.图9为ngs测序检测多基因载体epipe2-u6-csy4-3pegrs在不同位点不同时间点编辑效率。
69.图10为ngs测序检测多基因载体eipe2-ef1α-csy4-3pegrs在不同位点不同时间点编辑效。
70.图11为ngs测序检测多基因载体epipe2-u6-csy4-10pegrs在不同位点第15天编辑效率。
71.图12为ngs测序检测多基因载体epipe2-ef1α-csy4-10pegrs在不同位点第15天编辑效率。
72.图13为ngs测序检测多基因载体epipe2-cbh-csy4-10pegrs在不同位点第15天编
辑效率。
具体实施方式
73.下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
74.下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
75.实施例1、附加体元件orip-ebna1介导的复制型引导编辑系统多基因编辑载体(epipe2-u6-csy4)的构建
76.1、利用限制性内切酶nru1(neb,#r3192v)酶切质粒pcmv-pe2(addgene,#132775),产生线性化的pcmv-pe2载体作为克隆载体骨架。
77.2、以pcep4(invitrogen,v044-50)质粒作为模板,设计并合成特异性扩增引物orip-f/r和ebna1-f/r,并在引物的5’端添加相对应的20bp的同源臂,同时在orip-f引物上添加nhe1识别位点,在ebna1-r引物上添加asc1识别位点,便于后期改造载体。利用2
×
a8 fasthifi pcr mastermix(艾德莱,pc8201)高保真酶扩增后得到orip片段和ebna1片段。引物序列如表1所示:
78.表1、引物序列
[0079][0080]
注:阴影部分为同源臂,划线部分为酶切位点
[0081]
orip片段pcr反应体系如表2所示:
[0082]
表2、orip片段pcr反应体系
[0083]
试剂体积2
×
a8 fasthifi pcr master mix25μlorip-f1μlorip-r1μlpcep4质粒1ngddh2o补足到50μl
[0084]
pcr程序:98℃3min;98℃10s,58℃15s,72℃100s,30个循环;72℃3min,8℃2min。
[0085]
扩增产物含有orip片段(约2400bp)的序列如seq id no.3的第9708-12129位(对应seq id no.5的第9708-12129位)所示(pcr产物含有orip并且两端带有酶切位点或同源臂序列)。
[0086]
ebna1片段的pcr反应体系如表3所示:
[0087]
表3、ebna1片段的pcr反应体系
[0088][0089][0090]
pcr程序:98℃3min;98℃10s,58℃15s,72℃100s,30个循环;72℃3min,8℃2min。
[0091]
扩增产物ebna1片段(约2500bp)的序列含有seq id no.3的第12111-14633位(对应seq id no.5的第12111-14633)所示(pcr产物含有ebna1且两端带有酶切位点或同源臂序列)。
[0092]
3、根据clonexpressmultis one step cloning kit(vazyme,c113-01)重组克隆试剂盒说明将步骤1线性化的pcmv-pe2载体和步骤2扩增得到的orip片段、ebna1片段按照说明书比例混合后在37℃反应30min,反应后的产物转化至化学感受态fast-t1(vazyme,c505-02)中,挑取单克隆菌液送至武汉擎科生物科技有限公司测序鉴定阳性克隆,将构建成功的载体命名为pcmv-pe2-pcep4。
[0093]
pcmv-pe2-pcep4的结构描述为:在pcmv-pe2载体的nrui位点处插入seq id no.3的第9708-14633位所示dna片段(orip和ebna1)的重组载体。
[0094]
4、利用asc1(neb,#r0558s)酶切pcmv-pe2-pcep4质粒,产生线性化的pcmv-pe2-pcep4载体作为克隆载体骨架。
[0095]
5、以pu6-pegrna-gg-acceptor(addgege,#132777)质粒作为模板,设计特异性引物pegrna-f1/r1和引物pegrna-f2/r2,在引物5’端添加相对应的20bp的同源臂。以pklv2-u6grna5(bbsi)-pgkpuro2azsg-w(addgene,#67975)质粒作为模板,设计特异性引物pklv2-f/r,同样添加相对应的20bp同源序列。其中,pegrna-r1、pegrna-f2/r2以及pklv2-f引物同源臂上都包含aar1(thermo scientific,er1581)识别位点,用于后期酶切连接pegrna;pegrna-f1引物上保留了asc1酶切切点。利用kapa hifi hotstartreadymix pcr kit(roche,kk2602)高保真酶扩增获得u6启动子片段、mrfp1片段以及pgk-puro-t2a-zsgreen片段。引物序列如表4所示:
[0096]
表4、引物序列
[0097]
[0098][0099]
注:阴影部分为同源臂,划线部分为酶切位点。
[0100]
u6启动子片段和mrfp1的pcr反应体系如表5所示:
[0101]
表5、u6片段和mrfp1的pcr反应体系
[0102]
试剂体积kapa hifi hotstartreadymix pcr kit25μl正向引物f1μl反向引物r1μlpu6-pegrna-gg-acceptor质粒1ngddh2o补充到50μl
[0103]
注:表4中的引物pegrna-f1/r1用于扩增u6启动子片段,引物pegrna-f2/r2用于扩增mrfp1片段。
[0104]
pcr程序:95℃3min;98℃20s,60℃15s,72℃15s,30个循环;72℃1min,16℃1min。
[0105]
扩增产物含有u6启动子的片段(约290bp)的序列如seq id no.3的第14608-14898位(对应seq id no.5的第14608-14898位)所示(pcr产物含有u6启动子且两端带有酶切位点或同源臂序列)。
[0106]
扩增产物含mrfp1的片段(约840bp)的序列如seq id no.3的第14879-15722位(对应seq id no.5的第14879-15722位)所示(pcr产物含有mrfp1且两端带有酶切位点或同源臂序列)。
[0107]
pgk-puro-t2a-zsgreen片段的pcr反应体系如表6所示:
[0108]
表6、pgk-puro-t2a-zsgreen片段的pcr反应体系
[0109]
试剂体积kapa hifi hotstartreadymix pcr kit25μlpklv2-f1μlpklv2-r1μlpklv2-u6grna5(bbsi)-pgkpuro2azsg-w质粒1ngddh2o补充到50μl
[0110]
pcr程序:98℃3min;98℃20s,60℃15s,72℃15s,30个循环;72℃1min,16℃1min。
[0111]
扩增产物含pgk-puro-t2a-zsgreen的片段(约1950bp)的序列如seq id no.3的第15703-17653位所示。
[0112]
6、根据clonexpressmultis one step cloning kit(vazyme,c113-01)重组克隆试剂盒说明将步骤4线性化的pcmv-pe2-pcep4载体和步骤5扩增得到的u6启动子片段、mrfp1片段、pgk-puro-t2a-zsgreen按照说明书比例混合后在37℃反应30min,反应后的产物转化至化学感受态fast-t1(vazyme,c505-02)中,挑取单克隆菌液送至武汉擎科生物科技有限公司测序鉴定阳性克隆,将构建成功的载体命名为epipe2。载体图谱见图1。
[0113]
epipe2载体全序列如seq id no.3所示。
[0114]
7、利用限制性内切酶xho1(neb,r0146s)酶切质粒epipe2,产生线性化的epipe2载
体作为克隆载体骨架。
[0115]
8、将csy4-p2a序列(seq id no.5的第16242-16877位)送至苏州金唯智生物科技有限公司合成,并由公司克隆到epipe2载体xho1多克隆位点处,构建的载体经测序验证正确后命名为epipe2-u6-csy4,载体图谱见图2。
[0116]
epipe2-u6-csy4载体全序列如seq id no.5所示。其中,第715-6987位为融合蛋白的编码基因(第715-4815位为cas9(h840a)的编码基因,第4915-6987位为m-mlv rt(d200n,t306k,w313f,t330p,l603w)的编码基因);第10224-12013位为orip元件;第12316-14241位为ebna1蛋白的编码基因的反向互补序列;第14883-15707位为用于插入pegrna编码基因的区域;第16248-16811位为csy4蛋白的编码基因;第16899-17495位为puromycin基因;第17574-18269位为zsgreen报告基因。
[0117]
cas9(h840a)与m-mlv rt(d200n,t306k,w313f,t330p,l603w)融合蛋白的氨基酸序列如seq id no.1所示。
[0118]
ebna1蛋白的氨基酸序列如seq id no.2所示。
[0119]
csy4蛋白的氨基酸序列如seq id no.4所示。
[0120]
实施例2、附加体元件orip-ebna1介导的复制型引导编辑系统多基因编辑载体的构建及其应用
[0121]
一、epipe2-u6-csy4-3pegrs的构建
[0122]
从文章“andrew v.anzalone,et al.search-and-replace genome editing without double-strand breaks or donor dna.nature volume 576,pages149

157(2019)”中选择fancf-+5gtot、vegfa-+5gtot和runx1-+5gtot三个位点编辑的pegrna(pegrna序列在文献中已经公开,都是做的点突变gtot),在每个位点pegrna编码序列的5’和3’端添加csy4的识别位点,然后依次串联起来。串联后的pegrna序列送至苏州金唯智生物科技公司合成,并克隆到epipe2-u6-csy4载体aar1多克隆位点之间,最终构建的多位点编辑载体经测序验证正确后命名为epipe2-u6-csy4-3pegrs,载体图谱见图3。
[0123]
串联后的pegrna结构(3pegrs)如图4所示,对应编码序列如seq id no.6所示。其中,第1-20位、第147-166位、第300-319、第446-465位均为csy4识别位点,第21-146位为fancf-+5gtot pegrna编码序列,第167-299位为vegfa-+5gtot pegrna编码序列,第320-445位为runx1-+5gtot pegrna编码序列。
[0124]
二、epipe2-ef1α-csy4-3pegrs的构建
[0125]
使用ef1α启动子代替u6启动子来转录串联的fancf-+5gtot、vegfa-+5gtot和runx1-+5gtot三个位点编辑的pegrna,仍然采用csy4蛋白剪切全长pegrna成单pegrna转录本的策略。序列ef1α-pegrna-bgh poly(a)signal送至苏州金唯智生物科技有限公司合成,并克隆到epipe2-u6-csy4-3pegrs载体asc1和aar1多克隆位点之间,构建的载体经测序验证正确后命名为epipe2-ef1α-csy4-3pegrs,载体图谱见图5。
[0126]
合成的ef1α-pegrna-bgh poly(a)signal序列如seq id no.7所示。其中,seq id no.7中第1-212位为ef1α启动子,第213-232位、第359-378位、第512-531位、第658-677位均为csy4识别位点,第233-358位为fancf-+5gtot pegrna序列,第379-511位为vegfa-+5gtot pegrna序列,第532-657位为runx1-+5gtot pegrna序列,678-902位为bgh poly(a)signal序列。
[0127]
三、epipe2-u6-csy4-10pegrs的构建
[0128]
从文章“andrew v.anzalone,et al.search-and-replace genome editing without double-strand breaks or donor dna.nature volume 576,pages149

157(2019)”中选择rnf2-del3-5gag、emx1-+5gtot、fancf-+4gatins、runx1-del2-4gat、dnmt1-+6gtoc、hek3-+1cttins、vegfa-del2-4gag、prnp-+6gtot、hexa-+1tatcins和cftr-del15-17ctt共计10条pegrna(编辑类型包含删除、插入和碱基突变,前面9条pegrna在文献均有记载,cftr-del15-17cttpegrna是自己通过在线网站http://pegfinder.sidichenlab.org/设计的),在每个位点pegrna的5’和3’端添加csy4的识别位点,然后依次串联起来。串联10pegrna序列送至苏州金唯智生物科技公司合成,并克隆到epipe2-u6-csy4载体aar1多克隆位点之间,最终构建的多位点编辑载体经测序验证正确后命名为epipe2-u6-csy4-10pegrs,载体图谱见图6。
[0129]
串联10pegrna序列如seq id no.8所示。其中,第1-20位、第153-172位、第300-319位、第440-459位、第588-607位、第730-749位、第870-889位、第1013-1032位、第1163-1182位、第1309-1328位、第1451-1470位为csy4识别位点;第21-152位为cftr-del15-17ctt pegrna编码序列,第173-299位为hexa-+1tatcins pegrna编码序列,第320-439位为prnp-+6gtot pegrna编码序列,第460-587位为vegfa-del2-4gag pegrna编码序列,第608-729位为hek3-+1cttins pegrna编码序列,第750-869位为dnmt1-+6gtoc pegrna编码序列,第890-1012位为runx1-del2-4gat pegrna编码序列,第1033-1162位为fancf-+4gatins pegrna编码序列,第1183-1308位为emx1-+5gtot pegrna编码序列,第1329-1450位为rnf2-del3-5gag pegrna编码序列。
[0130]
四、epipe2-ef1α-csy4-10pegrs的构建
[0131]
使用ef1α启动子代替u6启动子来转录串联10条pegrna,仍然采用csy4蛋白剪切全长pegrna成单pegrna转录本的策略。序列ef1α-pegrna-bgh poly(a)signal送至苏州金唯智生物科技有限公司合成,并克隆到epipe2-u6-csy4-10pegrs载体asc1和aar1多克隆位点之间,构建的载体经测序验证正确后命名为epipe2-ef1α-csy4-10pegrs,载体图谱见图7。
[0132]
合成的ef1α-pegrna-bgh poly(a)signal序列如seq id no.9所示。其中,第1-212位为ef1α启动子;第234-253位、第386-405位、第533-552位、第673-692位、第821-840位、第963-982位、第1103-1122位、第1246-1265位、第1396位1415位、第1542-1561位、第1684-1703位为csy4识别位点;第254-387位为cftr-del15-17ctt pegrna编码序列;第406-532位为hexa-+1tatcins pegrna编码序列;第553-672位为prnp-+6gtot pegrna编码序列;第693-820位为vegfa-del2-4gag pegrna编码序列;第841-962位为hek3-+1cttins pegrna编码序列;第983-1102位为dnmt1-+6gtoc pegrna编码序列;第1123-1245位为runx1-del2-4gat pegrna编码序列;第1266-1395位为fancf-+4gatins pegrna编码序列;第1416-1541位为emx1-+5gtot pegrna编码序列;第1562-1683位为rnf2-del3-5gag pegrna编码序列;第1704-1928位为bgh poly(a)signal。
[0133]
五、epipe2-cbh-csy4-10pegrs的构建
[0134]
使用cbh启动子代替u6启动子来转录串联10条pegrna,仍然采用csy4蛋白剪切全长pegrna成单pegrna转录本的策略。序列cbh-pegrna-bgh poly(a)signal送至苏州金唯智生物科技有限公司合成,并克隆到epipe2-u6-csy4-10pegrs载体asc1和aar1多克隆位点之
间,构建的载体经测序验证正确后命名为epipe2-cbh-csy4-10pegrs,载体图谱见图8。
[0135]
合成的cbh-pegrna-bgh poly(a)signal序列如seq id no.10所示。其中,第1-794位为cbh启动子;第816-835位、第968-985位、第1115-1134位、第1255-1274位、第1403-1422位、第1545-1564位、第1685-1704位、第1828-1847位、第1978-1997位、第2124-2143位、第2266-2285位为csy4识别位点;第836-967位为cftr-del15-17ctt pegrna编码序列;第986-1114位为hexa-+1tatcins pegrna编码序列;第1135-1254位为prnp-+6gtot pegrna编码序列;第1275-1402位为vegfa-del2-4gag pegrna编码序列;第1423-1544位为hek3-+1cttins pegrna编码序列;第1565-1684位为dnmt1-+6gtoc pegrna编码序列;第1705-1827位为runx1-del2-4gat pegrna编码序列;第1848-1977位为fancf-+4gatins pegrna编码序列;第1998-2123位为emx1-+5gtot pegrna编码序列;第2144-2265位为rnf2-del3-5gag pegrna编码序列;第2286-2510位为bgh poly(a)signal。
[0136]
六、附加体元件orip-ebna1介导的复制型引导编辑系统多基因编辑载体在hek293t细胞中的应用
[0137]
1、转染前一天,将状态良好的hek293t细胞铺板于6孔板中,加入新鲜培养基培养至细胞汇合度为80-90%时可用于转染。
[0138]
2、按照polyplus公司jetprime转染说明书进行转染,每个六孔板细胞转染2.5μg的质粒,根据所提取的质粒的浓度计算出所需要的多基因载体epipe2-u6-csy4-3pegrs、epipe2-ef1α-csy4-3pegrs、epipe2-u6-csy4-10pegrs、epipe2-ef1α-csy4-10pegrs和epipe2-cbh-csy4-10pegrs的用量。转染时使用2%fbs/dmem完全培养基,转染4-6h后更换为正常的10%fbs/dmem培养基。
[0139]
3、转染24h后可通过荧光显微镜观察zsgreen荧光蛋白的表达来测试转染效率,之后都使用含有2μg/ml puromycin的10%fbs培养基进行培养,加入puromycin的目的一方面是杀死未成功转染的细胞,起到富集的作用,另一方面是为防止质粒丢失。分别在第3天、第6天、第10天、第15天、第20天以及第25天收集部分细胞提取细胞基因组dna,利用ncbi在线网站设计特异性引物扩增相对应的位点,pcr产物送至安诺优达基因科技(北京)有限公司进行ngs测序检测编辑效率。特异性的pcr扩增引物见表7,pcr反应体系见表8。pcr反应程序:95℃3min;98℃20s,60℃15s,72℃8s,30个循环;72℃1min,16℃1min。
[0140]
表7、pcr扩增引物(序列方向为5’到3’)
[0141]
[0142][0143]
表8、pcr反应体系
[0144]
试剂体积kapa hifi hotstartreadymix pcr kit25μl正向引物f1μl反向引物r1μl基因组dna100ngddh2o补充到50μl
[0145]
4、实验结果
[0146]
结果显示:附加体元件orip-ebna1介导的复制型引导编辑系统多基因编辑载体epipe2-u6-csy4-3pegrs、epipe2-ef1α-csy4-3pegrs在hek293t细胞中均可实现3基因同时高效精确编辑,其中epipe2-u6-csy4-3pegrs在3个位点的编辑效率均高于epipe2-ef1α-csy4-3pegrs,表明u6启动子更适合用于转录3个串联pegrna的转录。epipe2-u6-csy4-10pegrs、epipe2-ef1α-csy4-10pegrs和epipe2-cbh-csy4-10pegrs在hek293t细胞中均成功编辑9个基因。
[0147]
图9为ngs测序检测多基因载体epipe2-u6-csy4-3pegrs在不同位点不同时间点编辑效率。
[0148]
图10为ngs测序检测多基因载体eipe2-ef1α-csy4-3pegrs在不同位点不同时间点编辑效。
[0149]
图11为ngs测序检测多基因载体epipe2-u6-csy4-10pegrs在不同位点第15天编辑效率。
[0150]
图12为ngs测序检测多基因载体epipe2-ef1α-csy4-10pegrs在不同位点第15天编辑效率。
[0151]
图13为ngs测序检测多基因载体epipe2-cbh-csy4-10pegrs在不同位点第15天编辑效率。
[0152]
本发明把csy4基因序列插入到复制型引导编辑系统(epipe2)载体中,并在不同pegrna的5’和3’端分别添加20bp的csy4识别序列,即可利用一个启动子启动多个pegrna的同时转录,然后在csy4蛋白作用下形成单个pegrna,从而实现多基因精确编辑。鉴于目前基因精确编辑效率仍然较低,还没有方法能够同时对2个以上基因实现精确任意编辑,本方法将基因治疗、多基因动物疾病模型的构建、基因设计育种领域具有广泛的应用前景。
[0153]
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和
范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本技术欲包括任何变更、用途或对本发明的改进,包括脱离了本技术中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

技术特征:
1.一种用于多基因编辑的载体,其特征在于:所述载体能够表达如下(a1)-(a3),并含有如下(a4)和(a5);(a1)由a1)和a2)融合而成的融合蛋白;a1)cas9切刻酶或其变体;a2)反转录酶或其变体;(a2)ebna1蛋白或其突变体ebna1
mut
;(a3)csy4蛋白;(a4)orip元件;(a5)用于插入pegrna编码序列的区域;所述用于插入pegrna编码序列的区域含有插入位点和位于所述插入位点上游的启动子。2.根据权利要求1所述的载体,其特征在于:所述cas9切刻酶为cas9(h840a);进一步地,所述cas9(h840a)的氨基酸序列如seq id no.1的第1-1367位所示;和/或所述反转录酶为m-mlv rt(d200n,t306k,w313f,t330p,l603w);进一步地,所述m-mlv rt(d200n,t306k,w313f,t330p,l603w)的氨基酸序列如seq id no.1的第1401-2091位所示;和/或在所述融合蛋白中,a1)和a2)之间由linker连接;进一步地,所述linker的氨基酸序列如seq id no.1的第1368-1400位所示;和/或所述融合蛋白的氨基酸序列如seq id no.1所示;和/或所述ebna1蛋白的氨基酸序列如seq id no.2所示;所述ebna1
mut
蛋白的氨基酸序列为将seq id no.2的第96-232位缺失后所得序列;和/或所述csy4蛋白的氨基酸序列如seq id no.4所示;和/或所述用于插入pegrna编码序列的区域中的所述启动子为ⅱ型启动子或ⅲ型启动子;进一步地,所述ⅲ型启动子如u6启动子或cbh启动子;所述ⅱ型启动子如ef1α启动子。3.根据权利要求1或2所述的载体,其特征在于:所述cas9(h840a)的编码基因如seq id no.5的第715-4815位所示;和/或所述m-mlv rt(d200n,t306k,w313f,t330p,l603w)的编码基因如seq id no.5的第4915-6987位所示;和/或所述融合蛋白的编码基因如seq id no.5的第715-6987位所示;和/或所述融合蛋白的编码基因存在于表达盒1中,所述表达盒1的序列如seq id no.5的第1-7287位所示;和/或
所述ebna1蛋白的编码基因如seq id no.5的第12136-14241位的反向互补序列所示;和/或所述csy4蛋白的编码基因如seq id no.5的第16248-16811位所示;和/或所述orip元件的序列如seq id no.5的第10224-12013位所示;和/或所述用于插入pegrna编码序列的区域的序列如seq id no.5的第14883-15707位所示。4.根据权利要求1-3中任一所述的载体,其特征在于:所述载体中还含有药物筛选基因和/或报告基因;进一步地,所述csy4蛋白的编码基因、所述药物筛选基因和所述报告基因存在于同一表达盒中,记为表达盒2。5.根据权利要求4所述的载体,其特征在于:所述药物筛选基因为puro基因;进一步地,所述puro基因的序列如seq id no.5的第16899-17495位所示;和/或所述报告基因为zsgreen报告基因;进一步地,所述zsgreen报告基因的序列如seq id no.5的第17574-18269位所示;和/或所述表达盒2的序列如seq id no.5的第15723-18269位所示。6.根据权利要求1-5中任一所述的载体,其特征在于:所述载体的全序列如seq id no.5所示或者为将seq id no.5的第14634-14874位所示的u6启动子序列替换为ef1α启动子序列或者cbh启动子序列;进一步地,所述ef1α启动子序列如seq id no.7的第1-212位所示;所述cbh启动子序列如seq id no.10的都1-794位所示。7.含有权利要求1-6中任一所述载体的重组菌或转基因细胞系。8.权利要求1-6中任一所述载体在如下任一中的应用:(b1)对生物体或生物细胞进行多基因编辑;(b2)制备用于对生物体或生物细胞进行多基因编辑的产品;(b3)提高对生物体或生物细胞的多基因编辑效率;(b4)制备用于提高对生物体或生物细胞的多基因编辑效率的产品。9.一种对生物体或生物细胞进行多基因编辑的方法,包括如下步骤:(c1)将针对不同靶基因的多个pegrna编码序列的5’和3’端分别添加cys4蛋白的识别序列后首尾相连,然后插入到权利要求1-6中任一所述载体的所述用于插入pegrna编码序列的区域中的所述插入位点,得到重组载体;(c3)将所述重组载体导入生物体或生物细胞,从而实现对生物体或生物细胞基因组中所述不同靶基因的编辑。10.根据权利要求1-9中任一所述载体或应用或方法,其特征在于:所述基因编辑为定点替换、缺失或插入;和/或所述多基因为两个以上基因;
和/或所述多个pegrna为两个以上pegrna;和/或所述cys4蛋白的识别序列如seq id no.6的第1-20位所示。

技术总结
本发明公开了一种复制型引导编辑器介导的高效精准多基因编辑系统。本发明提供了一种用于多基因编辑的载体,其能够表达由Cas9切刻酶或其变体和反转录酶或其变体融合而成的融合蛋白、EBNA1蛋白和Csy4蛋白;并且含有Orip元件和用于插入pegRNA编码序列的区域;所述用于插入pegRNA编码序列的区域含有插入位点和位于所述插入位点上游的启动子。相比于传统方法,该技术可一次性精确高效编辑多个基因,在基因治疗、多基因动物疾病模型的构建、基因设计育种以及聚合精准育种等领域具有广泛的应用前景。用前景。


技术研发人员:赵书红 阮进学 赵广兴 李新云 韩晓松 熊友才 苏寅钰 谢胜松
受保护的技术使用者:华中农业大学
技术研发日:2022.01.26
技术公布日:2023/8/4
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐