一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用的制作方法

未命名 09-17 阅读:154 评论:0

succinatiphilus细菌中的dsucas9。采用本发明cas9蛋白的ii型crispr/cas9基因编辑系统可识别多种不同的pam序列,hqcas9识别的pam序列为ngngnc,相对比较复杂的pam可以更精确的识别靶位点,提高cas9蛋白识别的精确性。dspcas9与dsucas9所识别的pam相近,第4位和第5位均为a,两个蛋白都可识别pam为nnnaa的靶位点。通过对人类基因组上“aa”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个aa出现,这极大的增加了dspcas9与dsucas9在人类基因组上的靶向范围,克服了spcas9的局限性。
9.第二方面,本发明提供一种编码cas9蛋白的核苷酸序列,所述核苷酸序列如seq id no.10~12中任一种序列所示。
10.第三方面,本发明提供了一种ii型crispr/cas9基因编辑系统,包括上述的cas9蛋白、辅助蛋白、crispr rna和tracrrna序列。
11.采用本发明的ii型crispr/cas9基因编辑系统能够在crrna的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明的基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
12.作为本发明所述的ii型crispr/cas9基因编辑系统的优选实施方式,所述tracrrna序列包括重复序列,所述重复序列如seq id no.7~9中任一种序列所示。进一步的,所述的tracrrna序列如seq id no.14~16中任一种序列所示。
13.作为本发明所述的ii型crispr/cas9基因编辑系统的优选实施方式,所述辅助蛋白的核苷酸序列如seq id no.4~6中任一种序列所示。
14.第四方面,本发明将所述ii型crispr/cas9基因编辑系统在原核或真核生物基因编辑中的应用。
15.第五方面,本发明将所述ii型crispr/cas9基因编辑系统在制备生物基因编辑制剂中的应用。
16.与现有技术相比,本发明的有益效果为:
17.(1)本发明的三种ii型crispr/cas9基因编辑系统可以识别特定的pam序列(ngngnc、nnnaa、nnnaa),能够在crrna的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了spcas9的局限性。
18.(2)采用本发明cas9蛋白的ii型crispr/cas9基因编辑系统能够在crrna的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。
附图说明
19.图1为本发明crispr/cas9基因编辑系统的进化树、系统组成和蛋白生物信息学分析结果示意图。
20.图2为本发明三种crispr/cas9基因编辑系统的原核pam序列图。
21.图3为本发明三种crispr/cas9基因编辑系统的原核干扰图。
22.图4为本发明三种crispr/cas9基因编辑系统的nc确认原核干扰图。
23.图5为本发明三种crispr/cas9基因编辑系统的scaffold结构图。
24.图6为本发明三种crispr/cas9基因编辑系统的真核细胞spacer最适长度探究图。
25.图7为本发明所述三种crispr/cas9基因编辑系统的guide-seq在靶与脱靶检测
图。
具体实施方式
26.为更好地说明本发明的目的、技术方案和优点,下面将结合具体实施例对本发明作进一步说明。本领域技术人员应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本发明所述cas9核酸内切酶是一种dna内切酶。本发明所述的碱基序列中的所述n,表示a、g、c、t中的任意一种。本发明所述的cas9蛋白,是一种多结构域的dna核酸内切酶,包括rec结构域、ruvc结构域、hnh结构域和pi结构域,它能识别在pam5’端识别与sgrna互补的dna序列,分别通过hnh结构域切割与sgrna互补的dna链,ruvc结构域切割非互补链dna。本发明所述的crrna,以碱基互补的方式引导cas蛋白识别入侵的dna,5’端为间隔序列,与靶dna互补,3’端为重复序列。本发明所述crispr/cas9基因编辑系统还需要tracrrna的参与,tracrrna是单独转录的,tracrrna与pre-crrna通过剪辑互补配对结合,经过rna酶iii酶切处理将pre-crrna的5’部分间隔序列和3’部分重复序列,形成成熟的crrna,与tracrrna结合形成tracrrna-crrna复合体,通过在crrna下游和tracrrna上游之间添加四个碱基的tetraloop(如“gaaa”、“tgaa”或“aaac”序列)可以将tracrrna和crrna连接起来形成scaffold。通过调节tracrrna的长度以及可识别间隔序列的长度能进一步优化cas9核酸内切酶的切割功能。
27.实施例中所用的试验方法如无特殊说明,均为常规方法;所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
28.实施例1:三种新型crispr/cas9基因编辑系统
29.利用宏基因组生物信息手段对ii型crispr/cas9基因编辑系统相关蛋白及其元件进行分析、预测、筛选,利用crisprcas finder软件进行宏基因组注释,通过nupack软件预测crrna和tracrrna的二级结构,使用hhpred软件预测功能域,并利用fasttree软件构建系统发育树。提供了三种新ii型crispr/cas9基因编辑系统,包括cas9蛋白、辅助蛋白、crispr rna和tracrrna,如图1所示。
30.本发明筛选得到三种新型编辑系统的cas9蛋白,分别来自:一种未注释细菌继而将其命名为hqcas9;dialister sp.900538805细菌中的dspcas9;dialister succinatiphilus细菌中的dsucas9。hqcas9蛋白编码1353个氨基酸,其序列如seq id no.1所示;dspcas9蛋白编码1383个氨基酸,其序列如seq id no.2所示;dsucas9蛋白编码1389个氨基酸,其序列如seq id no.3所示。将3种cas9蛋白与已发表的其他14种ii型crispr/cas9基因编辑系统进行系统发育树分析,显示hqcas9、dspcas9、dsucas9归为type ii a这一支,三种cas9蛋白之间序列相似性较高,与frcas9亲缘关系最近,进化树如图1a所示。
31.所得crispr/cas9基因编辑系统由以下多个元件组成:基因编码的cas9核酸内切酶,辅助蛋白cas1、cas2、csn2、crispr array以及反式激活crispr rna(trans-activating crrna,tracrrna)。本发明所述三种新型crispr/cas9基因编辑系统的组成图如图1b所示、cas9蛋白结构图如图1c所示。辅助蛋白cas1,其序列如seq id no.4所示;辅助蛋白cas2,其序列如seq id no.5所示;辅助蛋白csn2,其序列如seq id no.6所示。三种辅助蛋白参与外源基因捕获,以及crrna的成熟。
32.crispr array包括直接重复序列和间隔序列,这两种序列是间隔排列的,两个重
复序列中间夹一个间隔序列,重复序列在同一细菌中的碱基组成和长度是相对保守的,在不同的细菌之间会有些许差异。本发明的三种新型crispr/cas9基因编辑系统所对应的重复序列,依次如seq id no.7~9所示。
33.上述序列信息如下:
34.seq id no.1:
35.mqtkkvdeyyvgfdigtnsvgyavtdknynlikhggepmwgshvfeaastaqerrtfrtarrrndrkkqrialvseifapeiakvdprffirrresalfrddvdikdryvvfndddftdkdyydiyptihhliydlmsnkekhdirlvymacaylvahrghflsevskdniedvldfdvvycnflnvmdnyaeipwkcdiskfkeilkkkqtvtnkereflqllnegkkfktseeddvsreglvkllsggtyelgklfpkltfeekvsvsfnmaeedfamvlqqlgdegdiisslrnvydwailsdvlngknsvsegkitvyeqhkkdlsflkyfvkkyipnryyevfrdgnivgnyvsysynlknvqnvskfkgakkdvfcdyikkvvkdikvddedkveyedmmfrldtysfipkqvendnrvipyqlyyyelkrildnassylefldekdmdgytsrekllsimefripyyvgplrtdngqhgwmkrkaegriypwnfedkvdldaseqefinrmtnsctylpgetvvpkysllyckfnvlneinnikindcsipiehkqgiyklferyrkvtpkkikdflisnnllhpedvisgidvtiksslksyhdfkkllescvlkenqveaiierltysedkgrilrwlhmefpdlsdddvkyisklkysdfgrlsrkllvgirgcnkdtgevdsimgmlwstndnmmkllsnsytfieeieaikneyyvehpanldsmldemyvsnavrrpihrtldilsdirkvcgknpskifvemargggekgvrtksrrdqiselyknmdkaevrelseqlegktdnelqsevlflyfmqlgkcaytqktididklktniynvdhiypqsyvkddsitnkvlviseengqkgdkypiskdirekmqpfwyrllsnkliseekyrrltrctsfteeeltgfinrqlvethqstkavttvfrtlfpdveivyskaglvsefrkefdmlktrsvndlhhakdaylnivvgnvyhcrftknfyitqkyslktktlfthsvklgddviwngqesignvrkvlaknnihytkypfmrkgglfdqmpvkaaagliprktgldtekyggynkstatafllvkykekgkqeamimpvdymysekvfsdneyalkyskenikkiwgrtedqvidvslplglrpikintmlsfdgfracitgkanagqkigftsmmplvignewenyikkidnyiekkgknknitlnekndgicgekneklyciltdkiinniysipfnsqqkilengydkfkkldierqvyflqnlvlvlksgragscdmsaiggsknaatfafgsklslwakkfqkvylidnsssgiyqnmsdnlldiik;
36.seq id no.2:
37.mmkeiknyfigldmgttsvgwaatdenyeiikkngkalwgirlfdeaqtaadrrmhriarrrierrsrridllqelfaqeickkdpgfyerlnesglyeedktvhqknslfndvdfddkayykeyptiyhlrydlmtkdrpfdvrlvylavhhilkhrghflfdhfqvdengvsgfeesfaafgdalehikgesfdmgkeeemkalcrdkklgvrhkalalaqclgrskdkdfkammtlaaggtallsevfkdeglkdfsknkvsfsdsqfendkpeiiaelgdrydliaalhglynwsflaelmrghkyiseakieiydkhkedlallkkvlkqdrsvynlmfkepgdkkpinysayvkacktngkklplpygkfkyeefiktvkfclknlpdspdkknienkleegsfllkavsvengaipyqlhlqelkiilskaeaylpflkvrdqygtvsdkiislftfripyyvgpinehagscwvvkkdkqgkvypwnftekidieksaegfirnltnkctyligedvlpknsllyseftvlnelnnvrigenaqklspelkekvlenlfkkhkhvsrrkfinylvtegidkkeaesisgldgdfkssmsslidmkhilgndfsredaekmikditifggdkkmlkkrlhrefsyltseqltsltrlsydgwgrlskellvnllpvekstgevlvdkgsgevlniisameqtsynlmellssrfgyataieernrekegngtisyqdvedmyispavkrplwqalkivreivkilgkepskifiemarengekgkrtisrkarlqelykkcrddsrdwakelaekpeedfrsdrlylyytqmgrsmytgkpidinqlfdrnvydidhiypqsltgddsldnrvlvektvnakkgdiyplgsaldgchiqgeihiqdiqremrpfwhmllekgliskekynrlsrttplsdtekaafigrqlvetrqstkacaellskaypqarivytkagnasrfrqyggfikvrdmndyhhakdaylnivvgnvfdtrftanplhflkgnhpvyslntealyghkvsrggvdawippekddeghimaghegtmgtvrkwmrknnilftrmplegkgglfdqtimkkgkgqvplkgdspvsdiek
yggynkassayfvltssklkdetiytietipliikrmiqtnkdkedyikrhwkdhgkkmvnphicyghipvqslleingfkvhltgksgkdfklrnaeqlcisnddaavlkrvlkynersslskgkeallitpfdniqevdlnrlyqvfedkltnqvykvklgkqasvlkkgedkfnelplevkcrvigeilhlfqcnaaiadlrliggaknagaltmnprvspedhvylieqsvtgffekrillapyggk;
38.seq id no.3:
39.mkeikkifigldmgtnsvgwtatdenyevikkngkalwgirlfdeaqtaedrrmhriarrrierrsrridllqelfaqeickkdpgfyerlnesglyeedktvhqtnslfndvdfndkayykkyptiyhlrhalmtenhpfdvrlvylaihhilkhrghflfenfqtdekgtsgfdesfaafgsaldrikgsspdvrkadsmkdilkdkklgvkekaasllqclgqgkekdfkammtlaaggtaslsdifndeklkdfeknkvnfssaqfeenepdimaelgdrydliaalhgfynwsllaelmgeyhyiseakiavydkhkadlkvlkrvlkqrpdiyakifrepgssanknysayvgvckvkgkkaaiekcsyedftktlkpclkdmpdsndkdyisrelnmgtflpksvskengvipyqlhlqelkiilskaeaylpflkvkdqygtvsdkiislftfripyyvgpinehagscwvvkkdkrgkvypwnftekidieksaegfirnltnkctyligedvlpknsllyseftvlnelnnvrigetmqklplrlkekvmdnlfsrykhvsrtkfikylvsegidkkeaesisgldgdfksslsslidmkhilgndfsrenaekmiqditifggdkkmlknrlhrefsyltpeqltsltqlsydgwgrlskeflvnllpaegdscevlvdhtsgevlniisamrqtsynlmellgsrfgygqaieernkkeegqgritykdvedlyispavrrplwqalkivreivkitgkepskifiemarengekgkrtisrkarlqalykkcrddtrdwakelegkseedfrsdrlylyytqmgrsmytgkpidinrlfdrnvydidhiypqsltgddsldnrvlvektvnakkgdtyplssaldgcyisgqqiriqdiqkemrpfwhmllekeliskekynrlsrtiplsdaekaafigrqlvetrqstkacaellskaypqtrivytkagnasrfrqyggfikvrdmndyhhakdaylnivvgnvfntrftanplhflkgnhqayslntealyghkvsrngvdawipaekdekgqvmaghegtmgtvrkwmrknnilftrmpyegkgglfdqnimkkekgqvpikgdspisnikkyggynkakvayfvltqsklnkktvytleaiplilknsiqsnedketyiqkqwrkngkkmehpivclghipvqslleingfkvhlsgkngkdillrnaeqlcineadtavlkkilkfnqraamskkgeeifinsfdniqeedlnrlyhvfedkltnqiykvklekqaavlkkgeetfnrlspeqkckligeilhlcqckathadlrliggakkagiltmgtqiypkdhvylieqsvtgffekrillapfgek;
40.seq id no.4:
41.mnqlvtggisvlnkgefikkqilvyepflgdkmsykndnmvirdgngkikyqvscyrifmvlivgdvtittgilrrqqkfgfrlcfltlglkvysvigpqlqgntllhckqyaydeltvgksiiinkilnqraaltrlrsktedvwecislleqyskrlqndslnlqeiigiegmaskiyfprifsntqwigrkprikfdyintlldigynalfnfidailqvfgfdvyygvlhtcfymrkslvcdimepmrpivdwqirksinlkqfkqddfvqvgkqyqlkykkstqylqvfleailnykeeifvyvrdyyrsfmknnpieaypvfkleel;
42.seq id no.5:
43.miivsydisddklrtkfskylsrfghriqysmfeidnserilnniicdihnqfek kfsqedsiyifnlskwckierfgyaknetndllvltgckprp;
44.seq id no.6:
45.mrffhhifskpiifrenkvnllvienkklfanfvrdfsvqsrgeegeillsddvsdldfekhaeviadyfsldfngkklssklitelkqsalygfageagellgllnsfgskvissvefplewetvydigavlklfdyrlnvssenflemlvdymevcshflkkdifvlvnlksyfdmeeikllykeaffrkwnlivlepsssgslheyediviidkdiceirldneefl;
46.seq id no.7:
47.gtttgagagtaatgtaaattcatagaggtataaga;
48.seq id no.8:
49.gtttgagagtgttgtgattcttgatagtggtaa;
50.seq id no.9:
51.gtttgagagtgttgtgattcttgatagtggtaa。
52.实施例2:原核pam耗竭实验
53.本实施例通过原核pam耗竭实验挖掘本发明实施例1的ii型crispr/cas9基因编辑系统cas核酸酶识别间隔序列所需的pam序列。hqcas9、dspcas9、dsucas9的核苷酸序列分别如seq id no.10~12所示。
54.具体操作如下:
55.(1)在pam library间隔序列(其序列如seq id no.14所示)的3’端添加6个位置随机碱基nnnnnn(共4096条插入片段),采用overlap pcr方法把library构建到puc19骨架载体上,得到具有4096种不同pam组合的pam library质粒,但5’端间隔序列是一样的spacer-pam混合质粒,经二代测序检测到6个位置的随机碱基丰度gini值小于0.1,表明6个位置的随机碱基分布较均匀,pam library质粒具有amp抗性基因。
56.(2)构建原核表达的pet28a-cas9质粒:分别在pet28a载体(addgene,108303)的ecor i和bamh i酶切位点上插入本发明所述三种crispr/cas9基因编辑系统,包括cas9蛋白、sgrna与tracrrna,cas9蛋白经大肠杆菌密码子优化,最后添加taa终止密码子;在异源启动子j23119启动子后添加5
’‑
重复序列-间隔序列(与pam library间隔序列互补)-重复序列-3’,即组成sgrna后接t7terminator;在异源启动子j23119启动子后添加鉴定出来的tracrrna(其序列依次如seq id no.14~16所示),三种质粒具有kana抗性基因。
57.(3)把含有pet28a-cas9(或pet28a空载质粒)和pam library质粒共同通过细菌电转进dh5α(全式金生物,cd201-01)感受态,37℃复苏1h后均匀涂抹在amp(100μg/ml)以及kana(50μg/ml)双重抗性的固体培养皿上置于37℃培养18h后刮取全部单克隆至无抗性培养基中,离心提取含pet28a-cas9(或pet28a空载质粒)和pam library质粒的混合质粒。
58.(4)在混合质粒上,随机碱基的两端设计合适的引物对(library-ngs-f和library-ngs-r)含有间隔序列和pam组合的位置进行pcr扩增及纯化,在产物两端加上接头(采用商业的illumina测序接头引物:hieff ngs384 dual index primer kit forset1(货号12613es02)i5primer:taagatta)进行二代测序(i7primer:gagattcc),以pet28a空载对照组的pam耗竭阈值为对照基准,利用weblogo 3分析6个随机碱基的消耗,通过负向筛选的方式得到每个cas9蛋白所识别的pam序列。
59.pam序列分析结果如图2所示,hqcas9、dspcas9、dsucas9能分别识别序列为ngngnc、nnnaa、nnnaa的pam。
60.上述序列信息如下:
61.seq id no.10:
62.atgcagaccaaaaaagttgatgaatactacgtgggcttcgatatcggcaccaactccgttggctacgcggtgaccgataaaaactacaacctgattaaacacggcggtgaaccgatgtggggctcccacgttttcgaggcggcgagcaccgcccaggaacgccgtaccttccgcaccgctcgccgccgtaacgatcgtaaaaaacagcgtatcgcgctggtgtctgaaatcttcgcgccggaaatcgcgaaagtggacccgcgtttcttcatccgtcgccgtgaatccgcgctgttccgc
gacgacgtggacattaaagatcgttacgtggttttcaacgacgacgatttcaccgataaagactactacgatatctacccgaccatccaccacctgatctacgacctgatgagcaacaaagaaaaacacgatattcgcctggtttacatggcgtgcgcctacctggtggcgcatcgcggccacttcctgtctgaagtttctaaagataacatcgaagatgttctggacttcgatgtcgtgtactgtaactttctgaacgttatggacaactacgcggaaatcccgtggaaatgcgatatttccaaattcaa
63.agaaatcctgaagaaaaaacagaccgtgaccaacaaagaacgtgaattcctccagctgctt
64.aacgaaggtaaaaaattcaaaaccagcgaagaggatgatgtgtctcgtgaaggcctggtg
65.aaactgctgtcgggtggcacctacgaactgggtaaactgtttccgaaactgacctttgaag
66.aaaaagtgagcgttagcttcaacatggcggaagaagattttgcgatggttctgcagcagct
67.gggtgacgaaggtgacatcatctccagcctgcgtaacgtttacgattgggcgatcctgagc
68.gacgtgcttaacggcaaaaacagcgtgtctgaaggcaaaattaccgtctacgaacagcaca
69.aaaaagatctgtctttcctgaaatacttcgtgaaaaaatacatcccgaaccgttattacgaa
70.gttttccgtgatggcaacatcgttggcaactatgtgagctatagctacaacctgaaaaacgt
71.tcagaacgtatccaaattcaaaggcgccaaaaaagacgttttctgtgattacattaaaaaa
72.gttgttaaagatattaaagttgacgatgaagataaagttgaatacgaagatatgatgttcc
73.gcctggatacgtacagcttcatcccgaaacaagttgaaaacgacaatcgtgttatcccgta
74.ccagctgtactactacgaactgaaacgtatcctggacaacgcgtcctcttacctggaatttc
75.tggacgaaaaagatatggacggttacacttcgcgcgaaaaactgctgtccatcatggaatt
76.ccgtatcccgtattatgtgggtccgctgcgtaccgataacggtcagcacggctggatgaaa
77.cgtaaagcggaaggccgtatctacccgtggaacttcgaagataaagtggatctggacgcta
78.gcgaacaggaatttattaaccgtatgaccaactcttgcacctacctgccgggtgaaaccgt
79.ggtgccgaaatatagcctgctgtactgcaaattcaacgttctgaacgaaattaacaacatc
80.aaaatcaacgactgttctatcccgatcgagcacaaacagggcatctacaaactgttcgaac
81.gctaccgcaaagtgaccccgaaaaagattaaagacttcctgatctctaacaacctgctgca
82.cccggaagatgttatcagcggcatcgatgttaccatcaaaagcagcctgaaatcctaccac
83.gacttcaaaaaactgctggaaagctgtgtgctgaaagaaaaccaggtggaagctatcatcg
84.aacgcctgacctacagcgaagataaaggccgtatcctgcgttggctgcacatggaattccc
85.ggacctgagcgatgatgacgttaaatacatctccaaactgaaatacagcgacttcggccgc
86.ctgagccgcaaactgctggtcggcatccgtggctgcaacaaagacaccggcgaagtggata
87.gcatcatgggcatgctgtggagcaccaacgacaacatgatgaaactgctgtctaacagcta
88.cacctttatcgaagaaatcgaagcgatcaaaaacgaatactacgttgaacacccggcgaac
89.ctggacagcatgctggatgaaatgtacgttagtaacgctgtgcgtcgtccgattcaccgtac
90.cctggatatcctgagcgacattcgcaaagtttgcggcaaaaacccgagcaaaatcttcgtt
91.gaaatggcgcgcggtggtggtgaaaaaggtgttcgtaccaaatcccgccgtgaccagatct
92.ctgaactgtataaaaacatggataaagcggaagtgcgtgaactgtctgaacagcttgaagg
93.taaaaccgataacgaattacagtccgaagtgctgttcctgtactttatgcaattgggtaaat
94.gcgcgtacacccagaaaaccatcgacatcgacaagctgaaaaccaacatttacaacgtgga
95.tcacatttacccgcagtcttacgtaaaagatgatagcatcaccaacaaagtgctggttatta
96.gtgaagaaaacggccagaaaggtgataaatatccgatctctaaagacatccgtgaaaaaa
97.tgcagccgttctggtaccgtttgctgagcaacaaactgatttctgaagaaaaataccgccg
98.cctgacccgctgtacctccttcaccgaagaagaactgaccggtttcattaaccgccagctcg
99.ttgaaacccaccagtccaccaaagcggttaccacggttttccgtactctgttcccggacgtg
100.gagatcgtttactctaaagcgggcctggtgtccgaattccgtaaagaattcgacatgctga
101.aaacccgtagtgtgaacgatctgcaccacgccaaagatgcgtatctgaacatcgtcgtggg
102.caacgtttaccattgtcgtttcaccaaaaacttctacattacccagaaatacagcctgaaaa
103.ccaaaaccctgttcacccattctgttaaactgggtgatgacgttatctggaacggccagga
104.gagcattggtaacgtgcgtaaagtgctggcgaaaaacaacatccactacactaaatatccg
105.ttcatgcgtaaaggtggcctgttcgaccagatgccggttaaagcggcggccggtctgatcc
106.cgcgtaaaaccggcctggataccgaaaaatacggtggttataacaaatccactgctaccgc
107.atttctgttagtgaaatacaaagaaaaaggcaaacaggaagccatgatcatgccggtagac
108.tacatgtacagcgaaaaagttttctccgataacgaatacgccttaaaatactccaaagaaa
109.atatcaaaaagatctggggtcgcacggaagatcaggtgatcgatgtgtctttaccgctggg
110.cctgcgtccgatcaaaattaacaccatgctgagcttcgacggcttccgcgcgtgcatcaccg
111.gcaaagcaaacgctggtcagaaaattggcttcaccagcatgatgccgctggtgatcggtaa
112.cgaatgggaaaactacatcaaaaagattgacaactacattgagaaaaaaggtaaaaacaa
113.aaacatcaccctgaatgaaaagaacgatggcatctgcggcgaaaagaacgaaaaactgta
114.ctgtatcctgactgacaaaatcatcaacaacatctactcgatcccgttcaactcccagcaga
115.aaatcctggagaacggctacgacaaattcaaaaaactggatatcgaacgccaggtgtactt
116.cctgcagaacctggttctcgttctgaaatcgggccgtgctggttcctgtgatatgagcgcaa
117.tcggtggctcgaaaaacgcggcgacctttgcgttcggttccaagctgagcctgtgggcgaa
118.aaaattccagaaagtgtacctgatcgataacagcagctctggcatctaccagaacatgagcgataacctgctggacatcatcaaataa;
119.seq id no.11:
120.atgatgaaagaaattaaaaactattttattggcctggatatgggcaccactagtgtgg
121.gctgggcagccactgatgaaaactatgaaattattaagaagaatggcaaagccctgtgggg
122.cattagactgtttgatgaagcgcagactgcagcagatagaagaatgcatagaattgcaaga
123.agaagaattgagagaagaagcagaagaattgacctgctgcaagaactttttgcccaagaa
124.atttgcaaaaaagatcctggcttttatgaaagactgaatgaaagtggcctgtatgaagaag
125.ataaaactgtgcatcagaaaaactctctgtttaatgatgtggattttgatgataaagcctat
126.tataaagaatatccaaccatttatcatctgagatatgatctgatgaccaaagatagaccatt
127.tgatgtgagactggtgtatctggccgtgcatcatattctgaaacatagaggccattttctgt
128.ttgatcattttcaagtggatgaaaatggtgtgagtggctttgaagaaagctttgcagccttt
129.ggtgatgccctggaacatattaaaggtgaaagctttgatatgggcaaagaagaagaaatg
130.aaagccctgtgcagagacaagaaactgggtgtgagacataaagccctggccctggcacag
131.tgccttggcagaagcaaagacaaagactttaaagccatgatgaccctggcagctggtggca
132.ctgccctgctgagtgaagtgtttaaagatgaaggcctgaaagattttagcaaaaacaaagt
133.gagctttagtgatagtcagtttgaaaatgataaacctgaaattattgcagaactgggtgat
134.agatatgatctgattgcagccctgcatggcctgtataactggagctttctggcagaactgat
135.gagaggccataaatatattagtgaagccaaaattgaaatttatgataaacataaagaagat
136.ctggccttgctgaaaaaagtgctgaaacaagatagaagtgtgtataacctgatgttcaagg
137.aacctggtgataaaaaacctattaactatagtgcctatgtgaaagcctgcaaaaccaatgg
138.taaaaaattaccactgccatatggcaagtttaaatatgaagaatttattaaaactgtgaaa
139.ttttgcctgaaaaacctgcctgatagccctgataaaaaaaacattgaaaacaaactggaag
140.aaggcagctttctgctgaaagcagtgagtgtggaaaatggtgccattccatatcagctgca
141.tctgcaagaactgaaaattattctgtctaaggcagaagcctatctgccatttctgaaagtga
142.gagatcagtatggcactgtgagtgataaaattattagcctgtttacctttagaattccatat
143.tatgtgggcccaattaatgaacatgctggcagctgctgggtggtgaaaaaagataaacaag
144.gcaaagtgtatccatggaactttactgaaaaaattgacattgaaaaaagtgcagaaggctt
145.tattagaaacctgaccaacaaatgcacctatctgattggtgaagatgtgctgccaaaaaac
146.agcctgctgtatagtgaatttactgtgctgaatgaactgaacaatgtgagaattggtgaaa
147.atgcacagaaactgagccctgaactgaaagaaaaagtgctggaaaacctgtttaaaaaac
148.ataaacatgtgagcagaagaaaatttattaactatctggtgactgaaggcattgataaaaa
149.agaagcagaaagcattagtggcctggatggtgattttaaaagcagcatgagcagcctgatt
150.gatatgaaacatattctgggcaatgattttagcagagaagatgcagaaaaaatgattaaag
151.atattaccatttttggtggtgataaaaaaatgctgaaaaaaagactgcatagagaatttag
152.ctatctgactagtgaacagctgactagcctgactagactgagctatgatggctggggcaga
153.ctgagcaaggaacttctggtgaacctgctgcctgtggaaaaaagcactggtgaagtcctgg
154.tggataaaggcagtggtgaggtgctgaacattattagtgccatggaacagactagctataa
155.tctgatggaattactgagcagcagatttggctatgccactgccattgaagaaagaaacaga
156.gaaaaagaaggcaatggcaccattagctatcaagatgtggaagatatgtatattagccctg
157.cagtgaaaagaccactgtggcaagccctgaaaattgtgagagaaattgtgaaaattctggg
158.caaagaaccaagcaaaatttttattgaaatggcaagagaaaatggtgaaaagggcaaaag
159.aaccattagcagaaaagcaagacttcaagagctgtataagaaatgcagagatgatagtag
160.agattgggccaaagaactggcagaaaaacctgaagaagattttagaagtgatagactgta
161.tctgtattatactcagatgggaagaagcatgtacactggcaaaccaattgatattaatcag
162.ctgtttgatagaaatgtgtatgatattgatcatatatatccacaaagcctgactggtgatga
163.cagcctggacaacagagtgctggtggaaaaaactgtgaatgccaaaaaaggagatatcta
164.ccccttaggtagtgccctggatggctgccatattcaaggtgaaattcatattcaagatattc
165.agagagaaatgagaccattttggcatatgctgctggaaaaaggcctgattagtaaagaaa
166.aatataacagactgagcagaaccaccccactgagtgatactgaaaaagcagcctttattgg
167.cagacagctggtggaaactagacagagcaccaaagcatgtgcagaattactgagcaaagc
168.ctatccacaagcaagaattgtgtataccaaagctggcaatgcaagcagatttagacagtat
169.ggtggctttattaaagtaagagacatgaatgattatcatcatgccaaagatgcctatctga
170.acattgtggtgggcaatgtgtttgatactagatttaccgccaacccactgcattttctgaaa
171.ggcaaccatcctgtgtatagcctgaacactgaagccctgtatggccataaagtgagcagag
172.gtggtgtggatgcctggattccacctgaaaaagatgatgaaggccatattatggctggcca
173.tgaaggcaccatgggcactgtgagaaaatggatgagaaaaaacaacattctgtttactaga
174.atgccattggaaggcaaaggtggcctgtttgatcagaccattatgaaaaaaggcaaaggcc
175.aagtgccactgaaaggtgatagccctgtgagtgatattgaaaaatatggtggctataacaa
176.agcaagcagtgcctattttgtgctgactagcagcaaactgaaagatgaaaccatttatacc
177.attgaaaccattccactgattattaaaagaatgattcagaccaacaaagataaagaagatt
178.atattaaaagacattggaaagatcatggcaagaaaatggttaacccacatatttgctatgg
179.ccatattcctgtgcagagcctgctggaaattaatggctttaaagtgcatctgactggcaaat
180.ctggcaaggactttaagctgagaaatgcagaacagctgtgcattagcaatgatgatgcagc
181.agtgctgaaaagagtgctgaaatataatgaaagaagcagcctgagtaaaggcaaagaagc
182.cctgctgattaccccatttgataacattcaagaagtggatctgaacagactgtatcaagtgt
183.ttgaagataaactgaccaaccaagtgtataaagtgaaactgggcaaacaagcaagtgtgtt
184.aaagaagggtgaagataaatttaatgaactcccactggaagtgaaatgcagagtgattggt
185.gaaattctgcatctgtttcagtgcaatgcagccattgcagatctgagactgattggtggtgc
186.caaaaatgctggtgccctgaccatgaacccaagagtgagccctgaagatcatgtgtatctg
187.attgaacagagtgtgactggcttttttgaaaaaagaattctgctggccccatatggtggcaaataa;
188.seq id no.12:
189.atgaaagaaattaaaaagatcttcatcggtctggatatgggcaccaacagcgtgggct
190.ggaccgcgaccgatgaaaactacgaagtgatcaaaaagaacggtaaagcgctgtggggta
191.tccgtctgttcgatgaagcacagaccgcagaagatcgtcgtatgcaccgcatcgcgcgtcg
192.ccgcatcgaacgccgctcccgtcgtatcgatctgctgcaggaactgttcgcgcaggaaatct
193.gcaaaaaagatccgggcttctacgaacgtctgaacgaaagcggtctgtacgaagaagata
194.aaactgtgcaccagaccaactccctgtttaacgacgtggatttcaacgataaagcgtacta
195.caaaaaatacccgaccatttaccacctgcgccatgcgctgatgaccgaaaaccacccgttc
196.gacgttcgcctggtttacctggcgatccaccacatcctgaaacatcgtggtcacttcctgtt
197.cgaaaacttccagacggacgaaaaaggcacctccggcttcgacgaatcttttgctgctttc
198.ggctctgcgctggatcgtattaaaggctcctcaccagatgtgcgtaaagccgactctatga
199.aagacatcctgaaagataaaaaactgggtgttaaagaaaaagcagcgagcctgctgcagt
200.gcctgggccagggcaaagaaaaagacttcaaagctatgatgaccctggcggcaggcggca
201.ccgcgtccctgtccgatatcttcaacgacgaaaaactgaaagacttcgaaaagaacaaagt
202.gaacttcagctctgcacagttcgaagaaaacgaaccggacatcatggcggaactgggcgac
203.cgttatgatctgatcgcggccctgcacggcttctataactggtctctgctggcagaactgat
204.gggtgaataccattacatcagcgaagctaaaattgcggtgtacgacaaacacaaagcggat
205.ctgaaagttctgaaacgcgttctgaaacagcgtccggacatctacgcgaaaatcttccgcg
206.aaccgggttcctctgcgaacaaaaactacagcgcgtacgtgggcgtttgcaaagttaaagg
207.caaaaaagccgcgatcgaaaaatgtagctacgaagatttcactaaaaccctgaaaccgtgc
208.ctgaaagatatgccggattctaacgacaaagattatatctctcgcgaactgaacatgggta
209.ccttcctgccgaaatccgttagcaaagaaaacggcgtgatcccgtaccagctgcacctgca
210.ggaactgaaaatcatcctgtctaaagcagaagcgtacctgccgttcctgaaagtgaaagac
211.cagtacggcaccgtttccgacaaaattatctccctgttcaccttccgtatcccgtactatgt
212.gggtccaatcaacgaacacgcgggctcctgctgggtggttaaaaaagataaacgcggtaa
213.agtgtacccgtggaacttcaccgaaaaaatcgatatcgaaaagtccgcggaaggcttcatc
214.cgtaacctgaccaacaaatgcacctacctgatcggtgaggatgttctgccgaaaaacagcc
215.tgctgtacagcgaattcaccgttctgaacgaactgaacaacgtgcgcatcggcgaaaccat
216.gcagaaactgccgctgcgtctgaaagagaaagtgatggacaacctgttcagccgttacaaa
217.cacgtgagccgcaccaaattcatcaaatacctggtgagcgaaggcatcgataaaaaagaa
218.gctgaaagcatctctggcctggacggcgatttcaaaagctctctgagctccctgatcgacat
219.gaaacacatcctgggtaacgacttcagccgtgaaaacgcggaaaaaatgatccaggatatc
220.accatcttcggcggcgataaaaagatgctgaaaaaccgcctgcaccgtgaattctcctacc
221.tgaccccggaacagctgaccagcctgacccagctgtcctacgacggctggggccgtctgag
222.caaagaattcctggttaacttactgccggctgaaggtgatagctgtgaagtgctggttgatc
223.acaccagcggcgaagtgctgaacattatcagcgcgatgcgtcagacctcctacaacctgat
224.ggaactgctgggcagccgcttcggctacggccaggcgatcgaagaacgtaacaaaaaaga
225.agaaggccagggccgtatcacctacaaagacgttgaggatctgtacatcagcccggcggtt
226.cgtcgtccgctgtggcaggcgctgaaaatcgtgcgcgaaatcgtgaaaatcaccggcaaag
227.aaccgagcaaaatcttcatcgaaatggcgcgtgaaaacggtgaaaaaggtaaacgtacca
228.tctctcgcaaagctcgcctgcaggctctgtacaaaaaatgtcgtgatgacacccgtgactg
229.ggcgaaagaactggaaggcaaatccgaagaagattttcgctctgatcgtctgtatctgtac
230.tacacccagatgggtcgcagcatgtacaccggtaaaccgatcgatattaaccgtctgttcg
231.atcgtaacgtgtatgacattgatcacatttacccgcagtccctgaccggtgacgatagcctg
232.gataaccgcgtactggtggaaaaaaccgttaacgcaaagaaaggtgacacctacccgctgt
233.ctagcgcactggatggttgctacatttctggtcagcagattcgtatccaggatatccagaaa
234.gaaatgcgtccgttctggcacatgctgctggaaaaagaactgatttctaaagaaaaataca
235.accgcctgtctcgcaccatcccgctgtccgacgcggaaaaagcagcgttcattggtcgtca
236.gctggttgagacccgccagtccaccaaagcctgcgcggaactgctgtctaaagcgtatccg
237.cagacccgtatcgtgtacaccaaagcgggcaacgctagccgtttccgtcaatacggtggct
238.ttatcaaagtgcgtgatatgaacgactaccaccacgcgaaagatgcatatctgaacatcgt
239.agttggcaacgttttcaacacccgtttcaccgccaacccgctgcacttcctgaagggtaacc
240.accaggcttactccctgaacaccgaagcgttgtacggtcataaagtatcccgtaacggcgt
241.ggatgcgtggatcccggcggagaaagatgaaaaaggccaggttatggcaggccacgaagg
242.caccatgggtaccgttcgcaaatggatgcgcaaaaacaacatcctgtttacccgcatgccg
243.tacgaaggcaaaggcggcctgttcgaccagaacatcatgaaaaaagaaaaaggccaggtg
244.ccgatcaaaggtgattccccgattagcaacatcaaaaaatacggtggctataacaaagcca
245.aagtggcgtatttcgttctgacgcagtctaaactgaacaaaaagaccgtttataccctgga
246.agccatcccgctgattctgaaaaacagcattcagtccaacgaagataaagaaacctatatt
247.cagaaacagtggcgtaaaaacggtaagaaaatggaacatccgatcgtttgtctgggccata
248.ttccggtgcagtccctgctggaaattaacggcttcaaagtgcacctgtcaggcaaaaacgg
249.taaagatatcctgctgcgcaacgcggaacagctgtgtatcaacgaagcagataccgctgtt
250.ctgaagaaaatcctgaaattcaaccagcgtgccgcgatgagtaaaaaaggcgaagaaatc
251.ttcatcaacagcttcgataacatccaggaagaagatctgaaccgcctgtaccacgttttcga
252.agataaactgaccaaccagatctacaaagttaaactggaaaaacaggctgctgtgctgaaa
253.aaaggcgaagaaaccttcaaccgcctgagcccagaacagaaatgtaaactgatcggtgaa
254.atcctgcacctgtgccagtgcaaagctactcacgctgatctgcgtctgattggcggcgcgaa
255.aaaagccggcatcctgaccatgggtacccagatctacccgaaagaccacgtttacctgatc
256.gaacagtccgttaccggcttcttcgaaaaacgtatcctgctggcgccgttcggtgaaaaataa;seq id no.13:atggcgaatacttttaaagtcat;
257.seq id no.14:
258.acattactctcaaactacaaatgtattcatttgatacatttgatatcaaattttgaaaatccagcttgcaactggtatgtaaatccacatctttgttatacattcttatacaataaatatcaacacatatctttcctaataccataacaatacctataacctgaactcctattcaaaatattgacaattcccctttcatgatgtaatgtgtaaatgaatttacattgcgagttcaaataaagtttttaccaaatcgccgttttccggttacacagtgtgtgtatcaatcctaagtttttacttaggattttttattatcattatatattgtatatttcattttctcgaatagtatatattttatatttttgattt;
259.seq id no.15:
260.aaaccgaacgaacacattgacaaaaccgataatggttttaccactatcaagaatcacaacactctcaaacctcaaattgcattttcatgcatcggttctctgcaagtgtatccgcttacaccgggcggcgcgactcttggcagtgtatcaaatgacaccctccctgaaatggagtatcctgtagatgtcaggataacttaccactatccgatcacaacacgagttcaaataaaaattcattcaaatcgtcacttcggtgaccccacagtgtgtggataaaagagctccttcgggagttctttttatttgcccggatatacgcacaacaaaaggccccattatctcatatcccaaaagacatgaaataacagagcctgaaaaagcctcttttgccaccttccctgctgtcctgtccatcatcataatcatcccttctctaataattaatataaaaaggatttcctatgaactcattttatcattaaactcattatatcatgagtgaccggtctacgccttctacctaaagcatgttaccttctacttctattatactcagaggcatgacacactctgtcgctccgcgaaaaaatcctgaatttttatcaaaaattaatcttacgaataaaaggaatgcctataatcctcatctgcagaagaaatcggcagcctgatctatctcctttctatatacagaggagtcccctgaaagcacaaaaacttcctgaatctcctgtggcagtgacctgcctttagagtttcaggaagtttttgctcctcacggtttcccgcaagggcggcaatcggaatcgccattagggaagcgctgattaaatcgttatcgaatttcattcttgtatttttattcaatgcaaggaattagtcgacgcgaatagcgagctatttaaggagactgatgacgaagcattggataaaaatacatatgaaattcgattctacgaattaatcagtgcttccttaggattgccatttgctgcatctttcccatgcgctttatgtaagctaaggaaacgcatgccgaatgaccgtcacatagcacccggtcattttctttattatactattttttacagcagtctgctttctttttctgtacatattctgtacatatcaaatcaaaagtcccctga;
261.seq id no.16:
262.tactctgcaaattgttacataatcttctccattgaaatttattttataagcaaaaaataagtccttcggcaatagagccaaattgcaatccacgcttcccttggggtgcagaaaaaaggaggcagaagccgccaaaggttctgccccctttcaaattgcattttcatgcagcagttctccgcaagtgtatccgcttacaccagacggcgcagttcctgacagtgtatcaaacccttcatcaggcagtcgataaaaggcaaattgacaccctccctgaaatggagtatcctgtagatgtcaggataacttaccactatccgatcacaacacaagttcaaataaaaatttattcaaatcgtcacttcggtgaccccacagtgtgtggataagagagctccttcgggagttctttttatttgcccgatttgagccacaataaaaggtcccgttatttcatatctcaaaagacatgaataaca;
263.library-ngs-f引物的序列为:
264.acactctttccctacacgacgctcttccgatctgtctacaatcggctcgatcga;
265.library-ngs-r引物的序列为:
266.gtgactggagttcagacgtgtgctcttccgatctgcgcagaccaaaacgatctc。
267.实施例3:原核干扰实验一
268.本实施例通过原核干扰实验验证本发明实施例1的三种ii型crispr/cas9基因编辑系统在原核生物中具有切割能力(即是否能够识别实施例2得到的pam序列),并且验证本发明实施例2所鉴定的pam的正确性。
269.具体操作如下:
270.(1)构建pam-target单条质粒,将实施例2所构建的pam library质粒的6位随机碱基替换为三种cas9蛋白对应的pam序列(hqcas9:agcgac;dspcas9:ggataa;dsucas9:ggataa)。
271.(2)将pam-target单条质粒分别电转入含有三种cas9基因编辑系统的dh5α感受态中,以pam空载质粒作为对照,37℃复苏1h后梯度稀释培养基,采用滴板法在含有amp(100μg/ml)以及kana(50μg/ml)双重抗性的培养皿上滴涂20μl培养基,置于37℃培养18h后,观察双抗板上的单克隆细菌数。
272.原核干扰结果如图3所示,从右向左为稀释方向,最右列为未稀释原菌液,稀释倍数越大单克隆长得越少。对照组为电转pam空白质粒组,与cas9基因编辑系统中的间隔序列不存在互补配对的靶序列,则cas9蛋白无法行使切割功能,细菌具有双抗性基因则正常生长。实验组的pam单条质粒中具有能与cas9基因编辑系统中的间隔序列互补配对的靶点以及pam,实验组的单克隆数量与对照组相比明显下降,说明cas9蛋白能识别本实施例选定的pam序列而发挥切割能力,使细菌不具备抗amp能力而不能生长。该实验结果表明,本发明的hqcas9、dspcas9、dsucas9能分别识别序列为agcgac、ggataa、ggacaa的pam序列,在原核系统中具备切割能力。
273.实施例4:原核干扰实验二
274.本实施例通过原核干扰实验验证本发明实施例1的三种ii型crispr/cas9基因编辑系统中发挥切割靶向dna序列所需要的tracrrna范围。
275.具体操作如下所示:
276.(1)把本发明实施例1的三种crispr/cas9基因编辑系统中的非编码区域(noncoding,nc)分为4段,分别通过gibson方法组装进target质粒中,前面加上强异源启动子j23119,分别构建为target-nc 1-4质粒。
277.(2)构建pet28a-δcas9质粒:将实施例2得到的pet28a-cas9质粒中删除所有的nc部分,保留cas9蛋白、重复序列和间隔序列。
278.(3)把target-nc 1-4质粒分别电转进入含有pet28a-δcas9的大肠杆菌dh5α感受态中,37℃复苏1h后梯度稀释培养基,采用滴板法在含有amp(100μg/ml)以及kana(50μg/ml)双重抗性的培养皿上滴涂20μl培养基,置于37℃培养18h后,观察双抗平板上的单克隆细菌数。
279.原核干扰结果如图4所示,结果表明,hqcas9的nc4、dspcas9的nc2、dsucas9的nc1所对应的生长菌落最少,说明这三段对应的nc区域是辅助cas9核酸酶发挥有效切割效应的主要序列。
280.实施例5:预测crispr/cas9基因编辑系统识别靶位点的rna二级结构
281.为预测本发明实施例1的三种ii型crispr/cas9基因编辑系统识别靶位点的rna二级结构,通过模拟tracrrna与重复序列转录后的rna结合过程,预测两者结合后的rna二级结构,通过使用在线软件nupack进行模拟,结果如图5所示,重复序列与tracrrna之间通过“gaaa”进行连接。三种crispr/cas9基因编辑系统发挥靶向切割所需要的scaffold序列如seq id no.17~19所示。
282.上述序列信息如下:
283.seq id no.17:
284.gtttgagagtaatgtaaattcatagaggtataagagaaaatgaatttacattgcgagttc aaataaagtttttaccaaatcgccgttttccggttacacagtgtgtgtatcaatcctaagtt;
285.seq id no.18:
286.gtttgagagtgttgtgattcttgatagtggtaagaaattaccactatccgatcacaaca cgagttcaaataaaaattcattcaaatcgtcacttcggtgaccccacagtgtgtggataaa agagctccttcgggagttctt;
287.seq id no.19:
288.gtttgagagtgttgtgattcttgatagtggtaagaaattaccactatccgatcacaaca caagttcaaataaaaatttattcaaatcgtcacttcggtgaccccacagtgtgtggataag agagctccttcgggagttctt。
289.实施例6:dsodn插入实验一
290.本实施例通过dsodn插入实验验证本发明实施例1的三种ii型crispr/cas9基因编辑系统在真核细胞中发挥靶向切割的最适间隔序列的长度。
291.具体操作如下:
292.(1)根据本发明实施例1的三种cas9蛋白进行人源密码子优化,将对应的核苷酸序列克隆进px330真核表达载体上(addgene,59909),获得px330-蛋白真核表达质粒。
293.(2)在哺乳动物细胞中,以hek293t细胞为例,选取内源性基因,以本实施例3所鉴定的能在原核生物中识别切割的pam序列,寻找到合适的靶位点,序列格式为5
’‑
不同长度的间隔序列(18~30bp)-直接重复序列-3’,通过gibson方法克隆到pxz载体上(addgene,160229),构建靶向同一靶位点、具有不同spacer长度的pxz-target质粒,同时转染px330-蛋白真核表达质粒与pxz-target质粒。具体target序列见表1。
294.(3)在生长状态良好的hek293t细胞24孔板中共转染px330-蛋白真核质粒、pxz-target质粒、1.2μl dsodn,72h后收细胞抽提dna。
295.(4)在对应的基因靶点上游以及dsodn序列上设计一对引物(见表1)进行dsodn-pcr扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsodn的插入,通过检测dsodn的插入情况验证本发明所述cas9基因编辑系统在真核细胞环境下是否具有编辑能力,并比较不同长度的间隔序列对应的条带强弱。
296.表1碱基大小和序列
[0297][0298][0299]
检测结果如图6所示,对应长度的pcr条带用红色三角标注,代表有dsodn的插入,说明这三种crispr/cas9基因编辑系统在真核细胞中均具有靶向切割能力。根据条带强弱比较发现hqcas9的spacer最佳间隔序列识别长度是20~24bp,dspcas9的spacer最佳识别长度是21~24bp,dsucas9的spacer最佳识别长度是22~24bp。
[0300]
实施例7:dsodn的插入实验二
[0301]
本实施例通过dsodn的插入实验,检测本发明实施例1的三种ii型crispr/cas9基因编辑系统在真核细胞中的在靶和脱靶情况以检测切割效果。
[0302]
具体操作如下所示:
[0303]
(a)构建位点质粒,实施例6的结果已表明三种cas9的最适识别的spacer的长度,哺乳动物细胞中,以hek293t细胞为例,选取内源性基因,寻找到合适的靶位点(见表2),序列格式为5
’‑
与靶点互补的间隔序列-scaffold-3’,通过gibson方法克隆到pxz载体上,构建pxz-target质粒。
[0304]
表2靶位点及其序列
[0305][0306]
(b)同时电转实施例6制备的px330-蛋白真核表达质粒、pxz-target质粒和1.2μl dsodn,72h后收细胞抽提dna。
[0307]
(c)在对应的基因靶点上游以及dsodn序列上设计引物(见表1)进行dsodn-pcr扩增,跑琼脂糖胶检测是否出现目的条带,用来判断是否有dsodn的插入,首先通过检测dsodn
的插入情况验证本发明所述cas9基因编辑系统在该选择的靶位点上是否发生靶向切割。
[0308]
(d)挑选能检测到dsodn-pcr条带的dna进行guide-seq建库,上机进行二代测序,通过生物信息学分析检测三种cas9基因编辑系统的在靶切割以及脱靶情况。
[0309]
guide-seq检测结果如图7所示,三个蛋白在对应的多个靶位点上的在靶reads数较高,脱靶位点较少或检测不到脱靶,说明本发明所述hqcas9、dspcas9、dsucas9基因编辑系统均在真核生物中具备较强的切割效率和较好的切割特异性。
[0310]
综上,本发明首次鉴定出三种全新的ii型crispr/cas9基因编辑系统,三种新型编辑系统的cas9蛋白分别命名为hqcas9、dspcas9和dsucas9,通过以上实施例证明本发明的三种ii型crispr/cas9基因编辑系统可以识别特定的pam序列(ngngnc、nnnaa、nnnaa),能够在crrna的引导下在原核环境或真核细胞中行使基因编辑功能,极大的增加了可靶向的范围,克服了spcas9的局限性。
[0311]
本发明选择原核和真核dna来验证三种ii型crispr/cas9基因编辑系统的编辑能力。cas9蛋白识别靶向序列需要与crrna间隔序列互补的核苷酸序列、可以识别的pam序列。首先,通过原核耗竭实验证明本发明的cas9蛋白在原核生物中具有切割能力,获知了cas9蛋白在原核系统中识别的pam序列。再通过原核干扰实验和真核细胞实验验证了pam的正确性。本发明通过人为设计crrna中的间隔序列,得到的ii型crispr/cas9基因编辑系统可以靶向基因组中几乎所有感兴趣的dna序列,产生位点特异的平末端双链断裂(dsb)。通过非同源末端修复dsb,在切割位点产生小的随机插入/缺失(indels)使目的基因失活;或者通过高保真同源修复,可以使用同源修复模板在dsb位点进行精确的基因组修饰。通过guide-seq结果显示两个蛋白的编辑在靶数较高,说明编辑效率高,脱靶数少说明编辑精确率高。hqcas9识别的pam序列为ngngnc,相对比较复杂的pam可以更精确的识别靶位点,提高cas9蛋白识别的精确性。dspcas9与dsucas9所识别的pam相近,第4位和第5位均为a,两个蛋白都可识别pam为nnnaa的靶位点。通过对人类基因组上“aa”序列位点覆盖的长度频率进行分析,平均每隔5bp就有一个aa出现,这极大的增加了dspcas9与dsucas9在人类基因组上的靶向范围。
[0312]
本发明的三种ii型crispr/cas9基因编辑系统的发现进一步扩大了基因编辑工具的种类,为科学研究与疾病治疗提供了有力的研究工具,对推动将基因编辑应用于临床治疗具有重要的作用。
[0313]
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

技术特征:
1.一种cas9蛋白,其特征在于,所述cas9蛋白的氨基酸序列如seq id no.1~3中任一种序列所示。2.一种编码权利要求1所述cas9蛋白的核苷酸序列,其特征在于,所述核苷酸序列如seq id no.10~12中任一种序列所示。3.一种ii型crispr/cas9基因编辑系统,其特征在于,包括如权利要求1所述的cas9蛋白、辅助蛋白、crispr rna和tracrrna序列。4.根据权利要求3所述的ii型crispr/cas9基因编辑系统,其特征在于,所述tracrrna序列包括重复序列,所述重复序列如seq id no.7~9中任一种序列所示。5.根据权利要求3或4所述的ii型crispr/cas9基因编辑系统,其特征在于,所述的tracrrna序列如seq id no.14~16中任一种序列所示。6.根据权利要求3所述的ii型crispr/cas9基因编辑系统,其特征在于,所述辅助蛋白的核苷酸序列如seq id no.4~6中任一种序列所示。7.权利要求3~6任一项所述ii型crispr/cas9基因编辑系统在原核或真核生物基因编辑中的应用。8.权利要求3~6任一项所述ii型crispr/cas9基因编辑系统在制备生物基因编辑制剂中的应用。

技术总结
本发明属于基因工程技术领域,公开了一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用。本发明筛选了一种Cas9蛋白,其氨基酸序列如SEQ ID NO.1~3中任一种序列所示。本发明还提供了一种编码Cas9蛋白的核苷酸序列。本发明提供了一种II型CRISPR/Cas9基因编辑系统,包括上述的Cas9蛋白、辅助蛋白、CRISPR RNA和tracrRNA序列。采用本发明的II型CRISPR/Cas9基因编辑系统能够在crRNA的引导下,在原核细胞或真核细胞中行使基因编辑功能。本发明Cas9蛋白及基因编辑系统的发现扩大了基因编辑工具的种类,对推动基因编辑应用于临床治疗具有重要的作用。重要的作用。重要的作用。


技术研发人员:田瑞 赵停停
受保护的技术使用者:珠海舒桐医疗科技有限公司
技术研发日:2023.05.08
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐