用于募集ADAR的向导RNA的筛选平台的制作方法

未命名 09-21 阅读：73 评论：0

用于募集adar的向导rna的筛选平台
1.关于相关申请的声明
2.本技术要求于2020年10月21日提交的美国非临时专利申请第63/094614号的优先权，其全部内容通过援引并入本文。
技术领域
3.本发明涉及鉴定用于定点rna编辑的向导rna的方法。特别地，本发明涉及用于鉴定有效用于定点a至i rna编辑的向导rna(grna)的高通量筛选方法，以及所鉴定的向导rna的使用方法。此外，本发明涉及向导rna序列，该序列已通过该筛选方法鉴定为在修复人idua(α-l-艾杜糖苷酸酶)转录物中的提前w402x终止密码子方面具有优越性。

背景技术：

4.定点rna编辑是一种用于在rna水平上操纵遗传信息的新技术。其通过小向导rna来实现，所述小向导rna将内源性rna编辑酶adar(作用于rna的腺苷脱氨酶)或工程化adar融合蛋白募集至用户确定的靶rna，从而使得特定的腺苷残基转化为肌苷(a至i编辑)。由于在生物化学上将肌苷理解为鸟苷，所以定点a至i rna编辑具有操纵rna和蛋白质功能用于治疗和生物工程目的的潜能。
5.目前的adar向导rna设计的特征在于具有与靶序列互补的可变长度的反义结构域和用于adar结合的可选募集结构域。到目前为止，只对少量的adar向导设计进行了测试，在编辑不同靶标中取得了不同程度的成功，而尚未建立统一的设计原则。鉴于adar各种天然rna靶标的编辑效率最高达100％，似乎有很大的潜力进一步优化adar向导rna。然而，由于缺乏合适的高通量方法来快速筛选候选向导，妨碍了该项优化工作。因此，需要高通量筛选用于a至i rna编辑的候选向导rna的方法。

技术实现要素：

6.在一些方面，本文提供了融合构建体。在一些实施方式中，本文提供了包含靶序列和向导rna序列的融合构建体。在一些实施方式中，向导rna序列包含与靶序列基本互补或完全互补的反义结构域。在一些实施方式中，向导rna序列还包含募集结构域，该募集结构域募集内源性作用于rna的腺苷脱氨酶(adar)和/或工程化adar融合蛋白。在一些实施方式中，募集结构域包括彼此基本互补或完全互补的第一链和第二链。
7.在一些实施方式中，融合构建体进一步包含环序列，使得构建体形成茎环二级结构。环序列可以包含任何合适数量的核苷酸。在一些实施方式中，环序列包含3-50个核苷酸。在一些实施方式中，环序列包含5个核苷酸。在一些实施方式中，环序列包含表1中所述的核苷酸序列。在一些实施方式中，反义结构域和靶序列通过环序列连接。在一些实施方式中，募集结构域的第一链和第二链通过环序列连接。
8.在一些实施方式中，向导rna序列包含在反义结构域中的一个或多个突变，其破坏反义结构域和靶序列之间在至少一个核苷酸位置的碱基配对。在一些实施方式中，向导rna
序列包含在募集结构域的第一链和/或第二链中的一个或多个突变，其破坏第一链和第二链之间在至少一个核苷酸位置的碱基配对。在一些实施方式中，第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列。例如，在一些实施方式中，第一链包含与seq id no:3具有至少80％序列同一性的核苷酸序列。在一些实施方式中，第一链包含表2中所述的核苷酸序列。在一些实施方式中，第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列。例如，在一些实施方式中，第二链包含与seq id no:4具有至少80％序列同一性的核苷酸序列。在一些实施方式中，第二链包含表3中所述的核苷酸序列。
9.在一些实施方式中，靶序列来源于人idua基因。在一些实施方式中，靶序列包含与gagcagcucuaggccgaa(seq id no:1)具有至少80％序列同一性的核苷酸序列。在一些实施方式中，相对于seq id no:1位于第11位的核苷酸是腺嘌呤(a)。在一些实施方式中，反义结构域包含与seq id no:2具有至少50％序列同一性的核苷酸序列。在一些实施方式中，反义结构域包含表5或表6中所述的序列。
10.在一些方面，本文提供了载体。在一些实施方式中，本文提供了包含本文所述的融合构建体的载体。本文所述的融合构建体和载体可用于选择用于定点rna编辑的向导rna的高通量筛选方法。
11.在一些方面，本文提供了高通量筛选方法。在一些实施方式中，本文提供了一种选择用于定点rna编辑的向导rna的高通量筛选方法。在一些实施方式中，该方法包括生成多个融合构建体，每个融合构建体包含靶序列和向导rna序列。在一些实施方式中，向导rna序列包含与靶序列基本互补或完全互补的反义结构域。
12.在一些实施方式中，该方法还包括在不同的细胞群中表达多个融合构建体中的每一个。在一些实施方式中，该方法进一步包括确定融合构建体是否诱导从表达融合构建体的细胞群中分离的核酸的一种或多种修饰。在一些实施方式中，细胞表达内源性作用于rna的腺苷脱氨酶(adar)和/或至少一种工程化adar融合蛋白。
13.在本文所述方法的一些实施方式中，向导rna序列还包含募集结构域，该募集结构域募集内源性作用于rna的腺苷脱氨酶(adar)和/或工程化adar融合蛋白。在一些实施方式中，募集结构域包括彼此基本互补或完全互补的第一链和第二链。
14.在本文所述方法的一些实施方式中，融合构建体还包含环序列，使得构建体形成茎环二级结构。在一些实施方式中，环序列包含3-50个核苷酸。例如，在一些实施方式中，环序列包含5个核苷酸。在一些实施方式中，环序列包含表1中所述的核苷酸序列。在一些实施方式中，反义结构域和靶序列通过环序列连接。在一些实施方式中，募集结构域的第一链和第二链通过环序列连接。
15.在一些实施方式中，向导rna序列包含在反义结构域中的一个或多个突变，其破坏反义结构域和靶序列之间在至少一个核苷酸位置的碱基配对。在一些实施方式中，向导rna序列包含在募集结构域的第一链和/或第二链中的一个或多个突变，其破坏第一链和第二链之间在至少一个核苷酸位置的碱基配对。在一些实施方式中，第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列。例如，在一些实施方式中，第一链包含与seq id no:3具有至少80％序列同一性的核苷酸序列。在一些实施方式中，第一链包含表2中所述的核苷酸序列。在一些实施方式中，第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列。例如，在一些实施方式中，第二链包含与seq id no:4具有至少80％序列同一性
的核苷酸序列。在一些实施方式中，第二链包含表3中所述的核苷酸序列。
16.在一些实施方式中，靶序列来源于需要定点a至i rna编辑的基因。在一些实施方式中，所述基因包含点突变，其中所述点突变是g至a点突变、t至a点突变或c至a点突变。在一些实施方式中，点突变与表达该基因的受试者的疾病或病症的发展相关。在一些实施方式中，点突变存在于靶序列中。
17.在一些实施方式中，确定融合构建体是否诱导从表达融合构建体的细胞群分离的核酸中的一种或多种修饰包括对分离的核酸进行测序。在一些实施方式中，分离的核酸包括rna。在一些实施方式中，从细胞群分离的核酸中的一种或多种修饰包括对最初存在于靶序列中的点突变的纠正。在一些实施方式中，点突变的纠正表明向导rna序列有效地诱导定点rna编辑。
18.在一些实施方式中，靶序列包含与gagcagcucuaggccgaa(seq id no:1)具有至少80％序列同一性的核苷酸序列。在一些实施方式中，相对于seq id no:1位于第11位的核苷酸是腺嘌呤(a)。在一些实施方式中，反义结构域包含与seq id no:2具有至少50％序列同一性的核苷酸序列。在一些实施方式中，反义结构域包含表5或表6中所述的序列。
19.在本文所述方法的一些实施方式中，其中所述方法鉴定所述向导rna序列的一个或多个优化特征，所述优化特征使得所述向导rna序列在从表达所述融合构建体的细胞群中分离的核酸中诱导一种或多种修饰。例如，如果存在于向导rna中，则优化的特征可以选自反义结构域、环序列和募集结构域。
20.在一些方面，本文提供了用于定点rna编辑的方法。在一些实施方式中，本文提供了一种用于定点rna编辑的方法，该方法包括通过本文所述的方法选择向导rna，并将包含该向导rna的构建体递送至细胞或受试者。例如，定点rna编辑的方法可以包括通过本文所述的高通量筛选方法选择向导rna，并将包含所选择的向导rna的构建体递送至细胞或受试者。在一些实施方式中，所述细胞是哺乳动物细胞。在一些实施方式中，受试者是哺乳动物。
21.在一些方面，本文提供了向导rna。在一些实施方式中，本文提供了用于定点rna编辑的向导rna。在一些实施方式中，本文提供了用于定点rna编辑的向导rna，其中所述向导rna包含与靶基因序列基本互补或完全互补的反义结构域。在一些实施方式中，向导rna包含募集内源性作用于rna的腺苷脱氨酶(adar)和/或工程化adar融合蛋白的募集结构域。在一些实施方式中，所述募集结构域包含彼此基本互补或完全互补的第一链和第二链。在一些实施方式中，第一链和第二链通过环序列连接。在一些实施方式中，环序列包含3-50个核苷酸。例如，在一些实施方式中，环序列包含5个核苷酸。在一些实施方式中，环序列包含表1中所述的核苷酸序列。
22.在一些实施方式中，第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列。例如，在一些实施方式中，第一链包含与seq id no:3具有至少80％序列同一性的核苷酸序列。在一些实施方式中，第一链包含表2中所述的核苷酸序列。在一些实施方式中，第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列。例如，在一些实施方式中，第二链包含与seq id no:4具有至少80％序列同一性的核苷酸序列。在一些实施方式中，第二链包含表3中所述的核苷酸序列。
23.在一些实施方式中，靶基因序列存在于含有w402x置换突变的人idua基因的一部分中。在一些实施方式中，靶基因序列包含seq id no:5。在一些实施方式中，反义结构域包
含与seq id no:2具有至少50％序列同一性的核苷酸序列。在一些实施方式中，反义结构域包含表5或表6中所述的序列。在一些实施方式中，向导rna可以用于治疗赫尔勒(hurler)综合征的方法中。
24.根据以下详细描述和附图，本公开的其他方面和实施方式将显而易见。
附图说明
25.图1是示出rna中腺苷至肌苷(a至i)编辑的示意图。由于肌苷被细胞机制识别为鸟苷，a至i编辑正式引入了可以影响rna和蛋白质功能的a至g点突变。
26.图2示出内源性adar募集向导rna(grna)的设计。adar由脱氨酶结构域(adar-d)和多个dsrna结合结构域(dsrbd)构成，编辑位于gria2 mrna前体发夹结构中的r/g位点(左图)。将发夹结构的一部分(55nt)与反义序列(18-40nt)融合，该反义序列与用户确定的序列互补，使得产生grna，该grna将adar酶引导至靶腺苷。发夹作为adar募集部分起作用，使其能够与dsrbd相互作用，而grna反义结构域和靶rna的杂交体被脱氨酶结构域识别，从而催化靶位点的编辑。为了募集adar，r/g grna要么从质粒中表达，要么作为经化学修饰的反义寡核苷酸(aso)应用。
27.图3是示出用于优化grna序列的方法的概览示意图。为了实现高编辑产量，在哺乳动物细胞中使用筛选平台来寻找最大限度地进行rna编辑的grna序列。
28.图4a-4e.治疗性a至i rna编辑的潜在应用。(a)20个经典氨基酸中的12个和全部三种终止密码子都可以通过a至i编辑来改变。(b，c)编码磷酸化位点(b)或其他就功能而言重要的位点(c)的密码子的定点a至i rna编辑可能用于调节蛋白质的功能，这些蛋白质的未活化或过度活化改善疾病转归。(d)翻译的抑制可以通过编辑起始密码子来实现，这可能是下调致病蛋白的一种选择。(e)a至i rna编辑可以纠正致病性g至a点突变。
29.图5.导致赫尔勒综合征的致病性g至a点突变。可以就其编辑人idua w402x(红色加有下划线的a)的能力筛选grna序列。idua mrna序列下方的字母表示编码的氨基酸的单字母编码和提前终止密码子(x)。
30.图6.筛查平台概述。可以通过质粒脂质转染在adar-flp-in t-rex细胞中表达靶rna/grna融合构建体。在rna分离后，可以生成用于下一代测序(ngs)的靶rna/grna cdna。使用不同的索引将允许多个实验的并行分析。可以建立计算流水线，用于确定每个单个grna序列在靶腺苷和周围离位腺苷产生的诱导编辑。
31.图7.用于优化grna反义结构域的文库概览。为了通过平台鉴定靶位点的诱导编辑和相应的grna两者，将靶序列(黑色)与grna融合(反义结构域：蓝色；adar募集部分：红色)。在此，含有致病点突变的idua w402x(红色带有下划线的a)mrna序列显示为靶标。
32.图8.对用于优化adar募集部分的文库的概述。
33.图9a-9g.aso文库原型。(a)基于此前验证的向导设计“v9.4”32
的靶标-向导融合构建体，其中在环区第40位存在单个t至c碱基置换。靶序列是人idua基因(hidua)中致病性w402x突变周围的区域。靶标a残基显示为黄色。(b，c)编辑水平，在没有(b)或有(c)adar1 p150的诱导表达的情况下，在质粒转染到flp-in t-rex 293细胞后24小时通过sanger测序进行确定。在不存在p150诱导的情况下，编辑是由内源性adar蛋白介导的。在不存在dox诱导的情况下，在具有和不具有稳定整合的adar1 p150的flp-in t-rex细胞中获得了相同的
结果(50％编辑)。(d)经修饰的融合原型仅由通过短环连接的靶序列和反义序列组成(即，没有募集结构域)。靶序列是hidua中致病性w402x突变周围的区域，在3
′
端延伸，为adar的双链rna结合结构域(dsrbd)提供结合位点。在反义链中引入两个错配(第54和58位)以模拟gria2 r/g位点的结构。(e)在没有dox诱导的情况下转染到adar1 p150 flp-in t-rex 293细胞后24小时小图(d)中的构建体的编辑；在dox诱导的情况下，编辑是饱和的。(f)分隔设计，其中靶区和反义区通过egfp编码序列分开。(g)用10ng/ml dox诱导，转染到adar1 p150 flp-in t-rex 293细胞后24小时小图(f)中的构建体的编辑；在不存在dox的情况下未观察到编辑。
34.图10a-10b.克隆构建体。(a)用于idua w402x筛选的基于pcdna5的克隆载体的质粒图和示意图。星号表示终止密码子；在idua w402x的情况下，在未编辑的靶序列中存在额外的终止密码子并通过编辑去除。re，限制性内切酶切割位点。(b)替选的克隆载体，用于图9f所示的分隔设计。对于给定的靶标，靶序列只需要克隆一次，并且可以使用限制性位点re1&2容易地插入新的向导文库。
35.图11a-11b.自定义序列插入pcdna5载体。(a)连接的靶标/向导构建体的序列(图10a)，在此示出idua w402x。(b)分隔构建体的序列，其中靶序列(顶部)和向导序列(底部)由egfp编码序列分开(图10b)。已经引入了额外的限制性内切酶位点以使得插入全向导序列(使用hpai或paci和avrii或bstbi)或仅交换反义结构域(使用bsu36i和hpai或paci)。为了包括bsu36i位点，募集结构域中三个碱基对的序列同一性发生了改变，同时保持了原始结构。相对于维持原始募集结构域序列的分隔构建体，这种序列变化未降低编辑水平(图9f)，在存在具有和不具有bsu36i限制性位点的募集结构域的情况下，检测到的编辑水平分别为33％和28％。
36.图12.具有随机反义区的靶标/向导融合构建体的pcr装配。
37.图13.用于idua w402x aso文库的pcr装配的引物的序列细节。为了确保高效扩增高度结构化的装配模板，外部引物应当远离靶标/向导双链体。
38.图14.逆转录和测序文库制备。umi，唯一的分子标识符，由15个随机核苷酸组成。umi允许在随后的定量中唯一地区分每个逆转录物，消除pcr偏倚和测序错误的影响
71,72
。以青色显示的序列元素对应于标准illumina接头序列。在此，使用长侧接区来确保illumina桥扩增不受稳定发夹结构的影响。图15.示于图14中的文库构建体和引物的序列细节。
39.图16的顶部小图示出靶向idua w402x的示例性发夹构建体(例如，包括募集结构域、靶序列和向导反义寡核苷酸)，其可以通过本文所述的方法生成，特别是如实施例3中所述。通过将反义序列随机化生成反义结构域突变体文库。直方图示出具有不同数量突变的反义变体的预测分布，在每个反义位置给予18％的简并(degeneracy)。
40.图17示出示例性工作流程，如本文所述，并且特别是如在实施例3中所述。
41.图18是条形图，示出与原型构建体相比，约1％的反义寡核苷酸变体在靶位点增加编辑。
42.图19示出在先导筛选中鉴定的反义寡核苷酸变体，其含有增强编辑的突变。
43.图20示出通过sanger测序(右下)在筛选(左下)中鉴定的高度编辑的变体的验证；还示出原型序列(左上)和相应的编辑水平(右上)。
44.图21示出募集结构域(基于gria2 r/g rna)突变的实施例，该募集结构域突变通
过恢复在原始募集结构域中被破坏的碱基对之一来增强编辑。原型在上部示出，增强编辑的三个单突变体示于下部。
45.图22示出在募集结构域终端环的每个位置处的碱基富集。基于相对于整个环文库(n＝1015)的前10％编辑变体(n＝102)计算富集度。
46.图23示出表2-6中用于指示序列变化的核苷酸位置的编号。
47.图24示出将募集结构域中的优化环序列与反义区中的有益错配组合的加合效应。将图中所示的构建体单独克隆并转染到仅表达内源性adar蛋白的flpin t-rex细胞中。通过sanger测序确定编辑水平。
48.图25示出人idua基因的序列。应当注意，该序列不包含见于赫尔勒综合征患者中的w402x突变。
具体实施方式
49.本公开涉及鉴定用于定点rna编辑的向导rna的方法。特别地，本发明涉及一种高通量筛选方法，该方法用于鉴定有效用于定点a至i rna编辑的向导rna。
50.1.定义
51.为了便于理解本技术，下文中对许多术语和短语进行了定义。在具体实施方式通篇中给出了其它定义。
52.本文中使用的术语“包括”、“包含”、“具有”、“有”、“可以”、“含有”及其变体意指开放式过渡短语、术语或词语，其不排除其它行为或结构的可能性。单数形式“一个/种”、“和”和“该/所述”包括复数形式，上下文另有明确说明除外。本公开还涵盖其它实施方式，“包括”本文所述的实施方式或要素、“由”本文所述的实施方式或要素组成和“基本上由”本文所述的实施方式或要素组成，无论是否明确阐述均如此。
53.在本文中对于数字范围的叙述明确地涵盖具有相同精确度的介于其间的每个数字。例如，对于6-9的范围，除了6和9之外还涵盖数字7和8，对于6.0-7.0的范围，明确涵盖数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。
54.除非本文另有定义，否则与本公开相关地使用的科学术语和技术术语应具有本领域普通技术人员通常理解的含义。例如，本文所述的细胞和组织培养、生物化学、分子生物学、免疫学、微生物学、遗传学、蛋白质和核酸化学以及杂交的技术以及与之相关地使用的任何术语是本领域中公知和常用的那些。术语的含义和范围应当清楚；在存在任何潜在歧义的情况下，本文提供的定义优先于任何词典或外在部定义。此外，除非上下文另有要求，否则单数术语应包括复数，复数术语应包括单数。
55.术语“氨基酸”是指天然氨基酸、非天然氨基酸和氨基酸类似物，除非另有说明，否则它们都是d和l立体异构体，如果它们的结构允许这种立体异构形式的话。
56.天然氨基酸包括丙氨酸(ala或a)、精氨酸(arg或r)、天冬酰胺(asn或n)、天冬氨酸(asp或d)、半胱氨酸(cys或c)、谷氨酰胺(gln或q)、谷氨酸(glu或e)、甘氨酸(gly或g)、组氨酸(his或h)、异亮氨酸(ile或i)、亮氨酸(leu或l)、赖氨酸(lys或k)、甲硫氨酸(met或m)、苯丙氨酸(phe或f)、脯氨酸(pro或p)、丝氨酸(ser或s)、苏氨酸(thr或t)，色氨酸(trp或w)、酪氨酸(tyr或y)和缬氨酸(val或v)。
57.非天然氨基酸包括但不限于氮杂环丁烷羧酸、2-氨基己二酸、3-氨基己二酸、β-丙
氨酸、萘胺(“naph”)、氨基丙酸、2-氨基丁酸、4-氨基丁酸、6-氨基己酸、2-氨基庚酸、2-氨异丁酸、3-氨基异丁酸、2-氨基戊酸、叔丁基甘氨酸(“tbug”)、2,4-二氨基异丁酸、锁链素、2,2'-二氨基庚二酸、2,3-二氨基丙酸、n-乙基甘氨酸、n-乙基天冬酰胺、高脯氨酸(“hpro”或“homop”)、羟基赖氨酸、异羟赖氨酸酯、3-羟脯氨酸(“3hyp”)，4-羟脯氨酸(“4hyp”)、异锁链素、异-异亮氨酸、n-甲基丙氨酸(“meala”或“nime”)、n-烷基甘氨酸(“nag”)，包括n-甲基甘氨酸、n-甲基异亮氨酸、包括n-甲基戊基甘氨酸在内的n-烷基戊基甘氨酸(“napg”)、n-甲基缬氨酸、萘基丙氨酸、去甲缬氨酸(“norval”)、去甲亮氨酸(“norleu”)、辛基甘氨酸(“octg”)、鸟氨酸(“orn”)、戊基甘氨酸(“pg”或“pgly”)、哌啶酸、硫代脯氨酸(“thiop”或“tpro”)、高赖氨酸(“hlys”)和高精氨酸(“harg”)。
58.如本文所用，术语“人工”是指由人类设计或制备的非天然组合物和系统。例如，人工肽或核酸是包含非天然序列的肽或核酸(例如，与天然存在的蛋白质或其片段不具有100％同一性的核酸或肽)。
59.如本文所用，“保守”氨基酸置换是指肽或多肽中的一个氨基酸被具有相似化学性质(诸如大小或电荷)的另一个氨基酸置换。为了本公开的目的，以下八个基团中的每一个都包含彼此保守置换的氨基酸：
60.1)丙氨酸(a)和甘氨酸(g)；
61.2)天冬氨酸(d)和谷氨酸(e)；
62.3)天冬氨酸(n)和谷氨酰胺(q)；
63.4)精氨酸(r)和赖氨酸(k)；
64.5)异亮氨酸(i)、亮氨酸(l)、甲硫氨酸(m)和缬氨酸(v)；
65.6)苯丙氨酸(f)、酪氨酸(y)和色氨酸(w)；
66.7)丝氨酸(s)和苏氨酸(t)；以及
67.8)半胱氨酸(c)和甲硫氨酸(m)。
68.天然存在的残基可以根据常见的侧链性质分类，例如：极性阳性(或碱性)(组氨酸(h)、赖氨酸(k)和精氨酸(r))；极性阴性(或酸性)(天冬氨酸(d)、谷氨酸(e))；极性中性(丝氨酸(s)、苏氨酸(t)、天冬酰胺(n)、谷氨酰胺(q))；非极性脂族(丙氨酸(a)、缬氨酸(v)、亮氨酸(l)、异亮氨酸(i)、甲硫氨酸(m))；非极性芳香族(苯丙氨酸(f)、酪氨酸(y)、色氨酸(w))；脯氨酸和甘氨酸；以及半胱氨酸。如本文所用，“半保守”氨基酸置换是指肽或多肽中的氨基酸被同类中的另一氨基酸置换。
69.在一些实施方式中，除非另有说明，否则保守或半保守氨基酸置换也可以涵盖具有与天然残基相似的化学性质的非天然存在的氨基酸残基。这些非天然残基通常通过化学肽合成而非通过生物系统中的合成来掺入。这些包括但不限于拟肽及其他反转或反向形式的氨基酸部分。在一些实施方式中，本文的实施方式可以限于天然氨基酸、非天然氨基酸和/或氨基酸类似物。
70.非保守置换可能涉及将一个类的成员交换为另一类的成员。
71.术语“氨基酸类似物”是指其中c端羧基、n端氨基和侧链官能团中的一个或多个已被可逆或不可逆地化学阻断或以其他方式修饰为另一官能团的天然氨基酸或非天然氨基酸。例如，天冬氨酸-(β-甲酯)是天冬氨酸的氨基酸类似物；n-乙基甘氨酸是甘氨酸的氨基酸类似物；或者丙氨酸羧酰胺是丙氨酸的氨基酸类似物。其他氨基酸类似物包括甲硫氨酸
亚砜、甲硫氨酸砜、s-(羧甲基)半胱氨酸、s-(羧甲基)半胱氨酸亚砜和s-(羧甲基)半胱氨酸砜。
72.术语“互补”和“互补性”是指核酸通过传统的watson-crick碱基配对或其他非传统类型的配对与另一核酸序列形成氢键的能力。两个核酸序列之间的互补程度可以通过核酸序列中可以与第二个核酸序列形成氢键(例如，watson-crick碱基配对)的核苷酸的百分比(例如，50％、60％、70％、80％、90％和100％互补)来表示。如果核酸序列的所有连续核苷酸与第二个核酸序列中相同数量的连续核苷酸形成氢键，那么两个核酸序列“完全互补”。如果两个核酸序列之间的互补度在至少8个核苷酸(例如9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸)的区域上为至少60％(例如65％、70％、75％、80％、85％、90％、95％、97％、98％、99％或100％)，或者如果两个核酸序列在至少中等、优选高度严格的条件下杂交，则两个核酸序列“基本互补”。示例性中等严格条件包括在37℃下于包含20％甲酰胺、5
×
ssc(150mm nacl，15mm柠檬酸三钠)、50mm磷酸钠(ph 7.6)、5
×
denhardt溶液、10％葡聚糖硫酸盐和20mg/ml变性剪切鲑鱼精子dna的溶液中温育过夜，然后在约37-50℃下或基本上类似的条件例如sambrook等人描述的适度严格的条件于1
×
ssc中洗涤过滤物，如下文所述。高度严格的条件是如下所述的条件：利用例如(1)低离子强度和高温洗涤，诸如在50℃下0.015m氯化钠/0.015m柠檬酸钠/0.1％十二烷基硫酸钠(sds)；(2)在杂交过程中于42℃下使用变性剂，诸如甲酰胺，例如50％(v/v)甲酰胺，含0.1％牛血清白蛋白(bsa)/0.1％ficoll/0.1％聚乙烯吡咯烷酮(pvp)/50mm磷酸钠缓冲液，ph 6.5，含750mm氯化钠和75mm柠檬酸钠，或(3)在42℃下使用50％甲酰胺、5
×
ssc(0.75m nacl，0.075m柠檬酸钠)、50mm磷酸钠(ph 6.8)、0.1％焦磷酸钠、5
×
denhardt溶液、经超声处理的三文鱼精子dna(50μg/ml)、0.1％sds和10％硫酸葡聚糖，在(i)42℃下于0.2
×
ssc中洗涤，(ii)在55℃下于50％甲酰胺中洗涤，以及(iii)在55℃下于0.1
×
ssc(优选与edta组合)中洗涤。在例如sambrook et al.,molecular cloning:a laboratory manual,3rd ed.,cold spring harbor press,cold spring harbor,n.y.(2001)；and ausubel et al.,current protocols in molecular biology,greene publishing associates and john wiley&sons,new york(1994)中提供了杂交反应的其它细节和严格度的解释说明。
73.术语“作用于rna的腺苷脱氨酶”或“adar”在本文中用于指一类天然地催化高等生物转录组双链rna(dsrna)区内位点的a至i编辑的酶。adar可以在调节蛋白质功能、rna剪接、免疫和rna干扰等方面发挥重要作用。
74.本文使用的术语“adar融合体”是指包含adar脱氨酶结构域和能够结合向导rna的结构域的工程酶。
75.术语“供体核酸分子”是指插入靶dna(例如，基因组dna)中的核苷酸序列。如上所述，供体dna可以包括例如基因或基因的一部分、编码标签的序列或定位序列、或调节元件。供体核酸分子可以为任何长度。在一些实施方式中，供体核酸分子的长度在10至10000个核苷酸之间。例如，长度在约100至5000个核苷酸之间；长度在约200至2000个核苷酸之间；长度在约500至1000个核苷酸之间；长度在约500至5000个核酸之间；长度在约1000至5000个核酸之间；或者长度在约1000至10000个核酸之间。
76.当外源dna例如重组表达载体被引入细胞内时，细胞已被这样的dna“基因修饰”、“转化”或“转染”。外源dna的存在会导致永久或短暂的遗传变化。转化dna可以整合(共价连
接)到细胞的基因组中，也可以不整合。例如，在原核生物、酵母和哺乳动物细胞中，转化dna可以保持在附加体元件诸如质粒上。就真核细胞而言，稳定地转化的细胞是转化dna已整合到染色体中从而通过染色体复制由子细胞遗传的细胞。这种稳定性通过真核细胞建立包括含有转化dna的子细胞群的细胞系或克隆的能力来证明。“克隆”是指通过有丝分裂由单个细胞或共同祖先衍生的细胞群。“细胞系”是指能够在体外稳定生长数代的原代细胞的克隆。
77.如本文所用，“核酸”或“核酸序列”是指嘧啶和/或嘌呤碱基的聚合物或低聚物，分别优选胞嘧啶(c)、胸腺嘧啶(t)和尿嘧啶(u)，以及腺嘌呤(a)和鸟嘌呤(g)。本技术涵盖任何脱氧核糖核苷酸、核糖核苷酸或肽核酸组分及其任何化学变体，诸如这些碱基的甲基化、羟甲基化或糖基化形式等。聚合物或低聚物在组成上可以是不均匀的或均匀的，并且可以从天然来源分离，或者可以人工产生或合成产生。此外，核酸可以是dna或rna，或其混合物，并且可以以单链或双链形式永久或过渡存在，所述双链形式包括同双链、异双链和杂合状态。在一些实施方式中，核酸或核酸序列包含其他种类的核酸结构，诸如dna/rna螺旋、肽核酸(pna)、吗啉基核酸(参见例如braasch and corey,biochemistry,41(14):4503-4510(2002))和美国专利no.5,034,506,其通过援引并入本文)、锁核酸(lna；参见wahlestedt et al.,proc.natl.acad.sci.u.s.a.,97:5633-5638(2000),其通过援引并入本文)、环己烯基核酸(参见wang,j.am.chem.soc.,122:8595-8602(2000))和/或核酶。因此，术语“核酸”或“核酸序列”也可以涵盖包含非天然核苷酸、经修饰核苷酸和/或非核苷酸构建块的链，其可以表现出与天然核苷酸相同的功能(即“核苷酸类似物”)；此外，本文所用的术语“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分，以及基因组或合成来源的dna或rna，其可以是单链或双链，并代表有义链或反义链。术语“核酸”、“多核苷酸”、“核苷酸序列”和“寡核苷酸”可互换使用。它们指任何长度的核苷酸的聚合形式，脱氧核糖核苷酸或核糖核苷酸，或其类似物。
78.本文中使用的术语“连接子”是指连接两个分子或部分例如融合蛋白的两个结构域的键(例如共价键)、化学基团或分子。通常，连接子位于两个基团、分子或其他部分之间或两侧，并通过共价键相互连接，从而连接两者。在一些实施方式中，连接子是氨基酸或多种氨基酸(例如，肽或蛋白质)。在一些实施方式中，连接子是有机分子、基团、聚合物或化学部分。在一些实施方式中，连接子的长度为5-100个氨基酸，例如，长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20-30、40-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。本文还涵盖更长或更短的连接子。
79.本文中使用的术语“突变”是指序列(例如，核酸或氨基酸序列)中的一个残基被另一个残基所置换，或者序列中一个或多个残基的缺失或插入。在本文中通常通过鉴定原始残基、随后鉴定残基在序列中的位置以及鉴定新置换的残基来描述突变。用于形成本文提供的氨基酸置换(突变)的各种方法在本领域中是公知的，并且由例如green和sambrook，molecular cloning:a laboratory manual(第4版，cold spring harbor laboratorypress，cold springharbor，n.y.(2012))提供。
[0080]“肽”或“多肽”是由肽键连接的两个或多个氨基酸的连接序列。肽或多肽可以是天然的、合成的，或天然和合成的修饰或组合。多肽包括蛋白质，诸如结合蛋白、受体和抗体。蛋白质可以通过添加糖、脂质或氨基酸链中不包括的其他部分来修饰。术语“多肽”和“蛋白
质”在本文中可互换使用。
[0081]
如本文所用，术语“百分比序列同一性”是指在将两个序列对齐并引入缺口(如有必要)以实现最大百分比同一性之后，核酸序列中核苷酸或核苷酸类似物或氨基酸序列中氨基酸与参考序列中相应的核苷酸或氨基酸相同的百分比。因此，在根据本技术的核酸比参考序列长的情况下，对于确定序列同一性，不考虑核酸中与参考序列不对齐的额外核苷酸。用于对齐的方法和计算机程序在本领域中是公知的，包括blast、align 2和fasta。
[0082]
本文中使用的术语“向导rna”是指被设计为与“靶序列”互补的核酸。术语“靶rna序列”、“靶核酸”、“靶序列”和“靶位点”在本文中可互换使用，用于指向导rna序列被设计为与其具有互补性的多核苷酸(核酸、基因、染色体、基因组等)。通常，grna和靶rna在靶位点形成具有中心a:c错配的dsrna双链结构，以通过adar脱氨酶结构域诱导高效和精确的编辑。
[0083]
在一些实施方式中，本文所述的向导rna(在本文中也称为aso)包含两种组分：反义结构域和募集结构域。术语“反义结构域”和“反义序列”在本文中可互换使用。grna的反义结构域(即反义序列)与靶rna结合。募集结构域(在本文中也称为adar募集部分)能够与adar或adar融合蛋白相互作用。在一些实施方式中，本文所述的向导rna仅包含反义结构域(即，缺乏募集结构域)。在一些实施方式中，本文所述的向导rna可以被优化用于rna编辑。例如，向导rna可包含一个或多个突变以优化rna编辑。本文描述了突变的合适位置和突变的类型。
[0084]
靶序列和向导序列不需要表现出完全互补，前提是互补度足以引起杂交。合适的grna:rna结合条件包括通常存在于细胞中的生理条件。本领域中已知其他合适的结合条件(例如，无细胞系统中的条件)；参见例如sambrook，其通过援引并入本文。
[0085]
靶rna序列可以是基因产物。本文使用的术语“基因产物”是指由基因表达产生的任何生物化学产物。基因产物可以是rna或蛋白质。rna基因产物包括非编码rna，诸如trna、rrna、微小rna(mirna)和小干扰rna(sirna)，以及编码rna，诸如信使rna(mrna)。
[0086]“载体”或“表达载体”是复制子，诸如质粒、噬菌体、病毒或粘粒，另一个dna片段诸如“插入片段”可以连接或整合至该复制子以使连接的片段在细胞中复制。例如，“插入体”可以是本文所述的构建体。例如，“插入体”可以是如本文所述的包含靶序列和向导rna序列的构建体。
[0087]
术语“野生型”是指从天然来源中分离出来的具有该基因或基因产物特征的基因或基因产物。野生型基因是指在群体中最常见并因而被任意指定为该基因的“正常”或“野生型”形式的基因。相比之下，术语“经修饰的”、“突变的”或“多态的”是指与野生型基因或基因产物相比，在序列和/或功能特性(例如，改变的特征)方面显示出修饰的基因或基因产物。应当注意，可以分离出天然存在的突变体；与野生型基因或基因产物相比，通过它们具有改变的特征这一事实将这些突变体鉴定出来。
[0088]
2.融合构建体
[0089]
在一些实施方式中，本文提供了融合构建体。在一些实施方式中，本文提供了包含向导rna序列和靶序列的融合构建体。本文提供的融合构建体可用于各种方法，包括用于选择用于定点rna编辑的向导rna的高通量筛选方法。
[0090]
在一些实施方式中，融合构建体具有茎环二级结构。术语“发夹”、“发夹环”、“茎
环”和/或“环”在本文中可互换使用，指的是当单链中的序列在相反方向上读取时碱基对互补从而形成构象类似发夹或环的区时，在单链寡核苷酸中形成的结构。
[0091]
在一些实施方式中，融合构建体包括靶序列。靶序列是基于目标基因(即需要定点a至i rna编辑的基因)来选择的。在一些实施方式中，靶序列包括突变序列。例如，靶序列可以包括具有一个或多个突变的核苷酸序列，其中所述一个或更多个突变导致疾病表型。在一些实施方式中，目标基因是idua。人idua基因的序列如图25所示。在一些实施方式中，目标基因是idua，并且靶序列包含idua序列的一部分或源自idua序列的一部分，该部分包含g至a突变，其致使提前idua w402x终止密码子，从而导致赫尔勒综合征。然而，这不旨在作为限制性实施例，并且本文所述的构建体可以包括用于高通量方法中的任何合适的靶序列，所述高通量方法用于选择对任何期望的基因具有优化的rna编辑能力的向导rna序列。
[0092]
在一些实施方式中，靶序列包含与gagcagcucuaggccgaa(seq id no:1)具有至少80％序列同一性(例如，至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％同一性)的核苷酸序列，前提是相对于seq id no:1在第11位的核苷酸是腺嘌呤(a)。
[0093]
在一些实施方式中，所述向导rna序列包含反义结构域。grna的反义结构域与靶rna结合。因此，反义结构域序列的选择取决于目标靶rna的序列(即，待编辑的期望rna)。反义结构域可以包含任何合适数量的核苷酸。在一些实施方式中，反义结构域包含10-50个核苷酸。例如，在一些实施方式中，反义结构域包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方式中，反义结构域包含超过50个核苷酸。在一些实施方式中，反义结构域包含10-30个核苷酸。在一些实施方式中，反义结构域包含15-25个核苷酸。在一些实施方式中，反义结构域的长度取决于向导rna是否另外包含募集结构域。例如，与含有募集结构域和反义结构域两者的向导rna序列相比，缺乏募集结构域的向导rna序列可以包含长度更长的反义结构域。在图9中举例说明了这一概念。例如，如图9a所示，在包含募集结构域的向导rna中，反义结构域的长度为18个核苷酸，而在图9d中，在缺乏募集结构域的向导rna中，反义结构域的长度为37个核苷酸。
[0094]
在一些实施方式中，本文所述的向导rna缺乏募集结构域。例如，在一些实施方式中，向导rna包含靶序列和反义结构域，并且不包含募集结构域。在一些实施方式中，靶序列和反义结构域通过环结构连接，使得构建体形成茎环二级结构。环结构可以包含任何合适数量的核苷酸。在一些实施方式中，环结构包含3-50个核苷酸。在一些实施方式中，环结构包含3-50个核苷酸、3-45个核苷酸、3-4个核苷酸、3-35个核苷酸，3-30个核苷酸，3-25个核苷酸和3-20个核苷酸，3-15个核苷酸或3-10个核苷酸或3-7个核苷酸。在一些实施方式中，环结构是五环(即，包括5个核苷酸)。在一些实施方式中，环结构包含表1中所述的序列。在一些实施方式中，所述环结构包含seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq.no:11、seq id no:12、seq-no:13、seq id no:14、seq id no.:15、seq id no:16、seq id n0:17或seq id no:18。
[0095]
在一些实施方式中，向导rna包含反义结构域和募集结构域。向导rna序列可以被优化用于rna编辑，例如通过在本文所述的反义结构域和/或募集结构域中进行一个或多个突变。
[0096]
在一些实施方式中，反义结构域旨在靶向人idua基因的一部分。然而，本文所述的高通量测序方法可以应用于任何合适的靶标，以鉴定用于任何期望基因的定点编辑的经优化grna。在一些实施方式中，反义结构域与靶序列基本互补。因此，反义结构域内的核苷酸与靶序列上的相应核苷酸碱基配对，从而形成构建体的二级结构(即构建体的茎环结构)。碱基配对不需要是100％。例如，在一些实施方式中，反义结构域中的一个或多个核苷酸与靶序列中相应位置的核苷酸并非碱基配对。在一些实施方式中，反义结构域包括破坏完全互补(即破坏碱基配对)的一个或多个突变。例如，反义结构域可以包括破坏与靶序列的碱基配对的一个或多个突变，这可能导致茎环结构的茎内的错配。在一些实施方式中，反义结构域包含与uucggcccagagcugcuc(seq id no:2)具有至少50％序列同一性的核苷酸序列。例如，反义结构域可以包含与seq id no:2具有至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核苷酸序列。在一些实施方式中，相对于seq id no:2的第8位(即，与靶链中的靶腺苷残基相对的位置)处的核苷酸是胞苷。第8位的3
′
侧的核苷酸(即，在第8位的胞苷的3
′
侧)在本文中表示为
“‑”
，后面是距第8位的核苷酸的数目，而在第8位的5
′
侧的核苷酸在本文中表示为“+”，后面是距第8位的核苷酸的数目。在一些实施方式中，反义结构域包含如表4所示的核苷酸序列。在一些实施方式中，反义结构域包含seq id no:195的核苷酸序列。
[0097]
在一些实施方式中，反义结构域具有超过18个核苷酸。例如，除了存在于序列中的与seq id no:2具有至少50％同一性的核苷酸之外，反义结构域还可以包含其它核苷酸。这种其它寡核苷酸可以存在于反义结构域的3
′
端或5
′
端。示例性的这种反义结构域在图23d和图23e中突出显示，它们中的每一个都示出了添加到反义链的3
′
端或5
′
端的其它核苷酸(例如，除了在原始构建体中使用的18nt反义结构域之外的5个核苷酸)。在一些实施方式中，反义结构域包含如表5或表6所示的序列。
[0098]
在一些实施方式中，反义结构域包含表5中所示的序列。在一些实施方式中，反义结构域包含seq id no:202的核苷酸序列。在一些实施方式中，反义结构域包含表6中所示的核苷酸序列。在一些实施方式中，反义结构域包含seq id no:303的核苷酸序列。在一些实施方式中，反义结构域包含seq id no:304的核苷酸序列。
[0099]
在一些实施方式中，向导rna序列包含募集结构域。募集结构域(在本文中也称为adar募集部分)有助于与adar或adar融合蛋白的相互作用。募集结构域被配置为结合(即募集)一种或多种adar蛋白或其融合体。例如，募集结构域可以被配置为募集adar1、adar2蛋白或其融合体。在一些实施方式中，募集结构域至少募集adar2蛋白。募集结构域可以包括任何合适数量的核苷酸。例如，募集结构域可以包含15-100个核苷酸。在一些实施方式中，募集结构域包含约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95或约100个核苷酸。在一些实施方式中，募集结构域是具有茎环二级结构的构建体的一部分。在一些实施方式中，募集结构域形成茎环结构的一部分。在一些实施方式中，茎环结构的环部分由5个核苷酸组成(即五环)。
[0100]
在一些实施方式中，募集结构域基于内源性(即天然存在的)adar靶标的序列。与内源性adar靶标相比，募集结构域可具有一个或多个修饰，这可能增强adar募集或相互作用。例如，募集结构域可以基于gria2r/g位点(adar2的内源性靶标)的序列。
[0101]
在一些实施方式中，募集结构域包括通过环结构(在本文中也称为环序列)连接的第一链(即5
′
链)和第二链(即3
′
链)。第一链和第二链表现出互补的碱基配对，从而有助于形成构建体的茎环结构。在一些实施方式中，这种碱基配对被募集结构域的第一链和/或第二链内的一个或多个突变破坏。在一些实施方式中，未经修饰的募集结构域是指表现出没有破坏的碱基配对(即，完全互补)的募集结构，而突变的募集结构域是指在第一链或第二链中包含破坏碱基配对的一个或多个突变的结构域。换言之，未经修饰的募集结构域包含与第二链完全互补的第一链，而突变的募集结构域所包含的第一链第二链基本上(即，至少60％)互补而非完全互补。
[0102]
在一些实施方式中，募集结构域包含通过环结构连接的第一链和第二链。环结构可以包含任何合适数量的核苷酸。在一些实施方式中，环结构包含3-50个核苷酸。在一些实施方式中，环结构包含3-50个核苷酸、3-45个核苷酸、3-4个核苷酸、3-35个核苷酸，3-30个核苷酸，3-25个核苷酸和3-20个核苷酸，3-15个核苷酸或3-10个核苷酸或3-7个核苷酸。在一些实施方式中，所述环结构是五环结构。五环结构的合适序列如表1所示。表1中所示的任何序列都可以用于本文所述的融合构建体。在一些实施方式中，所述环结构包括seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq.no:11、seq id no:12、seq-no:13、seq id no:14、seq id no.:15、seq id no:16、seq id n0:17或seq id no:18。
[0103]
在一些实施方式中，第一链(即，5
′
链)包含与ggugucgagaagaggagaacaauau(seq id no:3)具有至少50％序列同一性的核苷酸序列。例如，第一链可以包含与seq id no:3具有至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核苷酸序列。在一些实施方式中，第一链(即5
′
链)包含如表2中所示的序列。在一些实施方式中，第一链包含seq id no:108的核苷酸序列。在一些实施方式中，第一链包含seq id no:109的核苷酸序列。
[0104]
在一些实施方式中，第二链包含与auguuguucucgucuccucgacacc(seq id no:4)具有至少50％序列同一性的核苷酸序列。例如，第二链可以包含与seq id no:4具有至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核苷酸序列。在一些实施方式中，第二链(即3
′
链)包含如表3所示的序列。在一些实施方式中，第二链包含seq id no:144的核苷酸序列。在一些实施方式中，第二链包含seq id no:145的核苷酸序列。在一些实施方式中，第二链包含seq id no:146的核苷酸序列。
[0105]
在一些实施方式中，第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列，第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列，并且第一链和第二链通过环结构连接。在一些实施方式中，所述环结构是五环结构。五环结构的合适序列如表1所示。表1中所示的任何序列都可以用于本文所述的融合构建体。在一些实施方式中，所述环结构包括seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq.no:11、seq id no:12、seq-no:13、seq id no:14、seq id no.:15、seq id no:16、seq id n0:17或seq id no:18。
[0106]
在一些实施方式中，融合构建体包含突变的组合。突变的组合可以在构建体内的一个或多个区中。例如，融合构建体可以在向导rna中包含多个突变。例如，所述构建体可以
包括向导rna的反义结构域内的一个或多个突变(即破坏与靶序列中相应核苷酸的给定碱基配对的一个或多个突变)和向导rna的募集结构域内的一个或多个突变(即破坏或恢复募集结构域的第一链和第二链之间的碱基配对的一个或多个突变)。例如，在一些实施方式中，构建体包含表4、表5或表6中所述的反义结构域和表1中所述环序列。在一些实施方式中，构建体包含如表4、表5或表6所述的反义结构域，以及包含如表2所述的第一序列和/或如表3所述的第二序列的募集结构域。在一些实施方式中，构建体包含如表4、表5或表6所述的反义结构域、如表1所述的环序列和包含如表2所述的第一序列和/或如表3所述的第二序列的募集结构域。
[0107]
在一些实施方式中，除了向导rna序列和靶序列之外，融合构建体还包含一种或多种组分。例如，融合构建体可以另外包含一种或多种组分以便于确定构建体是否在目标细胞中有效表达。例如，融合构建体可以另外包含编码荧光蛋白的序列，这使得构建体是否在目标细胞中表达可视化。在一些实施方式中，融合构建体包含向导rna序列和靶序列之间的介入序列。这样的介入序列可以包含任何合适数量的核酸。例如，融合构建体可以包含编码荧光蛋白的序列，其可以辅助确定构建体在目标细胞中的表达。例如，在图9f中示出了这样的实施方式。
[0108]
3.高通量筛选方法
[0109]
已经做出了巨大努力来开发能够精确操纵遗传信息的工具。除了在生命科学中的各种应用外，这些工具还有很大的潜力用于治疗疾病，尤其是那些使用抗体或小分子的经典治疗方法会失败的疾病。精确改变遗传信息的一种方法是基因组的靶向操纵。crispr-cas系统已使基因组工程成为一种主流方法，其广泛用于体外和体内研究基因功能的基础研究中。
1,2
目前正在大力将这项技术应用于临床。然而，其治疗用途的方法仍然具有挑战性，最近的报告强调了这一点，该报告显示crispr-cas系统可以诱导细胞周期阻滞3、细胞死亡4或免疫反应
5-7
。引入dna的变化永久存在这一事实既是一种优点，也是一种缺点。一方面，基因组工程为永久治愈具有挑战性的疾病提供了机会。另一方面，这伴随着巨大的安全风险，因为作为无意的副产物发生的潜在有害的脱靶突变可能会稳定地置于基因组中。
[0110]
由于rna的变化是短暂的，因此可以通过实现转录组工程的工具来实现对遗传信息的操纵，而不必担心与基因组工程相关的安全问题。rna修饰的可逆性提供了暂时操纵基本生物过程诸如细胞信号传导或炎症的机会，否则其永久性改变将产生严重后果。此外，引入rna变化(可能从0％到100％)的可调性允许精确调节生物学结果。近年来，已经开发了若干种工具，使腺苷能够在靶rna中位点特异性地转化为肌苷(图1)，称为定点a至i rna编辑。
8,9
由于肌苷在生物化学上由细胞机制解释为鸟苷，a至i编辑正式在rna中引入a至g点突变，这提供了操纵或恢复遗传信息的机会。到目前为止，所有用于位点特异性a至i编辑的工具都使用作用于rna的腺苷脱氨酶(adar)的催化活性。
8,9
这些酶在高等生物转录组的双链rna(dsrna)区内的数百万个位点天然地催化a至i编辑，并在调节蛋白质功能、rna剪接、免疫和rna干扰中起到重要作用。
10-14
有数种使用工程化adar融合体或内源性adar酶策略用以将adar的催化活性引导到转录组内的特定位点。
[0111]
adar具有共同的结构特征，其包括n端的多个dsrna结合结构域(dsrbd)和c端的脱氨酶结构域。dsrbd在很大程度上导致adar的杂泛性，因为它们能够与各种dsrna结构结合。为了设计特定的编辑机器(即adar融合蛋白)，去除dsrbd，将adar脱氨酶结构域融合至允许
与向导rna(grna)相互作用的蛋白质结构域，从而形成脱氨酶-grna复合物。通过应用简单的碱基配对规则，grna将工程化脱氨酶导向至任何选定的靶rna。通常，grna和靶rna在靶位点形成具有中心a:c错配的dsrna双链结构，以诱导通过脱氨酶结构域进行有效和精确的编辑。
8,9
[0112]
已经设计了若干种脱氨酶-grna复合物，其装配由ms2-mcp
15,16
、crispr-cas13
17,70
、λn-boxb
18-20
或snap-tag
21-23
系统介导。例如，adar融合蛋白可以包含与cas酶融合的adar脱氨酶结构域。例如，adar融合蛋白已被证明在与cas13b融合时进行c至u编辑
17
。
[0113]
为了进行定点rna编辑，必须将工程化的adar融合体和grna异位引入细胞中。在优化的条件下，adar融合grna复合物可以以几乎定量的产量编辑转录物。
17,20,23
然而，人们反复发现，有效的编辑通常伴随着整个转录组的大量脱靶编辑(多达数万个脱靶位点)，这是由异位表达后细胞中高水平的工程化adar融合体引起的。
16,17,23,27
[0114]
一种在没有脱氨酶异位表达相关脱靶编辑风险的情况下进行定点rna编辑的可能性是利用内源性adar酶。stafforst和fukuda小组提供了人adar确实可以用于定点编辑的第一个证据。
28-30
然而，成功的编辑仍然取决于adar酶的异位表达。在这些报告中，通过含有两个功能结构域的源自质粒的grna将adar募集至靶rna。第一结构域，grna的反义结构域，与靶rna结合，而第二结构域,adar募集部分，旨在促进与adar dsrbd的相互作用(图2)。一旦靶rna和grna形成模拟编辑靶标的天然dsrna的双链体，adar介导的编辑就会在靶位点发生。
32
细胞培养中的定点rna编辑可以用内源性adar进行。
32
相对于此前的研究，所述grna是以经化学修饰的反义寡核苷酸(aso)的形式提供的，而非从质粒中表达。用经化学修饰的grna靶向若干种内源性转录物在多种细胞类型中产生有效的rna编辑。
32
此外，编辑已被证明是精确的，并且不会干扰天然编辑稳态，因为只发现了一些同地编辑的脱靶位点(14个编辑显著增加或减弱的位点)。
32
[0115]
内源性adar需要高效的grna才能以足够的效率进行定点rna编辑。然而，采用当前最先进设计的adar募集grna的细胞培养实验表明，许多靶位点仅有50％以下被编辑。
32
鉴于adar天然地编辑人类转录组中的位点，产量最高达100％，
46
仍有潜力改进grna设计，以实现最大程度的定点rna编辑。然而，在形成的靶rna/grna双链体中进行高选择性和高效编辑的合理grna工程仍然具有挑战性。
[0116]
在一些实施方式中，本文提供了用于鉴定、选择、产生和利用使rna编辑产量最大化的grna的系统和方法。该平台允许针对grna序列在哺乳动物细胞中介导定点rna编辑的能力来高通量筛选grna序列(图3)。获自筛选的结果提供了对adar和工程化adar融合的有效定点rna编辑的更佳理解。该平台为优化单个靶位点的grna序列提供了一种强大的方法。此外，该平台不仅能够量化靶位点的编辑产量，而且能够量化位于靶rna和grna之间的双链体内的所有其他周围离位腺苷的编辑产量。这提供了一种印象，即(离位/靶标)编辑是如何通过双链序列和结构进行调节的。该信息不仅对定点rna编辑有用，而且对了解人类转录组中已知位点的编辑结果也有用。
[0117]
在一些实施方式中，本文提供了一种选择用于定点rna编辑的向导rna的高通量筛选方法。在一些实施方式中，该方法包括生成本文所述的多个融合构建体。融合构建体包含如本文所述的靶序列和向导rna序列。在一些实施方式中，靶序列来源于需要定点a至i rna编辑的基因。例如，在一些实施方式中，该基因包括g至a点突变、t至a点突变、或c至a点突
变。在一些实施方式中，需要对这样的突变进行纠正。例如，可能需要g至a点突变的纠正、t至a点突变的纠正、或c至a点突变的纠正。在一些实施方式中，点突变与表达该基因的受试者的疾病或病症的发展相关。例如，受试者可能患有赫尔勒综合征。在一些实施方式中，点突变存在于靶序列中。例如，靶序列可以包含在表达该基因的受试者中引起疾病或病症的g至a点突变、t至a点突变或c至a点突变。在一些实施方式中，突变是g至a点突变，并且该突变存在于靶序列中。
[0118]
所述方法进一步包括在合适的细胞中诱导融合构建体的表达。例如，该方法可以进一步包括用融合构建体转染表达作用于rna的腺苷脱氨酶(adar)的细胞或表达adar融合蛋白的细胞。该方法进一步包括相对于对照确定融合构建体是否有效地诱导从细胞分离的核酸中的一个或多个突变。可以使用任何合适的表达adar或adar融合蛋白的细胞。合适的细胞包括真核细胞，包括但不限于酵母细胞、高等植物细胞、动物细胞、昆虫细胞和哺乳动物细胞。真核细胞的非限制性实例包括猴、牛、猪、鼠、大鼠、禽、爬行动物和人细胞。
[0119]
转染方法可以通过使用合适的细胞透化剂(例如lipofectamine)来辅助，或者可以通过其他合适的技术诸如电穿孔来进行。在递送到细胞之前，融合构建体可以容纳在合适的载体中。合适的载体包括病毒载体(例如，慢病毒载体、逆转录病毒载体、腺病毒载体、腺体相关病毒载体、α病毒载体等)和非病毒载体(例如，质粒、粘粒、噬菌体等)。在细胞内实现构建体的期望表达之后，该方法还包括确定相对于对照给定的融合构建体是否有效地诱导从细胞分离的核酸中的一种或多种修饰。因此，在一些实施方式中，该方法进一步包括从细胞中分离核酸。分离的核酸可以是rna。
[0120]
在一些实施方式中，确定融合构建体是否诱导从表达融合构建体的细胞群分离的核酸中的一种或多种修饰包括对分离的核酸进行测序。在一些实施方式中，从细胞群分离的核酸中的一种或多种修饰包括对最初存在于靶序列中的突变(例如，g至a点突变、c至a点突变或t至a点突变)的纠正。例如，可以从细胞中分离rna，并且可以进行测序以确定最初存在于靶序列中的g至a点突变是否已经被纠正。例如，adar的成功募集使选定的腺嘌呤残基能够修饰为肌苷。由于肌苷在生物化学上由细胞机制解释为鸟苷，a至i编辑在rna中引入了a至g点突变。因此，可以纠正靶序列中存在的点突变，诸如靶序列中的g至a点突变。例如，最初存在于靶序列中的腺苷残基可以被纠正为鸟嘌呤残基。g至a点突变的纠正表明向导rna序列有效地诱导定点rna编辑(即，定点a到i rna编辑)。
[0121]
在一些实施方式中，该方法进一步包括确定与对照相比，构建体的表达是否有效地诱导了rna中的修饰。例如，该方法可以包括确定分离的核酸(例如，rna)的序列。可以使用各种合适的测序方法和技术来确定核酸链的序列。例如，测序方法可以是sanger测序。作为另一实例，测序方法可以是下一代测序技术(例如，下一代rna测序技术)。术语下一代测序，或“ngs”，是指允许对数百万个核酸序列同时测序的各种测序技术，也被称为高通量测序或大规模平行测序。在一些实施方式中，可以从细胞中分离rna，并且可以制备靶rna/grna融合体的cdna用于随后用ngs测序(诸如通过使用可从illumina商购的平台)。对于测序文库的制备，可以使用具有不同索引的ngs接头，这允许对多个构建体进行并行分析。为了分析测序数据，可以使用计算流程，其能够检测靶rna序列内的编辑水平并鉴定相应的grna。
[0122]
在一些实施方式中，本文所述的方法可用于鉴定包含一种或多种优化特征的
grna，该一种或多种优化特征使得包含优化特征的向导rna有效诱导定点rna编辑。优化的特征可以选自反义结构域、募集结构域和环序列。例如，本文所述的方法可用于鉴定优化的反义结构域、靶序列、环序列和/或募集结构域序列。在一些实施方式中，本文所述的方法可用于鉴定优化的反义结构域。因此，这种优化的反义结构域可以用于环状向导rna或缺乏募集结构域的向导rna。例如，优化的反义结构域可以用于环状向导rna或缺乏募集结构域的向导rna中，用于定点基因编辑方法。或者，优化的反义结构域可以与向导rna中的另一优化特征诸如优化的募集结构域和/或优化的环序列组合使用。在一些实施方式中，本文所述的方法可用于鉴定含有优化募集结构域的grna。例如，所述方法可以鉴定含有募集结构域的优化的第一链序列和/或优化的第二链序列的grna。在一些实施方式中，所述方法可以鉴定优化的环序列。因此，本文所述的方法可用于辅助生成含有一种或多种优化特征的向导rna，所述一种或多种优化特征包括优化的反义结构域、优化的靶序列和优化的环序列，和/或优化的募集结构域序列。
[0123]
4.向导rna和治疗方法
[0124]
定点a至i rna编辑的治疗能力源于其通过正式引入a至g点突变来产生密码子含义变化的能力。全部三种终止密码子和20个经典氨基酸中的12个可以通过a至i编辑来重新编码(图4a)。这包括酪氨酸、丝氨酸和苏氨酸残基，它们通常作为信号传导蛋白中的磷酸化位点(图4b)。编辑这些磷酸化位点可以用来纠正疾病诸如癌症中的异常信号传导。事实上，定点a至i编辑已成功应用于有效编辑stat1 mrna中的5
′‑
uau三联体，
23,32
其编码y701，y701的磷酸化对信号转导至关重要。
33
除了用于磷酸化的氨基酸残基的重新编码外，发现a至i编辑用于在功能上重要的其他位点诱导氨基酸置换(图4c)。这可用于改变蛋白质的功能，这些蛋白质的不激活或过度激活对疾病的治疗具有有益作用。此外，通过靶向5
′‑
aug起始密码子抑制致病蛋白的功能也是可行的，其编辑得到缬氨酸密码子(5
′‑
iug)，阻止翻译起始(图4d)。
[0125]
治疗性a至i rna编辑的一个特别有吸引力的应用是修复致病性g至a点突变(图4d)。根据clinvar数据库(http://www.ncbi.nlm.nih.gov/clinvar/)，有数千种致病的g至a点突变可以调节蛋白质功能(功能的获得或丧失)或改变rna剪接。已经发表了若干份报告，表明定点a至i rna编辑在医学上被用作纠正致病性g至a点突变的一种强大方法。
16,18,20,22,32
[0126]
发现定点a至i rna编辑可用于逆转由g至a点突变引起的上述及其他疾病表型，而不存在与基因组工程相关的安全问题。在治疗方面，利用内源性adar进行定点rna编辑是有希望的，因为这种方法目前比应用异位表达的工程化adar融合的方法精确得多。
17,23,32,43
此外，用内源性adar成功编辑只需要将grna作为经化学修饰的核酸施用，这极大地简化了定点rna编辑的治疗应用。合适的修饰包括但不限于2
′‑
o-甲基(2
′‑
ome)、硫代磷酸酯(ps)、2
′‑
o-甲基硫代pace(msp)、2
’‑
o-甲基pace(mp)、2
′‑
氟代rna(2
′‑
f-rna)和限制性乙基(s-cet)。或者，grna可以从质粒中表达，例如用腺相关病毒(aav)递送。
[0127]
在一些实施方式中，本文提供了利用内源性adar来纠正引起赫尔勒综合征的提前idua w402x终止密码子的方法(图5)。这种方法可以显著受益于对引起疾病的g至a点突变的高效修复。因此，在用于治疗赫尔勒综合征的方法之前，使用本文所述的系统和方法对grna进行优化。在鉴定优化的grna之后，所述grna可用于本文所述的治疗疾病的方法中。
[0128]
在一些实施方式中，本文提供了用于定点rna编辑的方法。该方法包括通过本文所
述的方法/平台选择grna，并向细胞或受试者提供包含向导rna的构建体。在一些实施方式中，向导rna是如本文所述的grna。在一些实施方式中，构建体可以另外包括靶向结构域，如本文所述。
[0129]
在一些实施方式中，本文提供了用于定点rna编辑的向导rna。所述向导rna可以是本文所述的任何合适的向导rna。可以使用本文所述的高通量筛选方法来鉴定向导rna。在一些实施方式中，向导rna包含与靶基因序列基本互补或完全互补的反义结构域。靶基因序列可以是任何需要定点rna编辑的基因序列。在一些实施方式中，靶基因序列存在于idua基因内。例如，靶基因序列可以存在于人idua基因内。人idua基因的序列如图25所示。如图25所示，位置402处的氨基酸是色氨酸(w)。然而，在赫尔勒综合征患者的idua基因中发现了w402x突变。因此，在一些实施方式中，靶基因序列包含存在于人idua mrna中的w402x突变。靶基因序列可以包含该w402x突变，以及在w402x突变的任一方向上的任何合适数量的核苷酸。在一些实施方式中，靶基因序列可以包括gaugaggagcagcucuaggccgaagugucgcag(seq id no:5)。
[0130]
合适的反义结构域序列的选择取决于目标靶基因。在一些实施方式中，反义结构域旨在靶向人idua基因的一部分，然而也可以靶向其他目标基因。在一些实施方式中，反义结构域被设计为使得反义结构域内的核苷酸与靶序列上的相应核苷酸碱基配对。在一些实施方式中，反义结构域与靶基因测序完全互补。在其他实施方式中，反义结构域中的一个或多个核苷酸发生突变，使得它们不与靶序列中相应位置的核苷酸碱基配对(即，反义域与靶序列基本上互补而非完全互补)。在一些实施方式中，反义结构域包含与uucggcccagagcugcuc(seq id no:2)具有至少50％序列同一性的核苷酸序列。例如，反义结构域可以包含与seq id no:2具有至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核苷酸序列。在一些实施方式中，相对于seq id no:2位于第8位的核苷酸(即，与靶反义双链体内的靶腺苷相对的核苷酸)是胞苷。在一些实施方式中，反义结构域包含如表4所示的核苷酸序列。第8位的3
′
侧的核苷酸(即，在第8位的胞苷的3
′
侧)在本文中表示为
“‑”
，后面是距第8位的核苷酸的数目，而在第8位的5
′
侧的核苷酸在本文中表示为“+”，后面是距第8位的核苷酸的数目。在一些实施方式中，反义结构域包含seq id no:195中所述的核苷酸序列。
[0131]
在一些实施方式中，反义结构域具有超过18个核苷酸。例如，除了存在于序列中的与seq id no:2具有至少50％同一性的核苷酸之外，反义结构域还可以包括额外的核苷酸。这种额外的寡核苷酸可以存在于反义结构域的3
′
端或5
′
端。示例性的这种反义结构域在图23d和图23e中突出显示，它们中的每一个都显示添加到反义链的3
′
端或5
′
端的额外核苷酸(例如，除了在原始构建体中使用的18nt反义结构域之外的5个核苷酸)。在一些实施方式中，反义结构域包含如表5或表6所示的序列。
[0132]
在一些实施方式中，反义结构域包含表5中所示的序列。在一些实施方式中，反义结构域包含seq id no:202的核苷酸序列。在一些实施方式中，反义结构域包含表6中所示的核苷酸序列。在一些实施方式中，反义结构域包含seq id no:303的核苷酸序列。在一些实施方式中，反义结构域包含seq id no:304的核苷酸序列。
[0133]
在一些实施方式中，向导rna序列包含募集结构域。募集结构域(在本文中也称为
adar募集部分)有助于与adar或adar融合蛋白的相互作用。募集结构域被配置为结合(即募集)一种或多种adar蛋白或其融合体。例如，募集结构域可以被配置为募集adar1、或adar2蛋白或其融合体。在一些实施方式中，募集结构域至少募集adar2蛋白。募集结构域可以包含任何合适数量的核苷酸。例如，募集结构域可以包含15-100个核苷酸。在一些实施方式中，募集结构域包含约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95或约100个核苷酸。在一些实施方式中，募集结构域是具有茎环二级结构的构建体的一部分。在一些实施方式中，募集结构域形成茎环结构的一部分，其中茎环结构中的环部分由5个核苷酸组成(即，五环)。
[0134]
在一些实施方式中，募集结构域包括彼此基本互补或完全互补的第一链和第二链。在一些实施方式中，第一链和第二链通过环序列连接。环结构可以包含任何合适数量的核苷酸。在一些实施方式中，环结构包含3-50个核苷酸。在一些实施方式中，环结构包含3-50个核苷酸、3-45个核苷酸、3-4个核苷酸、3-35个核苷酸，3-30个核苷酸，3-25个核苷酸和3-20个核苷酸，3-15个核苷酸或3-10个核苷酸或3-7个核苷酸。在一些实施方式中，所述环结构是五环结构。五环结构的合适序列如表1所示。表1中所示的任何序列都可以用于本文所述的融合构建体。在一些实施方式中，所述环结构包含seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq.no:11、seq id no:12、seq-no:13、seq id no:14、seq id no.:15、seq id no:16、seq id n0:17或seq id no:18。
[0135]
在一些实施方式中，募集结构域基于内源性(即，天然存在的)adar靶标的序列。与内源性adar靶标相比，募集结构域可具有一个或多个修饰，这可能增强adar募集或相互作用。例如，募集结构域可以基于gria2r/g位点(adar2的内源性靶标)的序列。
[0136]
在一些实施方式中，募集结构域包括通过环结构(在本文中也称为环序列)连接的第一链(即5
′
链)和第二链(即3
′
链)。第一链和第二链表现出互补的碱基配对，从而有助于形成构建体的茎环结构。在一些实施方式中，这种碱基配对被募集结构域的第一链和/或第二链内的一个或多个突变破坏。在一些实施方式中，未经修饰的募集结构域是指表现出没有破坏的碱基配对(即，完全互补)的募集结构，而突变的募集结构域是指在第一链或第二链中包含破坏碱基配对的一个或多个突变的结构域。换言之，未经修饰的募集结构域包含与第二链完全互补的第一链，而突变的募集结构域所包含的第一链第二链基本上(即，至少60％)互补而非完全互补。
[0137]
在一些实施方式中，募集结构域包括通过五环结构连接的第一链和第二链。在一些实施方式中，第一链(即，5
′
链)包含与ggugucgagaagaggagaacaauau(seq id no:3)具有至少50％序列同一性的核苷酸序列。例如，第一链可以包含与seq id no:3具有至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核苷酸序列。在一些实施方式中，第一链(即5
′
链)包含如表2中所示的序列。在一些实施方式中，第一链包含seq id no:108的核苷酸序列。在一些实施方式中，第一链包含seq id no:109的核苷酸序列。
[0138]
在一些实施方式中，第二链包含与auguuguucucgucuccucgacacc(seq id no:4)具有至少50％序列同一性的核苷酸序列。例如，第二链可以包含与seq id no:4具有至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、
至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％序列同一性的核苷酸序列。在一些实施方式中，第二链(即3
′
链)包含如表3所示的序列。在一些实施方式中，第二链包含seq id no:144的核苷酸序列。在一些实施方式中，第二链包含seq id no:145的核苷酸序列。在一些实施方式中，第二链包含seq id no:146的核苷酸序列。
[0139]
在一些实施方式中，第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列，第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列，并且第一链和第二链通过环结构连接。环结构可以包含任何合适数量的核苷酸。在一些实施方式中，环结构包含3-50个核苷酸。在一些实施方式中，环结构包含3-50个核苷酸、3-45个核苷酸、3-4个核苷酸、3-35个核苷酸，3-30个核苷酸，3-25个核苷酸和3-20个核苷酸，3-15个核苷酸或3-10个核苷酸或3-7个核苷酸。在一些实施方式中，环结构是五环(即，包含5个核苷酸)。在一些实施方式中，环结构包含表1中所述的序列。在一些实施方式中，所述环结构包含seq id no:6、seq id no:7、seq id no:8、seq id no:9、seq id no:10、seq.no:11、seq id no:12、seq-no:13、seq id no:14、seq id no.:15、seq id no:16、seq id n0:17或seq id no:18。
[0140]
在一些实施方式中，向导rna包括突变的组合。在一些实施方式中，向导rna包含至少2个突变(即，2个、3个、4个、5个或多于5个突变)。例如，所述向导rna可以包括反义结构域内的一个或多个突变(即破坏与靶序列中相应核苷酸的给定碱基配对的一个或多个突变)和向导rna的募集结构域内的一个或多个突变(即破坏或恢复募集结构域的第一链和第二链之间的碱基配对的一个或多个突变)。在一些实施方式中，向导rna包含在募集结构域中的多个突变。在一些实施方式中，向导rna包含表4、表5或表6中所述的反义结构域和表1中所述环序列。在一些实施方式中，向导rna包含如表4、表5或表6所述的反义结构域，和含有如表2所述的第一序列和/或如表3所述的第二序列的募集结构域。在一些实施方式中，构建体包含如表4、表5或表6所述的反义结构域、如表1所述的环序列和包含如表2所述的第一序列和/或如表3所述的第二序列的募集结构域。
[0141]
本文所述的向导rna可用于细胞或受试者中的定点rna编辑方法(例如，定点a至i rna编辑)。例如，可以进行rna编辑来治疗受试者的疾病或病症。例如，本文所述的向导rna可用于治疗以受试者表达的基因中的g至a点突变为特征的疾病或病症的方法中。在一些实施方式中，该疾病是赫尔勒综合征。
[0142]
在一些实施方式中，可以将向导rna或包含该向导rna的构建体配制成用于递送至细胞或受试者的组合物。例如，可以将该构建体配制成用于肠胃外施用的组合物。术语“肠胃外”是指任何合适的非口服施用途径，包括皮下、肌内、静脉内、鞘内、脑脊髓内、动脉内、椎管内、硬膜外、皮内等。该构建体可以用任何合适的赋形剂、稳定剂、防腐剂等配制。在一些实施方式中，该组合物可以提供给患有赫尔勒综合征的受试者。因此，在本文提供的一些实施方式中，是治疗赫尔勒综合征的方法，该方法包括向有此需要的受试者提供包含本文所述的grna(即，优化的grna)的组合物。grna可以使用本文所述的高通量筛选方法进行鉴定。
[0143]
应当理解，内源性adar和/或工程化adar融合可适用于本文所述的定点rna编辑方法。例如，通过本文所述的筛选方法鉴定的向导rna(包括优化的向导rna)可能非常适合与本文所述方法中的adar融合蛋白一起使用。
[0144]
在此引用的全部参考文献，包括出版物、专利申请和专利，都以援引的方式并入本
文，其程度与每个参考文献单独且具体地指示以援引的形式并入并在本文中整体阐述的程度相同。
[0145]
本文描述了本发明的优选实施方式，包括发明人已知的用于实施本发明的最佳模式。通过阅读前述描述，这些优选实施方式的变化对于本领域普通技术人员而言可以显而易见。本发明人期望熟练的技术人员在适当的情况下采用这样的变化，并且本发明人有意以不同于本文具体描述的方式来实施本发明。因此，本发明包括适用法律允许的本发明所附权利要求中所述主题的全部修改和等同形式。此外，本发明涵盖上述要素的任何组合及其所有可能的变型，本文中另有说明或上下文明显矛盾的情况除外。
[0146]
实施例
[0147]
实施例1-优化grna序列
[0148]
筛选平台概述：有效的编辑通常取决于许多因素，诸如底物序列和grna/靶双链体的长度和结构。
48,49
目前的知识无法得出如何设计使adar酶能够以最高可能效率编辑特定位点的grna的结论。为了克服这一障碍，可以采用下一代测序(ngs)来针对其编辑g至a点突变的能力筛选grna文库序列。在实际情况下，当靶转录物与能够募集adar酶的grna结合时，在靶转录物中进行编辑。对于基于ngs的筛选，靶序列和aso序列在同一转录物中表达，从而可以在单个测序读段上鉴定它们，以知晓哪个编辑水平是由哪个aso序列介导的。为了实现这一点，可以从全长转录物中获得含有致病性g至a点突变的靶区，并将其与aso文库序列融合，从而产生发夹结构，该发夹结构模拟靶rna和反式作用grna之间的双链。在实施例2中更详细地描述了靶rna/grna文库的设计。
[0149]
对于筛选实验，靶rna/grna融合文库可以作为dna寡核苷酸排序并连接到表达载体中。例如，可以使用成熟的克隆和使用策略将文库连接到表达载体中。
50,51
可以通过合适的方法诸如通过脂质转染将所得质粒文库递送至人类adar表达细胞。在用质粒文库温育后，可以从细胞中分离rna，并且可以制备靶rna/grna融合体的cdna以用于其随后的ngs测序(illumina测序)。对于测序文库的制备，可以使用具有不同索引的ngs接头，这允许对多个实验进行并行分析。为了分析测序数据，可以使用计算流程，其能够检测靶rna序列内的编辑水平并鉴定相应的grna。可替选地，靶/grna融合体可以在体外转录并转染到细胞中，而不需要质粒。
[0150]
在靶位点处诱导的编辑水平之间的比较揭示了哪些grna序列可以指导adar进行有效的rna编辑。此外，检查靶rna/grna融合体中离位腺苷的编辑程度示出grna如何精确地介导rna编辑。靶rna/grna双链结构和序列对编辑效率和特异性的影响也可以通过分析来评估。
[0151]
实施例2
[0152]
靶rna/grna融合体文库的设计
[0153]
使adar能够催化定点rna编辑的grna包括两部分：用于结合靶序列的反义结构域和确保与adar酶相互作用的不完美双链adar募集部分(图2)。
[0154]
由于rna编辑可能受到多种因素的影响，最大限度的编辑似乎需要为每个位点定制grna序列。为了找到那些最佳的grna序列，可以对每个目标靶标进行grna反义和adar募集部分的筛选。
[0155]
可以设计用于鉴定最大化rna编辑的grna序列的靶rna/grna文库。可以在grna部
biol.15,104-114(2018).
[0187]
28 wettengel,j.,reautschnig,p.,geisler,s.,kahle,p.j.&stafforst,t.harnessing human adar2 for rna repair
–
recoding a pink1 mutation rescues mitophagy.nucleic acids res.45,2797-2808(2017).29fukuda,m.etal.construction of a guide-rnafor site-directed rna mutagenesis utilising intracellular a-to-i rna editing.sci.rep.7,41478(2017).
[0188]
30heep,m.,mach,p.,reautschnig,p.,wettengel,j.&stafforst,t.applying human adar1p110 and adar1p150 for site-directed rna editing—g/c substitution stabilizes guidernas against editing.genes 8,34(2017).
[0189]
32merkle,t.et al.precise rna editing by recruiting endogenous adars with antisense oligonucleotides.nat.biotechnol.37,133-138(2019).
[0190]
33miklossy,g.,hilliard,t.s.&turkson,j.therapeutic modulators of stat signalling for human diseases.nat.rev.drug discov.12,611(2013).
[0191]
46kawahara,y.et al.glutamate receptors:rna editing and death of motor neurons.nature 427,801-801(2004).
[0192]
47bennett,c.f.,baker,b.f.,pham,n.,swayze,e.&geary,r.s.pharmacology of antisense drugs.annu.rev.pharmacol.toxicol.57,81-105(2017).
[0193]
48eggington,j.m.,greene,t.&bass,b.l.predicting sites of adar editing in doublestranded rna.nat.commun.2,319(2011).
[0194]
49wong,s.k.,sato,s.&lazinski,d.w.substrate recognition by adar1 and adar2.rna 7,846-858(2001).
[0195]
50bassik,m.c.et al.rapid creation and quantitative monitoring of high coverage shrna libraries.nat.methods 6,443-445(2009).
[0196]
51shalem,o.et al.genome-scale crispr-cas9 knockout screening in human cells.science 343,84-87(2014).
[0197]
70jing x et al.implementation of the crispr-cas13a systemin fission yeast and its repurposing for precise rna editing.nucleic acids res(2018)
[0198]
实施例3
[0199]
筛选方法
[0200]
设计和测试aso文库原型：aso文库原型基于已发表的aso设计
‘
v9.4’32
，关键区别在于靶序列的18个核苷酸(nt)区被包括作为模拟向导/靶复合物的融合构建体的一部分(图9a)。该融合构建体独特地使得在相同的测序读段中捕获向导rna序列及相关的编辑事件。此外，募集结构域中的发夹环序列从“gcuaa”变为“gccaa”，以消除终止密码子。
[0201]
在先导筛选中探测到的靶序列包括来自类idua基因的18nt区域，包含在赫尔勒综合征患者中观察到的g至a突变，侧接来自野生型idua序列的10个上游残基和7个下游残基。融合构建体的向导rna部分包括募集结构域，随后是18nt反义序列。募集结构域基于adar的内源性gria2r/g位点，并且包括若干序列置换以抑制募集结构域内的编辑
32
。除与编辑位点相对的c错配，反义序列与靶序列互补，之前发现这会增加编辑
49
。
[0202]
在筛选之前，重要的是确保文库原型被可检测地编辑，但不能在筛选条件下完成，
以提供足够的动态范围来鉴定增强子变体。因此，首先在具有和不具有诱导型adar1 p150表达的flp-in t-rex 293细胞中测试了原型的编辑。将原型限制性克隆到pcdna5载体中，作为mcherry和egfp编码序列之间的间隔区(详见克隆部分)。在存在或不存在10ng/ml多西环素(dox)的情况下，将具有整合的adar1 p150的flp-in t-rex 293细胞接种在24孔组织培养板(350000个细胞/孔)中。20小时后，用2.5μl脂质体2000逐滴移液转染500ng质粒。24小时后，使用rneasy minelute试剂盒(qiagen)分离和纯化总rna，并使用m-mulv逆转录酶(neb)用anmcherry特异性引物逆转录。对pcr扩增的琼脂糖凝胶纯化的cdna进行sanger测序，以确定编辑水平。在仅存在内源性adar(无dox诱导)的情况下，观察到的编辑为约50％，在dox诱导的情况下为100％(图9b，c)。因此，仅表达内源性adar蛋白的flpin t-rex细胞用于随后的筛选。
[0203]
为了获得其他原型的适当基线编辑水平(即可检测，但《《100％)，可以操纵许多变量，包括原型设计、细胞类型、多西环素浓度、内源性adar蛋白的敲除或时间。已经对向导/靶融合体的若干种变体进行了测试。例如，可以省略募集结构域，而是使用通过短环连接的较长靶序列和反义序列(图9d，e)。这种设计允许在较长的区域内探测影响编辑的靶特异性序列特征，而不会产生可能干扰筛选规程的过度稳定的rna结构。在该设计的扩展中，靶序列和向导序列由egfp编码序列(720nt+短连接子)而非短环分隔(图9f)。在该设计中，靶序列和向导序列由翻译序列在空间上分隔，更接近于使用反式向导模拟编辑。
[0204]
为了加快新靶标的一个或多个原型的鉴定，将其用作后续高通量文库设计的参考序列，可以通过使用包含不同原型设计的寡核苷酸池来进行小的初始筛选。这种10s或100s的设计库可以包括以下参数的系统变化：靶区和反义区的长度；编辑位点在构建体内的位置；募集结构域的性质(如果存在的话)。可以获得寡核苷酸库，例如作为idt opool或小型twist/agilent寡核苷酸文库。可以对寡聚体进行克隆和筛选，类似于下面的全面筛选程序，适当缩小规模。
[0205]
文库设计-为了获得靶向idua w402x突变的反义变体文库，将图9a中的反义区随机化，使得在每个位置，原型中显示的“一致性”碱基在82％的时间存在，而其他3个碱基中的每一个在6％的时间存在。选择这种简并水平是为了在约10000个变体文库中提供反义区的单突变体和双突变体的完整代表，同时仍然采样大量的高阶突变体。应根据随机序列的长度、期望的文库大小和期望的突变体覆盖率来调整该简并水平。可以将随机化的残基引入向导序列中的任何位置，跨越整个向导序列，或者例如仅包括编辑位点附近的残基，并且随机化的残基数可以改变。
[0206]
克隆-将基于图9中原型的aso文库克隆到mcherry和egfp编码序列之间的pcdna5载体中(图10)。为了模拟翻译区内的编辑(因为大多数治疗性编辑可能靶向编码序列)，将mcherry终止密码子从靶序列上游移除。也可以使用替代载体，其中向导-靶融合体在egfp mrna的3
′
utr内表达或作为rna聚合酶iii转录的小rna文库表达。图10示出可以使用的示例性载体和布置，但它们不应被解释为以任何方式进行限制。用于克隆的载体不限于编码序列的任何特定顺序或布置(例如，mcherry、egfp、靶rna或向导rna)。
[0207]
在克隆之前，aso文库插入片段由两个单链dna寡核苷酸进行pcr装配，这两个寡核苷酸在募集结构域中部分重叠，并且包含靶区或随机反义区(图12，图13)。含有随机化区的引物(图12、图13中的“引物1_bw_内部”)由斯坦福大学的pan学院使用手工混合的碱基生
成，从而获得18％的简并性。引物也可市购，诸如获自idt。下文中提到的所有其他寡核苷酸都获自idt。使用kod xtreme
tm
热启动dna聚合酶(novagen)用1.5nm的长引物和500nm的短末端引物进行pcr装配。退火温度为62℃(30s)，延伸步骤在68℃下进行15s。通过实时定量pcr(qrt-pcr)测定，文库扩增16个周期，对应于半饱和。kod xtreme聚合酶针对高度结构化的模板进行了优化，因此强烈建议用于文库制备。或者，涵盖全aso融合构建体和侧接区的双链(ds)dna片段，具有有限数量的随机化位置，可以市购获得，例如，获自idt。
[0208]
为了防止pcr副产物并排除对凝胶纯化的需要，在这里和下文中，所有的pcr反应都进行了对应于半饱和的多个循环，如通过qrt-pcr所确定的。通过聚丙烯酰胺凝胶电泳(page；含tbe的novex 6％丙烯酰胺凝胶；invitrogen；用1x sybr gold后染色)对所有pcr产物的纯度进行评估。
[0209]
用macherey-nagel pcr纯化试剂盒纯化dsdna产物，并使用clai和nhei限制性内切酶以及t4 dna连接酶在mcherry和egfp编码序列之间限制性克隆到pcdna5载体中。使用nebiocalculator测定的5倍摩尔过量的插入片段进行连接反应。在室温下温育30分钟并在16℃下温育3小时后，在65℃下加热-灭活反应10分钟，并使用macherey-nagel pcr纯化试剂盒纯化和浓缩dna。为了获得约10000个变体文库，将50ng的dna(2μl体积)转化到25μl的top10感受态细胞(invitrogen)中。将细胞铺板在两块15cm lb-carb 100平板(teknova)上，并在37℃下温育过夜。为了获得更大的文库，连接dna的量、细胞体积和平板的数量应当按比例增加。
[0210]
通过用剃须刀片轻轻刮擦lb carb平板并用lb肉汤洗涤，从lb carb板上收获约10000个菌落。在高速质粒midi柱(qiagen)上纯化质粒dna。
[0211]
为了实现更高的通量，以100000个克隆的规模，应当使用电活性细胞(诸如lucigenendura)，并且可以将细胞铺板在245mm
×
245mm的lb-carb板上。质粒dna应当使用maxi制备物(例如，来自qiagen的hispeed plasmid maxi试剂盒)分离。
[0212]
细胞培养-将具有整合的空pcdna5载体的flp-in t-rex 293细胞维持在dmem培养基(gibco)中，该培养基补充有10％fbs、100μg/ml潮霉素b、15μg/ml杀螨素和100u/ml gibco
tm
青霉素-链霉素。发现具有整合的adar1 p150的flp-in t-rex细胞中的诱导型adar1表达对于观察到足够的编辑水平而言并非必要(图9b，c)；因此，使用含有空pcdna5载体并因而仅表达内源性adar蛋白的flp-in t-rex 293细胞进行筛选。不要求筛选规程使用flp-in t-rex细胞，并且任何其他表达足够的adar蛋白以进行可检测的编辑并且适于转染的细胞系都可用于筛选。
[0213]
筛选规程-将150万个293flp-in t-rex细胞与整合的空pcdna5载体接种在6孔组织培养物包衣板的每个孔中，并在37℃下温育。22小时后(对应于约70％的细胞融汇)，将质粒文库(2.75μg)和脂质体2000(8.25μl)分别在optimem(550μl终体积)中稀释，并在室温下温育5分钟。将两种溶液混合并温育20分钟，并将1ml混合物滴加至铺板的细胞。24小时后，取出培养基，通过上下移液收获细胞。将转染规模改为10μg dna，转染到接种在10cm平板上的500万个细胞中，筛选结果不受影响。文库转染和收获细胞之间的时间也不影响筛选结果，在7小时至48.5小时之间变化。
[0214]
在单个rneasy mini柱(qiagen)上纯化总rna。对于更大规模的转染，可能需要多个rneasy mini柱或一个rneasy-midi柱，如通过手册中所述的柱容量和细胞类型及数量确
miseq试剂盒可以用于对单个10000个变体文库进行测序。与hiseq和miseq相比，我们发现illumina nextseq和novaseq平台在文库构建体的发夹区产生的测序质量不足，阻碍了可靠的序列鉴定和编辑水平的量化。因此，nextseq和novaseq不应当用于筛选。
[0216]
为了提高测序质量，通过将cdna文库与约40％的phix测序对照v3(illumina)混合来提高序列多样性。为了在dna水平上严格区分真实的编辑事件和意外的a至g突变，还对质粒dna文库进行了测序。从“pcr扩增”步骤开始，使用与cdna文库制备中所使用相同的引物来制备dna文库以进行测序(图14)。在这一步骤中，使用0.3μm的引物2_fw和引物2_pw，以及1.5nm的截短版本的带条形码的引物_rt扩增0.2ng/μl质粒文库(图14)，在3
′
端缩短2nt，以匹配引物2_cw和引物2_bw的熔化温度(57℃)，这与最佳rt温度(60
°
)不同。以下步骤与cdna文库制备中的步骤相同，包括装瓶步骤。cdna和dna文库制备的示例性构建体和引物如图15所示。
[0217]
分析-使用flash-1.2.11合并成对的末端读段，去除截短的读段，并基于umi序列相对于恒定mcherry和egfp序列区的位置来鉴定umi序列以及每个读段中的文库变体序列。从进一步分析中删除包含非冗余umi的读段(即，存在于单个读段中的umi)。其余读段按其各自的umi序列分组，并基于在包含相同umi的两个或多个读段中观察到的序列确定靶-向导融合体的一致序列。可替选地，可以使用更严格的标准来进行一致性确定，例如要求至少一半的读段具有相同的可变序列(buenrostro等人，2014)。如果包含给定umi的所有读段在靶-向导融合区中具有不同的序列，则不存在一致性，并且弃去相应的读段。由于错误不太可能同时发生在umi和可变向导rna区两者中，该基于一致性的规程即使在存在测序或pcr错误的情况下也能可靠地鉴定文库变体和编辑的残基。使用自定义python脚本执行这些分析及随后的分析。
[0218]
在鉴定umi一致性后，与每个向导rna变体相关的编辑水平被量化如下。从进一步分析中除去在靶序列或募集结构域中具有非a至g变化的序列。只有由至少10个umi代表的向导rna变体(包括反义或募集结构域区的变体)被增殖(propagate)以进行进一步分析，以确保准确的定量。对于每个向导rna序列，对以下每个版本的靶序列的umi进行计数：(1)完整的靶序列(“未编辑的”)；(2)靶序列，在预期位点具有a至g更改，不考虑任何额外的脱靶编辑(“编辑的”)；(3)目标序列仅具有非预期的a至g更改，没有在靶(on-target)编辑(“脱靶”)。在预期位点编辑的变体比例计算如下：
[0219][0220]
通过对umi(其表示唯一的cdna)进行计数，而不是分析原始测序读段，这种定量方法减少了由pcr偏差或其他技术人工物引起的潜在不均匀序列显示的影响。
[0221]
虽然在idua的情况下脱靶编辑是罕见的，但对于富含a的靶序列(或募集结构域)而言，脱靶编辑可能更普遍。在这些情况下，应当对具有意外编辑事件的变体进行详细分析，因为这可以为设计更具体的向导和化学修饰的战略定位提供信息。
[0222]
为了解释在dna水平上(在靶序列或向导rna内)由a至g突变引起的伪编辑事件，将cdna文库与平行测序的质粒dna文库交叉引用。从每个反义变体的相应编辑水平中减去在dna文库中观察到的a至g突变率。对dna文库进行测序还可以允许区分以g突变为特征的真
实反义变体和反义区中罕见的a至g编辑事件，因为cdna和dna文库之间这种变体的相对显示不同。
[0223]
可以通过本文所述的平台(诸如实施例3中所述的方法)选择和/或优化的示例性向导rna变体(即aso)如下图和表中所示。
[0224]
图16示出靶向idua w402x的示例性发夹构建体(包括募集结构域、靶序列和向导反义寡核苷酸)，其可以通过本文所述的方法产生，特别是如实施例3所述的方法。
[0225]
图17示出了示例性工作流程，如本文所述，并且特别是如在实施例3中所述。
[0226]
图18是条形图，示出与原型构建体相比，约1％的反义寡核苷酸变体增加了靶位点的编辑。
[0227]
图19示出与原型相比含有修饰的反义寡核苷酸变体。
[0228]
图20示出通过sanger测序(右下)在筛选(左下)中鉴定的高度编辑的变体的验证；还示出了原型序列(左上)和相应的编辑水平(右上)。
[0229]
实施例4
[0230]
具有增强的编辑效力的grna变体的分类
[0231]
根据本文所述的方法，鉴定了增强编辑效率的各种类型的突变。特别地，通过筛选靶向人idua w402x突变的》20000个构建体，鉴定出以下增强靶aso融合文库编辑的特征。我们还成功地将筛选方法应用于》10个其他目标治疗靶标。
[0232]
类别1：募集结构域突变。由于募集结构域构成了向导rna的靶标-独立部分，因此如下改进应当是普遍适用的。合适的突变包括用watson-crick或摇摆碱基对替换原始募集结构域中的错配(图21)。其他合适的突变包括环序列突变。对1024个可能的五环序列中的1015个进行了筛选，揭示了44-95％的编辑值范围。最高度编辑的序列的前10％示出富u序列的强富集，尤其是在第3和第4环位置(图22)。
[0233]
表1-3中列出了具有类别1突变的向导序列的实施例。
[0234]
表1.具有最高编辑水平的募集结构域环的前10％序列。募集结构域茎和反义区保持恒定。
[0235]
[0236]
[0237]
[0238][0239]
表2.具有募集结构域茎的5
′
链的优化序列的向导序列的实施例。示出了在原型设计之上编辑水平变化大于5％的序列(图23a；67.3％的编辑)，并指示了相对于原型序列的序列变化(编号见图23a)。募集结构域的3
′
链、环和反义区保持恒定。
[0240]
[0241][0242]
表3.具有募集结构域茎的3
′
链的优化序列的向导序列的实施例。示出了在原型设计之上编辑水平变化大于5％的序列(图23b；63.0％的编辑)，并指示了相对于原型序列的序列变化(编号见图23b)。募集结构域的5
′
链、环和反义区保持恒定。
[0243]
[0244]
[0245][0246]
类别2：靶标:反义双链体错配。反义区中的错配和摇摆碱基对可以增强idua w402x靶标的编辑(表4-6)。某些错配或其组合富含于反义变体，可进行最有效的编辑(图19)。相对于编辑位点的有益错配的位置似乎与靶标:反义双链体和募集结构域的长度变化无关，诸如当靶标:反义双链体向上游或下游延伸5bp时(图23d，e)。当hidua编辑位点向5
′
端移动5bp时，或当募集结构域被下游idua序列替换时，相同的有益错配位置(相对于靶位点)持续存在。
[0247]
单个向导特征的组合，诸如反义区中的错配和募集结构域环的置换的组合，或者反义区中的若干错配的组合倾向于对编辑具有加合效应(图24)。在反式向导中，这些加合效应应当与多个突变对向导/靶标结合的潜在不稳定效应相平衡。
[0248]
表4.具有优化反义结构域的向导序列的实施例。示出了在原型设计(63.0％)之上编辑水平变化大于5％的序列，并指示了相对于原型序列的序列变化(编号见图23c)。募集结构域保持恒定。只示出了生物重复之间的相对标准偏差不超过5％的变体。
[0249][0250]
表5.具有来自文库的优化反义序列的引导序列的实例，其中靶反义双链体在靶序列的5
′
端延伸了5bp。示出了在原型设计之上编辑水平变化大于5％的序列(图23d；以56.6％编辑)，并指示了相对于原型序列的序列变化(编号见图23d)。募集结构域保持恒定。
[0251]
[0252]
[0253]
[0254]
[0255][0256]
表6.具有来自文库的优化反义序列的向导序列的实施例，其中靶反义双链体在靶序列的3
′
端延伸了5bp。示出了在原型设计之上编辑水平变化大于5％的序列(图23e；以56.0％编辑)，并指示了相对于原型序列的序列变化(编号见图23e)。募集结构域保持恒定。
[0257]
[0258]
[0259]
[0260]
[0261]
[0262]
[0263]
[0264]
[0265][0266]
参考文献
[0267]
71buenrostro,j.d.,araya,c.l.,chircus,l.m.,layton,c.j.,chang,h.y.,snyder,m.p.,and greenleaf,w.j.(2014).quantitative analysis of rna-protein interactions on a massively parallel array reveals biophysical and evolutionary landscapes.nat biotechnol 32,562-568.
[0268]
72kivioja,t.,vaharautio,a.,karlsson,k.,bonke,m.,enge,m.,linnarsson,s.,and taipale,j.(2011).counting absolute numbers of molecules using unique molecular identifiers.nat methods 9,72-74.
[0269]
32merkle,t.,merz,s.,reautschnig,p.,blaha,a.,li,q.,vogel,p.,wettengel,j.,li,j.b.,and stafforst,t.(2019).precise rna editing by recruiting endogenous adars with antisense oligonucleotides.nat biotechnol37,133-138.
[0270]
49wong,s.k.,sato,s.,and lazinski,d.w.(2001).substrate recognition by adar1 and adar2.rna 7,846-858。

技术特征：
id no:2具有至少50％序列同一性的核苷酸序列。21.根据权利要求20所述的融合构建体，其中所述所述反义结构域包含表5或表6中所述的序列。22.一种载体，其包含前述权利要求中任一项所述的融合构建体。23.前述权利要求中任一项所述的融合构建体或权利要求22所述的载体，其用于选择用于定点rna编辑的向导rna的高通量筛选方法。24.一种用于选择用于定点rna编辑的向导rna高通量筛选方法，所述方法包括：a.产生多个融合构建体，每个融合构建体包含靶序列和向导rna序列，其中所述向导rna序列包含与所述靶序列基本互补或完全互补的反义结构域；b.在不同的细胞群中表达所述多个融合构建体中的每一个；和c.确定融合构建体是否诱导从表达所述融合构建体的细胞群中分离的核酸中的一种或多种修饰。25.根据权利要求24所述的方法，其中，细胞表达内源性作用于rna的腺苷脱氨酶(adar)和/或至少一种工程化adar融合蛋白。26.根据权利要求24或权利要求25所述的方法，其中所述向导rna序列进一步包含募集结构域，所述募集结构域募集内源性作用于rna的腺苷脱氨酶(adar)和/或工程化adar融合蛋白。27.根据权利要求26所述的方法，其中，所述募集结构域包含彼此基本互补或完全互补的第一链和第二链。28.根据权利要求24至27中任一项所述的方法，其中所述融合构建体进一步包括环序列，使得所述构建体形成茎环二级结构。29.根据权利要求28所述的方法，其中，所述环序列包含3-50个核苷酸。30.根据权利要求29所述的方法，其中，所述环序列包含5个核苷酸。31.根据权利要求30所述的方法，其中，所述环序列包含表1中所述的核苷酸序列。32.根据权利要求28至31中任一项所述的方法，其中所述反义结构域和所述靶序列通过所述环序列连接。33.根据权利要求28至31中任一项所述的方法，其中所述募集结构域的所述第一链和所述第二链通过所述环序列连接。34.根据权利要求24至33中任一项所述的方法，其中所述向导rna序列包含所述反义结构域中的一个或多个突变，其破坏所述反义结构域和所述靶序列之间在至少一个核苷酸位置的碱基配对。35.根据权利要求27至34中任一项所述的方法，其中所述向导rna序列包含所述募集结构域的所述第一链和/或所述第二链中的一个或多个突变，其破坏所述第一链和所述第二链之间在至少一个核苷酸位置的碱基配对。36.根据权利要求35所述的方法，其中，所述第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列。37.根据权利要求36所述的方法，其中，所述第一链包含与seq id no:3具有至少80％序列同一性的核苷酸序列。38.根据权利要求36或权利要求37所述的方法，其中所述第一链包含表2中所述的核苷
酸序列。39.根据权利要求27至38中任一项所述的方法，其中所述第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列。40.根据权利要求39所述的方法，其中，所述第二链包含与seq id no:4具有至少80％序列同一性的核苷酸序列。41.根据权利要求39或权利要求40所述的方法，其中所述第二链包含表3中所述的核苷酸序列。42.根据权利要求24至41中任一项所述的方法，其中所述靶序列源自需要定点a至i的rna编辑的基因。43.根据权利要求42所述的方法，其中，所述基因包含点突变，其中所述点突变是g至a点突变、t至a点突变或c至a点突变。44.根据权利要求43所述的方法，其中，所述点突变与表达所述基因的受试者的疾病或病症的发展有关。45.根据权利要求43或权利要求44所述的方法，其中所述点突变存在于靶序列中。46.根据权利要求45所述的方法，其中，确定融合构建体是否诱导从表达所述融合构建体的细胞群中分离的核酸中的一种或多种修饰包括对分离的核酸进行测序。47.根据权利要求46所述的方法，其中，所述分离的核酸包括rna。48.根据权利要求46或权利要求47所述的方法，其中所述从细胞群分离的核酸中的一种或多种修饰包括对最初存在于所述靶序列中的点突变的纠正。49.根据权利要求48所述的方法，其中，所述点突变的纠正表明所述向导rna序列有效地诱导定点rna编辑。50.根据权利要求24至49中任一项所述的方法，其中所述靶序列包含与gagcagcucuaggccgaa(seq id no:1)具有至少80％序列同一性的核苷酸序列，其中相对于seq id no:1第11位的核苷酸是腺嘌呤(a)。51.根据权利要求24至50中任一项所述的方法，其中所述反义结构域包含与seq id no:2具有至少50％序列同一性的核苷酸序列。52.根据权利要求51所述的方法，其中，所述所述反义结构域包含表5或表6中所述的序列。53.根据权利要求24至52中任一项所述的方法，其中所述方法鉴定所述向导rna序列的一个或多个优化特征，其使所述向导rna序列在从表达所述融合构建体的细胞群中分离的核酸中诱导一种或多种修饰。54.根据权利要求53所述的方法，其中，所述优化特征选自反义结构域、环序列和募集结构域，如果存在于所述向导rna中的话。55.一种用于定点rna编辑的方法，所述方法包括：a.通过权利要求23至54中任一项所述的方法选择向导rna；和b.将包含所述向导rna的构建体递送至细胞或受试者。56.根据权利要求55所述的方法，其中，所述细胞是哺乳动物细胞，或者其中所述受试者是哺乳动物。57.一种用于定点rna编辑的向导rna，其中所述向导rna包括：
a.与靶基因序列基本互补或完全互补的反义结构域；和b.募集内源性作用于rna的腺苷脱氨酶(adar)和/或工程化adar融合蛋白的募集结构域，其中所述募集结构域包含彼此基本互补或完全互补的第一链和第二链，并且其中所述第一链和所述第二链通过环序列连接。58.根据权利要求57所述的向导rna，其中所述环序列包含3-50个核苷酸。59.根据权利要求58所述的向导rna，其中所述环序列包含5个核苷酸。60.根据权利要求59所述的向导rna，其中所述环序列包含表1中所述的核苷酸序列。61.根据权利要求57至60中任一项所述的向导rna，其中所述第一链包含与seq id no:3具有至少50％序列同一性的核苷酸序列。62.根据权利要求61所述的向导rna，其中所述第一链包含与seq id no:3具有至少80％序列同一性的核苷酸序列。63.根据权利要求61或权利要求62所述的向导rna，其中所述第一链包含表2中所述的核苷酸序列。64.根据权利要求57至63中任一项所述的向导rna，其中所述第二链包含与seq id no:4具有至少50％序列同一性的核苷酸序列。65.根据权利要求64所述的向导rna，其中所述第二链包含与seq id no:4具有至少80％序列同一性的核苷酸序列。66.根据权利要求64或权利要求65所述的向导rna，其中所述第二链包含表3中所述的核苷酸序列。67.根据权利要求57至66中任一项所述的向导rna，其中所述靶基因序列存在于含有w402x置换突变的人idua基因的一部分中。68.根据权利要求67所述的向导rna，其中所述靶基因序列包含seq id no:5。69.根据权利要求66或权利要求67所述的向导rna，其中所述反义结构域包含与seq id no:2具有至少50％序列同一性的核苷酸序列。70.根据权利要求69所述的向导rna，其中所述所述反义结构域包含表5或表6中所述的序列。71.根据权利要求57至70中任一项所述的向导rna，用于治疗赫尔勒综合征的方法。

技术总结
本发明涉及鉴定用于定点RNA编辑的向导RNA的方法。特别地，本发明涉及一种用于鉴定有效用于定点A至I RNA编辑的向导RNA的高通量筛选方法，以及所鉴定的向导RNA的使用方法。以及所鉴定的向导RNA的使用方法。以及所鉴定的向导RNA的使用方法。

技术研发人员：进
受保护的技术使用者：小利兰
技术研发日：2021.10.21
技术公布日：2023/9/20

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

用于募集ADAR的向导RNA的筛选平台的制作方法

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

用于募集ADAR的向导RNA的筛选平台的制作方法

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表