一种基于多聚单核苷酸多态性的猪10K液相芯片及其应用
未命名
07-23
阅读:157
评论:0
一种基于多聚单核苷酸多态性的猪10k液相芯片及其应用
技术领域
1.本发明涉及生物育种领域,具体涉及基于多聚单核苷酸多态性(multiple dispersed nucleotide polymorphism,msnp)的猪10k液相芯片及其应用。
背景技术:
2.随着分子生物学技术的突飞猛进,以基因组选择技术为核心的生物育种技术在奶牛、猪、鸡、作物、林木和水产生物开始大量研究和应用,带来了畜禽育种的巨大变革,成为推动畜禽育种前进的强大动力。目前,基因组选择也是我国种业振兴计划中大力发展的育种技术。基因组选择的一个前提是对个体进行快速高通量的基因型分型检测,单核苷酸多态性(single nucleotide polymorphism, snp)具有数量庞大,在基因组范围分布广泛、较为方便地进行大规模快速筛查以及基因分型等特点,被认为是目前最佳的分子标记。基因组选择,正是利用覆盖于全基因组的snp标记计算个体的基因组育种值,进而选择优秀个体。随着分子检测技术发展,能够进行高通量基因分型的snp芯片应运而生。
3.理论研究和育种实践表明,包含约5万个snp标记的50k芯片在动物上分子育种效果好,是当前基因组选择的主流。但是动物育种尤其是猪群体规模大,需要对小猪进行早期选择以确定进入性能测定的个体,最终选出优秀的个体进入育种核心群。但小猪早期选择只有父母信息可以利用,来自同一窝的个体由于父母信息相同而无法区分遗传优劣。研究表明,基因组选择可以提高小猪早期选择的准确性,龙生九子,各有不同,通过基因组信息可以挑选出同一窝优秀个体。这就意味着需要对小猪进行大规模的基因型检测,以1000头基础母猪的育种场为例,若实现理想的基因组选择效果,每年需要检测的小猪至少2.2万头,固相芯片50k 和液相50k分别需要396万和297万,虽然液相已大大降低了芯片检测费用,但仍然是一笔很大的负担,这极大限制了我国生猪分子育种的实施。有的企业为了节省成本,仅检测少量个体,带有很大的随机性,育种效果大打折扣。如果采用低密度芯片如10k(含1万个左右标记)进行早期检测,由于价格低廉,可极大降低早期选择基因型检测的成本。同时,利用基因型填充技术可以将10k芯片标记基因型填充至50k芯片,且准确性高,仍然能够保证小猪早期选择的准确性与用50k芯片检测一样。
4.但当前猪育种中,还没有商业化的10k芯片,发明人基于固相芯片技术,开发了猪10k低密度芯片,并获得了专利授权(专利号:zl201711190317.6,含8846个标记)。但是由于固相芯片灵活性差、样本量要求严格(需是12或24的倍数)、定制成本高等缺点,影响了该芯片的大规模使用。与固相芯片不同,基于靶向测序基因型检测(genotyping by target sequencing,gbts)技术的液相芯片,具有标记增减方便、无样本量要求、定制成本低等优点。图1显示了gbts技术主要对靶位点及其上下游进行多重测序,保证靶位点基因型分型质量。另外,液相芯片在对靶位点基因型检测同时,靶位点上下游的多态位点也能够得到基因型分型,称之为多聚单核苷酸多态性(multiple singlenucleotide-polymorphism cluster, msnp或multiple dispersed nucleotide polymorphism,mnp)。对于连锁不平衡程度中等的msnp,靶位点上下游的标记可以提供额外的信息。因此,多聚单核苷酸多态性技
术,在不增加靶位点snp和检测成本的前提下,显然可以增加更多有效msnp标记,提高液相芯片的信息含量,充分利用gbts技术特点,这是固相芯片技术做不到的。
技术实现要素:
5.因此,本发明在已开发的猪9k固相snp芯片基础上(专利号:zl201711190317.6),结合猪基因组特点,利用多聚单核苷酸多态性技术,优化靶位点探针设计,开发了基于多聚单核苷酸多态性的猪10k液相芯片(简称10k液相芯片),用于猪基因组育种,降低猪分子育种成本。
6.本发明开发了猪10k液相芯片,同时提供了芯片靶位点snp标记筛选和探针制备方法,利用本发明设计的芯片能够节省猪基因组选择成本,并且能够最大限度地利用靶位点上下游msnp标记信息,提高猪遗传分析和分子育种效率。
7.具体来说,本发明的目的在于提供以下方面:第一方面,提供一种snp标记筛选和探针制备的方法。基于杜洛克、大白、长白三个猪品种全基因组测序数据(11.1参考基因组版本),挖掘并筛选10200个靶位点snp,再依据探针设计原则,针对靶位点snp设计探针并优化,最终设计15572个探针。
8.其中,所述方法包括以下步骤:步骤一:靶位点snp标记筛选
9.(1)初步筛选的靶位点snp标记。参照zl201711190317.6中描述的方法,基于杜洛克、大白、长白三个猪品种全基因组测序数据,比对至猪11.1参考基因组,依据标记间距和基因功能注释挑选标记筛选靶向捕获位点,即靶位点snp,靶位点snp筛选的原则是:
①
各染色体上分布均匀、各染色体两端分布较密;
②
标记间距大于280kb;
③
生长、繁殖、饲料报酬、肉质、体尺性状重要候选位点;
④
qtldb数据库比对,snp标记尽量落在经济性状qtl区域。得到如zl201711190317.6中所述的标记数8846个标记作为靶位点。
10.(2)靶位点snp补充和优化。在初筛基础上,补充和优化多态性高、区域连锁不平衡程度中等的标记,原则如下:
①
多态性主要考虑杜洛克、长白猪、大白猪中maf》0.35;
②
与上下游snp标记平均连锁不平衡程度r2低于0.85。
11.在9k固相芯片标记间距大于280kb(9k固相芯片平均间距279kb)的区域,挑选符合上述snp原则的标记,补充和优化靶位点靶位点snp,相对于猪9k固相snp芯片一共增加了2243个符合要求的靶位点snp。
12.步骤二:根据靶位点snp设计探针
13.利用多聚单核苷酸多态性检测技术优化和设计探针,以每个靶位点snp为核心,设计1-4个110bp长度探针,每个探针覆盖靶位点,以靶位点为核心的探针总覆盖165bp长度区间。探针设计的原则是:1)选取探针含量在30%-80%之间的;2)选取同源性区域个数≤5的;3)选取探针区域不包含ssr、n区域的。
14.步骤三:通过对探针多重测序和杂交,挑选含高质量msnp的探针,优化探针
15.对探针进行测序和杂交,检测靶位点在内的msnp基因型分型质量,设定缺失率na《0.1,最小等位基因频率maf》=0.05, 杂合度het 《0.5作为标准筛选msnp,去掉不符合要求的msnp, 若探针没有符合基因型质控要求的msnp, 删去该探针和靶位点snp。符合质检要求的msnp,最终作为10k msnp液相芯片位点。
16.其中,所述方法中步骤三设计的探针有助于保证同一靶位点snp下,实现msnp标记(含靶位点)检测数量和质量最优。
17.按照上述探针和靶位点snp质量要求(缺失率na《0.1,最小等位基因频率maf》=0.05, 杂合度het 《0.5),9k固相芯片有1089个靶位点snp不符合要求,加以删除,新增的2443个靶位点snp及msnp符合要求。本发明最终包含10200个靶位点snp,15572个探针。
18.通过上述可见,本发明筛选的靶位点snp是以9k为基础的优化和更新,剔除了猪9k固相snp芯片中探针质量不高,探针上下游区间msnp标记数少的靶位点snp,而在猪9k固相snp芯片中的标记间距大于280kb的区间内增加新的靶位点。
19.第二方面,根据第一方面设计的15572个探针,本发明将合成后的猪10k探针进行等摩尔质量混合,利用edta和tris-hcl混合液定容为3 pmol/ml的猪10k探针混合液,用于后期探针测序和杂交,称之为msnp液相芯片。
20.步骤一:探针准备。将上述合成后的猪10k探针进行等摩尔质量混合,利用edta和tris-hcl混合液定容为3 pmol/ml的猪10k探针混合液。
21.步骤二:探针杂交液配制。根据文库类型,本发明采用pooled, barcoded library,genobaits block i, genobaits block ii for ilm/mgi,本发明探针进行猪10k探针杂交液的配制,用于后续dna文库杂交捕获。
22.第三方面,利用第二方面的液相芯片,检测猪只个体基因型。
23.其中,所述方法包括以下步骤:步骤一:猪样本获得与基因组dna提取;步骤二:猪cdna文库构建;步骤三:用本发明的探针与文库进行杂交、测序;步骤四:按测序数据操作流程,对msnp基因型分型,完成个体所有液相芯片标记位点的基因型判定。
24.与现有技术相比,本发明提供的猪10k液相芯片的开发具备以下有益效果:本发明提供了基于靶向捕获测序进行基因分型的猪snp 10k液相芯片探针,探针设计考虑了捕获的snp位点在全基因组的分布情况、位点多态性、msnp标记质量等问题。在杜洛克、长白猪、大白猪群体中靶位点maf要求大于0.35,有效地避免了简化基因组测序分型技术可能导致的标记密度不均匀和多态性较差等问题。
25.本发明考虑了同一靶位点探针内(1-4个)msnp标记间连锁不平衡问题,在保持液相芯片设计基本原则下,产生更多分型质量高、在探针区域内与靶位点snp连锁不平衡中等的msnp,增加探针区域内snp标记的整体多态性,使可检测的snp数目扩大到位点数的1.5-2倍以上。解决了传统液相芯片高质量和有效msnp标记较少的问题,且成本没有增加。
26.本发明有助于在保持基因组选择准确性的同时,降低猪基因组选种成本。相比当前主流的50k芯片,本发明检测费用是50k固相芯片的1/3,50k液相芯片的1/2。本发明考虑了与50k固相芯片和50k液相芯片的兼容,可通过基因型填充技术,将10k液相芯片基因型数据填充至50k芯片,准确性高。填充后的基因型数据用于基因组选择,能够取得与50k芯片一样的基因组选择准确性,大大节省了分子育种成本,可大规模用于基因组育种。
附图说明
27.图1固相芯片和液相芯片技术示意图。
28.图2 猪10k msnp液相芯片靶位点(深灰)和msnp(浅灰色)各染色体数量分布。
29.图3 10k msnp液相芯片靶位点(a)以及包含靶位点的所有msnp(b)的染色体密度分布。
30.图4 基因型质控后的10k液相芯片靶位点snp和msnp标记数。
31.图5 质控后靶位点(a)和所有msnp(含靶位点)(b)各染色体分布情况。
32.图6 10k液相芯片基因型填充到50k时不同染色体(a)和maf区间(b)的填充准确性。
具体实施方式
33.下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
34.实施例1:本发明所需的snp标记筛选方法和探针制备步骤一:靶位点snp标记筛选。
35.(1)初步筛选的靶位点snp标记。参照zl201711190317.6中描述的方法,基于杜洛克、大白、长白三个猪品种全基因组测序数据,比对至猪11.1参考基因组,依据标记间距和基因功能注释挑选标记筛选靶向捕获位点,即靶位点snp。靶位点snp筛选的原则是:
①
各染色体上分布均匀、各染色体两端分布较密;
②
标记间距大于280kb;
③
生长、繁殖、饲料报酬、肉质、体尺性状重要候选位点;
④
qtldb数据库比对,snp标记尽量落在经济性状qtl区域。得到如zl201711190317.6中所述的标记数8846个标记作为靶位点。
36.(2)靶位点snp补充和优化在初筛基础上,补充和优化多态性高、区域连锁不平衡程度中等的标记,原则如下:
①
多态性主要考虑杜洛克、长白猪、大白猪中maf》0.35;
②
与上下游snp标记平均连锁不平衡程度(r2)低于0.85。
37.在9k固相芯片标记间距大于280kb(9k固相芯片平均间距279kb)的区域,挑选符合上述snp原则的标记,补充和优化靶位点snp,一共增加了2243个符合要求的靶位点snp。
38.步骤二:根据靶位点snp设计探针。
39.利用多聚单核苷酸多态性检测技术优化和设计探针,以每个靶位点snp为核心,设计1-4个110bp长度探针,每个探针覆盖靶位点,以靶位点为核心的探针总覆盖165bp长度区间。探针设计的原则是:1)选取探针含量在30%-80%之间的;2)选取同源性区域个数≤5的;3)选取探针区域不包含ssr、n区域的。
40.步骤三:通过对探针多重测序和杂交,挑选含高质量msnp的探针,优化探针。
41.对探针进行杂交和测序,检测靶位点snp和上下游探针覆盖范围内msnp基因型分型质量,设定缺失率na《0.1, 最小等位基因频率maf》=0.05, 杂合度het 《0.5作为标准筛选msnp,去掉不符合要求的msnp, 若探针没有符合基因型质控要求的msnp, 删去该探针和相应的靶位点snp。符合质检要求的snp,最终作为10k msnp液相芯片靶位点。
42.猪9k固相芯片采用固相芯片技术,只考虑靶位点snp的基因型检测质量,不考虑靶位点snp上下游的msnp质量,有1089个靶位点不符合探针质量和msnp筛选标准,进行了删
除。新补充的2443个靶位点snp全部符合探针和msnp质量要求。本发明开发的猪10k msnp液相芯片靶位点数为10200个,设计15572根探针。表1展示了各染色体上9k固相芯片删除和新增靶位点snp数。且本发明采用了多聚单核苷酸多态性技术,每个靶位点snp200bp区域内有多个msnp,15572根探针产生高质量msnp总数约20580个。靶位点和msnp位点(含靶位点)在各染色体分布见图2。
43.表1各染色体上9k固相芯片删除和新增靶位点snp数。
44.实施例2:10k液相芯片的制备本实施例用来展示本发明10k液相芯片的制备流程。具体如下:步骤一:探针准备根据实施例1确定合成猪10k探针,并进行等摩尔质量混合,利用edta和tris-hcl(te缓冲液)混合液定容,配制成3pmol/ml的猪10k探针混合液,用于后期测序和杂交。
45.1.te缓冲液的配制1
×
tebuffer组成浓度:10mmtris-hcl1mm edta,ph=8.0配制量:500ml配制方法:量取下列溶液于500ml烧杯中
1m tris-hcl buffer ph=8.0,5ml0.5m edta ph=8.0, 1ml向烧杯中加入约400mldd h2o均匀混合;将溶液定容到500ml后,高温高压灭菌;室温保存.2.利用配制好的te缓冲对猪10k探针定容,配制成3 pmol/ml的猪10k探针混合液,用于后期测序和杂交。
46.步骤二:探针杂交液配制1.根据文库类型,将下述试剂混合于1.5ml的pcr管中,组成成分及容量:;2.利用真空浓缩仪在≤60℃的温度下浓缩至全干;3.浓缩完成后需将进行12000rpm离心1min,所制备探针可在在室温(15-25℃)下过夜储存用于后续dna文库杂交捕获。
47.实施例3、10k液相芯片的使用和检测方法本实施例用来展示本发明的10k液相芯片进行基因型检测的操作流程。具体如下:步骤一:猪样本获得与基因组dna提取。
48.选取某种猪场133头大白、长白猪,对耳组织进行基因组dna的提取。具体方法如下:1. 将适量乙醇脱水的猪耳组织剪碎放到96深孔板中(量小的话可以使用2.0ml离心管),加1个5mm钢珠,液氮冷冻后,利用研磨仪研磨1-2min。
49.2. 加入 500 ul buffer pl2 、5 ul蛋白酶 k(目前实验室使用的已稀释的蛋白酶 k)到上述深孔板中。盖紧胶盖,利用振荡器振荡混匀。
50.3. 放入 65℃水浴 30min,水浴中间取出颠倒混匀。
51.4. 加入 500 ul酚氯仿异戊醇到深孔板中,用振荡器或移液器上下吹打充分混匀,静置 5min。
52.5. 4000 转离心 10 min,转移 400ul 上清液到新的 96 孔深孔板中。(注意一定不要吸到中间沉淀)。
53.6. 加入 800ul pw 溶液,充分混匀。
54.7. 将步骤 6 中的上清液分两次转移至 96 孔离心柱中,真空抽滤。
55.8. 向 96 孔离心柱中加入 600ul wb i,室温放置 2min,真空抽滤。(确认在 wb i 中已按瓶上指定的体积加入无水乙醇)。
56.9. 向 96 孔离心柱中加入 600ul wb ii,真空抽滤。(确认在 wb ii 中已按瓶上指定的体积加入无水乙醇)。
57.10. 向 96 孔离心柱中加入 600ul wb ii,真空抽滤。
58.11. 将 96 孔离心柱放入一个空的收集板中,4000 转离心 5 min。将 96 孔离心柱放置于新96 孔 pcr 板上,室温晾干。
59.12. 96 孔离心柱中加 60~100ul 65℃预热 te,室温放置 2 min,4000rpm 离心 5 min(将te 预热到 65℃有利于提高 dna 的洗脱效率糖凝胶电泳检测目的片段长度)。
60.步骤二:猪cdna文库构建。
61.1. 探针混合液a) 在 pcr 管中采用本发明的试剂配制如下反应:dna1ng-200ng,genobaits末端修复缓冲液4 μl,genobaits末端修复酶3.1 μl,添加无核酸酶水至20 μlb) 将反应体系轻轻混匀后,短暂离心将反应液收集至管底。
62.c) 将反应管置于 pcr 仪中,进行以下反应,37℃20 min,72℃,20 min,然后于 4
ꢀ°
c保持。完成后设置热盖温度为82℃:2. 接头连接a) 在步骤1的反应体系中直接加入以下组分:genobaitsultradna连接酶2μl,genobaitsultradna连接酶缓冲液8μl,genobaits adapter for mgi2μl,添加无核酸酶水8μl至总体积为20 μl。
63.b) 将反应体系轻轻混匀后,短暂离心将反应液收集至管底。
64.注:体系一定要充分混匀,否则可能导致建库失败。
65.c) 将反应管置于 pcr 仪中,进行以下反应程序:22℃60 min, 4
ꢀ°
c保持,完成后取消热盖:3. dna纯化a)将genoprep dna clean beads提前取出,室温平衡30min以上,使用前振荡混匀。
66.b) 在步骤2的连接体系加入48 μlgenoprep dna clean beads,震荡混匀,尽量不要产生气泡,静置5min后,短暂离心将液体收集至管底。
67.c) 置于磁力架上至少3min,直至溶液澄清,移除上清。
68.d) 保持 pcr 管处于磁力架中,加入 100μl 80%乙醇。室温孵育 30秒,移除上清。
69.e) 保持 pcr 管处于磁力架中,开盖晾 5分钟,直至乙醇挥发干。
70.f) pcr 管从磁力架中取出,用步骤四的 pcr 体系重悬磁珠。
71.4. 文库扩增起始量1ng-10ng时,推荐扩增循环数为8;起始量10ng-100ng时,推荐扩增循环数为6-8;起始量100ng及以上时,推荐扩增循环数为6。
72.a)在新管中配制以下反应:genobaits pcr master mix10μl、i5 barcode(10μm)-mgi1μl、i7 barcode(2μm)-mgi5μl、添加无核酸酶水4μl至总体积为20 μl。
73.b) 将上述体系加入到步骤三晾干的磁珠中,将磁珠重悬后,短暂离心将反应液收集至管底。
74.c) 将反应管置于 pcr 仪中,进行以下反应:
。
75.5. 纯化a) 在步骤4的体系加入20μl genoprep dna clean beads,震荡混匀,尽量不要产生气泡,静置5min后,短暂离心将液体收集至管底。
76.b) 置于磁力架上至少3min,直至溶液澄清,移除上清。
77.c) 保持 pcr 管处于磁力架中,加入 100μl 80%乙醇。室温孵育30秒,移除上清。
78.d) 保持 pcr 管处于磁力架中,开盖晾10分钟。
79.e) 将 pcr管从磁力架中取出,加入35μl tris-hcl,震荡混匀,静置5min后,短暂离心将液体收集至管底。
80.f) 磁力架上,待溶液澄清(约3分钟),将上清移至新管,-20℃保存。
81.g) 文库需进行进一步的文库质量检测(如浓度测定与分布测定),以应用于上机或下一步的实验。
82.步骤三:猪基因组片段与本发明探针杂交,样品pcr与纯化,进行测序。
83.1、利用混合好的本发明探针,在室温(15-25℃)下融化,混合均匀并短暂离心2、genobaitsblock ii、genobaitsblocka) 根据文库类型,将下述试剂混合于1.5 ml的pcr 管中:混合文库0.6-1μg、genobaitsblock i5 μg(5 μl)、genobaitsblock ii for ilm/mgi2μl、本发明探针300ng。
84.b) 利用真空浓缩仪在≤60℃的温度下浓缩至全干;c) 浓缩完成后需将进行12000rpm离心1min再进行后续操作。
85.3、 dna文库杂交捕获a)在室温下溶解所有的genobaits杂交试剂;b) 将试剂加入试管;c) 吸打或涡旋混匀,12000rpm离心1min,室温放置5min,再次吸打或涡旋混匀,轻微离心,将混合 mix全部转移至0.2mlep管中;d) 热循环孵化条件95℃ 10min (热盖温度105℃);e) 待 pcr 扩增仪降温至 65
°
c时,转移至另一热盖温度为 75
°
c pcr 仪中。备注:若实验需要可进行65℃过夜杂交,(14-16h) *65℃杂交温度有助于提高捕获率4、准备洗脱液(wash buffer)单一捕获体系,稀释genobaits buffers到1
×ꢀ
的体系。
86.*1
×
体系室温可保存4周
87.*10
×
wash bufferⅰ及10
×ꢀ
s-w buffer常温下会有沉淀,可放于65℃下,沉淀可溶解。
88.5、准备genobaits dna probe beadsa) genobaits probe beads使用前室温放置10 min;b) 涡旋振荡15s混匀;c) 一个反应准备50 μl的genobaits probe beads 放入0.2ml的ep管中;d) 试管放在磁力架上,让磁珠与溶液彻底分离。
89.e) 去除上清,保留磁珠f) 洗脱,每个反应加150 μl的genobaits 1x bead wash buffer ,涡旋振荡10s,试管转移至磁力架上,磁珠与溶液完全分离,去上清。
90.g) 重复上述第6步两次,共洗3次。
91.6、杂交片段与genobaits dna probe beads结合a) 将杂交液16 μl(全部)转移至准备好的beads中b) 涡旋震荡10s充分混匀,离心5s。
92.c) ep管放入pcr仪中,65℃,45min,热盖温度75℃(dna与磁珠结合)每12min,震荡5s7、洗脱去除未结合的dna(用步骤4中的1
×ꢀ
wash buffer)a) 准备65℃洗脱液(在pcr仪上完成)b) 准备室温洗脱液c) 重悬磁珠,悬液用于步骤8,剩余10μl留作备份。
93.8、pcr富集a) 根据文库类型,在0.2ml的pcr管中配备pcr试剂b) 简短涡旋,离心,保证磁珠仍在溶液中c) 将pcr管放入pcr仪中,热盖温度105℃,进行pcr扩增9、 pcr产物纯化a) 每个 pcr 反应中加入 45μl(1.5x volume)genoprep dna clean beads,震荡混匀,尽量不要产生气泡,静置5min后,短暂离心将液体收集至管底。
94.b) 置于磁力架上至少3min,直至溶液澄清,移除上清。
95.c) 保持 pcr 管处于磁力架中,加入 100μl 80% 乙醇。室温孵育 30秒,移除上清。
96.d) 保持 pcr 管处于磁力架中,开盖晾 10 分钟。
97.e) 将 pcr 管从磁力架中取出,加入 35μl tris-hcl,震荡混匀,静置5min后,短暂离心将液体收集至管底。
98.f) 磁力架上,待溶液澄清(约 3 分钟),将上清移至新管,-20 度保存。
99.g) 文库需进行进一步的文库质量检测(如浓度测定与分布测定),以应用于上机或下一步的实验。
100.10、文库检测a) 用qubits fluorometer和qubit dsdna hs assay kit测量文库b) 测量数字电泳系统上捕获dna文库片段的平均长度c) 用kapa library quantification kit测量文库浓度11、测序按测序仪要求操作。对靶位点snp的平均测序深度为105.88x。
101.步骤四:msnp基因型分型按测序数据处理流程获得所有msnp位点基因型。具体步骤如下:1、利用trimmomatic软件去除接头和低质量reads。
102.2、使用bwa软件将每个个体的reads比对到猪参考基因组sscrofa11.1 (gca_000003025.6);3、使用samtools生成bam和排序后的bam文件;4、使用gatk pipeline生成含有所有msnp(含靶位点snp)的vcf文件。
103.实施例3展示了本发明液相芯片使用操作流程,实施例4则对猪场样本评测液相芯片基因型检测质量。
104.实施例4:猪10kmsnp液相芯片基因型分型质量评测采集来自猪场133头长白和大白猪血样,按实施例3采用本发明进行基因型检测,对本发明msnp标记质量进行评测。
105.1、靶位点和msnp标记数统计根据133头猪样品10k芯片基因型检测结果统计,实际测定如本发明所示,10kmsnp液相芯片共有靶snp位点10200个,经过基因型分型后,一共有20585个snp,包含10200个靶位点snp和其所在探针的msnp标记(10385个)。表明本发明设计的msnp液相芯片能够大幅增加snp数,较之仅考虑靶位点的固相芯片,能够在在不增加测序成本的情况下大幅提高有效snp标记数。
106.2、靶位点和msnp标记各染色体分布密度统计图3 中a和b反映了10k液相芯片靶位点染色体分布与msnp(含靶位点snp)各染色体分布密度,两者分布相似。msnp仅在靶位点snp的基础上提高了snp的密度,并没有改变snp分布的大致情况。表明在实际应用中,msnp的检出符合多聚单核苷酸多态性理论检测技术特征,从而提高有效msnp标记捕获的效率。
107.3、靶位点和msnp标记的缺失率和maf统计133个样本的基因型数据表明,msnp液相芯片中10200个靶位点与额外增加的
10385个msnp的检出率和最小等位基因频率maf几乎没有差异(表2),表明msnp液相芯片对snp数目的增加不会降低芯片数据的质量。
108.表2靶位点snp和msnp基因型质量
109.注:括号内为标准差4、基因型质量控制后,靶位点和msnp标记数统计;基因型质量控制是高通量基因型分型后的常规操作,主要用来剔除基因型检测质量低的标记和个体,用于后续的遗传分析或分子育种。质控步骤通常如下:a) 去除位置未知的位点b) 去除检出率(call rate)低于 90%或缺失率高于10%的 snp;c) 去除最小等位基因频率(maf)低于 0.05 的 snp;d) 去除严重偏离哈代-温伯格平衡(p《10-6
)的 snp。
110.10kmsnp液相芯片靶位点snp和所有msnp标记(包含靶位点)质控后均剔除掉部分snp。质控后msnp标记共有16001个,其中包含8423个靶位点(图4),靶位点不满足质控的,其探针内的msnp也同样不符合质控条件。质控后,msnp标记数仍大约为靶位点的2倍,跟质控前基本相同。靶位点和所有msnp标记各染色体密度分布没有太大变化(图5中a和b),与质控前10k靶位点分布一致(图3中a和b)。表明质控后msnp在不降低数据质量的情况下可以大大提高snp的检测数量,这有助于保留更多的遗传变异。
111.本发明主要为了降低猪分子育种的成本,标记少就意味着成本低,本发明检测费用是50k固相芯片的1/3,50k液相芯片的1/2(zl202110359470.7)。而基因组选择仍以5万个标记的效果较为理想,10k液相芯片主要通过基因型填充技术将其填充至50k芯片的基因型数据。实施例5即是为说明10k 芯片基因型填充到50k 芯片的准确性及基因组选择效果。
112.实施例5:10k msnp液相芯片基因型填充到50k芯片及基因组选择效果本发明对上述133头个体进行本发明液相芯片基因型检测,同时利用申请人已获得的发明50k 液相芯片(zl202110359470.7)进行基因型检测,使得每个个体均具有猪液相10k和液相50k基因型数据。
113.理论研究和育种实践表明,50k芯片兼顾了基因组选择效果和育种成本,应用最为广泛。为了保证10k芯片的基因组选择效果,需要利用基因型填充技术,将10k芯片数据填充到50k芯片基因型数据,因此需要构建一定规模的50k芯片群体作为填充参考群体,进而依据该群体进行10k芯片填充。本实施例用前期研究积累的4126头个体作为参考群,包含长白、大白和杜洛克三个品种,并利用50k液相芯片进行了检测。需要说明的是,基因型填充参考群体不需要太大,通常4000就能保证很高的填充准确性。通过经典的基因型填充软件beagle 4.1按操作指南将133头10k 液相芯片个体填充到50k液相芯片。由于这133头个体也同时进行了50k液相芯片检测(原始50k芯片基因型),计算133头样本每个位点填充50k芯片基因型与原始50k芯片基因型的相关系数,作为填充准确性衡量标准。如图6所示,所有染色体上的位点基因型填充平均准确性为0.964(图6),标记maf低于0.05时,填充准确性较
低,而一般基因型质控时,这些标记都会剔除掉。因此,基因型质控后,10k液相芯片填充至50k液相芯片的准确性会进一步提高至0.98,由于填充错误的标记比例不高,对50k液相芯片的基因组选择准确性没有影响。
114.在133头10k芯片填充至50k芯片的基础上,本实施例进一步选取了更大群体规模的10k液相芯片,将其填充至50k液相芯片,评价基因组选择效果。实施例选取2991头来自同一个猪场的大白个体,其中1199头个体包含生长性状(达100kg体重日龄、100kg体重活体背膘厚)表型记录,804头拥有繁殖性状(总产仔数)表型记录,系谱记录共42281条。所有个体同时用上述的50k液相芯片和本发明10k液相芯片检测。10k液相芯片用上述的4126头50k液相芯片参考群填充至50k芯片基因型数据。分别从有生长和繁殖表型记录的群体中提取198头和108头最年轻的个体作为验证群,剩余群体作为参考群,用经典的一步法gblup(ssgblup)方法估计三个性状的基因组育种值。用验证群个体的性状校正表型值与其估计基因组育种值的皮尔逊相关系数评价基因组选择准确性。结果表明,如表3所示,三个性状使用填充后的芯50k芯片和原始50k芯片的基因组选择准确性没有差异,说明只利用10k液相芯片检测,填充至50k液相芯片,基因组选择效果与仅利用50k液相芯片检测相同。
115.表3. 10k液相芯片填充至50k液相芯片基因组选择准确性
116.基因组选择实施中,需要大量的个体基因型检测,如果用50k液相芯片,则基因型检测费用很高,而通过基因型填充,则只需要一定规模的个体进行50k液相芯片检测,用于基因型填充参考群,更多使用本发明的10k芯片。本发明通过基因型填充技术实现了利用10k液相芯片在不降低基因组选择准确性的前提下,大幅降低基因组选择分子育种成本的目的。解决我国猪分子育种中的一个瓶颈,从而可以大规模实施分子育种,成为我国种业振兴的助推器。
技术特征:
1.一种用于多聚单核苷酸多态性的10k液相芯片的snp标记筛选和探针制备的方法,其以猪品种全基因组测序数据,挖掘并筛选靶位点snp,再针对靶位点snp设计探针并优化,最终得到确定的探针,所述方法包括以下步骤:步骤一、确定靶位点snp:通过下述方式筛选获得靶位点snp作为确定的靶位点snp:(1)初步筛选的靶位点snp标记:基于杜洛克、大白、长白三个猪品种全基因组测序数据,比对至猪11.1参考基因组,依据标记间距和基因功能注释挑选标记筛选靶向捕获位点,即靶位点snp,靶位点snp筛选的原则是:
①
各染色体上分布均匀、各染色体两端分布较密;
②
标记间距大于280kb;
③
生长、繁殖、饲料报酬、肉质、体尺性状重要候选位点;
④
qtldb数据库比对,snp标记尽量落在经济性状qtl区域;如此得到的标记作为靶位点snp;(2)靶位点snp补充和优化:在初筛步骤得到靶位点snp的基础上,补充和优化多态性高、区域连锁不平衡程度中等的标记,原则如下:
①
多态性主要考虑杜洛克、长白猪、大白猪中maf>0.35;
②
与上下游snp标记平均连锁不平衡程度r2低于0.85;步骤二、根据确定的靶位点snp设计探针:利用多聚单核苷酸多态性检测技术,以每个靶位点snp为核心,设计1-4个110bp长度探针,每个探针覆盖靶位点,以靶位点为核心的探针总覆盖165bp长度区间;而探针设计的原则是:1)选取探针含量在30%-80%之间的;2)选取同源性区域个数≤5的;3)选取探针区域不包含ssr、n区域的;步骤三、挑选含高质量msnp的探针并优化探针:对探针进行杂交和测序,检测靶位点在内的msnp基因型分型质量,设定缺失率na<0.1,最小等位基因频率maf>=0.05,杂合度het<0.5,作为标准筛选msnp,去掉不符合要求的msnp,若探针没有符合标准要求的msnp,删去该探针和靶位点,符合质检要求的msnp,最终作为10k msnp液相芯片的靶位点。2.如权利要求1所述的方法,其特征在于,所述猪品种全基因组测序数据是11.1参考基因组;所述靶位点snp筛选的原则是:
①
各染色体上分布均匀、各染色体两端分布较密;
②
多态性考虑杜洛克、长白猪、大白猪中maf>0.35;
③
与上下游snp标记平均连锁不平衡程度r2低于0.85;
④
与qtldb数据库比对,snp标记尽量落在经济性状qtl区域;
⑤
与已知的猪50k芯片的部分位点重叠。3.如权利要求2所述的方法,其特征在于,所述已知的猪50k芯片是50ksnp液相芯片、美国纽勤公司ggp50k或中芯一号。4.一种基于多聚单核苷酸多态性的猪10kmsnp液相芯片,其特征在于,其是基于如权利要求1至3任一项所述方法得到的探针制备而成。5.如权利要求4所述的猪10kmsnp液相芯片,其特征在于,合成所述探针后进行等摩尔质量混合,缓冲液中定容1-5 pmol/ml,然后配制探针杂交液即得。6.如权利要求5所述的猪10kmsnp液相芯片,其特征在于,所述缓冲液是edta和tris-hcl混合液。7.如权利要求5所述的猪10kmsnp液相芯片,其特征在于,进一步包括采用pooled,barcoded library,genobaits block i,genobaits block ii for ilm/mgi配制探针杂交液,其组成如下:pooled,barcoded library
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
0.6 μlgenobaits block i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
5μl
genobaits block ii for ilm/mgi
ꢀꢀꢀ
2μl所述探针
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
300ng。8.如权利要求7所述的猪10kmsnp液相芯片,其特征在于,利用真空浓缩仪在≤60℃的温度下对探针杂交液浓缩至全干。9.一种利用如权利要求4至8任一项所述猪10kmsnp液相芯片检测猪只个体基因型的方法,所述方法包括以下步骤:受检猪样本获得与基因组dna提取;猪cdna文库构建;用所述猪10kmsnp液相芯片与所构建的文库进行杂交、测序;按测序数据操作流程,对msnp基因型分型,完成个体所有液相芯片标记位点的基因型判定。
技术总结
本发明涉及基因分子育种领域,具体涉及基于多聚单核苷酸多态性的猪10K液相芯片及其应用。本发明在保持液相芯片设计基本原则下,对已有芯片增加新标记,并利用多聚单核苷酸多态性技术对探针进行优化,产生更多分型质量高、在探针区域内与靶位点SNP连锁不平衡中等的SNP标记,提高芯片的有效标记数量。本发明的mSNP液相芯片使可检测的SNP数目增加到靶位点SNP标记数的1.5-2倍,解决了已有芯片仅含靶位点SNP,无法提供mSNP标记的问题,且成本没有增加。通过基因型填充技术,将本发明的芯片基因型数据填充至主流的50K芯片,用于基因组选择,获得与50K芯片相同或相近的分子选种准确性,降低了猪分子育种成本。降低了猪分子育种成本。降低了猪分子育种成本。
技术研发人员:丁向东 刘华涛 李淑娟 张梓鹏 都鹤鹤 邵玉如 王楚端
受保护的技术使用者:中国农业大学
技术研发日:2023.06.15
技术公布日:2023/7/22
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种多处理卡间的数据传输方法和系统与流程 下一篇:一种放电装置、检测系统的制作方法
