一种预测猪饲料转化率的方法
未命名
07-19
阅读:208
评论:0
1.本发明涉及生物信息学领域,特别涉及一种预测猪饲料转化率的方法。
背景技术:
2.生猪养殖业的主要效益取决于与饲料有关的成本以及所生产的瘦肉的数量和质量。为了提高畜牧业的经济效益,降低饲料成本,有必要了解影响生猪生长发育性能的因素。其中猪的饲料转化率(fcr)是畜牧养殖的重要经济性状,直接与猪的生长性状相关,是指饲养的畜禽增重一公斤所消耗的饲料量,它是评价饲料报酬的一个重要指标,也是编制生产计划和财务计划的重要依据,在育种中具有重要的研究意义。目前,许多研究致力于探索基因与性状之间的关系。但随着研究的深入,其边际效益不断下降,需要一个新的研究切入点。
3.随着近几年肠道微生物研究不断取得新的突破,人们逐渐认识到肠道微生物的重要性。哺乳动物胃肠道存在着大量的微生物群,其基因数量约为宿主基因的1-1.3倍,肠道微生物以及其代谢产物对宿主的生长发育有着不可忽视的影响,而目前鲜有将肠道微生物利用到禽畜育种中。
4.可见,现有技术还有待改进和提高。
技术实现要素:
5.鉴于上述现有技术的不足之处,本发明的目的在于提供一种预测猪饲料转化率的方法,旨在通过利用肠道微生物和snp位点预测猪饲料转化率,以提高预测的准确性。
6.为了达到上述目的,本发明采取了以下技术方案:
7.一种预测猪饲料转化率的方法,包括以下步骤:获取饲料转化率数据并筛选与饲料转化率相关的特定肠道微生物,计算所述特定肠道微生物的相对丰度;获取猪的原始snp数据,计算与所述特定肠道微生物的相对丰度相关的snp位点;以所述特定肠道微生物的相对丰度及其相关的snp位点作为自变量,以饲料转化率数据作为因变量,构建训练数据集;采用所述训练数据集对初始构建的机器学习回归模型进行训练,获得预测猪饲料转化率模型,并基于所述预测猪饲料转化率模型对饲料转化率进行预测。
8.所述的预测猪饲料转化率的方法,其中,所述获取饲料转化率数据并筛选与饲料转化率相关的特定肠道微生物,计算所述特定肠道微生物的相对丰度,具体包括以下步骤:从多只猪的肛门采集粪便样品;提取粪便中的微生物基因组dna,然后进行16s rdna测序,获得微生物组16s rdna数据;对所述微生物组16s rdna数据进行质控和聚类,获得聚类后的16s rdna数据;根据微生物数据库对每个16s rdna进行注释,获得肠道微生物种群数据,根据所述肠道微生物种群数据计算各种微生物的相对丰度;根据微生物的相对丰度以及该微生物在猪只中的存在率对所述肠道微生物种群数据进行过滤;计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度。
9.所述的预测猪饲料转化率的方法,其中,所述计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度,具体包括:利用偏相关和信息论算法计算所述肠道微生物种群数据与饲料转化率数据之间的相关性,以获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度。
10.所述的预测猪饲料转化率的方法,其中,所述计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度,具体包括:对所述肠道微生物种群数据进行分类,以属作为最小分类等级,分类后获得多个同属微生物单元,计算所述同属微生物单元与所述饲料转化率数据的相关性。
11.所述的预测猪饲料转化率的方法,其中,所述根据微生物的相对丰度以及该微生物在猪只中的存在率对所述肠道微生物种群数据进行过滤,具体包括:保留相对丰度在0.1%以上,且在20%以上的粪便样品中存在的微生物。
12.所述的预测猪饲料转化率的方法,其中,所述获取猪的原始snp数据,计算与所述特定肠道微生物的相对丰度相关的snp位点,具体包括以下步骤:采集多只猪的组织,提取组织dna,采用基因芯片进行分型,获得原始snp数据;对所述原始snp数据进行过滤,获得过滤后的snp数据;以所述特定肠道微生物的相对丰度为响应值,以所述过滤后的snp数据作为预测值,通过模型计算出与所述特定肠道微生物的相对丰度相关的snp位点。
13.所述的预测猪饲料转化率的方法,其中,所述对所述原始snp数据进行过滤,获得过滤后的snp数据,具体包括:去除所述原始snp数据中符合以下任一条的snp,以获得过滤后的snp数据:缺失率大于0.1的snp;最小等位基因频率小于0.05的snp;不符合hardy-weinberg平衡的snp。
14.所述的预测猪饲料转化率的方法,其中,所述以所述特定肠道微生物的相对丰度为响应值,以所述过滤后的snp数据作为预测值,通过模型计算出与所述特定肠道微生物的相对丰度相关的snp位点,具体包括:通过构建lasso模型计算出与所述特定肠道微生物的相对丰度相关的snp位点。
15.所述的预测猪饲料转化率的方法,其中,所述机器学习回归模型为lr模型,其具体方程式为:
16.y=0.03410414x1+0.05310852x
2-0.17967665x3+2.6525974048842955
17.所述方程式中,y为饲料转化率的预测值,x1和x2分别对应的snp位点为:rs81429163和rs81429663,所述方程式中snp位点用0、1或2表示,0表示主等位基因纯合子,1表示杂合子,2表示次等位基因纯合子;x3为甲基杆菌的相对丰度。
18.所述的预测猪饲料转化率的方法,其中,所述机器学习回归模型为rf模型;所述特定肠道微生物为:甲基杆菌属、拟杆菌属、普雷沃氏菌属、梭杆菌科未分类属、拟杆菌目未分类科;所述与特定肠道微生物的相对丰度相关的snp位点为:rs81429163、rs81325861、rs81450579、rs81450581、rs81451919、rs330259558、rs330673669、rs34149272、rs81226653、rs81408398、rs340738784、rs81408146、rs80787454、rs328122894、rs81436486、rs343879761、rs318740977、rs80814938、rs81452772、rs81275853、rs81238518。
19.有益效果:
20.本发明提供了一种预测猪饲料转化率的方法,通过特定肠道微生物的相对丰度及与其相关的snp位点作为自变量,以饲料转化率数据作为因变量,构建机器学习回归模型并进行训练,训练得到的预测猪饲料转化率模型通过肠道微生物和snp位点对饲料转化率进行预测,预测结果更加准确。
具体实施方式
21.本发明提供一种预测猪饲料转化率的方法,为使本发明的目的、技术方案及效果更加清楚、明确,以下举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
22.实施例1数据采集
23.以杜长大三元杂交猪为研究对象,收集385头杜长大三元杂交猪的平均日增重数据以及获取各头猪的原始snp数据和微生物组16s rdna数据。
24.s101.平均日增重数据采集
25.采用性能自动测定系统测定猪64~150日龄时的日增重,当体重达到130
±
5kg时,结束测定。原始体重数据经过质控后,根据饲料投食量,计算每只猪的饲料转化率,饲料转化率=消耗饲料总量(kg)/增重总量(kg)。
26.s102.原始snp数据获取
27.采集猪耳组织并进行dna提取,采用geneseek porcine 50k的基因芯片对385头猪进行基因分型,获得原始snp数据。
28.s103.微生物组16s rdna数据获取
29.采用直肠拭子从猪的肛门进行粪便样品的采集,采集后的样品暂存于冰盒内,随后转运至实验室-80℃冰箱保存。
30.微生物基因组dna提取:采用ctab对样本基因组dna进行提取,提取后进行pcr扩增;
31.pcr扩增的步骤如下:
32.第一步、98℃预变性1分钟;
33.第二步、进行30个循环,每个循环依次为:变性:98℃处理10秒;退火:50℃处理30秒;延伸:72℃处理30秒;
34.第三步、72℃处理5分钟进行延伸。
35.pcr产物的混样和纯化:根据pcr产物浓度进行等浓度混样,充分混匀后使用1
×
tae浓度2%的琼脂糖胶电泳纯化pcr产物,选择割胶回收目标条带。产物纯化试剂盒使用的是thermo scientific公司genejet胶回收试剂盒。
36.文库构建和上机测序:使用illumina公司truseq dna pcr-free library preparation kit建库试剂盒进行文库的构建,构建好的文库经过qubit定量和文库检测,合格后,使用novaseq 6000进行上机测序;获得微生物组16s rdna数据。
37.实施例2
38.一种预测猪饲料转化率的方法,包括以下步骤:
39.s201.获取猪饲料转化率数据并筛选与猪饲料转化率相关的特定肠道微生物,计
算所述特定肠道微生物的相对丰度;
40.s202.获取猪的原始snp数据,计算与所述特定肠道微生物的相对丰度相关的snp位点;
41.s203.以所述特定肠道微生物的相对丰度及其相关的snp位点作为自变量,以猪饲料转化率数据作为因变量,构建训练数据集;
42.s204.采用所述训练数据集对初始构建的机器学习回归模型进行训练,获得预测猪饲料转化率模型,并基于所述预测猪饲料转化率模型对猪只的平均日增重进行预测。
43.本实施例中,所述获取猪饲料转化率数据并筛选与猪饲料转化率相关的特定肠道微生物,计算所述特定肠道微生物的相对丰度,具体包括以下步骤:
44.s2011.对实施例1中获取的微生物组16s rdna数据进行质控,质控的具体方法如下:利用qiime2软件中的dada2插件对微生物组16s rdna数据进行质控和聚类,聚类后获得多个分类单元;所述质控包括去除序列中的引物,对序列进行截选,过滤掉数量低于2的序列。
45.s2012.对分类单元进行微生物组数据过滤,过滤后的数据通过比对ncbi refseq数据库以对这些分类单元进行物种注释,置信度超过97%的菌种,认为是同一种菌;物种注释后计算各种微生物的相对丰度;
46.s2013.根据微生物的相对丰度以及该微生物在猪只中的存在率对所述肠道微生物种群数据进行过滤,保留相对丰度超过0.1%,且在20%以上的粪便样品中存在的微生物,过滤后得到68种微生物。
47.s2014.计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,从过滤后的肠道微生物种群数据中筛选出与所述饲料转化率数据相关的特定肠道微生物及其相对丰度,具体包括:
48.通过python利用scikit-learn包构建lasso线性模型,计算68种微生物的相对丰度与饲料转化率数据之间的相关性,经过计算,得到甲基杆菌(methylobacterium persicinum)与饲料转化率显著相关。
49.本实施例中,所述获取猪的原始snp数据,计算与所述特定肠道微生物的相对丰度相关的snp位点,具体包括以下步骤:
50.s2021.对实施例1中获取的原始snp数据进行过滤,过滤的具体方法如下:利用plink(版本1.9)对原始snp数据进行过滤,排除符合以下任一条件的snp或个体:(1)个体或snp缺失率大于0.1的个体或snp;(2)最小等位基因频率(maf)小于0.05的snp;(3)不符合hardy-weinberg平衡(hwe)中的snp;snp数据的质量不佳,那么计算的结果的有效性和准确性就无法保证,在进行snp芯片测序采集的过程中,难免在测序、人工操作等方面出现误差,导致不能真实反映个体的情况,如果不对这些测序出现问题的数据进行筛选控制,必然会对后续操作造成影响;
51.经过过滤处理后得到31931个snp位点。
52.s2022.所述以所述特定肠道微生物的相对丰度为响应值,以所述过滤后的snp数据作为预测值,通过模型计算出与所述特定肠道微生物的相对丰度相关的snp位点,具体包括:采用全基因组关联性分析,利用gemma进行全基因组分析,利用gec软件矫正p值为5.23e-5,得到与甲基杆菌相关联的sn p位点有:rs81429163、rs81325861、rs81450579、
rs81450581、rs81451919。
53.所述采用所述训练数据集对初始构建的机器学习回归模型进行训练,获得预测猪饲料转化率模型,并基于所述预测猪饲料转化率模型对猪只的平均日增重进行预测,具体包括:
54.s2041.通过python利用scikit-learn包建立线性回归模型(lr),分别进行5折交叉验证,每一折将数据分为30%的测试数据集和70%的训练数据集,采用训练数据集对模型进行训练,获得的预测猪饲料转化率模型的具体方程式为:
55.y=-0.15249576x1+0.04179918x
2-0.0001629x3+0.03331888x4+0.011125
56.89x
5-0.01743993x657.所述方程式中,y为饲料转化率的预测值,x1为甲基杆菌的相对丰度,x2至x6依次对应的snp位点为:rs81429163、rs81325861、rs81450579、rs81450581、rs81451919,所述方程式中snp位点用0、1或2表示,0表示主等位基因纯合子,1表示杂合子,2表示次等位基因纯合子。
58.以甲基杆菌及其相关位点信息进行饲料转化率的预测,采用测试集和均方误差(mse)对模型的预测能力进行检验,以反应预测的准确性,mse越小代表模型预测能力越准确。
59.实施例3
60.一种预测猪饲料转化率的方法,其与实施例2的区别在于,所述s2021中,通过python利用scikit-learn包建立决策树模型(dt),对模型进行训练,获得预测猪饲料转化率模型。
61.实施例4
62.一种预测猪饲料转化率的方法,其与实施例2的区别在于,所述s2021中,通过python利用scikit-learn包建立支持随机森林模型(rf),对模型进行训练,获得预测猪饲料转化率模型。
63.实施例5
64.一种预测猪饲料转化率的方法,其与实施例2的区别在于,所述s2021中,通过python利用scikit-learn包建立支持向量机模型(svr),对模型进行训练,获得预测猪饲料转化率模型。
65.实施例6
66.一种预测猪饲料转化率的方法,其与实施例2的区别在于,所述s2021中,通过python利用scikit-learn包建立梯度提升模型(xgb),对模型进行训练,获得预测猪饲料转化率模型。
67.实施例7
68.一种预测猪饲料转化率的方法,其与实施例2的区别在于:
69.所述s2014中,对所述肠道微生物种群数据进行分类,以属作为最小分类等级,分类后获得多个同属微生物单元;
70.通过python利用scikit-learn包构建lasso线性模型,计算同属微生物单元的相对丰度与饲料转化率数据之间的相关性,经过计算,得到甲基杆菌属(methylobacterium)、普雷沃氏菌属(prevotella)、拟杆菌属(bacteroides)、梭杆菌科未分类属
(fusobacteriaceae)、拟杆菌目未分类科(bacteroidales)与饲料转化率显著相关。
71.s2022中,通过全基因组关联性分析得到与上述微生物显著相关的snp为:
[0072][0073][0074]
所述s2041中,通过python利用scikit-learn包建立线性回归模型(lr),对模型进
行训练,获得预测猪饲料转化率模型。
[0075]
实施例8
[0076]
一种预测猪饲料转化率的方法,其与实施例6的区别在于:所述s2041中,通过python利用scikit-learn包建立决策树模型(dt),对模型进行训练,获得预测猪饲料转化率模型。
[0077]
实施例9
[0078]
一种预测猪饲料转化率的方法,其与实施例6的区别在于:所述s2041中,通过python利用scikit-learn包建立随机森林模型(rf),对模型进行训练,获得预测猪饲料转化率模型。
[0079]
实施例10
[0080]
一种预测猪饲料转化率的方法,其与实施例6的区别在于:所述s2041中,通过python利用scikit-learn包建立梯度提升模型(xgb),对模型进行训练,获得预测猪饲料转化率模型。
[0081]
实施例11
[0082]
一种预测猪饲料转化率的方法,其与实施例2的区别在于:
[0083]
s2014中,利用r语言(版本4.1.3)使用cetf包实现偏相关和信息论(pcit)算法计算68种微生物的相对丰度与饲料转化率之间的相关性,计算得到fenollaria massiliensis和clostridium carnis与饲料转化率显著相关。
[0084]
s2022中,采用全基因组关联性分析得到与fenollaria massiliensis和clostridium carnis相关联的snp位点有:rs81367309、rs81430187、rs80849522、rs80902784、rs81318490、rs80838375、rs80956143。
[0085]
所述s2041中,通过python利用scikit-learn包建立线性回归模型(lr),对模型进行训练,获得预测猪饲料转化率模型;
[0086]
所述预测猪饲料转化率模型的方程式为:
[0087]
y=0.0155083374x
1-0.0459946054x2+0.0500502357x3+0.05002357x4+0.
[0088]
0500502357x
5-0.105219107x6+0.0156824091x7+0.249537406x
8-8.80126679x9+2.6786203108368087
[0089]
所述方程式中,y为饲料转化率的预测值,x1至x7依次对应的snp位点为:rs81367309、rs81430187、rs80849522、rs80902784、rs81318490、rs80838375、rs80956143,所述方程式中snp位点用0、1或2表示,0表示主等位基因纯合子,1表示杂合子,2表示次等位基因纯合子,x8和x9分别为fenollaria massiliensis和clostridium carnis的相对丰度。
[0090]
实施例12
[0091]
一种预测猪饲料转化率的方法,其与实施例11的区别在于:
[0092]
所述s2041中,通过python利用scikit-learn包建立决策树模型(dt),对模型进行训练,获得预测猪饲料转化率模型。
[0093]
实施例13
[0094]
一种预测猪饲料转化率的方法,其与实施例11的区别在于:所述s2041中,通过python利用scikit-learn包建立随机森林模型(rf),对模型进行训练,获得预测猪饲料转化率模型。
[0095]
实施例14
[0096]
一种预测猪饲料转化率的方法,其与实施例11的区别在于:所述s2041中,通过python利用scikit-learn包建立梯度提升模型(xgb),对模型进行训练,获得预测猪饲料转化率模型。
[0097]
实施例15
[0098]
一种预测猪饲料转化率的方法,其与实施例2的区别在于:
[0099]
s2022中,通过构建lasso模型,以甲基杆菌的相对丰度为因变量,基因型为自变量,计算与甲基杆菌线性相关的snp位点,得到的相关snp位点为:rs81429163和rs81429663。
[0100]
s2041.通过python利用scikit-learn包建立线性回归模型(lr),获得的预测猪饲料转化率模型的具体方程式为:
[0101]
y=0.03410414x1+0.05310852x
2-0.17967665x3+2.6525974048842955
[0102]
所述方程式中,y为饲料转化率的预测值,x1至x2依次对应的snp位点为:rs81429163和rs81429663,所述方程式中snp位点用0、1或2表示,0表示主等位基因纯合子,1表示杂合子,2表示次等位基因纯合子,x3为甲基杆菌(methylobacterium persicinum)的相对丰度。
[0103]
实施例16
[0104]
一种预测猪饲料转化率的方法,其与实施例15的区别在于:
[0105]
所述s2041中,通过python利用scikit-learn包建立决策树模型(dt),对模型进行训练,获得预测猪饲料转化率模型。
[0106]
实施例17
[0107]
一种预测猪饲料转化率的方法,其与实施例15的区别在于:所述s2041中,通过python利用scikit-learn包建立随机森林模型(rf),对模型进行训练,获得预测猪饲料转化率模型。
[0108]
实施例18
[0109]
一种预测猪饲料转化率的方法,其与实施例15的区别在于:所述s2041中,通过python利用scikit-learn包建立梯度提升模型(xgb),对模型进行训练,获得预测猪饲料转化率模型。
[0110]
实施例19
[0111]
一种预测猪饲料转化率的方法,其与实施例2的区别在于:
[0112]
所述s2014中,对所述肠道微生物种群数据进行分类,以属作为最小分类等级,分类后获得多个同属微生物单元;
[0113]
利用r语言(版本4.1.3)使用cetf包实现偏相关和信息论(pcit)算法计算多个同属微生物单元的相对丰度与饲料转化率之间的相关性,计算得到普雷沃氏菌属(prevotella)和梭杆菌科未分类属(fusobacteriaceae)与饲料转化率显著相关。
[0114]
所述s2022中,通过构建lasso模型,以甲基杆菌的相对丰度为因变量,基因型为自变量,计算与普雷沃氏菌属和梭杆菌科未分类属线性相关的snp位点,得到的相关snp位点为:rs81238518和rs80968564。
[0115]
s2041.通过python利用scikit-learn包建立线性回归模型(lr),获得的预测猪饲
料转化率模型的具体方程式为:
[0116]
y=0.02334701x1+0.00925973x2+0.39380811x3+0.82699312x4+2.580732314 2083325
[0117][0118]
所述方程式中,y为饲料转化率的预测值,x1至x2依次对应的snp位点为:rs81238518和rs80968564,所述方程式中snp位点用0、1或2表示,0表示主等位基因纯合子,1表示杂合子,2表示次等位基因纯合子,x3和x4分别为普雷沃氏菌属(frevotella)和梭杆菌科未分类属(fusobacteriaceae)的相对丰度。
[0119]
实施例20
[0120]
一种预测猪饲料转化率的方法,其与实施例19的区别在于:
[0121]
所述s2041中,通过python利用scikit-learn包建立决策树模型(dt),对模型进行训练,获得预测猪饲料转化率模型。
[0122]
实施例21
[0123]
一种预测猪饲料转化率的方法,其与实施例19的区别在于:所述s2041中,通过python利用scikit-learn包建立随机森林模型(rf),对模型进行训练,获得预测猪饲料转化率模型。
[0124]
实施例22
[0125]
一种预测猪饲料转化率的方法,其与实施例19的区别在于:所述s2041中,通过python利用scikit-learn包建立梯度提升模型(xgb),对模型进行训练,获得预测猪饲料转化率模型。
[0126]
对实施例2-22训练得到的预测猪饲料转化率模型进行5次交叉验证,5次交叉验证的均方误差(mse)如下表所示,mse越小代表模型预测能力越准确:
[0127][0128][0129]
上述结果中,实施例2-6的区别仅在于,初始构建的机器学习回归模型的种类不同,从结果上看,采用lr模型构建的猪饲料转化率模型的均方误差(mse)最小,对应的准确率最高。
[0130]
实施例7-10与实施例2的区别在于,s2014中,以属作为最小分类单元对微生物种群数据进行分类,并以此计算与饲料转化率相关的属,得到相应的结果后,再分别构建不同的模型预测饲料转化率。从结果上看,若以属作为最小分类单元(实施例2-6是以种作为最
小分类单元),得到的与饲料转化率相关的微生物种类更多,相应的snp位点也更多,以此构建的饲料转化率预测模型根据模型的具体种类不同,准确率也不同。
[0131]
实施例7同样是采用lr模型,但是结果与实施例2略有下降;实施例8和实施例10的准确性也不如实施例2。
[0132]
实施例9采用的是rf模型,其准确率明显高于实施例2,说明最小分类单元以及模型种类的调整能够优化构建的饲料转化率预测模型。
[0133]
实施例11-14与实施例2的区别在于,计算微生物与饲料转化率相关性的算法不同,以及后续构建的模型种类不同,计算相关性的算法不同会导致得到的微生物种类发生变化,其进一步构建的饲料转化率预测模型也不同。从结果上看,实施例11所构建的饲料转化率预测模型的准确性相对于实施例2有所上升,但是略差于实施例9,而实施例12-14的准确性均不如实施例2。
[0134]
实施例15-18与实施例2的区别在于,s2022中,计算与微生物相关的snp位点的算法不同,得到的相关snp位点不同,相应构建的饲料转化率预测模型也有所不同。从结果上看,实施例15以及实施例16的mse值分别较实施例2和实施例3小,而实施例17和实施例18的mse值则分别较实施例5和实施例6大,说明对于不同的模型种类,算法所导致的微生物种类和snp位点的不同,会给不同种类的预测模型带来不同的影响。
[0135]
实施例19-22与实施例2-6的区别在于,s2014中,以属作为最小分类单元对微生物种群数据进行分类,并利用pcit法进行相关性分析计算与饲料转化率相关的属;另外s2022中采用lasso模型计算与特定肠道微生物相关的snp位点,最终训练得到的模型中,lr模型的准确性最好。
[0136]
综合比较各个实施例,发现实施例9所构建的模型的预测准确性最好,实施例11次之。
[0137]
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
技术特征:
1.一种预测猪饲料转化率的方法,其特征在于,包括以下步骤:获取饲料转化率数据并筛选与饲料转化率相关的特定肠道微生物,计算所述特定肠道微生物的相对丰度;获取猪的原始snp数据,计算与所述特定肠道微生物的相对丰度相关的snp位点;以所述特定肠道微生物的相对丰度及其相关的snp位点作为自变量,以饲料转化率数据作为因变量,构建训练数据集;采用所述训练数据集对初始构建的机器学习回归模型进行训练,获得预测猪饲料转化率模型,并基于所述预测猪饲料转化率模型对饲料转化率进行预测。2.根据权利要求1所述的预测猪饲料转化率的方法,其特征在于,所述获取饲料转化率数据并筛选与饲料转化率相关的特定肠道微生物,计算所述特定肠道微生物的相对丰度,具体包括以下步骤:从多只猪的肛门采集粪便样品;提取粪便中的微生物基因组dna,然后进行16s rdna测序,获得微生物组16s rdna数据;对所述微生物组16s rdna数据进行质控和聚类,获得聚类后的16s rdna数据;根据微生物数据库对每个16s rdna进行注释,获得肠道微生物种群数据,根据所述肠道微生物种群数据计算各种微生物的相对丰度;根据微生物的相对丰度以及该微生物在猪只中的存在率对所述肠道微生物种群数据进行过滤;计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度。3.根据权利要求2所述的预测猪饲料转化率的方法,其特征在于,所述计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度,具体包括:利用偏相关和信息论算法计算所述肠道微生物种群数据与饲料转化率数据之间的相关性,以获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度。4.根据权利要求2所述的预测猪饲料转化率的方法,其特征在于,所述计算过滤后的所述肠道微生物种群数据与所述饲料转化率数据的相关性,获得与所述饲料转化率数据相关的特定肠道微生物及其相对丰度,具体包括:对所述肠道微生物种群数据进行分类,以属作为最小分类等级,分类后获得多个同属微生物单元,计算所述同属微生物单元与所述饲料转化率数据的相关性。5.根据权利要求2所述的预测猪饲料转化率的方法,其特征在于,所述根据微生物的相对丰度以及该微生物在猪只中的存在率对所述肠道微生物种群数据进行过滤,具体包括:保留相对丰度在0.1%以上,且在20%以上的粪便样品中存在的微生物。6.根据权利要求1所述的预测猪饲料转化率的方法,其特征在于,所述获取猪的原始snp数据,计算与所述特定肠道微生物的相对丰度相关的snp位点,具体包括以下步骤:采集多只猪的组织,提取组织dna,采用基因芯片进行分型,获得原始snp数据;对所述原始snp数据进行过滤,获得过滤后的snp数据;以所述特定肠道微生物的相对丰度为响应值,以所述过滤后的snp数据作为预测值,通
过模型计算出与所述特定肠道微生物的相对丰度相关的snp位点。7.根据权利要求6所述的预测猪饲料转化率的方法,其特征在于,所述对所述原始snp数据进行过滤,获得过滤后的snp数据,具体包括:去除所述原始snp数据中符合以下任一条的snp,以获得过滤后的snp数据:缺失率大于0.1的snp;最小等位基因频率小于0.05的snp;不符合hardy-weinberg平衡的snp。8.根据权利要求6所述的预测猪饲料转化率的方法,其特征在于,所述以所述特定肠道微生物的相对丰度为响应值,以所述过滤后的snp数据作为预测值,通过模型计算出与所述特定肠道微生物的相对丰度相关的snp位点,具体包括:通过构建lasso模型计算出与所述特定肠道微生物的相对丰度相关的snp位点。9.根据权利要求1所述的预测猪饲料转化率的方法,其特征在于,所述机器学习回归模型为lr模型,其具体方程式为:y=0.03410414x1+0.05310852x
2-0.17967665x3+2.6525974048842955所述方程式中,y为饲料转化率的预测值,x1和x2分别对应的snp位点为:rs81429163和rs81429663,所述方程式中snp位点用0、1或2表示,0表示主等位基因纯合子,1表示杂合子,2表示次等位基因纯合子;x3为甲基杆菌的相对丰度。10.根据权利要求1所述的预测猪饲料转化率的方法,其特征在于,所述机器学习回归模型为rf模型;所述特定肠道微生物为:甲基杆菌属、拟杆菌属、普雷沃氏菌属、梭杆菌科未分类属、拟杆菌目未分类科;所述与特定肠道微生物的相对丰度相关的snp位点为:rs81429163、rs81325861、rs81450579、rs81450581、rs81451919、rs330259558、rs330673669、rs34149272、rs81226653、rs81408398、rs340738784、rs81408146、rs80787454、rs328122894、rs81436486、rs343879761、rs318740977、rs80814938、rs81452772、rs81275853、rs81238518。
技术总结
本发明公开了一种预测猪饲料转化率的方法,涉及生物信息学领域。所述预测猪饲料转化率的方法包括以下步骤:获取饲料转化率数据并筛选与饲料转化率相关的特定肠道微生物,计算所述特定肠道微生物的相对丰度;获取猪的原始SNP数据,计算与所述特定肠道微生物的相对丰度相关的SNP位点;以所述特定肠道微生物的相对丰度及其相关的SNP位点作为自变量,以饲料转化率数据作为因变量,构建训练数据集;采用所述训练数据集对初始构建的机器学习回归模型进行训练,获得预测猪饲料转化率模型,基于所述预测猪饲料转化率模型对猪饲料转化率进行预测。本发明通过构建预测猪饲料转化率模型可以准确地预测猪只生长过程中的饲料转化率。可以准确地预测猪只生长过程中的饲料转化率。
技术研发人员:李英 张涛 邓飞龙 赵云翔 彭云娟 谢婷
受保护的技术使用者:佛山科学技术学院
技术研发日:2023.03.29
技术公布日:2023/7/18
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
