【技术实现步骤摘要】
基于机器学习寻找影响猪脂肪沉积的候选基因的方法
[0001]本专利技术涉及生物信息学领域,具体为一种基于机器学习寻找影响猪脂肪沉积的候选基因的方法。
技术介绍
[0002]脂肪沉积是养猪生产中复杂的数量性状和重要的经济性状,其与生猪的生产效率、猪肉品质和繁殖性状密切相关。近年来,人们开始更加关注猪肉的质量,因此脂肪含量作为影响肉质的主要指标显得越来越重要。随着基因组时代的来临,挖掘影响猪脂肪沉积性状的分子标记和基因成为加快肉质改良的一个重要途径,所以寻找影响猪脂肪沉积的候选基因成为当前养猪业进行肉质遗传改良的重要目标。
[0003]脂肪沉积是一个动态平衡的过程,受多种基因的时空调控。通过RNA
‑
seq深度测序技术能够进行转录组测序,进而体现特定时间点特定组织的基因表达状态。因此,利用转录组数据对于准确挖掘影响猪脂肪沉积的候选基因至关重要。
[0004]然而,目前大多数在这方面的转录组研究均使用很少的重复,只能识别表达变化最大的基因,因此缺乏在生物学意义水平上检测能力。也有研究表明,不同的检 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习寻找影响猪脂肪沉积的候选基因的方法,主要包括以下步骤:步骤一:收集猪肌肉样本,通过FOSS机测定肌内脂肪含量,作为样本标签,根据肌内脂肪含量大小分为高低组转化为二分类处理问题;步骤二:提取样本RNA,进行mRNA建库得到测序数据;步骤三:对步骤二中的测序数据进行质控和比对处理得到基因的count值,所述count值为比对到的reads数,并标准化得到样本基因表达TPM值;所述TPM值计算公式为:上述公式中各字母的含义:: 比对到基因上的read数,即基因的count值;: 基因的外显子长度的总和,根据参考基因组Sus Sscrofa11.1的注释计算;:所有基因比对read数和其外显子长度总和之比的和;将基因表达TPM值作为样本特征,并设置与样本特征一一对应的标签值,将样本特征和标签值构建成数据集;步骤四:利用数据集通过交叉验证的方式进行神经网络机器学习训练;步骤五:基于Permutation Importance的方法计算神经网络模型特征的重要性。2.根据权利要求1所述的一种基于机器学习寻找影响猪脂肪沉积的候选基因的方法,其特征在于,所述步骤一中猪肌肉样本来自屠宰后的大白猪进行,每只大白猪的重量在100
±
5kg,取100g背最长肌搅碎,再利用FOSS NIRS DS 2500近红外光谱仪测定背最长肌的肌内脂肪含量。3.根据权利要求2所述的一种基于机器学习寻找影响猪脂肪沉积的候选基因的方法,其特征在于,步骤二中的测序数据的获取,通过如下步骤:1) 将上述背最长肌样本,取适量采用TRIzol 试剂盒提取总 RNA,用1.5%的琼脂糖凝胶电泳检测其RNA 的完整性,用 NanoDrop 检测总 RNA浓度,放入到
‑
80℃保存;2) 对上述获得总RNA浓度的样品,进行反转录得到cDNA,构建cDNA 文库并进行质量检测,利用 Illumina Hiseq2500测序仪进行双端测序。4.根据权利要求3所述的一种基于机器学习寻找影响猪...
【专利技术属性】
技术研发人员:刘华涛,刘年丰,
申请(专利权)人:青岛兴牧畜牧科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。