一种基于生物基因组序列的microRNA预测方法技术

技术编号:16913266 阅读:216 留言:0更新日期:2017-12-30 20:44
本发明专利技术公开了一种基于生物基因组序列的microRNA预测方法,本发明专利技术设计了一种预测动物基因组序列中的microRNA的方法并进行了实验验证。该方法包括如下几个步骤:步骤一、从网站下载生物物种基因组序列和成熟miRNAs序列;步骤二、利用下载的其它物种miRNAs进行基因组balst比对去掉匹配碱基数不符的序列,抽取该microRNA的前体序列进行茎环结构预测;步骤三、从基因组中删除预测得到含有编码蛋白质的茎环序列;步骤四、筛选AU含量不合适及不符合典型前体miRNA结构特征的序列被删除;步骤五、获得可能的miRNAs基因;步骤六、利用stem‑loop RT‑PCR实验验证预测的microRNA。

A microRNA prediction method based on biological genome sequence

The invention discloses a microRNA prediction method based on biological genome sequence. The invention designs a method for predicting microRNA in animal genome sequence and has been verified by experiments. The method comprises the following steps: step one, from the website of biological species genome sequence and mature miRNAs sequence; step two, the use of other species miRNAs downloaded genomic balst was removed on the base sequence matching does not match, the precursor sequence extraction microRNA to predict the stem loop structure; step three, from the genome delete the predicted stem loop sequence containing protein encoding sequence; step four, the content of AU screening is not appropriate and does not conform to the typical structure of the miRNA precursor was removed; step five, miRNAs gene; step six, using stem loop RT PCR experimental verification of the predicted microRNA.

【技术实现步骤摘要】
一种基于生物基因组序列的microRNA预测方法
本专利技术涉及一种鱼类基因组DNA提取的
,特别是一种基于生物基因组序列的microRNA预测方法。
技术介绍
MicroRNA(微小核糖核酸)是一类大约长度为18-25nt的内源性非编码小RNA分子,它通过与靶基因互补发挥转录后水平的负调控作用,广泛参与多种生物学过程,如细胞发育、分化、增殖、凋亡、代谢、肿瘤转移等。自从在1993年首次在秀丽小杆线虫(Caenorhabditiselegans)中发现了第一个microRNAlin-4和2000年又在线虫中发现了另一种重要的microRNA基因let-7以来[1,2],科学界掀起了寻找和鉴定microRNA的热潮。目前常用的鉴定miRNAs的方法有两种:分子生物学和生物信息学。分子生物学主要包括直接克隆和新近发展起来的新一代高通量测序方;其优点是能够高效的鉴定miRNAs,其结果具有较少的假阳性。然而分子生物学方法耗费时间,价格昂贵,具有很强的技术依赖性,生物信息学方法则弥补了这些缺陷。这种方法具有更加方便、经济,快速有效地预测物种的microRNA数量,尤其是一些低丰度的microRNA和组织特异性microRNA往往很难通过实验发现。目前通过分子生物学和生物信息学等方法,已有多生物的microRNAs被鉴定。随着测序技术的进步和测序工作的逐步开展,越来越多的物种全基因组序列被测出。这使得在全基因组序列中利用生物信息学来预测和发现新的microRNA更加容易,大大提高发现和研究microRNA的效率。本专利技术为解决已有全基因组序列物种进行microRNA预测,并设计一种预测方法,基于生物软件与分析,对已测序的全基因组物种进行预测,以达到深度挖掘microRNA分子的目的,并通过实验验证进行证实。
技术实现思路
本专利技术的目的是为了解决上述现有技术的不足而提供一种基于生物基因组序列的microRNA预测方法。本专利技术具有以下优点:物种microRNA序列数据来源方便,预测microRNA步骤简单,结果可靠。此方法不需要用克隆或者高通量测序等实验方法来鉴定microRNA,省去了费时,费力和费钱等过程,就能预测出该物种的microRNA分子。为了实现上述目的,本专利技术所设计的一种基于生物基因组序列的microRNA预测方法,具体步骤如下:S1、从网站中的数据库下载生物物种基因组序列和成熟miRNAs序列;S2、将下载的miRNA序列与物种基因组序列进行blast比对,寻找存在0-3个碱基差异的同源序列;S3、抽取microRNA前体序列进行茎环二级结构预测,并删除含有编码蛋白质的茎环序列;S4、删除AU含量不合适和不符合典型前体microRNA茎环结构特征的序列;S5、经过筛选步骤,在大弹涂鱼中获得存在的microRNA分子;S6、利用stem-loopRT-PCR实验对预测得到的microRNA进行实验验证。进一步,在步骤S1中:从miRBase数据库中下载所属物种的成熟miRNAs序列;从NCBI数据库中下载物种基因组序列;在步骤S2中:从NCBI数据库中下载序列比对软件:blast-2.2.27;在步骤S3中:利用mFold3.1在线软件,选取包含microRNA序列左右两侧各100nt片段并进行二级结构预测,对获得的序列进行NCBI网站比对,删除其中重复和表达蛋白的序列;在步骤S4中:筛选是按四个标准进行筛选microRNA:(1)预测得到的microRNAs与已知成熟的miRNAs的序列只能存在0~3个碱基差异;(2)预测的成熟的microRNA位于茎环结构的一条臂上;(3)microRNA前体的二级结构具有较高的绝对值最小折叠自由能和较高的最小折叠自由能系数;(4)microRNA中A+U的含量在30%~70%之间。本专利技术得到的一种基于生物基因组序列的microRNA预测方法,本专利技术针对酚-氯仿抽提法提取基因组DNA的缺点,结合大鲵血红细胞中含有细胞核,基因组DNA含量比其他哺乳动物丰富的特点,提出了用无水乙醇进行两次沉淀,代替酚-氯仿抽提进行大鲵血液基因组DNA提取的方法,本方法快速、高效、无毒、经济,所得到的基因组DNA可以进行下一步的基因工程领域研究,如PCR、酶切、Southern杂交、构建DNA文库和遗传多样性检测等。附图说明:图1microRNA预测流程;图2是本实施例中Stem-loopRT-PCR实验验证部分microRNA的表达图片。具体实施方式下面结合附图和实施例对本专利技术进一步说明。实施例1:如图1、图2所示,本实施例提供的一种基于生物基因组序列的microRNA预测方法,具体步骤如下:S1、从网站中的数据库下载生物物种基因组序列和成熟miRNAs序列;S2、将下载的miRNA序列与物种基因组序列进行blast比对,寻找存在0-3个碱基差异的同源序列;S3、抽取microRNA前体序列进行茎环二级结构预测,并删除含有编码蛋白质的茎环序列;S4、删除AU含量不合适和不符合典型前体microRNA茎环结构特征的序列;S5、经过筛选步骤,在大弹涂鱼中获得存在的microRNA分子;S6、利用stem-loopRT-PCR实验对预测得到的microRNA进行实验验证。进一步,在步骤S1中:从miRBase数据库中下载所属物种的成熟miRNAs序列;从NCBI数据库中下载物种基因组序列;在步骤S2中:从NCBI数据库中下载序列比对软件:blast-2.2.27;在步骤S3中:利用mFold3.1在线软件,选取包含microRNA序列左右两侧各100nt片段并进行二级结构预测,对获得的序列进行NCBI网站比对,删除其中重复和表达蛋白的序列;在步骤S4中:筛选是按四个标准进行筛选microRNA:(1)预测得到的microRNAs与已知成熟的miRNAs的序列只能存在0~3个碱基差异;(2)预测的成熟的microRNA位于茎环结构的一条臂上;(3)microRNA前体的二级结构具有较高的绝对值最小折叠自由能和较高的最小折叠自由能系数;(4)microRNA中A+U的含量在30%~70%之间。本实施例中以大弹涂鱼基因组序列为例进行microRNA的预测,具体的实施步骤如下:1、从miRBase数据库中(http://www.mirbase.org/)下载其它物种成熟的microRNA;从NCBI数据库下载大弹涂鱼的基因组序列(http://www.ncbi.nlm.nih.gov/genome/?term=Boleophthalmus%20pectinirostris);2、将删除重复的6375条microRNAs序列作为目标比对序列进行大弹涂鱼基因组序列blast,将evalue值设置为e-10,其它参数默认,保留<e-10的序列;再进一步剔除错配超过3个碱基的序列;3、提取剩下的microRNA序列左右各100nt,具体方法参考作者发的文章HuangYongetal.ComputationalidentificationandcharacteristicsofnovelmicroRNAsfromthesilkworm(BombyxmoriL.),2010,37:3171-3176本文档来自技高网
...
一种基于生物基因组序列的microRNA预测方法

【技术保护点】
一种基于生物基因组序列的microRNA预测方法,其特征在于,具体步骤如下:S1、从网站中的数据库下载生物物种基因组序列和成熟miRNAs序列;S2、将下载的miRNA序列与物种基因组序列进行blast比对,寻找存在0‑3个碱基差异的同源序列;S3、抽取microRNA前体序列进行茎环二级结构预测,并删除含有编码蛋白质的茎环序列;S4、删除AU含量不合适和不符合典型前体microRNA茎环结构特征的序列;S5、经过筛选步骤,在大弹涂鱼中获得存在的microRNA分子;S6、利用stem‑loop RT‑PCR实验对预测得到的microRNA进行实验验证。

【技术特征摘要】
1.一种基于生物基因组序列的microRNA预测方法,其特征在于,具体步骤如下:S1、从网站中的数据库下载生物物种基因组序列和成熟miRNAs序列;S2、将下载的miRNA序列与物种基因组序列进行blast比对,寻找存在0-3个碱基差异的同源序列;S3、抽取microRNA前体序列进行茎环二级结构预测,并删除含有编码蛋白质的茎环序列;S4、删除AU含量不合适和不符合典型前体microRNA茎环结构特征的序列;S5、经过筛选步骤,在大弹涂鱼中获得存在的microRNA分子;S6、利用stem-loopRT-PCR实验对预测得到的microRNA进行实验验证。2.根据权利要求1所述的一种基于生物基因组序列的microRNA预测方法,其特征在于,在步骤S1中:从miRBase数据库中...

【专利技术属性】
技术研发人员:黄勇任洪涛高小婵熊建利
申请(专利权)人:河南科技大学
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1