一种基于miRNA-mRNA调控关系的合成致死基因组合的特征构建方法技术

技术编号:36793160 阅读:15 留言:0更新日期:2023-03-08 22:49
本发明专利技术属于生物信息领域,公开了一种基于miRNA

【技术实现步骤摘要】
一种基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法


[0001]本专利技术属于生物信息领域,具体涉及一种基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法。

技术介绍

[0002]合成致死(Synthetic lethality)效应,又称协同致死效应,是最近几年抗癌药研发的一种全新思路,因该治疗策略毒性小且效果好而备受关注。然而,如何获得一批高质量的具合成致死效应的基因组合是当前面临的主要挑战。
[0003]机器学习预测是获取大量合成致死基因组合的一种高效的方法。大部分采用机器学习预测的方法所使用的特征值来源有限,如基因表达、蛋白质网络拓扑结构和基因功能等方面。然而,在合成致死相关的mRNA

miRNA调控网络特征值研究仍然缺乏,特别是基于大数据的研究方法。

技术实现思路

[0004]目的:为了克服现有技术中存在的不足,本专利技术提供一种基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,基于本方法构建的特征值可以对机器学习预测作出有效的贡献,提高预测效果。
[0005]为解决上述技术问题,本专利技术采用的技术方案为:
[0006]一种基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,包括以下步骤:
[0007]获取isomiR序列,利用信息熵量化miRNA对应isomiR序列的不确定性,作为miRNA的特征
[0008]获取miRNA

mRNA调控关系,找到对合成致死相关基因具有调控关系的miRNA,用表达相关系数作为权重对miRNA特征计算加权平均值;
[0009]合成致死基因组合的特征即为2个相关基因上述计算结果的均值,用于输入机器学习模型。
[0010]进一步的,根据isomiR表达数据获取所有isomiR的染色体坐标及其对应前体和成熟miRNA的名称;根据前体的名称,从hsa.gff3中获得前体的染色体坐标,从hairpin.fa中获取前体的序列。
[0011]进一步的,获取所有isomiR的染色体坐标,获取相应位置的序列。
[0012]进一步的,根据isomiR的染色体坐标与前体坐标的相对位置,从前体序列中提取出isomiR序列,其中正链的坐标起点在序列头部,负链的坐标起点在序列尾部。
[0013]进一步的,从hsa.gff3中前体对应成熟miRNA中,根据成熟miRNA名称找到isomiR对应成熟miRNA的染色体坐标。
[0014]进一步的,从hsa.gff3中前体对应成熟miRNA中,根据成熟miRNA名称找到isomiR
对应成熟miRNA的染色体坐标,将相对于成熟miRNA坐标偏移量超出4nt的isomiR去除。
[0015]进一步的,从starBase数据库下载所有miRNA

mRNA调控关系结果,下载的每一组调控关系应至少被三种预测软件预测到。
[0016]进一步的,对miRNA利用信息熵量化miRNA对应isomiR5

端和3

端序列的不确定性,作为miRNA的特征,记为MIH:
[0017][0018]MIH表示miRNA的特征,L表示经典miRNA长度变化范围,其范围为
±
4nt,i为其中某位置,表示某位置碱基出现的频率,表示某位置碱基不出现的频率。
[0019]进一步的,一对miRNA

mRNA调控关系,用TCGA表达数据进行Spearman相关性分析,保留显著负相关的结果。
[0020]进一步的,对于所有调控某个mRNA的miRNA,对它们的MIH用表达相关系数作为权重计算加权平均值,作为mRNA的特征,记为m:
[0021][0022]m表示mRNA的特征,N为调控某个mRNA的miRNA数量,i表示其中一个miRNA,r为表达相关系数,MIH表示miRNA的特征;
[0023]合成致死基因组合的特征即为2个相关基因上述计算结果的均值。
[0024]一种基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,包括以下步骤
[0025]步骤1:从TCGA数据库isomiR表达数据里获取所有isomiR的染色体坐标,收集各miRNA的isomiR序列。将相对于成熟miRNA坐标偏移量超出4nt的isomiR去除。
[0026]对这些miRNA利用信息熵量化其对应isomiR5

端和3

端序列的不确定性,作为miRNA的特征,记为MIH:
[0027][0028]MIH表示miRNA的特征,L表示经典miRNA长度变化范围(
±
4nt),i为其中某位置,表示某位置碱基出现的频率,表示某位置碱基不出现的频率。
[0029]步骤2:从starBase数据库下载所有miRNA

mRNA调控关系结果,下载的每一组调控关系应至少被三种预测软件预测到。找到对合成致死相关基因具有调控关系的miRNA。一对miRNA

mRNA调控关系,用TCGA表达数据进行Spearman相关性分析,用表达相关系数作为权重对miRNA特征MIH计算加权平均值,作为mRNA的特征。
[0030]步骤3:合成致死基因组合的特征即为2个相关基因上述计算结果的均值,用于输入机器学习模型。
[0031]有益效果
[0032]本专利技术提供的基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,利用miRNA调控及短小灵活的isomiR深入探寻合成致死基因组合的特征,对机器学习预测作
出有效的贡献,提高预测效果。
附图说明
[0033]图1是本专利技术实施例的方法流程图;
[0034]图2是实施例中是否加入本专利技术所构建的特征时的模型预测效果比较。
具体实施方式
[0035]下面结合附图和实施例对本专利技术作进一步描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。
[0036]实施例1
[0037]从miRBase数据库下载人类miRNA的染色体坐标文件hsa.gff3,下载所有前体的Fasta格式序列文件hairpin.fa。
[0038]从TCGA数据库isomiR表达数据获取所有isomiR的染色体坐标及其对应前体和成熟miRNA的名称。根据前体的名称,从hsa.gff3中获得前体的染色体坐标,从hairpin.fa中获取前体的序列。根据isomiR的染色体坐标与前体坐标的相对位置,从前体序列中提取出isomiR序列,其中正链的坐标起点在序列头部,负链的坐标起点在序列尾部。从hsa.gff3中前体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,包括以下步骤:获取isomiR序列,利用信息熵量化miRNA对应isomiR序列的不确定性,作为miRNA的特征;获取miRNA

mRNA调控关系,找到对合成致死相关基因具有调控关系的miRNA,用表达相关系数作为权重对miRNA特征计算加权平均值;合成致死基因组合的特征即为2个相关基因上述计算结果的均值,用于输入机器学习模型。2.根据权利要求1所述的基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,根据isomiR表达数据获取所有isomiR的染色体坐标及其对应前体和成熟miRNA的名称;根据前体的名称,从hsa.gff3中获得前体的染色体坐标,从hairpin.fa中获取前体的序列。3.根据权利要求1所述的基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,获取所有isomiR的染色体坐标,获取相应位置的序列。4.根据权利要求1所述的基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,根据isomiR的染色体坐标与前体坐标的相对位置,从前体序列中提取出isomiR序列,其中正链的坐标起点在序列头部,负链的坐标起点在序列尾部。5.根据权利要求4所述的基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,从hsa.gff3中前体对应成熟miRNA中,根据成熟miRNA名称找到isomiR对应成熟miRNA的染色体坐标。6.根据权利要求4所述的基于miRNA

mRNA调控关系的合成致死基因组合的特征构建方法,其特征在于,从hsa.gff3...

【专利技术属性】
技术研发人员:郭丽窦宇阳向阳洋任玉杰任得康
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1