【技术实现步骤摘要】
基于卷积去噪自编码机的piRNA
‑
疾病关联关系预测方法
[0001]本专利技术涉及涉及深度学习和生物信息学
,更具体地说,特别涉及一种基于卷积去噪自编码机的piRNA
‑
疾病关联关系预测方法。
技术介绍
[0002]近年来,Piwi蛋白质相互作用RNA被认为是细胞生物学的重要媒介,并成为小分子非编码RNA家族的最新成员。Piwi蛋白质相互作用RNA是一种包含21
‑
30个核苷酸的单链RNA,在不同的生物体中主要与Argonaute家族PIWI蛋白成员(Argonaute3、Piwi、Aubergine)相互作用,形成与表观遗传调控、精子发生、转座子沉默、mRNA调控和发育以及基因组重排相关的piRNA/PIWI复合物。该复合物可通过识别piRNA序列引起异染色质修饰和转座子沉默,已成为高度保守的小分子RNA引导基因调控机制的典范。
[0003]此外,Piwi蛋白质相互作用RNA是癌症基因组学的新兴参与者,参与多种人类疾病(包括癌症)相关的异常表达。传统的生 ...
【技术保护点】
【技术特征摘要】
1.基于卷积去噪自编码机的piRNA
‑
疾病关联关系预测方法,其特征在于,包括以下步骤:S1、获取已知的Piwi蛋白质相互作用RNA与疾病关联关系数据、Piwi蛋白质相互作用RNA的ID和序列信息,以及疾病语义信息;S2、基于Piwi蛋白质相互作用RNA的核苷酸序列信息,利用基于重叠移动窗口的序列衍生特征提取方法计算每种Piwi蛋白质相互作用RNA序列特征,利用欧式相似性测量方法计算Piwi蛋白质相互作用RNA序列之间的相似性特征;S3、利用有向无环图构建各种疾病之间的关系,定义两种不同的图中节点对目标疾病的语义贡献度,分别计算两种目标疾病的语义值,根据疾病之间有向无环图的共享部分计算两种疾病语义相似性特征;S4、利用Piwi蛋白质相互作用RNA
‑
疾病关联关系对分别计算Piwi蛋白质相互作用RNA和疾病的高斯相互作用谱核相似特征;S5、基于均值相似核融合方法分别融合Piwi蛋白质相互作用RNA与疾病的多种相似特征,构建卷积去噪自动编码神经网络架构,提取输入数据的更深层次的隐藏特征,同时将噪声数据添加到训练数据集中,得到无污染特征数据;S6、以Piwi蛋白质相互作用RNA与疾病关联关系数据作为正样本,基于剩余所有未确定的Piwi蛋白质相互作用RNA与疾病关联对,随机抽取与正样本相同关联对作为负样本,将整个训练数据集进行五次随机划分,每次划分成五个部分,其中四部分作为训练数据集,剩余一部分作为测试数据集;S7、基于极限学习机利用训练数据集构建分类模型,利用测试数据集对模型进行打分,重复进行五次实验,取五次实验的平均结果作为模型的性能评价指标。2.根据权利要求1所述的基于卷积去噪自编码机的piRNA
‑
疾病关联关系预测方法,其特征在于,所述步骤S2中利用基于重叠移动窗口的序列衍生特征提取3
‑
mer方法,计算表观遗传标记的每种Piwi蛋白质相互作用RNA序列的核苷酸序列信息集合上所有3
‑
聚体出现次数占整个序列长度的统计概率,生成特征向量作为其序列特征,利用欧几里得距离测度方法计算Piwi蛋白质相互作用RNA之间的序列相似性特征。3.根据权利要求1所述的基于卷积去噪自编码机的piRNA
‑
疾病关联关系预测方法,其特征在于,所述步骤S3中是基于MeSH数据库利用有向无环图构建各种疾病之间的关系,某种疾病D可以被表示为DAG(D)=(D,T(D),E(D)),其中T(D)为包含D及其祖先的节点集,E(D)为从父节点到子节点的边集,疾病D的第一种语义值可以表示为:其中,有向无环图中的疾病项目d对D的语义贡献通过以下公式定义:其中Δ是语义贡献衰减因子。4.根据权利要求3所述的基于卷积去噪自编码机的piRNA
‑
疾病关联关系预测方法,其
特征在于,如两种疾病d
i
和d
j
的有向无环图相似,则可以将疾病d
i
和d
j
视为相似的疾病,并定义第一种类型的疾病d
i
和d
j
之间的语义相似度DS1(d
i
,d
j
)为:以及第二种类型疾病语义相似度为:以及第二种类型疾病语义相似度为:以及第二种类型疾病语义相似度为:再将两种不同疾病d
i
和d
j
的语义相似性特征由均值相似核融合方法表示为:5.根据权利要求1所述的基于卷积去噪自编码机的piRNA
‑
...
【专利技术属性】
技术研发人员:彭绍亮,姬博亚,王小奇,习鹏,赵雄君,
申请(专利权)人:湖南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。