当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于深度神经网络的致病同义突变相关文献预测方法技术

技术编号:32479525 阅读:25 留言:0更新日期:2022-03-02 09:43
本发明专利技术公开了一种基于深度神经网络的致病同义突变相关文献预测方法,包括以下步骤:(1)数据收集与筛选:按照关键词检索文献摘要,通过和已有标准库进行比较,划分和筛选出致病同义突变相关文献和无关文献,即正负样本数据集,再通过自助法划分出训练数据集和独立测试集;(2)文本特征提取:利用Word2vec的词向量提取方法对获取的文献数据进行文本特征提取;(3)模型构建与训练;(4)模型预测和使用。本发明专利技术通过采用深度神经网络技术构建最优模型,用来从海量的文献中识别致病同义突变相关文献的信息,大大提升了致病同义突变文献信息的获取精度和速度,极大程度上减少了科研工作者的工作量,从而大大提高了科学研究效率。从而大大提高了科学研究效率。从而大大提高了科学研究效率。

【技术实现步骤摘要】
一种基于深度神经网络的致病同义突变相关文献预测方法


[0001]本专利技术涉及生物信息计算
,具体涉及一种基于深度神经网络的致病同义突变相关文献预测方法。

技术介绍

[0002]支撑生命活动的蛋白质是至关重要的,而中心法则告诉我们DNA链上每三个碱基会控制一种氨基酸生成,也称为密码子,且一个氨基酸可以对应多个密码子,所以基因有了一定的容错性。为此,人们普遍认为错义突变从基因改变到氨基酸改变,再到最终导致蛋白质功能影响是生命科学研究和突破的重点,所以错义突变这些年有了极大的发展。另外,近年来越来越多文献证明同义突变也会从各个方面影响生命活动,所以已经有专家开始研究同义突变致病性预测,也有开始进行同义突变和疾病的关联性分析工作。
[0003]这些工作都离不开致病同义突变数据,而根据我们的调研,绝大部分可靠的致病同义突变信息都来源文献中,比如人类基因突变数据库中每一个突变信息都有对应的文献依据,反推如果可以从大量文献中找到同义突变相关的文献,那么就可以通过增加文献的方式来增加致病同义突变数据。另一方面,如果可以将PubMed生命科学领域本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度神经网络的致病同义突变相关文献预测方法,其特征在于,包括以下步骤:(1)数据收集与筛选:按照关键词检索文献摘要,通过和已有标准库进行比较,划分和筛选出致病同义突变相关文献和无关文献,即正负样本数据集,再通过自助法(Boostraping)划分出训练数据集和独立测试集;(2)文本特征提取:利用Word2vec的词向量提取方法对获取的文献数据进行文本特征提取;(3)模型构建与训练:获取的正负样本数据集根据自助法验证的方式划分训练集和验证集,训练集用于对模型进行构建与训练,验证集用于进行模型的参数调整和多种模型的比较,最终获取最优的网络模型;(4)模型预测和使用:使用数据集训练的模型对未来出现的文献进行预测,来判别其是否是致病同义突变相关的文献。2.根据权利要求1所述的一种基于深度神经网络的致病同义突变相关文献预测方法,其特征在于,步骤(1)中所述正负样本数据集划分的主要步骤为:以来自PubMed上检索同义突变关键词获得的文献为基准,再跟从HGMD数据库和dbDSM数据库中获取的文献信息进行比对,将从PubMed上检索文献并...

【专利技术属性】
技术研发人员:夏俊峰汪华东郑春厚
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1