一种基于标准化表型术语的疾病和基因预测方法技术

技术编号:36097324 阅读:26 留言:0更新日期:2022-12-24 11:16
本发明专利技术公开了一种基于标准化表型术语的疾病和基因预测方法,该方法包括以下步骤:S1、将原始疾病表型通过输入层进行分层级输入;S2、将输入后的原始疾病表型通过数据层转换为标准疾病表型;S3、将标准疾病表型通过分析层进行逐级搜索,并进行评分预测;S4、将预测结果通过输出层输出。本发明专利技术通过对表型输入的自然语言处理,逐级搜索不同层级表型进行打分来预测疾病和基因,且逐级以上一个标准疾病表型打分最高的疾病作为搜索域,逐级减少下一级的搜索范围,使得本发明专利技术大大减少了计算量的时间,极大的提高了本发明专利技术的使用效率,以及避免了非主要表型对于疾病预测的主导作用。主要表型对于疾病预测的主导作用。主要表型对于疾病预测的主导作用。

【技术实现步骤摘要】
一种基于标准化表型术语的疾病和基因预测方法


[0001]本专利技术涉及自然语言分析和遗传疾病分析领域,具体来说,涉及一种基于标准化表型术语的疾病和基因预测方法。

技术介绍

[0002]随着移动互联网的应用和普及,越来越多的用户开始借助移动终端,线上地开展业务,而远程医疗系统诊断疾病也在蓬勃的发展,病人用户通常需要利用用户终端,将自身的医疗数据上传到疾病预测服务器,疾病预测服务器根据用户终端上传的医疗数据,做出相应的疾病预测,同时随着大规模生物样本数据库、强大基因组学和医疗技术的发展,人们逐渐意识到大多数疾病的发生是自身遗传密码和外界环境共同作用的结果,因此,依据个体的基因、健康差异来制定个性化治疗和预防方案的新型治疗方法,引领了新的医学时代。
[0003]而基因表达是将来自基因的遗传信息合成功能性基因产物的过程,该过程受到多个维度的精确调控和复杂相互作用的影响,例如基因突变、转录因子、非编码RNA和甲基化等,这种多层次的监管网络使多组学整合成为表征表型复杂生物学机制的重要方法,现有遗传性疾病的研究通常根据生物信息分析后得到的基因突变去查本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于标准化表型术语的疾病和基因预测方法,其特征在于,该方法包括以下步骤:S1、将原始疾病表型通过输入层进行分层级输入;S2、将输入后的原始疾病表型通过数据层转换为标准疾病表型;S3、将标准疾病表型通过分析层进行逐级搜索,并进行评分预测;S4、将预测结果通过输出层输出。2.根据权利要求1所述的一种基于标准化表型术语的疾病和基因预测方法,其特征在于,所述将原始疾病表型通过输入层进行分层级输入包括以下步骤:S11、将原始疾病层级依次分为原始主要表型、原始次要表型及原始其他表型;S12、将原始主要表型、原始次要表型及原始其他表型赋予权重。3.根据权利要求2所述的一种基于标准化表型术语的疾病和基因预测方法,其特征在于,所述原始主要表型、原始次要表型及原始其他表型权重比分别为7:3:1。4.根据权利要求1所述的一种基于标准化表型术语的疾病和基因预测方法,其特征在于,所述将输入后的原始疾病表型通过数据层转换为标准疾病表型包括以下步骤:S21、将输入的原始疾病表型通过自然语言处理;S22、将处理后的原始疾病表型转化为人类表型数据库中的标准疾病表型。5.根据权利要求4所述的一种基于标准化表型术语的疾病和基因预测方法,其特征在于,所述将输入的原始疾病表型通过自然语言处理包括以下步骤:S211、通过语义检索任务,将人类表型数据库中的标准疾病表型作为被检索对象对输入的原始疾病表型进行检索;S212、基于CosENT模型对STS

B数据集进行训练,训练完成后得到用于语义检索的模型;S213、设定相似性分数的阈值;S214、对训练结果进行选择;其中,所述标准疾病表型包括标准主要表型、标准次要表型及标准其他表型。6.根据权...

【专利技术属性】
技术研发人员:林娜王滔孙红波何涛
申请(专利权)人:南京腾鸿医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1