System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种基于图表示学习的环状rna-疾病关联预测方法、装置及存储介质。
技术介绍
1、环状rna(circrna)是一种非编码rna,具有共价闭环结构,在20世纪70年代首次被发现,但一直以来对环状rna的研究进展十分缓慢,直到近年来随着高通量测序技术、生命科学和基因组学研究的进一步发展,人们对环状rna的研究进程才得到进一步推进。已有研究表明环状rna的失调和突变与人类的一些疾病之间存在一定的相关性。
2、国内外对与环状rna与疾病的关联性研究方法主要可以分为两大类:一是基于生物学实验的研究,二是基于计算方法的预测研究。利用传统的生物学实验来验证环状rna与疾病的关联关系准确度高,但耗时长、成本高,目前可能难以应对庞大的环状rna和疾病关联网络。基于计算方法的预测研究存在着构建网络的方式较为单一、未考虑环状rna与疾病相互作用过程中其它类型生物分子的参与等问题。
技术实现思路
1、本专利技术提供一种基于图表示学习的环状rna-疾病关联预测方法、装置及存储介质,旨在提高异构网络的灵活性,使得图表示学习模型获得更丰富的节点表示,提高环状rna-疾病预测的准确性。
2、为实现上述目的,本专利技术提供一种基于图表示学习的环状rna-疾病关联预测方法,所述方法包括:
3、基于环状rna及相关信息构建环状rna的异构网络,所述异构网络包括环状rna节点和疾病节点;
4、将异构网络中各个节点的特征随机初始化后输入图表示
5、基于环状rna节点的表示向量和疾病节点的表示向量的内积确定为对应环状rna与疾病的关联预测得分。
6、可选地,所述基于环状rna及相关信息构建环状rna的异构网络包括:
7、从公开的数据集中获取构建环状rna的异构网络所需的相关信息,所述相关信息包括rna与疾病的关联关系、环状rna的相关生物分子及相互作用关系、环状rna序列和宿主基因;
8、基于环状rna序列计算环状rna序列之间的序列相似度在对应的环状rna节点之间添加第一边,基于疾病的疾病语义相似度在对应的疾病节点之间添加第二边,以获得异构网络。
9、可选地,所述从公开的数据集中获取构建环状rna的异构网络所需的相关信息包括:
10、从rnadisease数据库分别获取环状rna、mirna与疾病之间的疾病关联关系;
11、基于rnainter数据库提取与环状rna有直接相互作用关系的相关生物分子,并提取环状rna与相关生物分子之间的相互作用关系,所述相关生物分子包括mirna、rna结合蛋白、转铁蛋白、化合物;
12、基于circbase数据库获取环状rna序列和宿主基因。
13、可选地,所述基基于环状rna序列计算环状rna序列之间的序列相似度在对应的环状rna节点之间添加第一边,基于疾病的疾病语义相似度在对应的疾病节点之间添加第二边,以获得异构网络包括:
14、将不同长度的环状rna序列进行可逆变换投影成相同长度的rna序列向量,基于皮尔逊相关系数计算相同长度的rna序列向量之间的序列相似度;
15、将所有序列相似度的平均值确定为第一阈值,在序列相似度大于第一阈值的两个环状rna序列对应的环状rna节点之间添加第一边;
16、计算组成疾病名称的各个单词向量的单词向量相似性,对获得的单词向量相似性进行累加去平均后获得对应的两个疾病名称的疾病语义相似度;
17、基于所有疾病语义相似性的平均值确定为第二阈值,在相似性大于第二阈值的两个疾病名称对应的疾病节点之间添加对应的第二边。
18、可选地,所述图表示学习模型包括异构相互注意力模块、异构信息传递模块和信息聚合模块;
19、所述将异构网络中各个节点的特征随机初始化后输入图表示学习模型,通过所述图表示学习模型按预设流程学习各个节点的表示向量包括:
20、通过所述异构相互注意力模块获得异构网络中每个目标节点的注意力分数;
21、通过所述异构信息传递模块获得异构网络中每个目标节点的信息向量;
22、通过所述信息聚合模块将目标节点的注意力分数与信息向量进行聚合,获得对应目标节点的表示向量。
23、可选地,所述通过所述异构相互注意力模块获得异构网络中每个目标节点的注意力分数包括:
24、通过异构相互注意力模块将异构网络中目标节点的一元组关系的终点映射至query向量,将所述一元组关系的起点映射至key向量;
25、基于所述query向量、所述key向量、投影矩阵以及参数矩阵确定每一组关系类型的注意力分数;
26、对各种关系类型的注意力分数进行归一化转化,获得对应目标节点的注意力分数。
27、可选地,所述通过异构信息传递模块获得异构网络中每个目标节点的信息向量包括:
28、将异构网络中目标节点的一元组关系的起点的表示向量进行线性变换,并与依赖于同一组关系类型的参数化投影矩阵相乘获得单头的信息传递;
29、将所述一元组关系中所有的单头的信息传递进行拼接获得所述目标节点的信息向量。
30、可选地,所述通过信息聚合模块将目标节点的注意力分数与信息向量进行聚合,获得对应目标节点的表示向量包括:
31、基于注意力分数对信息进行聚合,获得目标节点在每一层的新的信息向量;
32、将所述新的信息向量进行线性投影获得线性投影向量,并获得所述线性投影向量的非线性激活函数结果;
33、将所述非线性激活函数结果与前一层的表示向量进行残差拼接,获得目标节点在对应层的表示向量;
34、将异构网络中每一层输出的表示向量相乘,获得所述目标节点最终的表示向量。
35、此外,为实现上述目的,本专利技术还提供一种基于图表示学习的环状rna-疾病关联预测装置,包括:
36、构建模块,用于基于环状rna及相关信息构建环状rna的异构网络;
37、学习模块,用于将异构网络中各个节点的特征随机初始化后输入图表示学习模型,通过所述图表示学习模型按预设流程学习各个节点的表示向量;
38、预测模块,用于基于环状rna节点的表示向量和疾病节点的表示向量的内积确定为对应环状rna与疾病的关联预测得分。
39、此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于图表示学习的环状rna-疾病关联预测程序,所述基于图表示学习的环状rna-疾病关联预测程序被处理器运行时实现如上所述的方法的步骤。
40、相比现有技术,本专利技术提出的一种基于图表示学习的环状rna-疾病关联预测方法、装置及存储介质,该方法包括:基于环状rna及相关信息构建环状rna的异构网络,所述异构网络包括环状rna节点本文档来自技高网...
【技术保护点】
1.一种基于图表示学习的环状RNA-疾病关联预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于环状RNA及相关信息构建环状RNA的异构网络包括:
3.根据权利要求2所述的方法,其特征在于,所述从公开的数据集中获取构建环状RNA的异构网络所需的相关信息包括:
4.根据权利要求2所述的方法,其特征在于,所述基基于环状RNA序列计算环状RNA序列之间的序列相似度在对应的环状RNA节点之间添加第一边,基于疾病的疾病语义相似度在对应的疾病节点之间添加第二边,以获得异构网络包括:
5.根据权利要求1所述的方法,其特征在于,所述图表示学习模型包括异构相互注意力模块、异构信息传递模块和信息聚合模块;
6.根据权利要求5所述的方法,其特征在于,所述通过所述异构相互注意力模块获得异构网络中每个目标节点的注意力分数包括:
7.根据权利要求5所述的方法,其特征在于,所述通过异构信息传递模块获得异构网络中每个目标节点的信息向量包括:
8.根据权利要求5所述的方法,其特征在于,所述通过信
9.一种基于图表示学习的环状RNA-疾病关联预测装置,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于图表示学习的环状RNA-疾病关联预测程序,所述基于图表示学习的环状RNA-疾病关联预测程序被处理器运行时实现如权利要求1-8中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种基于图表示学习的环状rna-疾病关联预测方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于环状rna及相关信息构建环状rna的异构网络包括:
3.根据权利要求2所述的方法,其特征在于,所述从公开的数据集中获取构建环状rna的异构网络所需的相关信息包括:
4.根据权利要求2所述的方法,其特征在于,所述基基于环状rna序列计算环状rna序列之间的序列相似度在对应的环状rna节点之间添加第一边,基于疾病的疾病语义相似度在对应的疾病节点之间添加第二边,以获得异构网络包括:
5.根据权利要求1所述的方法,其特征在于,所述图表示学习模型包括异构相互注意力模块、异构信息传递模块和信息聚合模块;
6.根据权利...
【专利技术属性】
技术研发人员:李君一,岑柯良,周靖力,王轩,刘博,王亚东,
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。