System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及生物信息,特别是涉及一种rna相似度分析图计算方法、装置、设备和介质。
技术介绍
1、核糖核酸(ribonucleic acid,rna)存在于生物细胞以及部分病毒、类病毒中的遗传信息载体。rna由核糖核苷酸经磷酸二酯键缩合而成长链状分子。一个核糖核苷酸分子由磷酸、核糖和碱基构成。rna的碱基主要有4种,即a(腺嘌呤)、g(鸟嘌呤)、c(胞嘧啶)、u(尿嘧啶)。
2、核糖核酸在生物各项活动中发挥着重要的作用。对核糖核酸的组成和结构的探索也是当前生物学家主要的研究方向之一。核糖核酸分子存在着许多的由互补碱基对形成的茎环结构,即为rna的二级结构。其中,二级结构可细分为3’片段,5’片段,发卡环,茎,内环,多连环片段等子结构。
3、基于在rna结构相似的情况下,大概率存在功能相似的规律,生物学家主要通过分析查找rna二级结构的相似性,从而发现与目标rna有相似功能的其他rna,从而为rna功能发现、病毒治疗等提供新的发现;通过对rna二级结构的相似度进行比对,可以发现相似度不同的其他种类rna,从而进行rna分类和发现新的rna。
4、目前,对于rna二级结构相似性的判断,生物学家们主要通过肉眼判断其中的茎环结构,主观的评估是否相似,存在主观性且效率不高的问题;也有通过树结构、小波分析或其他的生物学算法进行相似性判断,但也存在无法便捷智能、高效快速又直观的计算出被查找rna与目标rna之间的相似性的问题。
技术实现思路
1、基于此,有必要针
2、第一方面,本申请实施例提供了一种rna相似度分析图计算方法,所述方法包括:
3、将被查找rna的序列数据转换为被查找rna结构图;
4、对所述被查找rna结构图与目标rna结构图进行相似性分析,得到第一相似度;
5、确定所述被查找rna结构图中基础组成结构的数量,并基于所述被查找rna结构图中基础组成结构的数量与所述目标rna结构图中基础组成结构的数量,得到第二相似度;
6、基于所述被查找rna结构图中的基础组成结构,对所述被查找rna结构图进行重构,生成被查找rna高阶图;对所述被查找rna高阶图与目标rna高阶图进行相似性分析,得到第三相似度;
7、基于所述第一相似度、所述第二相似度以及所述第三相似度,获得所述被查找rna与目标rna的最终相似度。
8、在其中一个实施例中,所述对所述被查找rna结构图与目标rna结构图进行相似性分析,得到第一相似度包括:
9、采用图核分解方法将所述被查找rna结构图分解为多个被查找rna子图,以及将目标rna结构图分解为多个目标rna子图;
10、基于所述多个被查找rna子图与所述多个目标rna子图,得到第一相似度。
11、在其中一个实施例中,所述基于所述多个被查找rna子图与所述子图多个目标rna子图,得到第一相似度包括:
12、对所述多个被查找rna子图进行编码,获得第一编码序列,以及对所述多个目标rna子图进行编码,获得第二编码序列;
13、基于所述第一编码序列以及所述第二编码序列,计算第一相似度。
14、在其中一个实施例中,所述确定所述被查找rna结构图中基础组成结构的数量,并基于所述被查找rna结构图中基础组成结构的数量与所述目标rna结构图中基础组成结构的数量,得到第二相似度包括:
15、确定所述被查找rna结构图中各基础组成结构对应的数量,以及确定所述目标rna结构图中各基础组成结构对应的数量;
16、将所述被查找rna结构图中各基础组成结构对应的数量组成第一结构向量,以及将所述目标rna结构图中各基础组成结构对应的数量组成第二结构向量;
17、基于所述第一结构向量以及所述第二结构向量,采用欧式距离计算方法获得第二相似度。
18、在其中一个实施例中,采用图匹配算法确定所述被查找rna结构图以及所述目标rna结构图中各基础组成结构对应的数量。
19、在其中一个实施例中,所述基于所述第一相似度、所述第二相似度以及所述第三相似度,获得所述被查找rna与所述目标rna的最终相似度的计算公式为:
20、score=α*score1+β*score2+γ*score3;
21、其中,α、β、γ表示约束参数,其大小在0至1之间,且满足α+β+γ=1,score1表示第一相似度,score2表示第二相似度,score3表示第三相似度,socre表示最终相似度。
22、在其中一个实施例中,所述基于所述被查找rna结构图中的基础组成结构,对所述被查找rna结构图进行重构,生成被查找rna高阶图包括:
23、将所述被查找rna结构图中的各所述基础组成结构分别作为一个节点;
24、将各所述基础组成结构的长度作为对应节点的属性;
25、根据各所述基础组成结构之间的拓扑关系进行连边,形成被查找rna高阶图。
26、第二方面,本申请实施例还提供了一种rna相似度分析图计算装置,所述装置包括:
27、转换模块,用于将被查找rna的第一序列数据转换为被查找rna结构图;
28、第一得到模块,用于对所述被查找rna结构图与目标rna结构图进行相似性分析,得到第一相似度;
29、第二得到模块,用于确定所述被查找rna结构图中基础组成结构的数量,并基于所述被查找rna结构图中基础组成结构的数量与所述目标rna结构图中基础组成结构的数量,得到第二相似度;
30、第三得到模块,用于基于所述被查找rna结构图中的基础组成结构,对所述被查找rna结构图进行重构,生成被查找rna高阶图;对所述被查找rna高阶图与目标rna高阶图进行相似性分析,得到第三相似度;
31、获得模块,用于基于所述第一相似度、所述第二相似度以及所述第三相似度,获得所述被查找rna与所述目标rna的最终相似度。
32、第三方面,本申请实施例还提供了一种电子设备,包括缓存模块、控制模块以及多个计算单元;
33、所述缓存模块,用于存储目标rna数据,所述目标rna数据包括目标rna结构图,第二结构向量以及目标rna高阶图;
34、所述控制模块,用于将多个被查找rna的序列数据分发到所述多个计算单元;
35、所述多个计算单元,用于基于所述目标rna数据以及所述被查找rna的序列数据,计算执行如上述第一方面所述的方法,获得各被查找rna与所述目标rna的相似度。
36、第四方面,本申请实施例还提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
37、上述rna相似度分析图计算方法、装置、设备和本文档来自技高网...
【技术保护点】
1.一种RNA相似度分析图计算方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述被查找RNA结构图与目标RNA结构图进行相似性分析,得到第一相似度包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个被查找RNA子图与所述子图多个目标RNA子图,得到第一相似度包括:
4.根据权利要求1所述的方法,其特征在于,所述确定所述被查找RNA结构图中基础组成结构的数量,并基于所述被查找RNA结构图中基础组成结构的数量与所述目标RNA结构图中基础组成结构的数量,得到第二相似度包括:
5.根据权利要求4所述的方法,其特征在于,采用图匹配算法确定所述被查找RNA结构图以及所述目标RNA结构图中各基础组成结构对应的数量。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第一相似度、所述第二相似度以及所述第三相似度,获得所述被查找RNA与所述目标RNA的最终相似度的计算公式为:
7.根据权利要求1所述的方法,其特征在于,所述基于所述被查找RNA结构图中的基础组成结构,对所述被
8.一种RNA相似度分析图计算装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括缓存模块、控制模块以及多个计算单元;
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至权利要求7中任一项所述的方法。
...【技术特征摘要】
1.一种rna相似度分析图计算方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述被查找rna结构图与目标rna结构图进行相似性分析,得到第一相似度包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个被查找rna子图与所述子图多个目标rna子图,得到第一相似度包括:
4.根据权利要求1所述的方法,其特征在于,所述确定所述被查找rna结构图中基础组成结构的数量,并基于所述被查找rna结构图中基础组成结构的数量与所述目标rna结构图中基础组成结构的数量,得到第二相似度包括:
5.根据权利要求4所述的方法,其特征在于,采用图匹配算法确定所述被查找rna结构图以及所述目标rna结构图中各...
【专利技术属性】
技术研发人员:许增辉,唐进,张宇,陈高祥,余婷,赵进,张吉,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。