System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物信息学和计算生物学,具体为一种多视图的circrna与mirna关系预测方法及系统。
技术介绍
1、在生物学和生物信息学的研究中,环状rna(circrna)和微小rna(mirna)是两类核心的非编码rna分子。它们在生命过程中起着重要的作用,并在基因表达调控、生物分子交互、疾病发生以及治疗等方面展示出了极大的潜力。特别是在这两者相互作用关系的研究中,对理解生物体内的复杂网络及其在疾病中的作用都具有重要意义。
2、circrna是一类特殊的非编码rna,其结构以环形为特征,不同于传统的线性rna分子。这种独特的环状结构使得它们在细胞中的稳定性远高于线性rna,从而在许多生物过程中发挥重要作用。研究人员已经发现,circrna在基因表达的调控、细胞生命周期、免疫反应等多种生物过程中起到关键作用。近年来的研究还进一步揭示了circrna在诸多疾病中,包括各类癌症、神经退行性疾病和心脏病等,在疾病的发生、发展和治疗中的重要性。mirna是一类长度约为22个核苷酸的小rna分子,它们通过与mrna的3'非翻译区域互补配对,导致mrna的降解或翻译抑制,从而调控基因的表达。自从1993年在线虫中首次发现mirna以来,人们已经发现了数千种mirna,并逐渐揭示出它们在生物过程中的作用,包括细胞增殖、分化、凋亡和免疫反应等。另外,mirna也在许多疾病中,如各种癌症、心脏病和神经退行性疾病等,发挥着重要作用。
3、在这两类rna分子中,circrna和mirna之间的相互作用关系很重要。其中,最重
技术实现思路
1、鉴于上述存在的问题,提出了本专利技术。
2、因此,本专利技术解决的技术问题是:目前的预测方法主要是基于生物信息学和机器学习的方法,但这些方法常常忽略了生物网络的结构信息,可能会导致预测的准确性不足。
3、为解决上述技术问题,本专利技术提供如下技术方案:一种多视图的circrna与mirna关系预测方法,包括:
4、采集云服务端的平台参数;
5、将所述平台参数通过粒子群算法得到初步优解;
6、将所述初步优解作为遗传算法的初始种群进行计算,通过适应度函数实现种群优化并判断是否达到停止条件,从而得到最优结果,实现负载平衡。
7、从数据库中收集circrna和mirna数据;
8、构建正负样本数据集,从序列和网络层面构建表征特征;
9、将特征数据融合为二维数据结构,得到序列特征和图嵌入特征的矩阵;
10、基于特征转化矩阵,构建四通道的卷积神经网络,分析预测circrna和mirna的关系。
11、作为本专利技术所述的多视图的circrna与mirna关系预测方法的一种优选方案,其中:所述构建正负样本数据集包括,从circnet和circbank两个数据库,选择强相关关联的circrna-mirna对作为正样本,弱相关性的circrna-mirna对作为负样本;构建cmi-14500和cmi-9600数据集。
12、作为本专利技术所述的多视图的circrna与mirna关系预测方法的一种优选方案,其中:所述负样本包括,获取数据集中所有已知的circrna和mirna,生成circrna-mirna对,将所有的circrna和所有的mirna进行配对,生成所有可能的circrna-mirna对,移除所有已知的正样本对;
13、为判断负样本对,使用生物信息学的预测工具miranda和targetscan预测circrna和mirna是否存在交互作用;miranda使用动态规划算法来寻找mirna序列与mrna序列之间的最佳匹配,并基于互补碱基的数量和类型、序列中的错配和间隙、mirna的种子区域与mrna的互补性三个因素评分,判断circrna-mirna是否存在相关关系;targetscan使用mirna序列与mrna的3’utr序列进行比对,关注mirna的种子区域与mrna中的3’utr中的互补序列的结合情况,通过评分基于种子匹配的强度、结合位点的保守性判断circrna-mirna是否存在相关关系;若miranda和targetscan同时判断circrna与mirna存在相关关系,则该样本对被判断为负样本对。
14、作为本专利技术所述的多视图的circrna与mirna关系预测方法的一种优选方案,其中:所述构建表征特征包括,从circrna和mirna的序列层面中提取序列特征;提取的特征包括序列长度、gc含量、核苷酸频率分布;
15、通过boruta特征选择方法筛选最为高效的特征,做出假设,若一个特征对预测目标非常重要,那么在数据中加入该特征的随机扰动后,该特征的重要性应该仍然高于这些随机特征;通过迭代地测试特征的重要性来选择最佳特征子集;通过构建基于circrna与mirna的相关关系图,图中节点表示circrna和mirna,边表示节点间的相关关系;采用图嵌入方法graphsage,为每个节点生成一个向量表示;graphsage算法通过采样和聚合节点的邻居信息来学习节点的嵌入,通过多个聚合层来实现。
16、作为本专利技术所述的多视图的circrna与mirna关系预测方法的一种优选方案,其中:所述聚合包括,初始化节点嵌入,对于图中的每个节点,随机初始化其嵌入表示采样邻居,对于每个节点v,从其邻居n(v)中随机采样固定数量的邻居节点;聚合邻居信息,对于采样得到的邻居节点,使用均值聚合函数来聚合它们的嵌入表示,均值聚合的公式表示为:
17、
18、其中,s表示采样得到的邻居节点集合,w表示可学习的权重;b表示可学习的偏置,σ表示relu激活函数;更新节点嵌入,将聚合后的邻居信息与当前节点的嵌入表示相结合,生成新的节点嵌入表示l表示当前层,l+1为l的下一层;s表示节点v的所有邻居节点,u表示邻居节点中的一个节点,u属于集合s;
19、迭代聚合,重复采样到嵌入的步骤,进行多轮聚合,每一轮都可以采样更多的邻居节点,从而融合来自更远邻居的信息;
20、输出最终嵌入,经过多轮聚合后,每个节点的最终嵌入表示将是最后一轮聚合的输出,其中l本文档来自技高网...
【技术保护点】
1.一种多视图的circRNA与miRNA关系预测方法,其特征在于,包括:
2.如权利要求1所述的多视图的circRNA与miRNA关系预测方法,其特征在于:所述构建正负样本数据集包括,从circNet和circBank两个数据库,选择强相关关联的circRNA-miRNA对作为正样本,弱相关性的circRNA-miRNA对作为负样本;构建CMI-14500和CMI-9600数据集。
3.如权利要求2所述的多视图的circRNA与miRNA关系预测方法,其特征在于:所述负样本包括,获取数据集中所有的circRNA和miRNA样本,生成circRNA-miRNA对,移除所有已知的正样本对;
4.如权利要求3所述的多视图的circRNA与miRNA关系预测方法,其特征在于:所述构建表征特征包括,从circRNA和miRNA的序列层面中提取序列特征;提取的特征包括序列长度、GC含量、核苷酸频率分布;
5.如权利要求4所述的多视图的circRNA与miRNA关系预测方法,其特征在于:所述聚合包括,初始化节点嵌入,对于图中的每个节点,随机初始
6.如权利要求5所述的多视图的circRNA与miRNA关系预测方法,其特征在于:所述融合为二维数据结构包括,将circRNA和miRNA的序列特征,通过二维直方图的方式转化为2维矩阵;将circRNA和miRNA的图嵌入表示通过二维直方图的方式转化为2维矩阵;通过二维直方图的转换模式,将circRNA和miRNA特征表示为一种联合分布的矩阵,二维直方图将数据集的每个维度划分为一系列区间;
7.如权利要求6所述的多视图的circRNA与miRNA关系预测方法,其特征在于:所述构建四通道的卷积神经网络包括,构建的网络的通道分别对应circRNA和miRNA的序列特征转化的矩阵数据和circRNA和miRNA图嵌入特征转化的矩阵数据;对卷积神经网络添加多视图的注意力机制,用于细致扫描数据特性;将基于序列的特征和基于图嵌入的特征结合在一起,完成对circRNA与miRNA关系的分析和预测。
8.一种采用如权利要求1-7任一所述方法的多视图的circRNA与miRNA关系预测系统,其特征在于:
9.一种计算机设备,包括:存储器和处理器;所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现多视图的circRNA与miRNA关系预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现多视图的circRNA与miRNA关系预测方法的步骤。
...【技术特征摘要】
1.一种多视图的circrna与mirna关系预测方法,其特征在于,包括:
2.如权利要求1所述的多视图的circrna与mirna关系预测方法,其特征在于:所述构建正负样本数据集包括,从circnet和circbank两个数据库,选择强相关关联的circrna-mirna对作为正样本,弱相关性的circrna-mirna对作为负样本;构建cmi-14500和cmi-9600数据集。
3.如权利要求2所述的多视图的circrna与mirna关系预测方法,其特征在于:所述负样本包括,获取数据集中所有的circrna和mirna样本,生成circrna-mirna对,移除所有已知的正样本对;
4.如权利要求3所述的多视图的circrna与mirna关系预测方法,其特征在于:所述构建表征特征包括,从circrna和mirna的序列层面中提取序列特征;提取的特征包括序列长度、gc含量、核苷酸频率分布;
5.如权利要求4所述的多视图的circrna与mirna关系预测方法,其特征在于:所述聚合包括,初始化节点嵌入,对于图中的每个节点,随机初始化其嵌入表示采样邻居,对于每个节点v,从其邻居n(v)中随机采样固定数量的邻居节点;聚合邻居信息,对于采样得到的邻居节点,使用均值聚合函数来聚合它们的嵌入表示,均值聚合的公式表示为:
6.如权利要求5所述的多视图的circr...
【专利技术属性】
技术研发人员:杨森,杨泽熙,卢嘉毅,倪嘉琦,聂琪,陈宏,
申请(专利权)人:常州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。