基于Logistic函数填充相似性矩阵的miRNA-疾病关联预测方法技术

技术编号：37713501 阅读：11 留言：0更新日期：2023-06-02 00:07

本发明专利技术提供基于Logistic函数填充相似性矩阵的miRNA

全部详细技术资料下载

【技术实现步骤摘要】
基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法

[0001]本专利技术涉及机器学习与生物基因结合领域，更具体地，涉及基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法。

技术介绍

[0002]MicroRNAs(miRNAs)是一组小的非编码RNA(约20
‑
25个核苷酸)，在转录后过程中通常可以作为靶信使RNA(mRNA)表达的负调控因子。它们通过碱基配对抑制靶mRNA，并影响基因翻译。而且，已经证实miRNA也可以作为正调节因子。近年来，大量现有的研究表明，miRNAs参与了许多重要的生物过程，包括细胞分化、发育、增殖和信号转导。此外，一些先前的研究证明miRNAs与各种疾病有关，包括癌症、阿尔茨海默症、糖尿病和淋巴瘤。例如，hsa
‑
mir
‑
21的表达水平与超过125种疾病相关。因此，识别更多miRNA与疾病之间的关系对生物医学研究有重要贡献。对疾病与miRNAs相关的知识可以促进我们在分子水平上理解疾病的发病机制，并有益于设计疾病诊断和治疗的分子工具。此外，基于miRNA对疾病的治疗也在研究。在这种背景下，对识别miRNA
‑
疾病关联的需求越来越大，这导致了生物医学领域的密集研究活动。
[0003]传统的实验方法对发现潜在的关联具有较高的精度，但其过程复杂、耗时。开发一种有效、方便的方法来检测miRNA与疾病之间的关系尤为重要。而计算模型可以作为识别...

【技术保护点】

【技术特征摘要】
1.基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法，其特点在于，包括以下步骤：S1：获取miRNA功能相似性MFS、疾病语义相似性DSS以及miRNA
‑
疾病邻接矩阵MD；S2：将MD矩阵每两行对应位相同且为1与不同的位个数作为Logistic函数的变量，计算出来的值用于填充MFS矩阵的0值处，填充后的矩阵为MS；将MD矩阵每两列对应位相同且为1与不同的位个数作为Logistic函数的变量，计算出来的值用于填充DSS矩阵的0值处，填充后的矩阵为DS；S3：分别为MS和DS矩阵建立一个权重矩阵来进一步消除整体的噪声；S4：使用拉普拉斯正则化最小二乘法来挖掘潜在的miRNA
‑
疾病关联。2.根据权利要求1所述的基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法，其特征在于，步骤S1中miRNA功能相似矩阵MFS，具体为：根据一种比较普遍的假设，功能相似的miRNA倾向于与表型相似的疾病存在关联关系，Wang等人借助了疾病语义相似性的帮助，计算得到了miRNA的功能相似性；该功能相似性分数在http://www.cuilab.cn/files/images/cuilab/misim.zip提供下载使用；由此构建了miRNA功能相似性矩阵MFS∈R
p
×
p
；其中，MFS(m
i
,m
j
)是miRNA m
i
和m
j
之间的功能相似性得分，p为miRNA的数量。3.根据权利要求1所述的基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法，其特征在于，步骤S1中疾病语义相似性矩阵DSS，具体为：在MeSH数据库中，疾病d
i
可以被标记为有向无环图(DAG)中的一个节点；我们将一个子网络表示为G(d
i
)＝(d
i
,T(d
i
),E(d
i
))，其中T(d
i
)是包含d
i
自身的所有祖先节点的集合，E(d
i
)是对应链接的集合；每种疾病的语义得分可以通过以下公式计算出来；结合其祖先节点在DAG(d
i
)中的贡献值，可以将疾病d
i
的语义值描述为：如果两种疾病在DAG中有更多的共享节点，则可以认为两种疾病之间的语义相似性更高，使用语义相似矩阵DSS(d
i
,d
j
)来表示疾病d
i
和疾病d
j
之间的语义相似度，定义为：由此我们构建了疾病语义相似性矩阵DSS∈R
q
×
q
，这里，DSS(d
i
,d
j
)是疾病d
i
和d
j
之间的语义相似性得分，q为疾病的数量。4.根据权利要求1所述的基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法，其特征在于，步骤S1中miRNA
‑
疾病邻接矩阵MD，具体为：从HMDD数据库获得了5430个miRNA
‑
疾病关联，包括495个miRNAs和383种疾病，miRNAs的集合用表示，疾病的集合用表示；关联矩阵用Y∈R
p
×
q
表示，其中Y(i,j)∈{0,1}；当miRNA m
i
与疾病d
j
有关联时，将Y(i,j)设为1；否则，将Y(i,j)设为0。
5.根据权利要求1所述的基于Logistic函数填充相似性矩阵的miRNA
‑
疾病关联预测方法，其特征在于，步骤S2中将MD矩阵每两行对应位相同且为1与不同的位个数作为Logistic函数的变量，计算出来的值用于填充MFS矩阵的0值处，填充后的矩阵为MS。6.根据权利要求1所述的基于Logistic函数填充相似性矩阵的mi...

【专利技术属性】
技术研发人员：谢国波，谢伟杰，顾国生，林志毅，刘世刚，刘浩杰，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人