一种数据融合方法及装置制造方法及图纸

技术编号:20945004 阅读:56 留言:0更新日期:2019-04-24 02:36
本申请提供一种数据融合方法及装置,用于解决现有技术中对癌症的多维属性数据融合,并进行癌症分子分型,从而获得癌症的分子亚型的过程中,时间复杂度会随着特征数增大而显著增加的问题。该方法包括:将获得的多个相似性矩阵连接,获得第一异质矩阵;使用第一预设算法对第一异质矩阵进行迭代计算,获得在迭代达到稳态分布下的第二异质矩阵;使用第二预设算法对第二异质矩阵进行融合计算,获得融合相似性矩阵;对融合相似性矩阵进行聚类分析,获得多个社团。

A Data Fusion Method and Device

This application provides a data fusion method and device for solving the problem of multi-dimensional attribute data fusion and cancer molecular typing in the existing technology, so as to obtain molecular subtypes of cancer, the time complexity will increase significantly with the increase of the number of features. The method includes: connecting multiple similarity matrices to obtain the first heterogenous matrix; using the first presupposition algorithm to iterate the first heterogenous matrix to obtain the second heterogenous matrix under the steady distribution of iteration; using the second presupposition algorithm to fuse the second heterogenous matrix to obtain the fused similarity matrix; clustering the fused similarity matrix. Analyse and get multiple associations.

【技术实现步骤摘要】
一种数据融合方法及装置
本申请涉及数据处理的
,尤其涉及一种数据融合方法及装置。
技术介绍
iCluster是一个无监督机器学习框架,用来进行数据整合。方法流程表示为多个数据矩阵的矩阵分解。Xi代表相同数量的样本的不同数据类型,不同的数据类型有不同的特征数量ni。多个矩阵被分解到一个共同的特征空间,由矩阵Z表示,矩阵Z也被称为聚类指示矩阵;它用于将p个样本分配到k个社团中。称为系数矩阵的矩阵Wi特定于每个数据集i(即分别对应于不同数据类型矩阵)。矩阵Z捕获跨数据类型的相关性,并根据Z将样本分配到子社团(癌症分子亚型)。但是目前在具体的实施过程中,iCluster数据整合技术通过整合癌症的多维属性数据进行癌症分子分型,得到癌症的分子亚型。若矩阵中特征数量变化,则矩阵分解的结果也会直接受到影响,若特征样本矩阵中特征数量十分巨大,则矩阵分解的计算量增加,时间复杂度也会增大,所以,这种方法的时间复杂度会随着特征数增大而显著增加。因此,现有技术中存在着对癌症的多维属性数据融合,并进行癌症分子分型,从而获得癌症的分子亚型的过程中,时间复杂度会随着特征数增大而显著增加的问题。
技术实现思路
有鉴本文档来自技高网
...

【技术保护点】
1.一种数据融合方法,其特征在于,所述方法包括:将获得的多个相似性矩阵连接,获得第一异质矩阵;使用第一预设算法对所述第一异质矩阵进行迭代计算,获得在迭代达到稳态分布下的第二异质矩阵;使用第二预设算法对所述第二异质矩阵进行融合计算,获得融合相似性矩阵;对所述融合相似性矩阵进行聚类分析,获得多个社团。

【技术特征摘要】
1.一种数据融合方法,其特征在于,所述方法包括:将获得的多个相似性矩阵连接,获得第一异质矩阵;使用第一预设算法对所述第一异质矩阵进行迭代计算,获得在迭代达到稳态分布下的第二异质矩阵;使用第二预设算法对所述第二异质矩阵进行融合计算,获得融合相似性矩阵;对所述融合相似性矩阵进行聚类分析,获得多个社团。2.如权利要求1所述的方法,其特征在于,所述将获得的多个相似性矩阵连接,获得第一异质矩阵,包括:将所述多个相似性矩阵与多个相同的预设矩阵按照预定顺序排列,获得第一异质矩阵。3.如权利要求2所述的方法,其特征在于,所述多个相似性矩阵包括第一相似性矩阵、第二相似性矩阵,所述第一异质矩阵为:其中,S为所述第一异质矩阵,In为预设矩阵,S1为所述第一相似性矩阵,S2为所述第二相似性矩阵。4.如权利要求3所述的方法,其特征在于,所述使用第二预设算法对所述第二异质矩阵进行融合计算,获得融合相似性矩阵,包括:对进行均值融合计算,获得其中,S'为所述第二异质矩阵,Sfusion为所述融合相似性矩阵,所述第一相似性矩阵包括多个节点,所述第二相似性矩阵包括多个节点,S′1为所述第一相似性矩阵中节点游走到所述第一相似性矩阵的概率矩阵,A′12为所述第一相似性矩阵中节点游走到所述第二相似性矩阵的概率矩阵,A'21为所述第二相似性矩阵中节点游走到所述第一相似性矩阵的概率矩阵,S'2为所述第二相似性矩阵中节点游走到所述第二相似性矩阵的概率矩阵。5.如权利要求3所述的方法,其特征在于,所述使用第一预设算法对所述第一异质矩阵进行迭代计算,获得在迭代达到稳态分布下的第二异质矩阵,包括:设置所述第一相似性矩阵的第一初始值、所述第二相似性矩阵的第二初始值和所述第一异质矩阵的第三初始值;将所述第一初始值、所述第二初始值和所述第三初始值代入可重启随机游走算法对所述第一异质矩阵进行迭代计算;当所述迭代计算满足第一预设条件时,迭代达到稳态分布,获得第二异质矩阵。6.如权利要求5所述的方法,其特征在于,所述设置所述第一相似性矩阵的第一初始值、所述第二相似性矩阵的第二初始值和所述第一异质矩阵的第三初始值,包括:设置所述第一初始值为其中,表示所述第一相似性矩阵的初始资源,满足关系设置所述第二初始值为其中,表示所述第二相似性矩阵的初始资源,满足关系设置所述第三初始值为其中,表示所述第一异质矩阵在第0时刻的概率向量,α1为所述第一相似性矩阵的初始资源获得概率,α2为所述第二相似性矩阵的初始资源获得概率,α1和α2满足关系α1+α2=1,并且,和满足关系7.如权利要求5所述的方法,其特征在于,所述将所述第一初始值、所述第二初始值和所述第三初始值代入可重启随机游走算法对所述第一异质矩阵进行迭代计算,包括:将所述第一初始值、所述第二初始值和所述第三...

【专利技术属性】
技术研发人员:何松伯晓晨文昱琦宋欣雨刘祯杨晓曦
申请(专利权)人:中国人民解放军军事科学院军事医学研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1