【技术实现步骤摘要】
中医临床数据的多视图聚类方法、装置及电子设备
[0001]本专利技术涉及计算机
,尤其涉及一种中医临床数据的多视图聚类方法、装置及电子设备。
技术介绍
[0002]聚类分析,是指将对象的集合分组为由类似的对象组成的多个类的分析过程。
[0003]目前,对于中医领域的临床数据,通常采用单视图聚类方法进行聚类分析,具体需要将不同视图的样本特征串联成单个联合视图样本特征,并将串联后的单个联合视图样本特征输入至聚类模型中进行聚类,得到聚类结果。
[0004]但是,单纯的将不同视图的样本特征串联成单个联合视图样本特征,然后采用单视图聚类方法进行聚类分析,聚类分析的效果差,例如聚类分析的准确性低。
技术实现思路
[0005]本专利技术提供一种中医临床数据的多视图聚类方法、装置及电子设备,用以解决现有技术中聚类分析的效果差的问题。
[0006]本专利技术提供一种中医临床数据的多视图聚类方法,包括:
[0007]从N个目标对象的中医临床数据中,获取所述N个目标对象对应的多视图信息,N为大 ...
【技术保护点】
【技术特征摘要】
1.一种中医临床数据的多视图聚类方法,其特征在于,包括:从N个目标对象的中医临床数据中,获取所述N个目标对象对应的多视图信息,N为大于1的整数;其中,所述多视图信息为所述中医临床数据中从至少两个角度对目标对象进行描述的信息;确定所述多视图信息对应的特征矩阵和邻接矩阵;将所述特征矩阵和所述邻接矩阵输入至预先设置的多视图图卷积编码模型中,得到所述多视图图卷积编码模型输出的所述N个目标对象对应的特征表示;其中,所述多视图图卷积编码模型用于基于所述特征矩阵和所述邻接矩阵,得到各所述特征表示;将各所述特征表示输入至预先设置的聚类模型中,得到所述聚类模型输出的聚类结果;其中,所述聚类模型用于基于各所述特征表示,对所述N个目标对象进行聚类,得到所述聚类结果,所述聚类结果用于表征所述N个目标对象的中医临床数据之间的关系。2.根据权利要求1所述的中医临床数据的多视图聚类方法,其特征在于,所述多视图信息包括以下至少两项:舌诊信息、脉诊信息以及主诉信息,所述聚类模型具体用于:采用预先设置的融合算法拼接各所述特征表示,得到一致性特征表示;基于所述一致性特征表示,对所述N个目标对象进行聚类,得到所述聚类结果。3.根据权利要求1或2所述的中医临床数据的多视图聚类方法,其特征在于,所述多视图图卷积编码模型包括l层图卷积编码层,所述多视图图卷积编码模型具体用于:基于所述特征矩阵X
(v)
和所述邻接矩阵A
(v)
,采用公式(1)得到第l层图卷积编码层的输出结果作为所述特征表示H
(v)
:其中,v表征所述多视图信息中的第v个视图,f
Linear
(
·
)表征线性激活函数,为为A
(v)
与单位矩阵I的和矩阵,是第v个视图对应的编码器中第l层待学习的参数矩阵,i表征矩阵的行,j表征矩阵的列。4.根据权利要求1所述的中医临床数据的多视图聚类方法,其特征在于,在所述将所述特征矩阵和所述邻接矩阵输入至预先设置的多视图图卷积编码模型中,得到所述多视图图卷积编码模型输出的所述N个目标对象对应的特征表示之后,所述方法还包括:将所述特征表示H
(v)
输入至预先设置的自分类模块中,得到所述自分类模块输出的分类结果;其中,所述自分类模块用于基于所述特征表示H
(v)
进行分类,得到所述分类结果;基于所述分类结果和所述聚类结果,构建第一损失函数;基于所述第一损失函数训练所述多视图图卷积编码模型。5.根据权利要求4所述的中医临床数据的多视图聚类方法,其特征在于,所述基于所述分类结果和所述聚类结果,计算第一损失函数,包括:基于所述分类结果和所述聚类结果采用公式(2)计算交叉熵损失函数采用公式(3)计算中心损失函数
其中,θ表征所述多视图图卷积编码模型的参数,φ表征所述自分类模块的参数,n表征节点数,CE(
·
)表征交叉熵函数...
【专利技术属性】
技术研发人员:李冬梅,田紫微,张小平,张磊,姜文娟,张润顺,赵玉凤,
申请(专利权)人:中国中医科学院中医药信息研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。