一种基于节点相似度的Kmeans中药材功效聚类方法技术

技术编号:24760551 阅读:116 留言:0更新日期:2020-07-04 10:11
本发明专利技术公开了一种基于节点相似度的Kmeans中药材功效聚类方法。本发明专利技术步骤:采集相关中医药数据,数据处理后形成方剂组成库、药材功效库、药材性味归经二值表;根据23大类功效表,将中药材功效总结归类,构建药材功效矩阵;基于方剂组成库构建方剂‑药材二分网络;计算基于度分布的药材对期望值,将药材对期望值作为中药材相似度;建立基于中药材相似度的Kmeans聚类模型;基于所述聚类模型对中药材进行聚类,得到中药材可能具有的潜在功效。本发明专利技术利用一种药材相似度矩阵进行Kmeans聚类的准确度可达0.728。同时使用Kmeans对传统药材的性味归经数据聚类,得到最终结果为0.646,高出约0.08,可见本发明专利技术提出的方法使得聚类结果更加精准。

A kmeans clustering method of traditional Chinese medicine efficacy based on node similarity

【技术实现步骤摘要】
一种基于节点相似度的Kmeans中药材功效聚类方法
本专利技术涉及计算机辅助药物设计领域,特别涉及一种基于节点相似度的Kmeans中药材功效聚类方法。
技术介绍
本专利技术中针对方剂、药材信息将功效相似或相同的药材聚为一类。该聚类问题是一个典型的基于划分的问题,基于划分的聚类算法中较为简单且常用的算法为Kmeans聚类算法。Kmeans是无监督学习算法,是一种分组观察的方法,可调参数少,聚类速度快,方法简单。但传统的Kmeans算法具有两个明显的缺点:一是聚类个数K值很难把控,如中药材功效繁多,每种药材可能具有几十甚至上百种功效,这样聚类质量会很难保证;二是样本间距离计算并不能确保是其真实的相似程度,特别是针对中药这种特殊数据。因此,本专利技术针对Kmeans上述两个缺点,利用方剂组成构建的二分网络,基于中药材相关特性提出了一种基于度分布的药材对相似度计算方法,并对比23大类功效表将药材的散乱功效归类,以获得聚类个数k以及结果对照。
技术实现思路
本专利技术的目的是针对现有技术的不足,提供一种基于节点相似度的Kmea本文档来自技高网...

【技术保护点】
1.一种基于节点相似度的Kmeans中药材功效聚类方法,其特征在于包括以下步骤:/n步骤1、采集相关中医药数据,数据处理后形成方剂组成库、药材功效库、药材性味归经二值表;/n步骤2、根据23大类功效表,将中药材功效总结归类,构建药材功效矩阵;/n步骤3、基于方剂组成库构建方剂-药材二分网络;/n步骤4、计算基于度分布的药材对期望值,将药材对期望值作为中药材相似度;/n步骤5、建立基于中药材相似度的Kmeans聚类模型;/n步骤6、基于所述聚类模型对中药材进行聚类,得到中药材可能具有的潜在功效。/n

【技术特征摘要】
1.一种基于节点相似度的Kmeans中药材功效聚类方法,其特征在于包括以下步骤:
步骤1、采集相关中医药数据,数据处理后形成方剂组成库、药材功效库、药材性味归经二值表;
步骤2、根据23大类功效表,将中药材功效总结归类,构建药材功效矩阵;
步骤3、基于方剂组成库构建方剂-药材二分网络;
步骤4、计算基于度分布的药材对期望值,将药材对期望值作为中药材相似度;
步骤5、建立基于中药材相似度的Kmeans聚类模型;
步骤6、基于所述聚类模型对中药材进行聚类,得到中药材可能具有的潜在功效。


2.根据权利要求1所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤1具体实现如下:
通过文献、数据库和其他网络资源的途径,基于人工、网络爬虫的方法采集中医药相关数据,整合形成方剂组成库、药材功效库以及药材性味归经二值表;方剂组成库中包括了方剂名以及对应的药材组成信息;药材功效库包含药材所具有的各类功效;药材性味归经二值表是基于药材所具有的性味归经的数据构建的二值表。


3.根据权利要求1或2所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤2具体实现如下:
依照中药的功效大类表将功效归类成23类,分别是补气、安神、开窍、化湿、温胃止呕、涌吐药、补血、祛风除湿、平肝息风、利尿通淋、温里理气、拔毒生肌、活血化瘀、消食、杀虫解毒、止痛、发散风寒、敛肺涩肠、收敛止血清热解毒、泻下、清热泻火、化痰止咳平喘、发散风热;通过对采集到的药材功效库进行匹配,得到简化的药材功效矩阵。


4.根据权利要求3所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤3具体实现如下:
使用方剂组成库,构建方剂药材关联二分网络,其中包括22570种方剂,1249味药材。


5.根据权利要求4所述的一种基于相似度的Kmeans中药材功效聚类方法,其特征在于步骤4具体实现如下
定义药材对期望值:即药材m1和药材m2同时存在于方剂i中的期望值,记为Pi;
Pi=A·B

【专利技术属性】
技术研发人员:谭露露周银座吴晨程
申请(专利权)人:杭州师范大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1