一种中医医案数据挖掘的方法技术

技术编号:26175520 阅读:35 留言:0更新日期:2020-10-31 14:09
本发明专利技术公开了一种中医医案数据挖掘的方法,在收集大量中医医案的基础上构建基于粒计算的中医医案知识库,研究通过关联规则挖掘算法、聚类算法,对中医医案进行高效的数据挖掘,解决由于海量中医医案中存在的术语表达模糊、繁杂以及因之带来数据挖掘算法效率低及应用不广泛等问题,拓宽了数据挖掘技术在中医药领域的应用,为促进相关产业的发展提供理论和技术支持。

A method of data mining of traditional Chinese medicine medical records

【技术实现步骤摘要】
一种中医医案数据挖掘的方法
本专利技术涉及中医学领域,尤其涉及一种中医医案数据挖掘的方法。
技术介绍
中医医案也即是病案,是医生治疗疾病时辩证、立法、处方用药的连续记录。医案记录了中医临床大夫试试辩证论治的过程,反映了医家的思维活动、学术观点以及丰富的临床经验,为中医药理论的创新与发展提供了宝贵的研究素材。对医案进行研究,并从医案中学习相关知识,不仅能丰富和深化理论知识,而且可以提高临床诊疗水平,开阔视野,启迪思路。因此,医案对于从事中医临床、教学和科研工作者来说,在中医临床研究和实践方面具有重大的指导意义。但中医医案中存在着一些术语表达模糊、称谓繁以及含义不明确,使得中医医案的数据挖掘存在着效率低、应用不广泛等情况。因此,建立高效、科学的中医医案数据库并使用对海量医案数据进行挖掘,是目前待解决的问题。
技术实现思路
针对上述存在的问题,本专利技术旨在提供一种中医医案数据挖掘的方法,能够拓宽数据挖掘技术在中医药领域的应用,为相关产业的发展提供支持。为了实现上述目的,本专利技术所采用的技术方案如下:一种本文档来自技高网...

【技术保护点】
1.一种中医医案数据挖掘的方法,其特征在于,包括以下步骤:/nS1:采集海量患者医案;/nS2:构建基于粒计算的中医医案知识库;/nS3:采用信息抽取算法对所述中医医案知识库文档中记载的患者症状信息进行规范化处理;/nS4:通过文本聚类算法对同一类症状的规范化患者症状信息进行聚类分析;/nS5:通过关联规则挖掘算法挖掘中医医案中的症状与方药,症状与证型,证型与方药之间以及中药配伍之间的多重关联关系。/n

【技术特征摘要】
1.一种中医医案数据挖掘的方法,其特征在于,包括以下步骤:
S1:采集海量患者医案;
S2:构建基于粒计算的中医医案知识库;
S3:采用信息抽取算法对所述中医医案知识库文档中记载的患者症状信息进行规范化处理;
S4:通过文本聚类算法对同一类症状的规范化患者症状信息进行聚类分析;
S5:通过关联规则挖掘算法挖掘中医医案中的症状与方药,症状与证型,证型与方药之间以及中药配伍之间的多重关联关系。


2.根据权利要求1所述的一种中医医案数据挖掘的方法,其特征在于:步骤S2中所述的构建基于粒计算的中医医案知识库的具体步骤包括:
S21:构建中医医案的概念集;
S22:结合所述概念集,使用汉语词法分析系统ICTCLAS分词系统对中医医案进行分词;
S23:对中医医案数据进行合适的粒化,并对粒子进行合成和分解;
S24:通过基于粒计算的概念获取算法及关系抽取算法对本体概念及关系的提取;
S25:将提取后的本体概念组成知识库。


3.根据权利要求2所述的一种中医医案数据挖掘的方法,其特征在于:步骤S21中构建中医医案的概念集的具体步骤包括:
S211:将由概念产生的相关概念定为概念集、概念、术语集、术语,且它们之间的关系如公式(1)所示,用于表示同一术语对于不同概念的集合:

T={t1,t2,...,tm},其表示m个不同术语t,






其中,表示具有l个意义相同但术语不同的集合,C为语料库;
S212:采用公式(2)设定其阈值,并通过优化所述阈值,构建中医医案的概念集,公式(2)表示为:



其中,DMDt,k为术语tt,k对于Dk的领域隶属度,CFt,k为Dk的领域特征词,0≤α≤1,其中α为控制与的随机因子,根...

【专利技术属性】
技术研发人员:赵丽丽梁科
申请(专利权)人:山东管理学院
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1