【技术实现步骤摘要】
一种中药和症状关系的数据挖掘方法
本专利技术涉及一种将中药和诊断症状进行匹配的方法,尤其涉及中药和症状关系的数据挖掘方法,属于数据挖掘
技术介绍
临床医案是名老中医临床实践经验及学术思想的载体,伴随大数据时代的到来,数据挖掘技术被广泛地应用于临床知识发现,有关方症关系挖掘的研究则较为稀少。目前,具有中医学背景的医学研究者和拥有计算机专业背景的跨领域合作者在各自的知识背景下进行科研创作,为弘扬中医药助力。前者以分析名老中医治疗某疾病的遣方用药规律为研究重点,通常采用关联规则[1]、复杂网络[2]和聚类方法[3,4]挖掘处方中的核心药对和方药配伍。从中医药理知识出发,根据中药功效的基础理论,归纳总结治疗该疾病的用药思想。李[5]等人基于熵聚类算法挖掘出10组治疗血脂异常的常用药物组合,药物组合的特征反映出血脂异常用药的基本原则是益气健脾、燥湿化痰、活血化瘀。后者以期运用数据挖掘的手段发现中药—症状之间的映射规律。Poon等人[6]将用于基因表达研究的双聚类算法运用在失眠症状-药物关系挖掘中,得到了症状子 ...
【技术保护点】
1.一种中药和症状关系的数据挖掘方法,其特征在于,该方法包括如下步骤,/n步骤1、对中医诊疗老年病数据集进行相关预处理,输入数据为文本形式的医案数据,输出数据为向量形式:/n步骤2、采用熵聚类算法挖掘方药配伍,输入是经过数据预处理后得到的所有中药向量,输出是方药配伍组合;具体步骤如下:/n步骤3、依据中医学上用一组方药配伍共同发挥功效治疗症状的中医常识为支撑,在得到方药配伍结果的基础上,探索方药配伍与症状的对应关系,如果某组方药配伍与某个症状具有映射关系,则所有组成方药配伍的中药与此症状具有映射关系。/n
【技术特征摘要】
1.一种中药和症状关系的数据挖掘方法,其特征在于,该方法包括如下步骤,
步骤1、对中医诊疗老年病数据集进行相关预处理,输入数据为文本形式的医案数据,输出数据为向量形式:
步骤2、采用熵聚类算法挖掘方药配伍,输入是经过数据预处理后得到的所有中药向量,输出是方药配伍组合;具体步骤如下:
步骤3、依据中医学上用一组方药配伍共同发挥功效治疗症状的中医常识为支撑,在得到方药配伍结果的基础上,探索方药配伍与症状的对应关系,如果某组方药配伍与某个症状具有映射关系,则所有组成方药配伍的中药与此症状具有映射关系。
2.根据权利要求1所述的一种中药和症状关系的数据挖掘方法,其特征在于,步骤1的实施过程如下:
步骤1.1、将文本解析成字符串,并进行字符串匹配、字符串分割操作,从中提取出症状词、中药词;
步骤1.2、对不规范的症状词、中药词进行数据清洗;针对一义多词、多词一义、复合表述的情况,基于设计聚合、拆分规则,纠正错误用语,保证症状词、中药词的唯一性和准确性;
步骤1.3、进行数据变换,根据症状词、中药词在就诊记录中存在与否,映射到对应的二进制值1、0;存在用1表示,不存在用0表示;
步骤1.4、进行降维,统计各个症状词、中药词出现的频次,将频次不足样本量十分之一的词删除。
3.根据权利要求1所述的一种中药和症状关系的数据挖掘方法,其特征在于,步骤2的实施过程如下:
步骤2.1、输入N个中药向量,计算中药向量两两之间的关联度系数;
步骤2.2、规定与给定中药向量关联度系数大小排名位列前M位且关联度系数大于0的中药向量为该中药向量的亲密变量;为每个中药向量按照此规定寻找亲密变量;
步骤2.3、将两个互为亲密变量的中药向量组成二元组方药配伍;接着搜索下一个可能聚类的中药向量,如果该中药向量能够与二元组方药配伍中的任意一个中药互为亲密变量,则这三个中药向量聚为一类,形成三元组方药配伍;以此类推,直到饱和,即不能再往里添加任何一个...
【专利技术属性】
技术研发人员:石东新,李朝晖,杨爽,张远,邱婉,蔡德俊,程博雅,
申请(专利权)人:中国传媒大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。