数据挖掘方法和装置制造方法及图纸

技术编号:24690226 阅读:61 留言:0更新日期:2020-06-27 09:56
本公开提出一种数据挖掘方法和装置,涉及大数据分析技术领域。本公开的一种数据挖掘方法,包括:获取病历数据,病历数据中包括每条病历的用药参数和病症参数;根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。通过这样的方法,能够通过对病历数据的分析得到病历参数的关联关系,从而实现对病历数据的有效应用,以便于有针对性的诊断和调度医疗资源。

Data mining methods and devices

【技术实现步骤摘要】
数据挖掘方法和装置
本公开涉及大数据分析
,特别是一种数据挖掘方法和装置。
技术介绍
目前医疗领域已经普遍采用电子病历,或将普通病历数据录入电子系统。电子病历多用于跟踪单个用户的病史、用药史,为医生了解病人状况带来了方便。
技术实现思路
专利技术人发现,相关技术中只是将病历数据归档存储,缺乏深层应用。由于生活习惯、气候习惯或年龄特点等因素的影响,病症可能会产生一些区域化、年龄相关化的特点,利用病历数据能够获取人群病症特点,从而有针对性的调度医疗资源和诊断。本公开的一个目的在于增加对病历数据的有效应用,以便于有针对性的诊断和调度医疗资源。根据本公开的一个方面,提出一种数据挖掘方法,包括:获取病历数据,病历数据中包括每条病历的用药参数和病症参数;根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。可选地,病历数据中还包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。可选地,数据挖掘方法还包括:根据参本文档来自技高网...

【技术保护点】
1.一种数据挖掘方法,包括:/n获取病历数据,病历数据中包括每条病历的用药参数和病症参数;/n根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。/n

【技术特征摘要】
1.一种数据挖掘方法,包括:
获取病历数据,病历数据中包括每条病历的用药参数和病症参数;
根据病历数据,确定病历数据的相同参数内部和不同参数之间的相关度,确定相关度大于预定相关度门限的参数关联关系。


2.根据权利要求1的方法,其中,病历数据中还包括患者画像信息,患者画像信息包括地域参数、性别参数、年龄参数、职业参数中的一项或多项。


3.根据权利要求1的方法,还包括:
根据参数关联关系指导病症诊断或用药。


4.根据权利要求1的方法,其中,确定相关度大于预定相关度门限的参数关联关系包括:
将出现在同一份病历或同一患者的病历中的病历数据中的参数作为一同出现的项;
获取支持度大于等于预定支持度门限的频繁项集,其中,支持度与预定相关度门限正相关。


5.根据权利要求4的方法,其中,获取支持度大于等于预定支持度门限的频繁项集包括:
获取支持度大于等于预定支持度门限的2元频繁项集;
在n-1元频繁项集的基础上获取n元频繁项集,直至n+1元频繁项集为空,其中,n为大于1的正整数。


6.根据权利要求1的方法,其中,获取病历数据包括:
根据预定格式筛选、归一化初始病历数据,获取病历数据,其中,筛选初始病历数据包括:按照预定格式删除不完整的初始病历数据;归一化初始病历数据包括:将初始病历数据的格式归一化、相同病症的标识归一化,以及将相同药物的标识归一化。


7.根据权利要求2的方法,其中,确定相关度大于预定相关度门限的参数关联关系包括:
将出现在同一患者的病历中的病历数据的每个参数分别作为项,生成病历向量;
根据余弦相似度算法将患者分群,获取患者病历向量集合;
根据同一所述患者病历向量集合,获取支持度大于等于预定支持度门限的频繁项集。


8.根据权利要求2的方法,在病历数据中包括地域参数的情况下:
根据地域参数与病症参数的相关度确定地域病症防疫策略;
和/或,
根据地域参数与药物参数的相关度确定地区药物供给策略。


9.一种数据挖掘装置,包括:
病历数据获取单...

【专利技术属性】
技术研发人员:石晓东高飞
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1