The invention belongs to the technical field of data mining, medical information and large data, in particular to a drug analysis method based on a full memory event sequence mining model. The method of the invention, the original data into the categories of drug medication event sequence, all each medication use event type event sequence nodes multidimensional vector into Euclidean space representation; then according to the previous node to predict drug events of a historical record of events weighted sum form feature prediction of event memory representation, as standard input vector classifier to predict the next event, the multi-dimensional vector to predict events expressed as output, training a prediction model, the multi dimension vector maps in Euclidean space to the original space type, the use of all drugs for the training sequence of events; the new drug event sequence, input the trained model, to predict future events. This method can make use of as much data as possible for decision making, thus reducing the error of decision making.
【技术实现步骤摘要】
一种基于全记忆事件序列挖掘模型的用药分析方法
本专利技术属于数据挖掘、医疗信息和大数据
,具体涉及一种基于全记忆事件序列挖掘模型的用药分析方法。
技术介绍
有效的用药方案对于患者获取最佳治疗是非常重要的。利用已经积累的大规模的患者临床用药历史数据进行分析建模,有助于医生对患者下一步用药提供决策支持。数据挖掘方法已经被用于用药分析,传统的用药数据挖掘方法采用频繁模式挖掘发现频繁出现的用药组合,推断药物之间的关联。然而,一方面,不考虑用药顺序的频繁模式挖掘忽略了疾病演变的特征对用药的影响;另一方面,虽然已有考虑“序”和时间特征的频繁序列模式挖掘方法被使用,然而,大量冗余的结果模式和关联规则限制了方法的实际应用。更重要的是,患者的用药并不是简单的考虑先后关系,还需要考虑在治疗过程中前序不同时间点的用药对目标时间点的用药的影响的差异。本专利技术针对患者用药历史数据,提出一种基于全记忆事件序列挖掘模型的用药分析方法。首先,采用事件序列形式建模表示用药历史数据,即形成用药事件序列;然后,针对患者疾病随时间的变化,以及用药受不同阶段用药情况的影响,将需要预测事件的时间节点前的所有事件看作为预测事件的记忆,对预测事件记忆加权构成事件记忆特征表示,并构建训练数据集;再构建训练模型,设置损失函数,求解参数;最后,对于待预测用药事件序列实现事件预测。该方法不仅考虑了时间顺序,以及不同阶段患者用药的影响差异,而且对比以往的一阶或高阶事件序列分析方法,能够利用尽可能多的数据来用于决策,从而减少决策的失误。
技术实现思路
本专利技术的主要目的是提供一种基于用药记录数据的用药分析方法 ...
【技术保护点】
基于全记忆事件序列挖掘模型的用药分析方法,其特征在于,具体步骤为:(1)首先,对患者历史用药数据进行预处理,即采集用药事件序列的原始数据,将原始用药数据转换成用药事件发生序列;然后,对用药事件序列数据进行处理,将序列中的每个事件都用一个或多个类别型的变量进行表示;(2)对于已经处理好的类别型变量表示的事件序列,设置一个特定的记忆长度阈值,选择高于该阈值的序列用于构造训练数据集;(3)采用基于全记忆事件序列方法构建训练预测模型;(4)对于新的用药事件序列,输入预测模型实现对未来时间节点的用药事件进行预测。
【技术特征摘要】
1.基于全记忆事件序列挖掘模型的用药分析方法,其特征在于,具体步骤为:(1)首先,对患者历史用药数据进行预处理,即采集用药事件序列的原始数据,将原始用药数据转换成用药事件发生序列;然后,对用药事件序列数据进行处理,将序列中的每个事件都用一个或多个类别型的变量进行表示;(2)对于已经处理好的类别型变量表示的事件序列,设置一个特定的记忆长度阈值,选择高于该阈值的序列用于构造训练数据集;(3)采用基于全记忆事件序列方法构建训练预测模型;(4)对于新的用药事件序列,输入预测模型实现对未来时间节点的用药事件进行预测。2.如权利要求1所述的基于全记忆时间序列挖掘模型的用药分析方法,其特征在于,步骤(1)中的患者历史用药数据的事件序列的转化表示方法,该步骤将患者历史用药记录表示为事件,每个事件用一个或多个类别型变量表示。3.如权利要求1所述的基于全记忆时间序列挖掘模型的用药分析方法,其特征在于,步骤(2)中将患者用药的历史事件作为记忆序列,形成记忆特征表示。4.如权利要求1所述的基于全记忆时间序列挖掘模型的用药分析方法,其特征在于,步骤(4)把要新的用药事件序列作为训练好的预测模型的输入,使用模型输出预测结果。5.如权利要求1所述的基于全记忆时间序列挖掘模型的用药分析方法,其特征在于,步骤(2)中所述构造训练数据集方法的具体步骤为:(1...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。