【技术实现步骤摘要】
患者治疗方案的确定方法、装置及计算机设备
本申请涉及数字医疗领域,尤其涉及到一种患者治疗方案的确定方法、装置及计算机设备。
技术介绍
深度强化学习是机器学习方法中的一种,完成从环境状态到动作映射学习,根据最大的反馈值选择最优的策略,搜索策略选择最优的动作,引起状态的变化得到延迟反馈值,评估函数,迭代循环,直到满足学习条件即终止学习。随着科技的发展,深度强化学习已逐步应到各个领域。目前,已有工作将深度强化学习技术用于患者诊断。但是利用深度强化学习进行患者诊断的方法往往存在以下不足:1.在患者诊断场景,在进行诊断决策时更关注哪些特征、各特征对结局贡献了多少,而目前的模型难以解释,导致信息无法做到透明化。2.目前的模型往往只能将患者的单次随访信息作为输入,但单次随访很难完全表示患者的长期随访状态,导致分析结果不够准确。
技术实现思路
有鉴于此,本申请提供了一种患者治疗方案的确定方法、装置及计算机设备,主要解决在将深度强化学习技术应用于患者诊断时,对特征贡献的可解释性弱,且分析结果不够准确的问题。 ...
【技术保护点】
1.一种患者治疗方案的确定方法,其特征在于,包括:/n基于深度强化学习DQN创建用于处理时序数据的患者分群模型;/n利用标记好分群结果的样本数据训练所述患者分群模型,以使所述患者分群模型符合预设训练标准;/n将预设时间段内的目标患者数据输入符合所述预设训练标准的患者分群模型,获取得到目标患者所属的目标群组;/n基于所述目标群组内的人群特征确定所述目标患者的第一治疗方案;/n依据所述目标患者数据提取所述目标患者的禁忌药品,并从所述第一治疗方案中筛选出包含所述禁忌药品的第二治疗方案;/n按照所述第一治疗方案以及所述第二治疗方案,分析得到所述目标患者的目标治疗方案。/n
【技术特征摘要】
1.一种患者治疗方案的确定方法,其特征在于,包括:
基于深度强化学习DQN创建用于处理时序数据的患者分群模型;
利用标记好分群结果的样本数据训练所述患者分群模型,以使所述患者分群模型符合预设训练标准;
将预设时间段内的目标患者数据输入符合所述预设训练标准的患者分群模型,获取得到目标患者所属的目标群组;
基于所述目标群组内的人群特征确定所述目标患者的第一治疗方案;
依据所述目标患者数据提取所述目标患者的禁忌药品,并从所述第一治疗方案中筛选出包含所述禁忌药品的第二治疗方案;
按照所述第一治疗方案以及所述第二治疗方案,分析得到所述目标患者的目标治疗方案。
2.根据权利要求1所述的方法,其特征在于,所述基于深度强化学习DQN创建用于处理时序数据的患者分群模型,具体包括:
将深度强化学习DQN对应网络结构中的最后一个全连接层,拆分成第一全连接层、第二循环神经网络层、第三循环神经网络层;
利用更改网络结构后的所述深度强化学习DQN构建患者分群模型,以便在向所述患者分群模型输入包含多个时间点的患者数据时,由所述第一全连接层输出各个时间点对应患者状态的嵌入值,由所述第二循环神经网络层输出各个时间点对应患者状态的第一关注度,由所述第三循环神经网络层输出各个时间点对应分群结果的第二关注度,并基于所述嵌入值、所述第一关注度以及所述第二关注度计算所述患者数据对应各个预设群组的预期奖励值。
3.根据权利要求2所述的方法,其特征在于,所述样本数据为包含当前时间点以及预设数量个历史时间点的时序数据;
所述利用标记好分群结果的样本数据训练所述患者分群模型,以使所述患者分群模型符合预设训练标准,具体包括:
将所述当前时间点和所述历史时间点下的样本数据,输入所述患者分群模型,获取得到预设数量个群组,以及各个样本数据对应各个群组的预期奖励值,所述预期奖励值是在计算同一时间点下所述第一关注度与所述第二关注度的第一加和,以及所述第一加和与所述嵌入值的乘积后,通过累加所述当前时间点和所述历史时间点下的所述乘积得到的;
提取所述样本数据对应的标记群组,将所述标记群组对应输出的第一预期奖励值确定为所述患者分群模型的训练输出结果;
计算所述第一预期奖励值与真实预期奖励值的均方差损失,若基于所述均方差损失判定损失函数达到收敛状态,则确定所述患者分群模型符合预设训练标准;
若判定所述损失函数未达到收敛状态,则利用所述样本数据重复训练所述患者分群模型,以使所述患者分群模型符合所述预设训练标准。
4.根据权利要求3所述的方法,其特征在于,所述将预设时间段内的目标患者数据输入符合所述预设训练标准的患者分群模型,获取得到目标患者所属的目标群组,具体包括:
提取预设时间段内目标患者的历史患者随访数据以及当前患者随访数据;
将所述历史患者随访...
【专利技术属性】
技术研发人员:徐卓扬,赵惟,左磊,孙行智,胡岗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。