【技术实现步骤摘要】
基于改进DQN的可解释性监测数据识别方法
[0001]本专利技术涉及基于改进DQN的可解释性监测数据识别方法,属于数据挖掘,尤其适用于基于改进DQN的可解释性监测数据识别方法。
技术介绍
[0002]目前利用人工智能技术分析医学诊疗数据进行预警研究已成为学科交叉融合新领域。既往研究报道和我们前期研究发现采用机器学习对术中监测数据进行挖掘具备术后心血管早期诊断和预警价值,在“预警算法改进和可解释性文本”上深入,有望显著提高围术期心血管不良事件早期预警准确性和可信性。
[0003]DeepQ
‑
Learning(DQN)算法与既往使用的监督学习不同,基于强化深度学习,针对动态直接监测数据的序列决策问题,可在无标记的情况下智能体(Agent)会与环境(Environment)进行交互并获取信息,学出状态与动作之间的映射,指导智能体根据状态做出最佳决策。基于动态直接监护体征数据的心血管危重不良事件预测是一个连续过程,这与DQN算法中智能体agent和环境进行交互并基于所采取的行动接收反馈的场景有相似之处。此 ...
【技术保护点】
【技术特征摘要】
1.基于改进DQN的可解释性监测数据识别方法,其特征在于,包括以下步骤:S1:将监测数据进行预处理后,按时序和周期进行采样并作为输入;S2:利用马尔科夫链模型生成状态转移概率P,构建强化学习网络(DQN);S3:将步骤S2所述的强化学习网络作为互注意力机制的预测器,构建改进的DQN模型;S4:将历史监测数据和对应的解释文本作为输入,对改进的DQN模型进行训练;S5:实时采集监测数据并采用改进的DQN模型对其进行分析,识别出其中的状态并输出对应的可解释性文本;所述的强化学习网络由一个包含五个元素(S,A,R,P,γ)的元组组成,其中,R为奖励函数,P为状态转移概率,γ为折现因子;所述的S为状态空间,为输入的监测数据;所述的A为动作空间,包含等待监测更多数据和及时做出选择对应某个解释标签这两类动作;所述的互注意力机制由一个编码器串联一对并联的生成器和预测器,然后再串联一个分类器构成;其中分类器中预设了所有的解释标签类别。2.根据权利要求1所述的基于改进DQN的可解释性监测数据识别方法,其特征在于,步骤S1所述的监测数据预处理包含对监测数据的补缺、归一化;所述的周期T的选取要远小于监测总时长,同时要兼顾精度和计算能力;所述的作为输入的监测数据为q
×
T维矩阵,其中q为监测数据的类别。3.根据权利要求1所述的基于改进DQN的可解释性监测数据识别方法,其特征在于,步骤S2所述的生成状态转移概率P具体为:统计历史监测数据和对应的解释文本,利用马尔科夫链模型建立状态转移矩阵即为状态转移概率P,根据概率来决定当前时刻的动作。4.根据权利要求1所述的基于改进DQN的可解释性监测数据识别方法,其特征在于,所述的步骤S2也可以采用基于强化学习网络的推荐系统来实现,利用历史周期数据的相似度排序,推荐出相似度最高的周期对应的动作。5.根据权利要求1所述的基于改进DQN的可解释性监测数据识别方法,其特征在于,所述的强化学习网络的奖励函数R在t时刻对应为:其中,s
t
为t时刻的状态,a
t
为t时刻的动作;p>...
【专利技术属性】
技术研发人员:陈芋文,钟坤华,孙启龙,陈嘉翼,
申请(专利权)人:中国科学院重庆绿色智能技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。