一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统技术方案

技术编号:24853349 阅读:30 留言:0更新日期:2020-07-10 19:07
本发明专利技术公开了一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统,包括:构建为用户提供的用于分析数据、选择数据和特征的交互式可视化界面;用户在前端界面选择完数据和特征,按预定时间间隔将信息传给后端,后端对原始输入特征进行更改,建立基于CatBoost的回归模型;模型建立完成后将信息传回前端界面,在可视化界面中更新特征重要程度分析和预测结果,用于帮助用户理解预测结果和交互式地挖掘数据背后的信息。本发明专利技术通过将机器学习模型与前端可视化内容结合,能够解决传统方法特征单一,可解释性不足,对于非专业领域人士难以使用,无法交互式分析等缺陷。

【技术实现步骤摘要】
一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统
本专利技术属于门诊量预测
,特别涉及一种基于CatBoost模型的交互式门诊量预测可视分析方法及系统。
技术介绍
随着计算机技术的不断发展,医疗领域也在朝着智能化和信息化的方向发展,合理的门诊量预测是现代医院对医疗资源进行智能化管理的重要前提之一,准确的门诊数量预测可以帮助医院合理配置不同科室的人手和医疗资源。现有的医院门诊数量预测方法往往只基于某些特定的特征和数据集,或者忽视了对结果的可解释性;以往的门诊数量预测系统对医生等非计算机领域用户存在较高的操作难度,最终对模型的预测效果评估也存在不易理解等问题,无法使医生交互式的对数据进行充分挖掘和深入分析。以下专利申请和文献提供了可参考的一种旨在对门诊数量进行预测的方法:文献1.一种环境变化对疾病发病影响的分析预测装置(中国专利技术专利申请的申请号为201510170135.7);文献2.基于深度信念网络的医院门诊量预测[J],计算机科学,20(43);文献1提出了一种基于非参数本文档来自技高网...

【技术保护点】
1.一种基于CatBoost模型的交互式门诊量预测可视分析方法,其特征在于,包括以下步骤:/n步骤1,获取历史环境因素数据与历史门诊数量数据载入数据库,对数据库的关系表和数据文件进行记录整理,获得原始医疗数据;/n步骤2,从原始医疗数据中抽取出目的数据库系统所需要的数据,形成规范医疗数据库;从规范医疗数据库中提取预设层级关系统计,获得门诊数量的字典类型数据;/n步骤3,在可视化交互界面,根据步骤2获得的门诊数量的字典类型数据,绘制获得交互式旭日图,用于展示门诊人数;/n步骤4,在可视化交互界面,根据交互式旭日图中用户的选择,绘制获得折线图,用于展示门诊人数随时间的分布情况;根据交互式旭日图中用...

【技术特征摘要】
1.一种基于CatBoost模型的交互式门诊量预测可视分析方法,其特征在于,包括以下步骤:
步骤1,获取历史环境因素数据与历史门诊数量数据载入数据库,对数据库的关系表和数据文件进行记录整理,获得原始医疗数据;
步骤2,从原始医疗数据中抽取出目的数据库系统所需要的数据,形成规范医疗数据库;从规范医疗数据库中提取预设层级关系统计,获得门诊数量的字典类型数据;
步骤3,在可视化交互界面,根据步骤2获得的门诊数量的字典类型数据,绘制获得交互式旭日图,用于展示门诊人数;
步骤4,在可视化交互界面,根据交互式旭日图中用户的选择,绘制获得折线图,用于展示门诊人数随时间的分布情况;根据交互式旭日图中用户的选择,绘制环境特征的交互式相关性分析雷达图,用于初步分析门诊人数和环境特征的相关性;用户根据雷达图选择预测需要的原始特征;其中,所述原始特征包括原始环境特征和原始时序特征;
步骤5,在后端,基于CatBoost建立门诊人数回归模型;将原始特征根据预设的时间间隔值输入后端生成历史门诊人数特征、历史环境特征和时序子序列的tsfresh特征;将tsfresh特征输入门诊人数回归模型,获得门诊量预测值;
步骤6,将获得的门诊量预测值传到可视化交互界面,绘制门诊人数回归模型的预测效果折线图,显示门诊人数回归模型的预测相对误差和均方误差。


2.根据权利要求1所述的一种基于CatBoost模型的交互式门诊量预测可视分析方法,其特征在于,步骤1中,还包括:
将获得的原始医疗数据进行预处理,用于发现并纠正数据文件中可识别的错误;其中,所述预处理包括数据筛选、数据清洗和数据抽取的重构转换。


3.根据权利要求1所述的一种基于CatBoost模型的交互式门诊量预测可视分析方法,其特征在于,还包括:
步骤7,从后端传输特征重要程度数据到可视化交互界面,将交互式相关性分析雷达更新为特征重要程度图;从后端传回每个样本的各个特征SHAP数据并更新门诊时序数据,用户点击折线图中某个具体门诊人数信息,在其上方绘制该样本的各个特征SHAP图。


4.根据权利要求1所述的一种基于CatBoost模型的交互式门诊量预测可视分析方法,其特征在于,还包括:
绘制医院总门诊人数与月份和星期关系的热力图,用于展示医院总体门诊人数随时间分布情况。


5.根据权利要求1所述的一种基于CatBoost模型的交互式门诊量预测可视分析方法,其特征在于,步骤5中,门诊人数回归模型预测的步骤具体包括:
步骤5.1,获取用户所选门诊的原始医疗数据,原始数据输入矩阵其中,J个初始特征,xij表示第i天的第j项特征;
步骤5.2,根据用户所选择的特征以及时间间隔值n,对原始数据输入矩阵X进行修改;其中,保留用户选择的特征,J个初始特征降为K个用户所选特征,K≤J,修改后的输入矩阵
根据时间间隔值n生成n天前的历史门诊人数特征以及历史环境特征,再次修改后的输入矩阵特征个数M=(K+1)n+3;
将(I-n)个样本的(1+K)个长度为n的时间子序列通过tsfresh包各提取出设定的29个时序数据;
最终模型的输入矩阵其中,
步骤5.3,判断步骤5.2得到的个特征的类型,将类别特征名存入列表,将列表内容传给CatBoost的cat_features参数;
步骤5.4,设置测试集比例,采用CatBoost回归算法构建回归模型,得到测试集上的预测结果绘制与测试集中门诊人数结果Y=(y1y2…yα(I-n))T的对比折线图;
在折线图图例中添...

【专利技术属性】
技术研发人员:钱步月韩昊辰郑莹倩兰欣刘辉吴风浪蔡宏伟
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1