一种基于高斯过程的医院门诊量预测方法及系统技术方案

技术编号:29616966 阅读:58 留言:0更新日期:2021-08-10 18:35
本发明专利技术涉及建模预测技术领域,公开了一种基于高斯过程的医院门诊量预测方法及系统,本方法包括步骤:S1:获取历史门诊量数据,并对历史门诊量数据进行预设处理得到模型训练集数据和模型验证集数据;S2:将模型训练集数据采用梯度下降算法优化高斯过程参数,并建立高斯过程的概率图模型;S3:在模型验证集数据上对步骤S2中得到的高斯过程的概率图模型进行验证,用均方误差指标来评价高斯过程的结果,并得到预设高斯过程模型。本方法为预测的数据提供了概率解释,该方法不仅给出了门诊量预测值,还克服了时间序列方法的普适性不高的缺点,同时也提供了一个完整的概率框架来解释算法。

【技术实现步骤摘要】
一种基于高斯过程的医院门诊量预测方法及系统
本专利技术涉及建模预测
,尤其涉及一种基于高斯过程的医院门诊量预测方法及系统。
技术介绍
随着计算机技术的不断发展,医疗领域也在朝着智能化和信息化的方向发展,合理的门诊量预测是现代医院对医疗资源进行智能化管理的重要前提之一,准确的门诊数量预测可以帮助医院合理配置不同科室的人手和医疗资源。中国作为人口大国,在医疗费用投入低于其他发达国家的情况下,在新生儿死亡率,全民寿命等方面与其他发达国家并没有拉开较大距离。在医疗资源有限的情况下,如何为患者提供更人性化的就医体验是目前面临的瓶颈。门诊作为各医院的一个大窗口,每天接收着不同地区,不同民族的患者,扩大医疗资源的覆盖面和医疗服务质量,是亟待解决的问题。目前大部分预测门诊量的方法是基于时间序列方法进行的,而时间序列的预测方法,在某些具有明显趋势性特征的数据上,有较好的预测效果,但门诊量所受的随机扰动因素很多,时间序列方法的预测结果的普适度不高的缺点就体现了出来。
技术实现思路
针对上述现有技术的现状,本专利技术所要解决的技术问题在于提供一种基于高斯过程的医院门诊量预测方法及系统,为预测的数据提供了概率解释,该方法不仅给出了门诊量预测值,还克服了时间序列方法的普适性不高的缺点,同时也提供了一个完整的概率框架来解释算法。本专利技术一种基于高斯过程的医院门诊量预测方法及系统,具体的包括以下技术方案:一种基于高斯过程的医院门诊量预测方法,包括步骤:S1:获取历史门诊量数据,并对历史门诊量数据进行预设处理得到模型训练集数据和模型验证集数据;S2:将模型训练集数据采用梯度下降算法优化高斯过程参数,并建立高斯过程的概率图模型;S3:在模型验证集数据上对步骤S2中得到的高斯过程的概率图模型进行验证,用均方误差指标来评价高斯过程的结果,并得到预设高斯过程模型;S4:将步骤S3中得到的预设高斯过程模型作为最终的预测模型,上传至后台服务器,用于当前门诊量的预测。进一步地,所述步骤S1中预设处理的方式包括步骤:S11:将历史门诊量数据从数据库中导出;S12:对历史门诊量数据进行判断,若历史门诊量数据中存在缺失值,则通过决策树算法对历史门诊量数据进行补全;S13:将历史门诊量数据的异常值剔除,并采用高斯3sigma原则筛选历史门诊量数据中的异常值;S14:将预设处理后的历史门诊量数据切分为模型训练集数据和模型验证集数据;其中,模型训练集用于模型训练,模型验证集用于模型选取。进一步地,所述步骤S2包括步骤:S21:建立高斯过程的概率图模型p(f|X,y),在时间点x1,...,xN上,高斯过程假设p(f(x1),f(x2),...,f(xN))是高斯分布,其均值向量是μ(x)协方差矩阵∑(x)协方差矩阵∑ij=k(xi,xj)是半正定的,k是一个半正定的核函数;S22:根据先验高斯分布,确定后验概率;先验高斯分布具有如下形式:根据概率法则,计算后验概率具有如下形式:S23:确定边际似然函数的梯度信息,在模型训练集数据上利用梯度下降算法更新参数信息;为了估计核函数的参数,采用kernel-SVM的方式,在整个离散空间搜索最优解,最大化边际似然函数:对数边际似然函数为:第一项是数据拟合项,第二项是模型复杂度,第三项是常数项;在边际似然函数中,第一项和第二项就是在高斯过程的概率图模型的内推与外延之间的平衡;高斯过程的概率图模型的梯度信息如下:其中,进一步地,所述步骤S4后包括步骤:S5:当历史门诊量数据产生新的数据信息,则历史门诊量数据的分布特征会改变,采用增量更新方法对高斯过程的概率图模型进行更新。一种基于高斯过程的医院门诊量预测系统,包括:数据获取处理模块:用于获取历史门诊量数据,并对历史门诊数量数据进行预设处理得到模型训练集数据和模型验证集数据;模型建立模块:用于将模型训练集数据采用梯度下降算法优化高斯过程参数,并建立高斯过程的概率图模型;模型验证模块:用于在模型验证集数据上对模型建立模块中得到的高斯过程的概率图模型进行验证,用均方误差指标来评价高斯过程的结果,并得到预设高斯过程模型;预测模型上传模块:用于将模型验证模块中得到的预设高斯过程模型作为最终的预测模型,上传至后台服务器,用于当前门诊量的预测。进一步地,所述数据获取处理模块包括:数据导出单元:用于将历史门诊量数据从数据库中导出;判断单元:用于对历史门诊量数据进行判断,若历史门诊量数据中存在缺失值,则通过决策树算法对历史门诊量数据进行补全;剔除筛选单元:用于将历史门诊量数据的异常值剔除,并采用高斯3sigma原则筛选历史门诊量数据中的异常值;数据切分单元:用于将预设处理后的历史门诊量数据切分为模型训练集数据和模型验证集数据;其中,模型训练集用于模型训练,模型验证集用于模型选取。进一步地,所述预测模型上传模块后包括:数据模型更新模块:当历史门诊量数据产生新的数据信息,则历史门诊量数据的分布特征会改变,采用增量更新方法对高斯过程的概率图模型进行更新。本专利技术采用上述技术方案包括以下有益效果:本专利技术是基于高斯过程预测门诊量,高斯过程定义了函数上的先验概率,这种先验概率可以根据已有的门诊量样本数据,转化为在函数上的后验概率。在函数空间上引入分布是比较困难的,但我们可以在任意有限维上定义此类分布。从自然数到整数,在到有理数,再到实数,复数的过程。假设f是门诊量预测函数,在未知函数f上根据现有门诊量数据推断出一个分布p(f|X,y),然后利用这个分布推断出预测分布p(y*|x*,X,y)=∫p(y*|f,x*)p(f|X,y)df,对新的时刻x*,做出门诊量预测y*。从而为预测的数据提供了概率解释,该方法不仅给出了门诊量的预测值,还克服了时间序列方法的普适性不高的缺点。附图说明图1为本专利技术实施例一提供的一种基于高斯过程的医院门诊量预测方法流程图一;图2为本专利技术实施例一提供的一种基于高斯过程的医院门诊量预测方法流程图二;图3为本专利技术实施例二提供的一种基于高斯过程的医院门诊量预测系统结构图一;图4为本专利技术实施例二提供的一种基于高斯过程的医院门诊量预测系统结构图二;图5为本专利技术实施例一提供的一种基于高斯过程的医院门诊量预测方法的高斯过程的概率图模型示意图;图6为本专利技术实施例二提供的一种基于高斯过程的医院门诊量预测系统结构图三。具体实施方式以下是本专利技术的具体实施例并结合附图,对本专利技术的技术方案作进一步的描述,但本专利技术并不限于这些实施例。实施例一本实施例提供了一种基于高斯过程的医院门诊量预测方法,如图1和图2所示,本方法包括步骤:S1:获取历史门诊量数据,并对历史门诊量数据进行预设处理得到模型训练集数据和模型验证集数据;S2:将模型训练集数据采本文档来自技高网...

【技术保护点】
1.一种基于高斯过程的医院门诊量预测方法,其特征在于,包括步骤:/nS1:获取历史门诊量数据,并对历史门诊量数据进行预设处理得到模型训练集数据和模型验证集数据;/nS2:将模型训练集数据采用梯度下降算法优化高斯过程参数,并建立高斯过程的概率图模型;/nS3:在模型验证集数据上对步骤S2中得到的高斯过程的概率图模型进行验证,用均方误差指标来评价高斯过程的结果,并得到预设高斯过程模型;/nS4:将步骤S3中得到的预设高斯过程模型作为最终的预测模型,上传至后台服务器,用于当前门诊量的预测。/n

【技术特征摘要】
1.一种基于高斯过程的医院门诊量预测方法,其特征在于,包括步骤:
S1:获取历史门诊量数据,并对历史门诊量数据进行预设处理得到模型训练集数据和模型验证集数据;
S2:将模型训练集数据采用梯度下降算法优化高斯过程参数,并建立高斯过程的概率图模型;
S3:在模型验证集数据上对步骤S2中得到的高斯过程的概率图模型进行验证,用均方误差指标来评价高斯过程的结果,并得到预设高斯过程模型;
S4:将步骤S3中得到的预设高斯过程模型作为最终的预测模型,上传至后台服务器,用于当前门诊量的预测。


2.根据权利要求1所述的基于高斯过程的医院门诊量预测方法,其特征在于,所述步骤S1中预设处理的方式包括步骤:
S11:将历史门诊量数据从数据库中导出;
S12:对历史门诊量数据进行判断,若历史门诊量数据中存在缺失值,则通过决策树算法对历史门诊量数据进行补全;
S13:将历史门诊量数据的异常值剔除,并采用高斯3sigma原则筛选历史门诊量数据中的异常值;
S14:将预设处理后的历史门诊量数据切分为模型训练集数据和模型验证集数据;其中,模型训练集用于模型训练,模型验证集用于模型选取。


3.根据权利要求1所述的基于高斯过程的医院门诊量预测方法,其特征在于,所述步骤S2包括步骤:
S21:建立高斯过程的概率图模型p(f|X,y),在时间点x1,...,xN上,高斯过程假设p(f(x1),f(x2),...,f(xN))是高斯分布,其均值向量是μ(x)协方差矩阵∑(x)协方差矩阵∑ij=k(xi,xj)是半正定的,k是一个半正定的核函数;
S22:根据先验高斯分布,确定后验概率;先验高斯分布具有如下形式:



根据概率法则,计算后验概率具有如下形式:



S23:确定边际似然函数的梯度信息,在模型训练集数据上利用梯度下降算法更新参数信息;为了估计核函数的参数,采用Kernel-SVM的方式,在整个离散空间搜索最优解,最大化边际似然函数:
(y|X)=∫p(y|f,X)p(f|X)df;
对数边际似然函数为:

【专利技术属性】
技术研发人员:俞建东
申请(专利权)人:宁波柠清信息科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1