基于时间序列的混合模型的医药数据销售预测方法及系统技术方案

技术编号:38726887 阅读:10 留言:0更新日期:2023-09-08 23:18
本发明专利技术提供了基于时间序列的混合模型的医药数据销售预测方法及系统,涉及医药销售预测技术领域,该基于时间序列的混合模型的医药数据销售预测方法包括以下步骤:获取医药销售的时间序列数据,对时间序列数据集中的医药销售数据进行预处理,构建特征矩阵;基于特征矩阵分别构建短期预测模型和长期预测模型;模型训练和测试评估;根据预测需求通过优化后的短期预测模型或长期预测模型进行医药数据销售的预测,并将预测结果进行可视化展示,利用解释性机器学习算法对预测结果进行解释和推论。本发明专利技术可以有效提高预测模型的准确性和鲁棒性;有助于提高预测结果的应用价值,可以帮助企业进行推理和决策,更好地把握市场趋势和竞争环境。争环境。争环境。

【技术实现步骤摘要】
基于时间序列的混合模型的医药数据销售预测方法及系统


[0001]本专利技术涉及医药销售预测
,具体来说,特别涉及基于时间序列的混合模型的医药数据销售预测方法及系统。

技术介绍

[0002]医药数据销售预测模型技术是随着大数据和人工智能技术的快速发展而兴起的。随着医药行业竞争日益激烈,越来越多的企业开始关注销售预测模型技术,以便更好地规划市场策略、提高销售业绩和降低风险。
[0003]以往,医药企业通常使用传统的销售预测方法,如基于经验的直觉预测和基于历史数据的回归分析等。这些方法往往不能准确地预测未来销售情况,而且缺乏对市场趋势和竞争环境的深入分析。随着大数据和机器学习技术的发展,医药企业开始将这些新技术应用到销售预测中,从而获得更加准确和精细的预测结果。
[0004]近年来,医药数据销售预测模型技术取得了较为显著的进展。首先,在数据收集方面,医药企业可以通过各种渠道获取更多、更全面的销售数据;其次,在建模方法方面,新颖、高效的机器学习算法被广泛应用,如深度学习、随机森林等;最后,在应用领域方面,医药企业不仅将销售预测模型应用于市场营销策略的规划和制定,还逐渐将其扩展到供应链管理和库存控制等领域。总之,医药数据销售预测模型技术在不断发展和创新,以满足医药企业对销售数据分析和决策支持的日益增长的需求。
[0005]传统的销售预测方法主要包括基于经验的直觉预测和基于历史数据的回归分析等。这些方法在一定程度上可以对销售情况进行预测,但存在诸多缺点。例如,基于经验的直觉预测缺乏科学性和准确性;而基于历史数据的回归分析则忽略了市场趋势和竞争环境等诸多因素。
[0006]数据挖掘和机器学习技术是目前医药销售预测领域中比较流行的技术。通过这些方法,可以从大量数据中挖掘出有用的信息,并建立相应的预测模型。与传统方法相比,数据挖掘和机器学习技术具有更高的准确性和可靠性,能够更好地预测未来的销售情况。
[0007]然而,在医药数据销售预测方向上,目前流行的数据挖掘和机器学习技术仍然存在着诸多局限性,具体存在以下缺陷:1、数据挖掘和机器学习技术需要大量的数据和计算资源,并且模型构建和评估过程比较复杂,需要专业知识和技能支持。
[0008]2、对医药行业而言,目前可用的数据源通常比较有限,这会影响模型的准确性和稳定性。
[0009]3、目前,数据挖掘和机器学习技术在应用到医药数据销售预测时,往往只是利用了简单常规的算法进行数据处理和模型建立,远远缺乏准确性和稳定性,难以在医药领域普及。
[0010]4、市场趋势和竞争环境变化快速,机器学习方法难以及时适应新的市场变化。
[0011]5、现有技术在预测结果的解释和推理方面存在局限性,难以为企业提供有效的决
策支持。
[0012]针对相关技术中的问题,目前尚未提出有效的解决方案。

技术实现思路

[0013]有鉴于此,本专利技术提供基于时间序列的混合模型的医药数据销售预测方法及系统,以解决上述提及的传统方法在预测准确性和可靠性方面存在局限性问题。
[0014]为了解决上述问题,本专利技术采用的具体技术方案如下:根据本专利技术的一方面,提供了基于时间序列的混合模型的医药数据销售预测方法,该方法包括以下步骤:S1、基于医药大数据获取医药销售的时间序列数据,得到时间序列数据集;S2、对时间序列数据集中的医药销售数据进行预处理,得到标准化数据;S3、基于得到标准化数据进行特征工程,通过选择和构造特征,构建特征矩阵;S4、基于特征矩阵分别构建短期预测模型和长期预测模型;S5、将特征矩阵分为训练集和测试集,采用K折交叉验证法对构建的短期预测模型和长期预测模型进行模型训练和测试评估;S6、根据预测需求通过优化后的短期预测模型或长期预测模型进行医药数据销售的预测,并将预测结果进行可视化展示,利用解释性机器学习算法对预测结果进行解释和推论。
[0015]作为本文的一个实施例,所述基于医药大数据获取医药销售的时间序列数据包括以下步骤:S11、确定需要获取的医药数据的类型和时间范围;S12、基于医药大数据获取医药销售数据,所述医药销售数据包括历史销售数据、药品研发数据及医院诊疗数据;S13、将医药销售数据按照时间顺序组织成时间序列,得到时间序列数据集。
[0016]作为本文的一个实施例,所述对时间序列数据集中的医药销售数据进行预处理,得到标准化数据包括以下步骤:S21、采用水平处理方法对医药销售数据中的异常数据进行处理,并利用异常数据点相邻时刻点的数据平均值取代异常点数据;S22、采用相似日纵向插值法对异常处理后的医药销售数据中的缺失数据进行填补;S23、采用min

max归一化方式对填补后的医药销售数据进行归一化处理,将医药销售数据的值限制在[0,1]的范围区间内。
[0017]作为本文的一个实施例,所述基于得到标准化数据进行特征工程,通过选择和构造特征,构建特征矩阵包括以下步骤:S31、收集与医药销售相关的数据;S32、利用最大信息系数法分析与医药销售相关的影响因素,并筛选出前h个相关的影响因素;S33、对筛选出的前h个相关影响因素进行特征工程,包括特征选择和特征构造,并构建特征矩阵。
[0018]作为本文的一个实施例,所述基于特征矩阵构建短期预测模型包括以下步骤:S41、通过单位根检验法对特征矩阵中的医药销售数据的时间序列数据进行平稳性检验;S42、采用贝叶斯信息准则法确定平稳时间序列模型的阶数;S43、通过作残差序列自相关函数和偏相关函数图,检验平稳时间序列模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该平稳时间序列选择合理,否则,重复步骤S41

S43,直至确定最佳的模型,并将其作为短期预测模型。
[0019]作为本文的一个实施例,所述基于特征矩阵构建长期预测模型包括以下步骤:S44、基于特征矩阵中的相关影响因素,并通过加权灰色关联投影法选择相似日数据集;S45、通过bootstrap重抽样的方法从相似日数据集中进行抽样,得到K个二级训练集,并将K作为随机森林的决策树数;S46、基于二级训练集并根据RFR算法生成相应的CART决策树,并在决策树生成的过程中,对于每个分量节点,从M维属性特征中不放回的抽出m维属性特征,遍历m维属性以及属性对应的数值,计算最小均方值,得到最优的分割数据;S47、训练每一棵决策树,直至达到预设终止条件,并得到长期预测模型。
[0020]作为本文的一个实施例,所述基于特征矩阵中的相关影响因素,并通过加权灰色关联投影法选择相似日数据集包括以下步骤:S441、基于特征矩阵中的相关影响因素构建灰色关联判断矩阵;S442、采用熵权法确定各影响因素的权重,得到权向量;S443、基于得到的权向量对灰色关联判断矩阵进行加权处理,得到加权灰色关联决策矩阵;S444、将加权灰色关联决策矩阵中的每一行视为一个行向量,则定义第一行为待预测日的行向量,其他的作为历史日行向量,并计算各个历史日行向量与在待预测日行向量的灰色关联投影值;S445、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于时间序列的混合模型的医药数据销售预测方法,其特征在于,该方法包括以下步骤:S1、基于医药大数据获取医药销售的时间序列数据,得到时间序列数据集;S2、对时间序列数据集中的医药销售数据进行预处理,得到标准化数据;S3、基于得到标准化数据进行特征工程,通过选择和构造特征,构建特征矩阵;S4、基于特征矩阵分别构建短期预测模型和长期预测模型;S5、将特征矩阵分为训练集和测试集,采用K折交叉验证法对构建的短期预测模型和长期预测模型进行模型训练和测试评估;S6、根据预测需求通过优化后的短期预测模型或长期预测模型进行医药数据销售的预测,并将预测结果进行可视化展示,利用解释性机器学习算法对预测结果进行解释和推论。2.根据权利要求1所述的基于时间序列的混合模型的医药数据销售预测方法,其特征在于,所述基于医药大数据获取医药销售的时间序列数据包括以下步骤:S11、确定需要获取的医药数据的类型和时间范围;S12、基于医药大数据获取医药销售数据,所述医药销售数据包括历史销售数据、药品研发数据及医院诊疗数据;S13、将医药销售数据按照时间顺序组织成时间序列,得到时间序列数据集。3.根据权利要求1所述的基于时间序列的混合模型的医药数据销售预测方法,其特征在于,所述对时间序列数据集中的医药销售数据进行预处理,得到标准化数据包括以下步骤:S21、采用水平处理方法对医药销售数据中的异常数据进行处理,并利用异常数据点相邻时刻点的数据平均值取代异常点数据;S22、采用相似日纵向插值法对异常处理后的医药销售数据中的缺失数据进行填补;S23、采用min

max归一化方式对填补后的医药销售数据进行归一化处理,将医药销售数据的值限制在[0,1]的范围区间内。4.根据权利要求1所述的基于时间序列的混合模型的医药数据销售预测方法,其特征在于,所述基于得到标准化数据进行特征工程,通过选择和构造特征,构建特征矩阵包括以下步骤:S31、收集与医药销售相关的数据;S32、利用最大信息系数法分析与医药销售相关的影响因素,并筛选出前h个相关的影响因素;S33、对筛选出的前h个相关影响因素进行特征工程,包括特征选择和特征构造,并构建特征矩阵。5.根据权利要求1所述的基于时间序列的混合模型的医药数据销售预测方法,其特征在于,所述基于特征矩阵构建短期预测模型包括以下步骤:S41、通过单位根检验法对特征矩阵中的医药销售数据的时间序列数据进行平稳性检验;S42、采用贝叶斯信息准则法确定平稳时间序列模型的阶数;S43、通过作残差序列自相关函数和偏相关函数图,检验平稳时间序列模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该平稳时间序列选择合理,否则,重复步骤
S41

S43,直至确定最佳的模型,并将其作为短期预测模型。6.根据权利要求1所述的基于时间序列的混合模型的医药数据销售预测方法,其特征在于,所述基于特征矩阵构建长期预测模型包括以下步骤:S44、基于特征矩阵中的相关影响因素,并通过加权灰色关联投影法选择相似日数据集;S45、通过bootstrap重抽样的方法从相似日数据集中进行抽样,得到K个二级训练集,并将K作为随机森林的决策树数;S46、基于二级训练集并根据RFR算法生成相应的CART决策树,并在决策树生成的过程中,对于每个分量节点,从M维属性特征中不...

【专利技术属性】
技术研发人员:吕洋张旭东
申请(专利权)人:北京药云数据科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1