基于机器学习的药品市场规模预测系统技术方案

技术编号:29979384 阅读:14 留言:0更新日期:2021-09-08 10:09
本发明专利技术涉及医药大数据技术领域,特别是涉及一种基于机器学习的药品市场规模预测系统,能预测药品市场采购量的变化趋势、协助制定药品市场的采购计划、帮助用户了解市场定位、辅助合理用药的监测评估;包括以下步骤:S1、数据需求;S2、采购量相关数据;S3、数据清洗;S4、数据纳入否;S5、多维度统计;S6、指标库;S7、随机分组;S8、评估变量重要性;S9、预测模型搭建;S10、是否历遍所有变量;S11、模型评估;S12、专家评价;S13、实用性判别;S14、真实环境测试;S15、是否重新评估。是否重新评估。是否重新评估。

【技术实现步骤摘要】
基于机器学习的药品市场规模预测系统


[0001]本专利技术涉及医药大数据
,特别是涉及一种基于机器学习的药品市场规模预测系统。

技术介绍

[0002]药品市场规模具有未知性和不确定性,采购量变化趋势受到医疗机构、药品特点、医疗保险、市场竞争、医药政策等多方面因素的影响,而个体经验用于药品采购量预测的局限性比较大,具体体现在以下方面:医疗机构在制定新一轮的药品采购计划和国家集采药品报量方面,缺乏科学合理的药品市场数据支持,凭借历往药品采购资料,简单按系数加成获取药品采购量预测值,并基于此预测值制定采购计划,使部分药品积压仓库或药品短缺,国家集采任务不达标被约谈或绩效评价不达标导致药品集中采购激励被一票否决,不利于医疗资源的合理利用和分配;相关政府部门在药品带量议价谈判、制定药品集中采购方案、药品集中采购激励方案、药品支付预算方案等药品市场相关政策方面,现主要依赖于医疗机构等受监管单位上报的数据,缺乏药品市场数据作为辅佐决策工具以校正现存数据的偏倚,削弱了药品带量议价的筹码,增加了集中采购执行受阻、激励措施与实际采购情况不适配、医保基金浪费等现象的可能性;企业机构在制定药品生产计划、药品销售计划、商业医疗保险风险评估方案、市场发展战略等企业计划方面,现主要采用第三方市场评估机构提供的横断面药品市场数据作为参考依据,忽略了药品数据的纵向变化特点,缺乏全局化和精细化相结合的药品市场数据支持,导致了药品市场定位不准确、药品产量滞后和产能过剩、商业医保风险不确定性增加等问题,目前,国内尚无一项关于药品市场规模预测的完整系统可以解决以上问题。

技术实现思路

[0003]为解决上述技术问题,本专利技术提供一种能预测药品市场采购量的变化趋势、协助制定药品市场的采购计划、帮助用户了解市场定位、辅助合理用药的监测评估的基于机器学习的药品市场规模预测系统。
[0004]本专利技术的一种基于机器学习的药品市场规模预测系统,包括以下步骤:
[0005]S1、数据需求:根据用户提出的药品市场规模预测方面的需求,若已有历史的建模经验,则结合历史的建模经验和问题解决方案,整合形成综合的数据需求;
[0006]S2、采购量相关数据:依据药品市场规模预测方面的数据需求,从药品交易数据库中调取采购量相关数据,并存于结构化的标准数据表中;
[0007]S3、数据清洗:对数据进行标记,并将有效的数据纳入模型;
[0008]S4、数据纳入否:对不纳入模型的数据进行数据检查,深入发现其不符合纳入模型标准的原因,挖掘其可能存在的数据问题;对纳入模型的数据进行多维度统计;
[0009]S5、多维度统计:对纳入模型的数据,从药品属性、医院属性、市场竞争、销量售价等方面进行多维度统计;
[0010]S6、指标库:将各个地区多维度统计的结果结构化,并存储于指标标准数据库中;
[0011]S7、随机分组:按照一定的分配比例,根据医疗机构的唯一编码,将部分医疗机构的数据划分为测试集,剩余医疗机构的数据划分为训练集,用于模型拟合;
[0012]S8、评估变量重要性:采用随机森林模型评估全部自变量的重要性,对于预测药品采购量的回归问题,采用均方误差增率(%IncMSE)作为自变量的重要性评价指标;对于预测采购量倍率评级的分类问题,采用平均准确率降幅(Mean Decrease Accuracy,MDA)评价自变量的重要性;
[0013]S9、预测模型搭建;
[0014]S10、是否历遍所有变量:检查循环是否历遍了训练集中的所有自变量,若未历遍所有自变量,则继续循环过程;若已历遍所有自变量,则结束循环,在预测模型集中根据拟合优度或准确率筛选最优模型;
[0015]S11、模型评估;
[0016]S12、专家评价:相关领域专家根据相关经验和参考资料,对模型的预测结果进行评价分析,提出修改建议,并评估其实用性;
[0017]S13、实用性判别:当预测模型未达到实用阶段时,则根据修改建议与评估结果,返回至数据需求生成阶段,指导下一步模型搭建方案;当预测模型达到实用阶段时,则存储于预测模型数据库中;
[0018]S14、真实环境测试;
[0019]S15、是否重新评估:根据真实环境测试结果,判断模型是否需要再评估,若需要再评估则返回至模型评估阶段,并根据专家评价结果修改建模方案,重新进入下一个建模阶段;若无需要再评估则将预测模型纳入到药品交易监测系统。
[0020]进一步地,所述步骤S3中,包括以下步骤:
[0021]1)将待清洗数据中无效订单数据、未知来源数据、错误数据等无效数据进行无效化标记;
[0022]2)利用药品编码,关联已搭建的药品信息标准库,对药品的目录通用名、目录剂型、标准规格、标准厂家名、基药、医保、限定日剂量等属性进行标记;
[0023]3)利用医院编码,关联已搭建的医疗机构信息标准库,对医疗机构的等级评级、行政区域、基层分类等属性进行标记;
[0024]4)对所有必要的字段制定缺失值补充的规则,补充规则亦随着建模过程中发现的问题反馈进行更新完善,结合补充规则,对待清洗数据进行缺失值补充;
[0025]5)结合纳入标准,对于无效数据、必要字段无法补充、不在统计时间范围内数据,或者建模经验认为需排除的其他数据等,标记为不纳入模型的数据,其他的数据则标记为纳入模型的数据。
[0026]进一步地,所述步骤S9中,包括以下步骤:
[0027]1)结合自变量的重要性评价结果,对自变量按重要性指标降序排序,得到自变量集合F{x1,x2,x3,

},循环过程中,依次取F中的前i位元素,使得每次循环,取fi中的所有元素作为搭建模型的自变量组合;
[0028]2)对于预测药品采购量的回归问题,采用随机森林回归器和岭回归模型,进行回归分析,同时在时间序列资料完整时,采用时间序列分析方法优化模型;对于预测采购量倍
率评级的分类问题,采用随机森林分类器模型,进行聚类分析;
[0029]3)调整部分模型中的参数,并评估模型的拟合优度或准确率,输出预测模型。
[0030]进一步地,所述步骤S11中,包括以下步骤:
[0031]1)利用筛选出的模型,结合测试集数据,得到测试集的预测结果;
[0032]2)对于回归分析,采用Bland

Altman法进行一致性评价,并比较差值与误差可接受阈值,误差可接受阈值由用户需求提出;对于聚类分析,采用十折交叉验证和混淆矩阵进行一致性评价,并比较准确度与准确度阈值,准确度阈值由用户需求提出;
[0033]3)对比分析两类模型的外推性,分析各自的优缺点,并形成模型评价结果。
[0034]进一步地,所述步骤S14中,包括以下步骤:
[0035]1)利用预测模型,结合新一轮药品采购周期的药品目录信息和药品交易数据库,对新一轮采购周期药品进行报量预测;
[0036]2)对于药品采购量预测结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的药品市场规模预测系统,其特征在于,包括以下步骤:S1、数据需求:根据用户提出的药品市场规模预测方面的需求,若已有历史的建模经验,则结合历史的建模经验和问题解决方案,整合形成综合的数据需求;S2、采购量相关数据:依据药品市场规模预测方面的数据需求,从药品交易数据库中调取报量相关数据,并存于结构化的标准数据表中;S3、数据清洗:对数据进行标记,并将有效的数据纳入模型;S4、数据纳入否:对不纳入模型的数据进行数据检查,深入发现其不符合纳入模型标准的原因,挖掘其可能存在的数据问题;对纳入模型的数据进行多维度统计;S5、多维度统计:对纳入模型的数据,从药品属性、医院属性、市场竞争、销量售价等方面进行多维度统计;S6、指标库:将各个地区多维度统计的结果结构化,并存储于指标标准数据库中;S7、随机分组:按照一定的分配比例,根据医疗机构的唯一编码,将部分医疗机构的数据划分为测试集,剩余医疗机构的数据划分为训练集,用于模型拟合;S8、评估变量重要性:采用随机森林模型评估全部自变量的重要性,对于预测药品采购量的回归问题,采用均方误差增率(%IncMSE)作为自变量的重要性评价指标;对于预测采购量倍率评级的分类问题,采用平均准确率降幅(Mean Decrease Accuracy,MDA)评价自变量的重要性;S9、预测模型搭建;S10、是否历遍所有变量:检查循环是否历遍了院训练集中的所有自变量,若未历遍所有自变量,则继续循环过程;若已历遍所有自变量,则结束循环,在预测模型集中根据拟合优度或准确率筛选最优模型;S11、模型评估;S12、专家评价:相关领域专家根据相关经验和参考资料,对模型的预测结果进行评价分析,提出修改建议,并评估其实用性;S13、实用性判别:当预测模型未达到实用阶段时,则根据修改建议与评估结果,返回至数据需求生成阶段,指导下一步模型搭建方案;当预测模型达到实用阶段时,则存储于预测模型数据库中;S14、真实环境测试;S15、是否重新评估:根据真实环境测试结果,判断模型是否需要再评估,若需要再评估则返回至模型评估阶段,并根据专家评价结果修改建模方案,重新进入下一个建模阶段;若无需要再评估则将预测模型纳入到药品交易监测系统。2.如权利要求1所述的基于机器学习的药品市场规模预测系统,其特征在于,所述步骤S3中,包括以下步骤:1)将待清洗数据中无效订单数据、未知来源数据、错误数据等无效数据进行无效化标记;2)利用药品编码,关联已搭建的药品信息标准库,对药品的目录通用名、目录剂型、标准规格、标准厂家名、基药、医保、限定日剂量等属性进行标记;3)利用医院编码,关联已搭建的医疗机构信息标准库,对医疗机构的等级评级、行政区域、基层分类等属性进行标记;
4)对所有必要的字段制定缺失值补充的规则,补充规则亦随着建模过程中发现的问题反馈进行更新完善,结合...

【专利技术属性】
技术研发人员:朱仁卓绮雯李晓彤劳丽玫
申请(专利权)人:深圳市全药网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1