一种基于线下药品零售市场分层分级放大方法技术

技术编号:38712698 阅读:12 留言:0更新日期:2023-09-08 14:55
本发明专利技术公开了一种基于线下药品零售市场分层分级放大方法,S1、建立总体;S2、设计样本框;S3、门店抽样;S4、对于步骤S3收集到样本门店的信息进行标准化处理;S5、数据清洗;S6、确定样本框;S7、计算放大系数;S8、计算环比趋势;S9、输出底层结果,对波动过大的数据,进行异常趋势平滑;S10、数据质量控制。本发明专利技术应用于零售市场研究,可以为药店产业提供业务战略咨询、产品研发立项、市场营销和终端市场监测服务。同时,也为消费者研究、综合研究以及零售行业研究等其它研究版块提供一定的数据支持。业研究等其它研究版块提供一定的数据支持。

【技术实现步骤摘要】
一种基于线下药品零售市场分层分级放大方法


[0001]本专利技术涉及数据处理
,具体涉及一种基于线下药品零售市场分层分级放大方法。

技术介绍

[0002]当前,线下药品零售对于行业未来的预测,通常采用自上而下的预测方案,先通过一些第三方市场分析和统计报告来确定整体数据,再从业务角度对市场进行层层细分,然后通过PEST分析模型从政治、经济、文化、人口、技术、自然等各个方面寻找未来影响行业的主要因素,以及最重要的因素对未来行业增速的影响,从而确认行业未来的成长空间。现有的方案能一定程度上满足商业应用,但存在着诸多不足:
[0003]1、数据颗粒度太粗,往往只是某个维度的总体数据。
[0004]2、滞后严重,数据来源滞后。
[0005]3、健壮性较差,容易受抽样不确定影响。
[0006]4、真实性不高,数据来源不稳定且受研究员主观影响较大。
[0007]5、适用场景不多,由于维度的限制,不支持更细维度或多维交叉研究。
[0008]6、专家决策较多,人脑输出比较较高。

技术实现思路

[0009]针对现有技术的不足,本专利技术旨在提供一种基于线下药品零售市场分层分级放大方法。
[0010]为了实现上述目的,本专利技术采用如下技术方案:
[0011]一种基于线下药品零售市场分层分级放大方法,具体过程为:
[0012]S1、建立总体:
[0013]S1.1、药店数据采集:从相关部门处采集药店数据源,以药店数据中的药店名称作为关键词采集药店的工商数据进行基础属性补充;
[0014]S1.2、数据清洗;
[0015]S1.3、建立药店数据库:药店数据清洗完成后,生成全国线下零售药店主数据库;该数据库有着标准的药店编码、多个标准化标签和抽样门店的映射关系;
[0016]S1.4、药店真实性、唯一性校验
[0017]S1.4.1、、药店准入:通过药品经营企业、定点零售药店、医保谈判药品配备机构、O2O直送店、合作连锁样本门店、地图药店POI中的一个或多个对药店准入进行校验;
[0018]S1.4.2、位置信息校验:通过地图POI接口校验药店真实性及补充地址位置信息;
[0019]S1.4.3、重复门店合并:建立重复门店映射,重复门店的相关标签会进行传递,工商信息取成立时间最晚的门店的工商信息,成立时间更新为重复门店里的最早的成立时间;
[0020]S1.5、特征工程:
[0021]1.5.1、特征转换:
[0022]对采集门店和抽样门店原始的特征变量进行转换处理以获取有用的信息,进行连续变量、离散变量、时间序列的转换;
[0023]1.5.2、特征选择
[0024]数据的特征变量可能过多或无效,通过特征选择以减少特征数量、实现特征降维,使模型泛化能力更强,减少过拟合,增强对特征和特征值之间的理解;
[0025]S1.6、建立预测
[0026]以单一算法分别建立数据特征与药店销售潜力的映射关系,使用AutomatedbyTPOT评估各单一算法的预测效果,最终融合多算法输出预测结果;
[0027]S1.7、模型参数优化:调整模型参数以优化预测结果;
[0028]S1.8、结果审核:评估多算法预测效果,输出最终预测结果;
[0029]最后预测出采集门店的销售潜力,药店分级完成市场总体定义;
[0030]S2、设计样本框:
[0031]按城市区域、药店类型、门店销售等级对药店进行划分:
[0032](1)按城市区域划分:每个城市独立一个区域,在区域内进行分层,根据分层对药店进行划分;
[0033](2)按药店类型划分:按照药店类型将药店划分为医院附近店、居民区店、商业街店和DTP药店;
[0034](3)门店销售等级划分:销售额达100万/月以上划分为A+级,销售额达30万/月以上但未达到100万/月为A级,销售额在15万/月以上但未达30万/月划分为B级,销售额在5万/月以上但未达15万/月划分为C级,销售额<5万/月划分为D级;
[0035]其中,分别医院附近店、居民区店、商业街店中门店销售等级为A级、B级、C级、D级作为一个基础模块,得到十二个基础模块,DTP药店作为一个独立的基础模块,A+级的药店独立作为一个基础模块,因此将药店划分得到一共十四个模块;
[0036]S3、门店抽样
[0037]S3.1、抽样方法
[0038]S3.1.1、分层随机抽样:分层随机抽样,又称类型随机抽样,它是先将总体各单位按一定标准分成各种类型;然后根据各类型单位数与总体单位数的比例,确定从各类型中抽取样本单位的数量;最后,按照随机原则从各类型中抽取样本;
[0039]S3.1.2、便利性抽样:在分层随机抽样的基础上,当部分样本药店不能顺利采集到数据时,则采取便利性抽样进行补充,找到与之相似的的药店进行替代;
[0040]S3.2、样本收集
[0041]利用电脑系统进行,对全部样本药店从零售终端POS系统报数,获取对对消费者的销售数据;对2/3的样本药店,对接连锁ERP系统,采集每张小票的交易记录,准确度高;对1/3的样本药店,采集连锁提供的月度电子报表,通过交换数据和购买数据获取,从连锁POS系统报数,获取对消费者的销售数据;
[0042]S4、对于步骤S3收集到样本门店的信息进行标准化处理;
[0043]S5、数据清洗:
[0044]对于步骤S3收集到样本门店的信息进行装换清洗,处理脏数据,并映射到药店数
据库;
[0045]S6、确定样本框:
[0046]S6.1、选取真实销售的门店,排除虚假销售的门店;
[0047]S6.2、选取连续两期的样本店
[0048]S6.3、成熟城市固定样本框
[0049]S6.3.1、选取指标:通过GSM模型,选取5个一级指标,12个二级指标,厘清影响城市成熟度的影响因素;
[0050]S6.3.2、确定指标权重:给多位业务专家发放权重调查问卷,使用AHP算法进行一致性判断,加权综合多位专家的打分,最终确认每个指标的权重;
[0051]S6.3.3、计算评分:标准化后每个城市各个指标的值,与指标权重加权求和,再0

1标准化计算每个城市的评分;
[0052]S6.4、城市分级管理:对城市分成A、B、C、D四个等级,用于对不同的城市采用不用的样本框处理机制;
[0053]其中,A级城市的数据样本丰富,抽样率充足,放大数据基本满足市场检验;B级城市的数据样本缺失某些基础模块,抽样率充足,放大数据基本满足市场检验;C级城市的数据样本缺失某些基础模块,抽样率一般,放大数据基本满足市场检验;D级城市的数据样本缺失某些基础模块,抽样率不足,放大数据市场挑战大;
[0054]对于A级城市,稳定样本框,每月只对流失门店,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于线下药品零售市场分层分级放大方法,其特征在于,具体过程为:S1、建立总体:S1.1、药店数据采集:从相关部门处采集药店数据源,以药店数据中的药店名称作为关键词采集药店的工商数据进行基础属性补充;S1.2、数据清洗;S1.3、建立药店数据库:药店数据清洗完成后,生成全国线下零售药店主数据库;该数据库有着标准的药店编码、多个标准化标签和抽样门店的映射关系;S1.4、药店真实性、唯一性校验S1.4.1、、药店准入:通过药品经营企业、定点零售药店、医保谈判药品配备机构、O2O直送店、合作连锁样本门店、地图药店POI中的一个或多个对药店准入进行校验;S1.4.2、位置信息校验:通过地图POI接口校验药店真实性及补充地址位置信息;S1.4.3、重复门店合并:建立重复门店映射,重复门店的相关标签会进行传递,工商信息取成立时间最晚的门店的工商信息,成立时间更新为重复门店里的最早的成立时间;S1.5、特征工程:1.5.1、特征转换:对采集门店和抽样门店原始的特征变量进行转换处理以获取有用的信息,进行连续变量、离散变量、时间序列的转换;1.5.2、特征选择数据的特征变量可能过多或无效,通过特征选择以减少特征数量、实现特征降维,使模型泛化能力更强,减少过拟合,增强对特征和特征值之间的理解;S1.6、建立预测以单一算法分别建立数据特征与药店销售潜力的映射关系,使用AutomatedbyTPOT评估各单一算法的预测效果,最终融合多算法输出预测结果;S1.7、模型参数优化:调整模型参数以优化预测结果;S1.8、结果审核:评估多算法预测效果,输出最终预测结果;最后预测出采集门店的销售潜力,药店分级完成市场总体定义;S2、设计样本框:按城市区域、药店类型、门店销售等级对药店进行划分:(1)按城市区域划分:每个城市独立一个区域,在区域内进行分层,根据分层对药店进行划分;(2)按药店类型划分:按照药店类型将药店划分为医院附近店、居民区店、商业街店和DTP药店;(3)门店销售等级划分:销售额达100万/月以上划分为A+级,销售额达30万/月以上但未达到100万/月为A级,销售额在15万/月以上但未达30万/月划分为B级,销售额在5万/月以上但未达15万/月划分为C级,销售额<5万/月划分为D级;其中,分别医院附近店、居民区店、商业街店中门店销售等级为A级、B级、C级、D级作为一个基础模块,得到十二个基础模块,DTP药店作为一个独立的基础模块,A+级的药店独立作为一个基础模块,因此将药店划分得到一共十四个模块;S3、门店抽样
S3.1、抽样方法S3.1.1、分层随机抽样:分层随机抽样,又称类型随机抽样,它是先将总体各单位按一定标准分成各种类型;然后根据各类型单位数与总体单位数的比例,确定从各类型中抽取样本单位的数量;最后,按照随机原则从各类型中抽取样本;S3.1.2、便利性抽样:在分层随机抽样的基础上,当部分样本药店不能顺利采集到数据时,则采取便利性抽样进行补充,找到与之相似的的药店进行替代;S3.2、样本收集利用电脑系统进行,对全部样本药店从零售终端POS系统报数,获取对对消费者的销售数据;对2/3的样本药店,对接连锁ERP系统,采集每张小票的交易记录,准确度高;对1/3的样本药店,采集连锁提供的月度电子报表,通过交换数据和购买数据获取,从连锁POS系统报数,获取对消费者的销售数据;S4、对于步骤S3收集到样本门店的信息进行标准化处理;S5、数据清洗:对于步骤S3收集到样本门店的信...

【专利技术属性】
技术研发人员:陈建雄李奎忠
申请(专利权)人:广州中康数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1