当前位置: 首页 > 专利查询>山东大学专利>正文

一种基于客户群体行为分析的加油站销量预测方法技术

技术编号:14825753 阅读:56 留言:0更新日期:2017-03-16 13:22
本发明专利技术涉及一种基于客户群体行为分析的加油站销量预测方法。本发明专利技术所述基于客户群体行为分析的加油站销量预测方法,通过独立于加油站的群体客户行为分析,可以全方位理解客户群体;通过聚类学习,找出群体客户之间的共性,有利于分析客户属性和行为规律。

【技术实现步骤摘要】

本专利技术涉及一种基于客户群体行为分析的加油站销量预测方法,属于数据分析的

技术介绍
能源行业是国民经济的支柱产业之一,由于原油生产的特殊性,油品存储成本和风险很高,需要根据销量定产,销量预测直接影响产业链上游的生产指标,影响油品生产和储运成本。同时,销量预测可以辅助能源销售企业有效规划库存和制订市场营销计划,为科学决策和管理提供依据。因此油品销量预测具有重要的现实意义。然而零售销量预测受到多种因素影响,如宏观经济因素、季节性和节假日等周期性因素、加油站周边的消费人群和竞争对手等环境因素、以及极端天气、促销活动等偶然因素,这些给预测工作带来挑战。传统预测手段主要采用时间序列分析方法对历史销量数据建模,计算移动平均或指数平滑得到预测结果,如ARIMA法、Holt-Winters法等,但是这类方法只依据销量这种外在呈现结果,没有对销售行为的内在动力进行分析,如客户具体购买情况和行为变化情况,因此不能感知客户的动态需求,无法有效预测趋势性和突发性并存的情况。后期基于统计分析的研究工作引入更多销量相关因素,如经济变化影响、产品需求变化影响、营销策略等,分析各种因素和销量的相关性,采用线性回归分析、支持向量机等方法进行销量预测,提高了预测准确度。但是,这些方法对数据质量和特征选择要求高,现实中无法提供所需的有效信息。近年来,神经网络、深度学习等机器学习方法解决了预测结果对特征选择的依赖性,采用输入层、隐含层和输出层的层次结构,输入层节点对应各类特征,输出层节点对应最后的预测结果,中间隐含层的层数和每层节点个数决定了模型复杂度,通过误差逆向传播调整影响因素的权重,进行销量预测。这类方法虽然在解决图像识别、语义分析等问题非常有效,但是针对加油站销量预测问题会因突发因素给后期预测结果带来偏差延续,而且其计算时间耗费巨大,不适用于需要及时更新的预测需求。现有方法的一个共性问题是缺少对销售主体即客户的理解。考虑到汽柴油零售销量的特殊性,上述讨论的销量相关因素会融合到客户消费行为中,通过不同群体行为的变化情况体现出来。例如,城市居民加油量少,对油价不敏感;生产企业客户的一次加油量远大于个体客户,一般情况下油品需求稳定,但是和经济形势密切相关;运输企业客户也是大额加油客户,在运输旺季时需求上涨,呈现一定的周期性;农业客户对柴油的需求明显大于汽油,且在农忙时节需求更多;经营油品的其他社会零售企业,对油价敏感,油价下跌时购买行为表现活跃。鉴于汽柴油零售过程没有客户详细信息,需要一种能够反映客户群体行为的分类方法,通过理解不同客户群体的需求,有效预测群体客户的变化规律,从而融合到既有的销售预测方法中。
技术实现思路
针对现有技术的不足,本专利技术提供一种基于客户群体行为分析的加油站销量预测方法。专利技术概述:本专利技术从销售主体角度分析零售内在动机,细粒度分析客户购买行为与能源销量的关联性,对碎片化的群体客户行为数据进行分类,得到不同客户群体分类的行为特征,如购买的商品数量、间隔周期、购买地点的时空分布等消费习惯;通过学习不同群体客户的行为规律,预测用户消费行为。将不同客户的个体消费行为统计细分为具有相似消费行为的客户群体,可以忽略消费个体间在消费频次、消费数量等消费特征上的差异性,聚合消费群体在行为模式上的相似性,使不同的消费群体代表了不同的消费特性。将用户行为预测融合到传统销量预测数据中,结合不同类型的群体与加油站的相关性,进行加油站零售销量。本专利技术提出的加油站零售销量预测方法包括三部分:基于购买行为的代表性群体客户分类,典型客户群体行为预测,基于客户行为的销量预测。本专利技术的技术方案为:一种基于客户群体行为分析的加油站销量预测方法,包括步骤如下:(1)基于购买行为的群体客户分类;根据客户行为特征将客户进行分类得到不同类别的典型客户群体:白天小额客户、白天普通客户、白天大额客户、高端油品客户、晚间普通客户、晚间大客户、深夜客户,油品和非油商品联动客户;油品销售的主体是客户,购买行为决定销量。本专利技术引入客户行为分析,提高销量预测的准确性。一方面,鉴于能源零售客户一般使用现金交易,无法追踪客户的身份,需要从群体行为特征中发现规律;另一方面,现实中客户群体在收入、属性与消费习惯等方面的显著差异,会直接导致不同的消费行为模式,如果把所有客户视为一类行为模式,会损失细节数据而难以发现共性所在。因此,需要综合考虑用户行为相关因素如包括交易时间、地点等环境信息、促销活动的偶然因素、交易量、和预测加油站的关联性等,将客户进行细分。客户行为特征是指根据客户消费种类、数量以及交易时间等特征对客户进行分类统计的结果。不同类型的客户群体代表了不同的消费特征,对销量预测的贡献度也各不相同。通过这些特征对样本中的客户进行聚类学习,找出共性特征,然后本方法针对每一类客户群体学习其规律。(2)典型客户群体行为预测选定一段时期(近半年或三个月)作为学习周期,学习典型客户群体的行为规律;当典型客户群体包括的用户数量大于阈值时,选择正态分布进行用户数量预测;设定每日人数为随机变量x,服从参数为(μ,σ2)正态分布,记作X~N(μ,σ2),μ为每日期望人数,标准差σ决定了分布的幅度,即人数变化的差异性;则密度函数为:通过最大似然方法来估计未知的均值μ和方差σ2;然后,根据(μ,σ2)预测具体人数μ或是数量区间[μ-σ,μ+σ];当典型客户群体包括的用户数量小于等于阈值时,选择泊松分布进行客户数量预测;概率密度为:其中,参数λ的最大似然估计结果为预测人数为学习出来的λ。泊松分布适用于描述单位时间内随机事件发生次数的概率,在此可预测每月的不同类型的客户群体数量分布。当每日用户数量符合指数分布时,将指数分布通过对数操作,转换为正态分布,根据正态分布估计思想对每月的典型客户群体包括的用户数量以及发生概率进行预测;典型客户群体包括的用户数量的预测值作为估计值,进一步进行销量预测;(3)基于客户行为进行销量预测鉴于能源零售问题与周期因素、偶然因素等多种影响因素相关,应将各类因素集成,有机地进行融合。根据细节交易数据可得到时间序列趋势性特征数据,是销量数据的周期性统计,如同比、环比等数据,表现了时间维度上的销量趋势变化情况;根据外部信息可提取到周期因素(节假日等)、偶然因素(极端天气、促销折扣行为等)以及周边环境因素(站点地理位置分级、周边服务人群构成)等外部特征数据,这些外部特征直接或间接地影响了油品销量。融合基于客户消费行为的不同类型的用户数量预测结果,综合以上特征数据进行基于客户行为的单点销量预测,使用模型为多元线性回归、BP神经网络、粒子群算法。预测模型的准确度对特征的数量及质量要求很高,因此需要分析特征与销量的相关性,以便在预测过程中辅助筛选出最优特征子集达到最好预测精度。鉴于上述各类因素与销量相关性的大小不同,且不同数据类型的准确性不同,需要分析特征和预测结果之间的相关性,以及特征之间的独立性。例如通过对于给定时间窗口内的客户群体数量变化序列,发现不同客户群体与销量的相关性,以及每类群体变化特点均不同,表现为:(1)周期性:各客户群体的变化呈现独立性周期变化趋势;(2)行为变化动态性:不同客户群体变化遵循的规律不完全一致;(3)相关性:不同客户群体的变化对销量变化本文档来自技高网
...
一种基于客户群体行为分析的加油站销量预测方法

【技术保护点】
一种基于客户群体行为分析的加油站销量预测方法,其特征在于,包括步骤如下:(1)基于购买行为的群体客户分类;根据客户行为特征将客户进行分类得到不同类别的典型客户群体:白天小额客户、白天普通客户、白天大额客户、高端油品客户、晚间普通客户、晚间大客户、深夜客户,油品和非油商品联动客户;(2)典型客户群体行为预测;选定一段时期作为学习周期,学习典型客户群体的行为规律;当典型客户群体包括的用户数量大于阈值时,选择正态分布进行用户数量预测;设定每日人数为随机变量x,服从参数为(μ,σ2)正态分布,记作X~N(μ,σ2),μ为每日期望人数,标准差σ决定了分布的幅度,即人数变化的差异性;则密度函数为:通过最大似然方法来估计未知的均值μ和方差σ2;然后,根据(μ,σ2)预测具体人数μ或是数量区间[μ‑σ,μ+σ];当典型客户群体包括的用户数量小于等于阈值时,选择泊松分布进行客户数量预测;概率密度为:其中,参数λ的最大似然估计结果为预测人数为学习出来的λ;当每日用户数量符合指数分布时,将指数分布通过对数操作,转换为正态分布,根据正态分布估计思想对每月的典型客户群体包括的用户数量以及发生概率进行预测;典型客户群体包括的用户数量的预测值作为估计值,进一步进行销量预测;(3)基于客户行为进行销量预测;将相关性系数和重要性系数,进行归一化处理后相乘,作为选择特征的概率,筛选出最优的特征子集,进行预测分析;(3‑1)特征子集采用概率包裹式特征筛选算法,针对包含N个特征的集合S,随机选取数值n,1≤n≤N,依据特征选择概率对集合S随机采样,取出包含n个不重复元素的特征子集;依据本次筛选的特征集合进行销量预测,记录每次预测的预测结果和特征子集;(3‑2)重复步骤(3‑1),直到预测次数达到设定门限,将每次的预测结果相互比较,则预测结果最优值对应的一组特征子集,作为筛选出的最优特征子集;(4)通过多元线性回归、BP神经网络或粒子群算法预测销量。...

【技术特征摘要】
1.一种基于客户群体行为分析的加油站销量预测方法,其特征在于,包括步骤如下:(1)基于购买行为的群体客户分类;根据客户行为特征将客户进行分类得到不同类别的典型客户群体:白天小额客户、白天普通客户、白天大额客户、高端油品客户、晚间普通客户、晚间大客户、深夜客户,油品和非油商品联动客户;(2)典型客户群体行为预测;选定一段时期作为学习周期,学习典型客户群体的行为规律;当典型客户群体包括的用户数量大于阈值时,选择正态分布进行用户数量预测;设定每日人数为随机变量x,服从参数为(μ,σ2)正态分布,记作X~N(μ,σ2),μ为每日期望人数,标准差σ决定了分布的幅度,即人数变化的差异性;则密度函数为:通过最大似然方法来估计未知的均值μ和方差σ2;然后,根据(μ,σ2)预测具体人数μ或是数量区间[μ-σ,μ+σ];当典型客户群体包括的用户数量小于等于阈值时,选择泊松分布进行客户数量预测;概率密度为:其中,参数λ的最大似然估计结果为预测人数为学习出来的λ;当每日用户数量符合指数分布时,将指数分布通过对数操作,转换为正态分布,根据正态分布估计思想对每月的典型客户群体包括的用...

【专利技术属性】
技术研发人员:孙宇清李守强
申请(专利权)人:山东大学普联软件股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1