一种基于长短期记忆神经网络的货源投放方法及系统技术方案

技术编号:36694424 阅读:22 留言:0更新日期:2023-02-27 20:04
本发明专利技术涉及烟草的数字营销技术领域,公开了一种基于长短期记忆神经网络的货源投放方法及系统,包括以下步骤:S1.收集货源数据,并对收集到的货源数据进行预处理;通过K

【技术实现步骤摘要】
一种基于长短期记忆神经网络的货源投放方法及系统


[0001]本专利技术涉及烟草的数字营销
,更具体的,涉及一种基于长短期记忆神经网络的货源投放方法及系统。

技术介绍

[0002]中国经济由高速增长阶段转向高质量发展阶段,新一轮科技革命和产业变革成为引领内生动力、结构优化的关键。在这样的背景下,新型基础设施建设在中央与国家级别会议被多次提及,根据发改委定义新型基础设施是提供数字转型、智能升级、融合创新等服务的体系,其中数据中心被列入信息基础设施的范畴,数字产业化正在向产业数字化转型升级。
[0003]数字营销围绕数据、内容和触点的全面优化展开,其中数据环节包括第一方数据运营、第三方数据、数据中台和数据分析等细分赛道。数字营销的目的在于以全链路的客户数据采集与分析,帮助企业形成更加完整的客户画像,从而精准触达目标客户,提高营销活动的投入产出比。企业需要从渠道接入和整合、全域客户洞察等维度考虑,选择合适的系统,因此,系统的灵活性和扩展性受到格外的关注,以期令企业能够更加从容地应对未来的市场变化。
[0004]近年来,烟草行业积极推进数字化技术应用,然而,很多烟草公司现有的货源投放系统、零售终端系统、库存管理系统等数字化系统之间存在着严重的数据孤岛化问题,随着对接系统的增多,数据量日趋庞大,数据利用率显著降低甚至出现数据过载的情况,并没有发挥出数据在数字化转型过程中应有的价值。因此,我们在传统烟草营销过程注重数据存留与筛选的基础上,应用深度学习领域算法等数字化前沿技术,进行数据收集、挖掘与分析,依据数据呈现出的规律,完成对卷烟货源精准投放系统的信息化模块构建,实现全流程的信息化操作闭环和系统的自动运算、生成、应用。
[0005]时间序列分析(Time

Series Analysis)是根据已有的历史数据来得到数据随时间序列的变化规律,进而预测未来时间点上数据的方法。根据调查可知,消费者对卷烟的偏好、人员的流动等市场因素都与时间有关,因此我们从时间的维度来进行卷烟销量预测,从而明确市场需求。由于卷烟货源每周投放一次,所以我们据此每周统计一次卷烟的销售情况,选择“周”作为时间序列单位。
[0006]长短期记忆(Long Short

Term Memory,LSTM)神经网络是一种特殊的循环神经网络(Recurrent Neural Network,RNN),RNN在训练中很容易出现梯度爆炸或者梯度消失的问题,导致无法处理较长序列数据,从而无法获取长距离数据的信息,而LSTM很好地克服了这一点。显而易见的是,货源投放策略会影响客户的订购量,因此我们将货源投放策略作为神经网络的输入,客户订购量作为神经网络的输出,训练神经网络,从而明确未来订购情况。
[0007]RNN展开后由多个相同的单元连续连接,实际上是一个自我不断循环的结构,随着输入数据的不断增加,这个自我循环的结构把上一次的状态传递给当前输入,一起作为新
的输入数据进行当前轮次的训练和学习,一直到输入或者训练结束,最终得到的输出即为最终的预测结果。LSTM与RNN的区别在于普通的RNN单个循环结构内部只有一个状态,而LSTM的单个循环结构(又称为细胞)内部有四个状态,相比于RNN,LSTM的循环结构之间保持着一个持久的单元状态不断传递下去,用于决定哪些信息要遗忘或者继续传递下去。一层LSTM是由单个循环结构组成,既由输入数据的维度和循环次数决定单个循环结构需要自我更新几次,而不是多个单个循环结构连接组成,即当前层LSTM的参数总个数只需计算一个循环单元即可。
[0008]现有技术有一种基于神经网络的烟草投放量研判方法及系统,属于机器学习及数据挖掘领域,技术方案为:该方法是使用神经网络模型构建卷烟投放量模型,根据烟草市场的特点,将卷烟的特征作为卷烟投放量模型的读取指标,卷烟投放量模型根据训练条件计算出符合要求的卷烟投放量,为客户提供在不同投放量下卷烟的模拟周投放情况,即根据用户所期望卷烟达到订足率条件下,提供用户卷烟的参考投放量;具体如下:S1、获取卷烟的特征数据;S2、对卷烟的相关特征的数据进行预处理;S3、训练卷烟投放量模型;S4、卷烟投放量模型结果展示与使用。
[0009]然而现有技术存在对数据利用不充分、价值量低的问题,因此如何专利技术一种能够充分利用数据,价值量高的货源投放方法,是本
亟需解决的问题。

技术实现思路

[0010]本专利技术为了解决现有货源投放技术对数据利用不充分、价值量低的问题,提供了一种基于长短期记忆神经网络的货源投放方法及系统,其具有模块化、标准化、智能化的特点。
[0011]为实现上述本专利技术目的,采用的技术方案如下:
[0012]一种基于长短期记忆神经网络的货源投放方法,包括以下步骤:
[0013]S1.收集货源数据,并对收集到的货源数据进行预处理;通过K

means算法对预处理后的货源数据进行聚类分析,得到数据地图;
[0014]S2.根据数据地图,构建投放策略;训练长短期记忆神经网络模型,即LSTM模型;
[0015]S3.结合时间序列分析,通过训练好的长短期记忆神经网络模型预测当前投放策略的订购量和销售量,并计算存销比、订购率、订足率,对当前投放策略进行优化;
[0016]S4.循环步骤S3,直到达到设定的优化阈值,得到最优投放策略;
[0017]S5.输出调控后的货源的投放策略结果。
[0018]优选的,所述的步骤S1中,对收集到的货源数据进行预处理,具体为:
[0019]S101.在pyecharts库中,使用global包进行全局设置,使用charts包画图,对货源数据中的数据进行描述性统计,绘制html图表;
[0020]S102.根据统计后的货源数据,在sklearn库中,使用preprocessing包进行货源数据的预处理,得到预处理数据。
[0021]进一步的,所述的步骤S102中,在sklearn库中,使用preprocessing包进行货源数据的预处理,具体步骤为:
[0022]S1101.提取货源数据中的主要特征,包括:“客户编码”“档位”“地理位置”“经营规模”“终端细分”“经度”“纬度”“订购量”“销售量”;
[0023]S1102.检查提取主要特征是否存在空值或错值,若有则进行填补;
[0024]S1103.将主要特征除去“客户编码”“经度”“纬度”之外的特征分为数值特征和分类特征两类;
[0025]S1104.对数值特征中的“订购量”和“销售量”特征采用z

score的形式进行标准化;分类特征包括“档位”“地理位置”“经营规模”“终端细分”;对分类特征进行编码,若种类数多于2则进行one

hot编码。
[0026]更进一步的,所述的步骤S1中,通过K

means算法对预处理后的货源数据进行聚类分析,得到数据地图,具体步骤为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于长短期记忆神经网络的货源投放方法,其特征在于:包括以下步骤:S1.收集货源数据,并对收集到的货源数据进行预处理;通过K

means算法对预处理后的货源数据进行聚类分析,得到数据地图;S2.根据数据地图,构建投放策略;训练长短期记忆神经网络模型,即LSTM模型;S3.结合时间序列分析,通过训练好的长短期记忆神经网络模型预测当前投放策略的订购量和销售量,并计算存销比、订购率、订足率,对当前投放策略进行优化;S4.循环步骤S3,直到达到设定的优化阈值,得到最优投放策略;S5.输出调控后的货源的投放策略结果。2.根据权利要求1所述的基于长短期记忆神经网络的货源投放方法,其特征在于:所述的步骤S1中,对收集到的货源数据进行预处理,具体为:S101.在pyecharts库中,使用global包进行全局设置,使用charts包画图,对货源数据中的数据进行描述性统计,绘制html图表;S102.根据统计后的货源数据,在sklearn库中,使用preprocessing包进行货源数据的预处理,得到预处理数据。3.根据权利要求2所述的基于长短期记忆神经网络的货源投放方法,其特征在于:所述的步骤S102中,在sklearn库中,使用preprocessing包进行货源数据的预处理,具体步骤为:S1101.提取货源数据中的主要特征,包括:“客户编码”“档位”“地理位置”“经营规模”“终端细分”“经度”“纬度”“订购量”“销售量”;S1102.检查提取主要特征是否存在空值或错值,若有则进行填补;S1103.将主要特征除去“客户编码”“经度”“纬度”之外的特征分为数值特征和分类特征两类;S1104.对数值特征中的“订购量”和“销售量”特征采用z

score的形式进行标准化;分类特征包括“档位”“地理位置”“经营规模”“终端细分”;对分类特征进行编码,若种类数多于2则进行one

hot编码。4.根据权利要求3所述的基于长短期记忆神经网络的货源投放方法,其特征在于:所述的步骤S1中,通过K

means算法对预处理后的货源数据进行聚类分析,得到数据地图,具体步骤为:S1201.将预处理后的货源数据除去“客户编码”“经度”“纬度”后分为K组,随机选取K个数据样本作为初始聚类中心;S1202.计算每个样本到各个聚类中心的距离,把每个样本分配给距离它最近的聚类中心,聚类中心以及分配给它们的样本就代表一个聚类;S1203.每被分配一个样本,该聚类的聚类中心就根据聚类中所有现存的样本被重新计算;S1204.重复步骤S1202和步骤S1203过程直到聚类不再发生变化,得到聚类数据;S1205.结合“客户编码”、“经度”、“纬度”、聚类数据,形成数据地图。5.根据权利要求1所述的基于长短期记忆神经网络的货源投放方法,其特征在于:所述的步骤S2中,训练长短期记忆神经网络模型,具体步骤为:S201.得到训练用数据集和验证用数据集;
S202.通过训练用数据集构建单层LSTM基础模型,将每个LSTM单元描述为:f
t
=σ(W
f
×
(h
t
‑1,X
t
)+b
f
)其中,判定为无用或不相关的历史信息将被遗忘门抛弃,f
t
为t周遗忘门的激活值,X
t
是自变量,表示t周的投放策略;将t

1周保留的信息与t周输入的信息共同更新为输入门状态:i
t
=σ(W
i
×
(h
t
‑1,X
t
)+b
i
)A
t
=tanh(W
c
×
(h
t
‑1,X
t
)+b
c
)A
t
=tanh(W
c
×
(h
t
‑1,X
t
)+b
c
)...

【专利技术属性】
技术研发人员:刘晓迪谢海欣何振峰于享江肖保棠苏德元
申请(专利权)人:广东烟草惠州市有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1