System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于中式卷烟产品数字化营销,具体涉及一种基于随机森林算法的中式卷烟产品市场状态分类方法。
技术介绍
1、受到政策限制、季节性波动、供需不均衡以及宏观经济变化等诸多不确定性因素的影响,烟草行业实现基于数字化和智能化的精准营销具有较大的难度。而对于中式卷烟产品的市场状态进行实时、准确的评价与识别是实现精准营销的基础,但传统的依赖于营销人员经验和事后进行的市场状态评估方法具有极大的不准确性。
2、人工智能特别是机器学习算法的快速发展使得对许多领域中的业务数据集进行较高精确度的分类成为可能,但由于中式卷烟产品的市场营销数据只具有较多的特征数据而缺乏状态标签数据。
3、因此有必要设计一种算法,可以在无标签信息情况下,通过对历史营销数据进行多维度特征分析,将影响中式卷烟产品市场状态的时间序列向量进行学习和训练,得到对中式卷烟产品市场状态的聚类分析。
技术实现思路
1、为解决现有技术存在的上述技术问题,本专利技术提供一种基于随机森林算法的中式卷烟产品市场状态分类方法。本专利技术采用加权k-means随机森林分类算法,通过构建中式卷烟产品市场状态评价指标体系,实现对中式卷烟产品市场状态的评价、分类与识别,具有较高的实时性和准确性,可以为中式卷烟产品的营销人员实施精准营销提供决策支持。
2、本专利技术采用的技术方案是:
3、一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,具体包括如下步骤:
4、s1:获取中式卷烟产
5、s2:设定卷烟产品市场状态种类及方案,基于市场状态影响因素的相关性分析,构建出中式卷烟产品市场状态的评价指标体系,并采用ahp-熵值法确定各评价指标及权重;
6、s3:根据所构建的中式卷烟产品市场状态的评价指标体系,从能够表征市场状态的指标中筛选出相关的特征向量,经降维和归一化处理,得到一级准则层的价格、要货积极性和存销比等三个特征向量;
7、s4:基于加权k-means的随机森林分类算法,根据所设定的卷烟产品市场状态种类和数量,输入特征向量进行学习和训练,得到中式卷烟产品在其生命周期的市场状态聚类结果,进而确定中式卷烟产品当前所处的市场状态;
8、s5:根据得到的中式卷烟产品当前所处的市场状态,即可制定和实施精准的营销策略。
9、进一步的,在步骤s1中,具体流程如下:
10、s1.1获取中式卷烟产品历史的市场销售历史数据,形成基于时间序列的各个数据集;
11、s1.2对所获取初始数据中存在的缺失或谬误的异常数据进行处理和清洗;根据中式卷烟产品销售过程中出现偏离正常范围的异常数据特点,设定异常数据处理规则对异常数据进行处理和清洗,形成能够影响中式卷烟产品市场状态、表征产品市场状态的特征向量时间序列。
12、进一步的,在步骤s2中,具体流程如下:
13、s2.1根据烟草行业企业的自身情况,结合实际营销业务的实际,确定中式卷烟产品市场状态的种类数量,以及对于不同产品市场状态下的营销方案内容;
14、s2.2将步骤s1.2中经清洗和处理后得到的市场销售历史数据进行相关性计算,得到各影响中式卷烟产品市场状态的各因素间相关性系数矩阵;
15、假设x1和x2为两个影响产品市场状态的因素,则两个因素间的相关性系数可表示为:
16、
17、其中,cov(x1,x2)为因素x1与因素x2的协方差,var(x1)为因素x1的方差,var(x2)为x2的方差;
18、对所有影响产品市场状态的因素两两进行相关性系数计算,即可得到各影响中式卷烟产品市场状态的各因素间相关性系数矩阵;
19、s2.3根据步骤s2.2得到的相关性系数矩阵,筛选后可得到表征中式卷烟产品市场状态的最佳指标,可用于对中式卷烟产品的市场状态进行评价,也可以对其时间序列数据通过机器学习和训练得到市场状态的不同分类;
20、s2.4采用ahp法,构建中式卷烟产品市场状态的评价指标体系;
21、对于从步骤s2.3得到的n个中式卷烟产品市场状态评价指标,基于ahp法,依据各评价指标的属性建立不同层级的评价因素集,形成递阶层次结构模型;
22、s2.5采用熵值法,根据各指标的差异系数计算各指标权重;
23、对于具有n个评价指标的m个评价对象,可以构建初始评价矩阵:
24、am×n=(aij)m×n (2)
25、其中,a为初始评价矩阵,aij为第i个评价对象的第j个指标的数值(i=1,2,3,…,m;j=1,2,3,…,n)。对初始评价矩阵进行归一化处理,得到标准化矩阵:
26、rm×n=(rij)m×n (3)
27、其中,r为经归一化处理后得到的标准化矩阵,rij为第i个评价对象的第j个指标经归一化处理好得到的数值(i=1,2,3,…,m;j=1,2,3,…,n)。则第j个指标在i个评价对象中出现的比重可表示为:
28、
29、其中,pij为第j个指标在i个评价对象中出现的比重。则第j个指标的信息熵为:
30、
31、其中,ej为第j个指标的信息熵,满足e≥0。
32、
33、其中,k为系数,满足k>0。由此,可计算出各指标的差异系数:
34、dj=1-ej (7)
35、其中,dj为第j个指标的差异系数。最终得到各指标的权重为:
36、
37、其中,wj为第j个指标的权重,j=1,2,3,…,n。
38、进一步的,在步骤s3中,具体流程如下:
39、s3.1根据步骤s2得到的中式卷烟产品市场状态评价指标体系,从步骤s1.2经处理和清洗后的数据序列中得到各评价指标所对应的特征向量时间序列;
40、s3.2对特征向量做降维处理;
41、根据所构建的中式卷烟产品市场状态评价指标体系,将步骤s3.1获取到的各评价指标所对应的特征向量时间序列作为输入,分别得到可用于聚类分析的一级准则层特征向量时间序列;
42、s3.3对上述一级准则层特征向量时间序列数据做无量纲、归一化处理;
43、评价指标根据指标变化方向,分为正向指标和逆向指标,其中正向指标值越大,越优,逆向指标值越小,越优;
44、假设有n个决策指标fj(1≤j≤n),m个待评价的方案ai(1≤i≤m),m个方案的n个指标值构成决策矩阵x=(xij)m×n;
45、采用极差变换法进行数据归一化处理,即对于正向指标:
46、
47、其中,xij为第i个方案第j个指标的值,max(xij)为各方案中第j个指标的最本文档来自技高网...
【技术保护点】
1.一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,具体包括如下步骤:
2.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤S1中,具体流程如下:
3.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤S2中,具体流程如下:
4.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤S3中,具体流程如下:
5.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤S4中,具体流程如下:
6.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤S5中,具体流程如下:
【技术特征摘要】
1.一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,具体包括如下步骤:
2.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤s1中,具体流程如下:
3.如权利要求1所述的一种基于随机森林算法的中式卷烟产品市场状态分类方法,其特征在于,在步骤s2中,具体流程如下:
4.如权...
【专利技术属性】
技术研发人员:孔振宇,胡哲瑞,杨超,
申请(专利权)人:浙江中烟工业有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。