The invention discloses a construction method and device, a large data precision marketing model modeling method includes: reading data sample files; according to the setting of the ratio of the modeling data sample is divided into training samples and test samples; for filling missing values; influence of continuous variables do discrete processing; calculating the information entropy of each attribute, and the data were replaced; fixed training data file and the last column is the target variable, training large data precision marketing model; the model is tested by using the AUC value to determine the model quality; read the target data file; the target data samples for filling missing values; continuous variables on the target data in the sample do discrete replacement; do discrete replacement for discrete data; calculate the probability of each target data output probability list. The model of the invention is more accurate, no manual operation is needed in the middle, the operation is simpler, and the model can be used by non analysts.
【技术实现步骤摘要】
大数据精准营销模型的构建方法及装置
本专利技术涉及大数据营销模型领域,特别涉及一种大数据精准营销模型的构建方法及装置。
技术介绍
传统的精准营销模型有很多,不同的模型和不同的数据处理手段都会导致模型的准确率不同,但是传统的精准营销模型中有一个通病,就是缺乏步骤之间的连接线,往往需要在中间步骤加入人工的操作,其操作较为复杂,另外,还需要每一个用户都要有数据分析的能力,当不具有数据分析能力的用户想要对传统的精准营销模型进行操作时,其面临的问题是不能进行操作。传统的精准影响模型只能针对特定的人群(即有数据分析能力的用户)才能进行操作,非分析人员不便于对传统的精准营销模型进行操作,其使用范围受限。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述缺陷,提供一种模型效果更加精准、中间不需要任何的人工操作、操作较为简便、非分析人员也能使用模型的大数据精准营销模型的构建方法及装置。本专利技术解决其技术问题所采用的技术方案是:构造一种大数据精准营销模型的构建方法,包括如下步骤:A)读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;B)按照设定的比例将所述建模数据样本划分为训练样本和测试样本;C)采取众数的方法对所述训练样本和测试样本进行缺失值补全;D)对所述训练样本中的连续型的影响变量做离散化处理;E)计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;F)采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;G ...
【技术保护点】
一种大数据精准营销模型的构建方法,其特征在于,包括如下步骤:A)读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;B)按照设定的比例将所述建模数据样本划分为训练样本和测试样本;C)采取众数的方法对所述训练样本和测试样本进行缺失值补全;D)对所述训练样本中的连续型的影响变量做离散化处理;E)计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;F)采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;G)利用所述测试样本对所述大数据精准营销模型进行测试,并输出测试结果,利用AUC值来判断所述大数据精准营销模型的好坏;H)读取目标数据样本文件并输入目标数据样本;所述目标数据样本文件包含影响变量;I)利用统计的方法对所述目标数据样本进行缺失值补全;J)对所述目标数据样本中连续型的影响变量按照所述建模数据样本的规则做离散化替换,替换成离散型数据;K)按照所述替换规则对所述离散型数据做离散化替换;L)计算所述目标数据样本中每一个目标数据的概率值;M) ...
【技术特征摘要】
1.一种大数据精准营销模型的构建方法,其特征在于,包括如下步骤:A)读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;B)按照设定的比例将所述建模数据样本划分为训练样本和测试样本;C)采取众数的方法对所述训练样本和测试样本进行缺失值补全;D)对所述训练样本中的连续型的影响变量做离散化处理;E)计算离散化处理后的每个影响变量中各属性的信息熵,并对缺失值补全后的数据进行替换,并存储替换规则;F)采用二元逻辑回归的方法固定所述建模数据样本文件的最后一列为目标变量,其他为自变量,利用所述训练样本训练所述大数据精准营销模型;G)利用所述测试样本对所述大数据精准营销模型进行测试,并输出测试结果,利用AUC值来判断所述大数据精准营销模型的好坏;H)读取目标数据样本文件并输入目标数据样本;所述目标数据样本文件包含影响变量;I)利用统计的方法对所述目标数据样本进行缺失值补全;J)对所述目标数据样本中连续型的影响变量按照所述建模数据样本的规则做离散化替换,替换成离散型数据;K)按照所述替换规则对所述离散型数据做离散化替换;L)计算所述目标数据样本中每一个目标数据的概率值;M)输出概率列表。2.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,所述步骤A)进一步包括:A1)读取建模数据样本文件,并判断是否找到所述建模数据样本文件,如是,执行步骤A2);否则,退出;A2)校验写入的所述建模数据样本是否具有所述目标变量且所述目标变量为二元变量,如是,执行步骤B);否则,报错后返回步骤A1)。3.根据权利要求1或2所述的大数据精准营销模型的构建方法,其特征在于,所述步骤H)进一步包括:H1)读取所述目标数据样本文件,并判断是否找到所述建模数据样本文件,如是,执行步骤H2);否则,退出;H2)校验所述目标数据样本文件中的字段与所述建模数据样本是否一致,如是,执行步骤I);否则,报错后返回步骤H1)。4.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,所述设定的比例为7:3。5.根据权利要求1所述的大数据精准营销模型的构建方法,其特征在于,当所述AUC值小于0.6时,确定所述大数据精准营销模型的测试结果不好。6.一种实现如权利要求1所述的大数据精准营销模型的构建方法的装置,其特征在于,包括:建模数据样本输入单元:用于读取建模数据样本文件并输入建模数据样本;所述建模数据样本文件包含影响变量和目标变量;样本划分单元:用于按照设定的比例将所述建模数据样本划分为训练样本和测试...
【专利技术属性】
技术研发人员:江颖,黄仕玲,吴国斌,张馨,钟山,
申请(专利权)人:广州帷策智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。