一种基于机器学习的智能选址融合方法技术

技术编号:27501669 阅读:22 留言:0更新日期:2021-03-02 18:26
本发明专利技术涉及人工智能下的机器学习技术领域,具体为一种基于机器学习的智能选址融合方法,该方法的步骤如下:步骤一、数据清洗,数据整合;步骤二、基于特征工程对数据分析处理;步骤三、数据分割训练得到结果;步骤四、基于LR模型对步骤三得到的结果进行训练,并预测得到最终的结果。本发明专利技术提供的基于机器学习的智能选址融合方法通过融合多种算法和模型,可大大提高商家店铺地址选择中的判断准确率。高商家店铺地址选择中的判断准确率。高商家店铺地址选择中的判断准确率。

【技术实现步骤摘要】
一种基于机器学习的智能选址融合方法


[0001]本专利技术涉及人工智能下的机器学习
,具体为一种基于机器学习的智能选址融合方法。

技术介绍

[0002]美团商家越来越多,开店铺的人也越来越多,如何选址开店的地址成为了商家关心的地方,随着科技的发展,智能选址的融合方法被越来越多的应用到店铺地址的智能化选择中,智能选址的融合方法基于机器学习从数据空间中发现规律,从而推测出新地址的开店类型,为商家开端选址做辅助,一般的智能选址的融合方法采用的是单独的模型基础,这种方法对于较佳位置的地址选择判断的准确率较低。鉴于此,我们提出一种基于机器学习的智能选址融合方法。

技术实现思路

[0003]本专利技术的目的在于提供一种基于机器学习的智能选址融合方法,以解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:
[0005]一种基于机器学习的智能选址融合方法,该方法的步骤如下:
[0006]步骤一、数据清洗,数据整合;
[0007]步骤二、基于特征工程对数据分析处理;
[0008]步骤三、数据分割训练得到结果;
[0009]步骤四、基于LR模型对步骤三得到的结果进行训练,并预测得到最终的结果。
[0010]作为本专利技术优选的技术方案,步骤一中的数据清洗包括:数据集成处理、数据类型转换处理、缺失值处理处理、重复值处理处理、异常值处理处理、特征修改处理以及数据抽样处理。
[0011]作为本专利技术优选的技术方案,步骤一中的数据整合的操作为:基于pandas 数据分析包对清洗后的数据进行加载、清理、转换以及重塑,从而实现数据规整化。
[0012]作为本专利技术优选的技术方案,步骤二的具体操作为:对原始数据进行各种特征分析处理,在原有的数据基础上得到大量的人工处理数据,包括统计特征数据、时序特征数据以及排序特征数据;其中,统计特征数据包括各项数据的数量、各项数据的均值、各项数据的方差以及各项数据的极值;时序特征数据包括3天和 8天的人流量、人流均值数及概率;排序特征数据包括人流量前20占比以及前 10餐厅数量占比。
[0013]作为本专利技术优选的技术方案,步骤三的具体操作为:基于xgboost、支持向量机、GBDT、LGB对不同数据分割20次后训练并得到80个结果。
[0014]作为本专利技术优选的技术方案,xgboost技术的实现步骤:
[0015]1)根据数据集初始化一棵树;
[0016]2)确定损失函数;
[0017]回归问题,损失函数是均方误差函数:
[0018]分类问题,常用的是损失函数是对数函数:
[0019][0020]3)拿出一棵树来作为推导“样本上的遍历计算”这个过程,然后通过函数变换得到“叶子节点上的遍历计算”这个过程,之后求解模型0:
[0021][0022][0023]K就是树的棵数,F表示所有可能的CART树,f表示一棵具体的CART树;
[0024]4)根据计算得到的模型复杂度设置复杂度阈值、从而减少计算资源。
[0025]作为本专利技术优选的技术方案,支持向量机技术的实现步骤:
[0026]1)将原问题转化为凸优化问题:
[0027]a、原始问题:
[0028][0029][0030]b、支持向量间隔为1,原问题转化为:
[0031][0032]y
i
((w
·
x
i
)+b)≥1,i=1,...,l;
[0033]2)凸优化问题求解:
[0034]a、构建拉格朗日函数:
[0035][0036]b、根据拉格朗日函数的对偶性,将原问题转换为:
[0037][0038]s.t.α
i
≥0,i=1,2,...,n
[0039][0040]c、利用SMO算法求解a*;
[0041]d、求解W和b:
[0042][0043][0044]e、最终决策函数:
[0045][0046]作为本专利技术优选的技术方案,GBDT技术的实现步骤:
[0047]1)回归问题:
[0048]a、所有样本值都初始化为均值,算出来第一轮残差值;
[0049]b、误差和特征值带进去构建树,划分标准为平方误差减少最多的那个特征值,然后划分到叶子节点,用均值作为这一轮的预测值,然后更新目标值和残差值,加上学习率;
[0050]c、重复第2步,直至满足终止条件,可能是达到最大树的个数,可能是最终的目标值变化幅度不大了;
[0051]d、更新累积目标值作为最终的预测结果;
[0052]2)二分类问题:
[0053]a、二分类问题,损失函数形式是对数形式;
[0054]b、拿残差去拟合一颗CART树,CART树划分的标准是均方损失最小,先用梯度当估计值,然后根据牛顿法,算出来一个叶子节点得分值,然后采用和回归一样的加法原理,继续计算残差继续拟合;
[0055]c、用sigmoid函数计算最后的预测类别;
[0056]3)多分类问题:
[0057]a、一轮拟合k颗树,k等于要分出来的类别,多分类问题用log损失作为损失函数,用MSE作为树的分裂准则;
[0058]b、设置目标函数,直接构建三棵树,构建完以后算出类别;
[0059]c、继续以残差为目标函数拟合树,拟合方案跟回归树一样,然后算函数得分值;
[0060]d、计算三棵树的得分值,用softmax函数计算最后的分类。
[0061]作为本专利技术优选的技术方案,LGB技术的实现步骤:
[0062]1)输入:训练数据,迭代步数d,大梯度数据的采样率a,小梯度数据的采样率b,损失函数和若学习器的类型;
[0063]2)输出:训练好的强学习器:
[0064]a、根据样本点的梯度的绝对值对它们进行降序排序;
[0065]b、对排序后的结果选取前a*100%的样本生成一个大梯度样本点的子集;
[0066]c、对剩下的样本集合(1-a)*100%的样本,随机的选取b*(1-a)*100%个样本点,生成一个小梯度样本点的集合;
[0067]d、将大梯度样本和采样的小梯度样本合并;
[0068]e、将小梯度样本乘上一个权重系数\frac{1-a}{b};
[0069]f、使用上述的采样的样本,学习一个新的弱学习器;
[0070]g、不断地重复a~f步骤直到达到规定的迭代次数或者收敛为止。
[0071]与现有技术相比,本专利技术的有益效果是:
[0072]本专利技术提供的基于机器学习的智能选址融合方法通过融合多种算法和模型,可大大提高商家店铺地址选择中的判断准确率。
附图说明
[0073]图1为本专利技术的主流程图。
具体实施方式
[0074]下面将结合本专利技术实施例对本专利技术实施例中的技术方案进行清楚本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的智能选址融合方法,其特征在于:该方法的步骤如下:步骤一、数据清洗,数据整合;步骤二、基于特征工程对数据分析处理;步骤三、数据分割训练得到结果;步骤四、基于LR模型对步骤三得到的结果进行训练,并预测得到最终的结果。2.根据权利要求1所描述的基于机器学习的智能选址融合方法,其特征在于:步骤一中的数据清洗包括:数据集成处理、数据类型转换处理、缺失值处理处理、重复值处理处理、异常值处理处理、特征修改处理以及数据抽样处理。3.根据权利要求1所描述的基于机器学习的智能选址融合方法,其特征在于:步骤一中的数据整合的操作为:基于pandas数据分析包对清洗后的数据进行加载、清理、转换以及重塑,从而实现数据规整化。4.根据权利要求1所描述的基于机器学习的智能选址融合方法,其特征在于:步骤二的具体操作为:对原始数据进行各种特征分析处理,在原有的数据基础上得到大量的人工处理数据,包括统计特征数据、时序特征数据以及排序特征数据;其中,统计特征数据包括各项数据的数量、各项数据的均值、各项数据的方差以及各项数据的极值;时序特征数据包括3天和8天的人流量、人流均值数及概率;排序特征数据包括人流量前20占比以及前10餐厅数量占比。5.根据权利要求1所描述的基于机器学习的智能选址融合方法,其特征在于:步骤三的具体操作为:基于xgboost、支持向量机、GBDT、LGB对不同数据分割20次后训练并得到80个结果。6.根据权利要求5所描述的基于机器学习的智能选址融合方法,其特征在于:xgboost技术的实现步骤:1)根据数据集初始化一棵树;2)确定损失函数;回归问题,损失函数是均方误差函数:分类问题,常用的是损失函数是对数函数:3)拿出一棵树来作为推导“样本上的遍历计算”这个过程,然后通过函数变换得到“叶子节点上的遍历计算”这个过程,之后求解模型0:之后求解模型0:K就是树的棵数,F表示所有可能的CART树,f表示一棵具体的CART树;4)根据计算得到的模型复杂度设置复杂度阈值、从而减少计算资源。7.根据权利要求5所描述的基于机器学习的智能选址融合方法,其特征在于:支持向量
机技术的实现步骤:1)将原问题转化为凸优化问题:a、原始问题:原始问题:b、支持向量间隔为1,原问题转化为:y
i
((w
·
x
i<...

【专利技术属性】
技术研发人员:李林渡邓方华张衍彬李进彬
申请(专利权)人:深圳市洪堡智慧餐饮科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1