一种基于多源数据驱动的银行网点选址推荐方法技术

技术编号:20918949 阅读:99 留言:0更新日期:2019-04-20 10:12
本发明专利技术涉及数据挖掘与大数据应用领域,特别是涉及一种基于多源数据驱动的银行网点选址推荐方法,该方法包含如下步骤:获取移动信令数据和银行网点周边数据,其包括本地公交数据,网络爬取数据;根据获取的数据对目标银行网点提取人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入五个特征;利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;使用已构建的银行网点选址推荐模型,根据目标区域的特征,推荐该区域最佳银行网点选址分布,以实现银行网点智能化选址的目的,解决传统选址带来的选址范围不精准、人力成本高的问题,并得到更好经济效益和社会效益。

A Node Location Recommendation Method Based on Multi-source Data Driven

The invention relates to data mining and large data application fields, in particular to a multi-source data-driven recommendation method for bank network location. The method includes the following steps: acquiring mobile signaling data and bank network peripheral data, including local bus data, network crawling data; extracting human flow, user value and traffic from the acquired data to the target bank network. Five features are traffic congestion index, number of competition networks and per capita income; using the constructed features, training multiple location classification models, and building a probability-based multi-model fusion recommendation model for banking network location; using the constructed recommendation model for banking network location, recommending the best distribution of banking network location in the region according to the characteristics of the target region, in order to achieve banking network location. The purpose of intelligent site selection is to solve the problems of inaccurate location range and high human cost brought by traditional site selection, and to achieve better economic and social benefits.

【技术实现步骤摘要】
一种基于多源数据驱动的银行网点选址推荐方法
本专利技术涉及数据挖掘与大数据领域,具体涉及一种基于多源数据驱动的银行网点选址推荐方法。
技术介绍
随着社会经济发展,各大商业银行对业务的需求,用户的积累日益增加,银行网点的选址直接关系到银行的发展及利益。因此,银行网点的选址对于银行的发展及未来规划具有重要的意义。传统的银行选址方法主要是包括人工调研法、专家打分法、询问专业的咨询公司等。这些方法首先是通过人力大范围的收集数据,包括地点范围内的人流量、银行竞争网点数、交通流量等,最后结合这些数据,通过数据可视化的方式展示结果,再由专家根据这些结果分析进而选择出最佳地址。但这些方法通常具有个人的偏向性,且结果不一定准确,由于不能实现自动化,因此效率低下,工作量较大,不仅导致人力经济支出负担较大,且决策时间也大大加长,无法满足现代社会高效、精确的需求。
技术实现思路
为解决上述问题的不足,本专利技术通过移动信令大数据及银行网点周边数据,其包括本地公交数据,网络爬取数据,提供一种基于多源数据驱动的银行网点选址推荐方法,能够有效解决传统方法时间长,调研成本高的问题,实现自动化银行选址的目的,且快速、精确、有效。为实现上述目的,本专利技术所述的基于多源数据驱动的银行网点选址推荐方法,包括如下步骤:步骤一、获取移动信令数据和银行网点周边数据;步骤二、根据获取的数据对目标银行网点构造至少包括人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入中任意两个或以上的特征;步骤三、利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;步骤四、使用已构建的银行网点选址推荐模型,根据目标区域的特征,推荐该区域最佳银行网点选址分布。进一步的,步骤一所述的移动信令数据包括但不限于银行网点基站数据、移动用户轨迹数据、移动用户工作地居住地数据、移动用户上网信息数据、移动用户所属银行数据。步骤一所述的银行网点周边数据包括但不限于本地公交数据、网络数据、周边房价数据。进一步的,步骤二包括:选取已有银行,以半径为r划定圆形区域,通过移动信令数据,银行网点周边数据,构造特征。其包括人流量特征、交通拥堵指数特征、周边竞争网点数特征和人均收入特征。针对移动信令数据,据统计该范围内移动用户数,通过去重处理,统计记录条数,作为人流量特征;根据移动用户上网信息数据以及移动用户所属银行数据,支付行为信息综合考量,构造用户价值特征。针对银行网点周边数据,通过本地公交数据,地图软件的应用程序编程接口数据,优选的,本专利技术选取百度地图API数据,基于路段速度计算交通拥堵状况指数特征;通过百度地图API,查询选址范围银行网点数作为周边竞争网点数特征;通过爬虫技术获取周边小区房价信息,通过该城市房价收入比ε,计算对应人均收入特征;则该范围内人均收入X计算公式为:其中,Xi表示第i个小区的房价;n为该选址范围内的小区数。进一步的,用户价值的计算方法包括:建立出以上层为用户价值,下层为影响价值的三个指标的阶梯层次结构;计算下层的三个指标对用户评分的影响权重,构建对比矩阵,即对各指标的影响权重进行两两比较,得到对比矩阵A,并计算出其最大特征值λmax与其特征向量a=(a1,a2,a3)T;在具有满意的一致性检验要求下,求得用户价值val为:val=a1·b1+a2·b2+a3·b3;b1表示为移动用户使用银行金融app使用次数;b2表示为移动用户在银行的支付信息;b3表示移动用户是否属于待选址银行网点的客户;其中三个指标依次为移动用户使用银行网点金融app的次数指标,移动用户在银行的支付信息指标,移动用户是否属于待选址银行网点的客户指标;即b1表示金融app使用次数,b2表示银行支付信息(银行直接支付次数,如用某银行app直接付款,不限定于某银行,可为任意一家银行),b3表示是否属于该银行(该银行即表示模型要预测建立的银行,即判断用户是否是属于该银行的用户),其中b1,b2为归一化后的值,b3为01值,即b3的值为0或1。而a1,a2,a3则表示利用层次分析法所计算出来的三个指标的权重,a1,a2,a3的值也就是本专利技术中所述的特征向量。进一步的,步骤三包括:利用所有特征数据,构建多个选址分类模型,优选的,本专利技术选择构建三个选址分类模型,其中,构建出的第一个选址分类模型,即采用支持向量机模型,其目标函数表示为:经转换后,目标函数为:s.t.yi(ωT·xi+b)≥1,i=1,...,n(3)式(1)~式(3)中,ω为特征参数,yi表示为步骤二中第i条训练集所对应的真实标签值;其取值为1或-1。xi为对应特征数据,n表示特征样本点总数。进一步的,第一层中基于逻辑回归构建第二个选址模型,其预测函数表示为:z=θT·x+b(5)通过极大似然方法,对应的目标函数为:式(5)~式(6)中,通过梯度下降方法求得对应解,Hθ(x)为基于逻辑回归的选址决策模型,Hθ(xi)表示为步骤二中第i条训练集数据所得结果;θ、b为拟合该公式的参数;yi表示为步骤二中第i条训练集所对应的真实标签值;然后通过梯度下降方法,求得对应解。进一步的,基于梯度提升树(GradientBoostingDecisionTree,简称GBDT)构建第三个选址模型,其损失函数为:L(y,f(x))=log(1+exp(-yf(x))(7)其中,式(7)中,y为对应标签值,其中y∈{-1,1},f(x)为前一轮迭代的强学习器,x为对应特征。可以理解的是,在本专利技术的基于多源数据驱动的银行网点选址推荐方法中,选址分类模型可以选择不同损失函数或者不同目标函数的模型,都应该属于本专利技术的保护范围,本领域技术人员可以根据实际情况选择合适的模型,本专利技术就不再枚举。进一步的,步骤三包括:根据上述步骤,通过选取不同的特征集,不同的模型方法,构建多个不同的模型,利用多个不同模型的差异性,构建出泛化性更好的决策选址模型,具体实现方式为:1.选取m个不同的模型作为第一层分类器;由于本专利技术中选取了三个选址模型,因此,此处,m=3。2.对第一层分类器的基础模型进行5折交叉验证,即将训练集分成5等分,选取其中1等分以及测试集作为预测集,另外4等分作为训练集,则一共需要进行5次预测,最后可以得出训练集所有记录的预测概率,以及5次测试集预测的概率;3.将训练集预测概率以及5次测试集预测的概率的平均值作为特征,一共有m个不同模型,即有m列特征,基于逻辑回归构建第二层分类器,对测试集进行预测;所述第二层分类器的损失函数设计如下:其中,式(8)和式(9)中,l(θ)表示为第二层分类器的损失函数;hθ(X)为第二层中基于逻辑回归的选址决策模型,hθ(xi)为第一概率特征中第i条训练集数据所得结果,xi为第一概率特征中第i条训练集所对应特征数据;yi为第一概率特征中第i条训练集所对应的真实标签值,p为其真实标签对应输出概率。可以理解的是,本专利技术中第二层分类器只有一个,即逻辑回归,其特征为第一层的多个分类器输出的概率,即第一概率特征,如第一层有m个分类器,则会输出m个概率,以此作为第二层的m个第一概率特征。hθ(x)即第二层中基于逻辑回归的分类模型,hθ(xi)中的xi表示第i条训练数据,即第i个第一概率特征,并将其输入到hθ(x)这个模本文档来自技高网...

【技术保护点】
1.基于多源数据驱动的银行网点选址推荐方法,其特征在于,包括以下步骤:步骤一、获取包括银行网点基站数据、移动用户轨迹数据、移动用户工作地居住地数据、移动用户上网信息数据以及移动用户所属银行数据的移动信令数据,以及获取包括本地公交数据、网络数据、地图数据以及周边房价数据的银行网点周边数据;步骤二、根据获取的数据对目标银行网点构造包括人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入特征;人流量特征:确定选址范围内基站信息,利用移动信令数据统计该范围内移动用户数,通过去重处理,统计记录条数,作为人流量特征;用户价值特征:根据移动用户上网信息数据以及移动用户所属银行数据构造用户价值特征;交通拥堵指数特征:结合本地公交数据和地图软件的应用程序编程接口数据,基于路段速度计算交通拥堵状况指数;周边竞争网点数特征:通过地图软件的应用程序编程接口,查询选址范围内的银行网点数,并作为周边竞争网点数;人均收入特征:确定选址范围,利用爬虫技术从网络爬取选址范围内的周边小区房价及其房价收入比ε,则该范围内人均收入X计算公式为:

【技术特征摘要】
1.基于多源数据驱动的银行网点选址推荐方法,其特征在于,包括以下步骤:步骤一、获取包括银行网点基站数据、移动用户轨迹数据、移动用户工作地居住地数据、移动用户上网信息数据以及移动用户所属银行数据的移动信令数据,以及获取包括本地公交数据、网络数据、地图数据以及周边房价数据的银行网点周边数据;步骤二、根据获取的数据对目标银行网点构造包括人流量、用户价值、交通拥堵指数、周边竞争网点数和人均收入特征;人流量特征:确定选址范围内基站信息,利用移动信令数据统计该范围内移动用户数,通过去重处理,统计记录条数,作为人流量特征;用户价值特征:根据移动用户上网信息数据以及移动用户所属银行数据构造用户价值特征;交通拥堵指数特征:结合本地公交数据和地图软件的应用程序编程接口数据,基于路段速度计算交通拥堵状况指数;周边竞争网点数特征:通过地图软件的应用程序编程接口,查询选址范围内的银行网点数,并作为周边竞争网点数;人均收入特征:确定选址范围,利用爬虫技术从网络爬取选址范围内的周边小区房价及其房价收入比ε,则该范围内人均收入X计算公式为:Xi表示第i个小区的房价;n为该选址范围内的小区数;步骤三、利用构造的特征,训练多个选址分类模型,并构建基于概率的多模型融合的银行网点选址推荐模型;步骤四、使用已构建的银行网点选址推荐模型,根据目标区域的特征,推荐该区域最佳银行网点选址分布。2.根据权利要求1所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,用户价值的计算方法包括:建立出以上层为用户价值,下层为影响价值的三个指标的阶梯层次结构;计算下层的三个指标对用户评分的影响权重,构建对比矩阵,即对各指标的影响权重进行两两比较,得到对比矩阵A,并计算出其最大特征值λmax与其特征向量a=(a1,a2,a3)T;在具有满意的一致性检验要求下,求得用户价值val为:val=a1·b1+a2·b2+a3·b3;b1表示移动用户使用银行金融app的次数,b2表示移动用户在银行的支付信息,b3表示移动用户是否属于待选址银行网点的客户,其中b1、b2为归一化后的值,b3为01值,即b3等于0或1;三个指标依次为移动用户使用银行金融app的次数指标,移动用户在该银行的支付信息指标,移动用户是否属于该银行的客户指标。3.根据权利要求1所述的基于多源数据驱动的银行网点选址推荐方法,其特征在于,所述的交通拥堵状况指数计算方...

【专利技术属性】
技术研发人员:冯辉宗邓轲范兴容许国良雒江涛
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1