模型分析方法及装置制造方法及图纸

技术编号:17407911 阅读:21 留言:0更新日期:2018-03-07 05:27
本发明专利技术公开了一种模型分析方法及装置,该方法包括:基于预设数量的客户信息样本,训练多种预先确定的模型;将训练的多种模型按照预先确定的组合规则组合成复合模型,并在收到待分析的客户信息后,将该待分析的客户信息输入所述复合模型以输出分析结果。本发明专利技术由于是对多种模型进行组合来利用组合的复合模型进行分析、预测,能结合不同模型的优点,相比于单一模型预测,有效提高了预测结果的精准度。

Model analysis method and device

The invention discloses a model analysis method and device, the method includes: the default client information based on the number of training samples, a variety of predefined model; multiple model training according to predefined combination rules are combined into a composite model, and the receipt of the customer information, customer information input to the analysis the composite model with output analysis. The invention is combined with various models to analyze and predict by combining composite models. It can combine the advantages of different models, and effectively improve the accuracy of prediction results compared with single model prediction.

【技术实现步骤摘要】
模型分析方法及装置
本专利技术涉及计算机
,尤其涉及一种模型分析方法及装置。
技术介绍
目前,在金融、保险等领域的数据挖掘预测项目中,业界通常采用单一模型来进行特定目标事件(例如,保险理赔事件)的预测,而众所周知,不同类型的模型对于目标事件的解释角度和侧重点会有所不同,因此,采用单一模型带来的预测结果的精准度有很大的局限性,预测错误率较高。
技术实现思路
本专利技术的主要目的在于提供一种模型分析方法及装置,旨在提高预测结果的精准度。为实现上述目的,本专利技术提供的一种模型分析方法,所述方法包括以下步骤:A、基于预设数量的客户信息样本,训练多种预先确定的模型;B、将训练的多种模型按照预先确定的组合规则组合成复合模型,并在收到待分析的客户信息后,将该待分析的客户信息输入所述复合模型以输出分析结果。优选地,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=(1/N)*F1+(1/N)*F2+……+(1/N)*FN。优选地,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=POWER(F1,1/N)*POWER(F2,1/N)*……*POWER(FN,1/N),其中,POWER(Fi,1/N)是对Fi模型分析出的结果求N次方根。优选地,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=N/(1/F1+1/F2+……+1/FN)。优选地,所述基于预设数量的客户信息样本,训练多种预先确定的模型的步骤包括:C、在训练一种预先确定的模型过程中,每训练一次后,将各个客户信息样本分别输入当前训练的模型中以确定出模型分析错误的客户信息样本;D、计算出模型分析错误的客户信息样本数量占所有客户信息样本数量的比例是否小于预设阈值;E、若模型分析错误的客户信息样本数量占所有客户信息样本数量的比例小于预设阈值,则该预先确定的模型训练结束;F、若模型分析错误的客户信息样本数量占所有客户信息样本数量的比例大于或者等于预设阈值,则按照预设的比例增加幅度在总客户信息样本中增加与模型分析错误的客户信息样本属于同一类型的客户信息样本的比重,并按照预设的比例减少幅度在总客户信息样本中减少模型分析正确的客户信息样本的比重,并重新执行上述步骤C、D、E、F。此外,为实现上述目的,本专利技术还提供一种模型分析装置,所述装置包括:训练模块,用于基于预设数量的客户信息样本,训练多种预先确定的模型;组合模块,用于将训练的多种模型按照预先确定的组合规则组合成复合模型,并在收到待分析的客户信息后,将该待分析的客户信息输入所述复合模型以输出分析结果。优选地,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=(1/N)*F1+(1/N)*F2+……+(1/N)*FN。优选地,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=POWER(F1,1/N)*POWER(F2,1/N)*……*POWER(FN,1/N),其中,POWER(Fi,1/N)是对Fi模型分析出的结果求N次方根。优选地,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=N/(1/F1+1/F2+……+1/FN)。优选地,所述训练模块包括:确定单元,用于在训练一种预先确定的模型过程中,每训练一次后,将各个客户信息样本分别输入当前训练的模型中以确定出模型分析错误的客户信息样本;计算单元,用于计算出模型分析错误的客户信息样本数量占所有客户信息样本数量的比例是否小于预设阈值;结束单元,用于若模型分析错误的客户信息样本数量占所有客户信息样本数量的比例小于预设阈值,则结束该预先确定的模型训练;调整单元,用于若模型分析错误的客户信息样本数量占所有客户信息样本数量的比例大于或者等于预设阈值,则按照预设的比例增加幅度在总客户信息样本中增加与模型分析错误的客户信息样本属于同一类型的客户信息样本的比重,并按照预设的比例减少幅度在总客户信息样本中减少模型分析正确的客户信息样本的比重,并返回调用所述确定单元、计算单元、结束单元。本专利技术提出的模型分析方法及装置,通过预设数量的客户信息样本训练出多种预先确定的模型,并将训练的多种模型组合成复合模型,在收到待分析的客户信息后,利用组合的复合模型对该待分析的客户信息进行分析。由于是对多种模型进行组合来利用组合的复合模型进行分析、预测,能结合不同模型的优点,相比于单一模型预测,有效提高了预测结果的精准度。附图说明图1为本专利技术模型分析方法一实施例的流程示意图;图2为图1中步骤S10的细化流程示意图;图3为本专利技术模型分析装置一实施例的功能模块示意图;图4为图3中训练模块01的细化功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种模型分析方法。参照图1,图1为本专利技术模型分析方法一实施例的流程示意图。在一实施例中,该模型分析方法包括:步骤S10,基于预设数量的客户信息样本,训练多种预先确定的模型;本实施例中,基于预设数量(例如,10万)的客户信息样本,训练多种预先确定的模型。例如,所述客户信息样本中的客户信息包括但不限于性别、年龄、联系方式、家庭住址、工作单位、征信记录、持有的保险产品信息、投保行为习惯、历史理赔信息等等,持有的保险产品信息包括但不限于保障型保险产品、收益型保险产品、短期型保险产品、终身型保险产品等等,投保行为习惯为一个客户在一段时间(如最近1年或3年)内持有的保险产品中持有时间最长的产品,或持有占比最大的产品,则代表该客户的投保行为习惯是该产品。例如,若一个客户持有的保险产品中超过预设比例(例如,60%)的产品是保障型产品,则代表该客户的投保行为习惯是偏好保障型保险产品。预先确定需进行训练的模型包括但不限于决策树(DecisionTree)模型、线性回归模型、逻辑回归(Logisticregression)模型、神经网络(NeuralNetworks,NN)模型等。其中,决策树模型是一种简单但是广泛使用的分类器,通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策树模型可读性好,具有描述性,有助于人工分析;且效率高。线性回归模型可以为一元线性回归或本文档来自技高网...
模型分析方法及装置

【技术保护点】
一种模型分析方法,其特征在于,所述方法包括以下步骤:A、基于预设数量的客户信息样本,训练多种预先确定的模型;B、将训练的多种模型按照预先确定的组合规则组合成复合模型,并在收到待分析的客户信息后,将该待分析的客户信息输入所述复合模型以输出分析结果。

【技术特征摘要】
1.一种模型分析方法,其特征在于,所述方法包括以下步骤:A、基于预设数量的客户信息样本,训练多种预先确定的模型;B、将训练的多种模型按照预先确定的组合规则组合成复合模型,并在收到待分析的客户信息后,将该待分析的客户信息输入所述复合模型以输出分析结果。2.如权利要求1所述的模型分析方法,其特征在于,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=(1/N)*F1+(1/N)*F2+……+(1/N)*FN。3.如权利要求1所述的模型分析方法,其特征在于,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=POWER(F1,1/N)*POWER(F2,1/N)*……*POWER(FN,1/N),其中,POWER(Fi,1/N)是对Fi模型分析出的结果求N次方根。4.如权利要求1所述的模型分析方法,其特征在于,所述预先确定的模型的数量为N,N为大于2的自然数,第i个预先确定的模型记为Fi,i为小于或者等于N的正整数,所述将训练的多种模型按照预先确定的组合规则组合成复合模型为:所述复合模型=N/(1/F1+1/F2+……+1/FN)。5.如权利要求1至4中任意一项所述的模型分析方法,其特征在于,所述基于预设数量的客户信息样本,训练多种预先确定的模型的步骤包括:C、在训练一种预先确定的模型过程中,每训练一次后,将各个客户信息样本分别输入当前训练的模型中以确定出模型分析错误的客户信息样本;D、计算出模型分析错误的客户信息样本数量占所有客户信息样本数量的比例是否小于预设阈值;E、若模型分析错误的客户信息样本数量占所有客户信息样本数量的比例小于预设阈值,则该预先确定的模型训练结束;F、若模型分析错误的客户信息样本数量占所有客户信息样本数量的比例大于或者等于预设阈值,则按照预设的比例增加幅度在总客户信息样本中增加与模型分析错误的客户信息样本属于同一类型的客户信息样本的比重,并按照预设的比例减少幅度在总客户信息样本中减少模型分析正确的客户信息样本的比重,并重新执行上述步骤C、D、E、F。6.一种...

【专利技术属性】
技术研发人员:陈依云
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1