一种基于边际零截断泊松模型的建模分析及预测方法技术

技术编号：34368629 阅读：55 留言：0更新日期：2022-07-31 10:02

一种基于边际零截断泊松模型的建模分析及预测方法，包括对零截断泊松分布的总体均值建模而非对标准泊松参数建模，构建参数估计的基于随机表示的EM

A modeling analysis and prediction method based on marginal zero Truncated Poisson model

全部详细技术资料下载

【技术实现步骤摘要】
一种基于边际零截断泊松模型的建模分析及预测方法

[0001]本专利技术涉及金融保险中的计数型数据分析领域，特别是涉及一种带有零截断特征的计数数据的建模和预测分析方法。

技术介绍

[0002]零截断型计数数据一般特指观测数据为1、2、3、4......这样大于0的正整数型数据，此类数据广泛出现于金融保险、交通安全以及医疗健康等领域。例如，无论是财产保险还是人身保险，投保人在一个保障年度内所购买的保单数量至少为1份，具有典型的零截断型计数特征。对于保险公司而言，无论是财产保险还是人身保险，如何挖掘出那些影响投保人购买保单数量的潜在因素并进行精准预测是有效增加投保人保险标的数量、提高企业经营效益的关键问题之一。为了实现这一目标，我们需要构建恰当的统计模型来准确衡量零截断观测频数与候选影响因子之间的联系；同时，发展有效的预测方法来提升模型的预测性能、降低预测误差。
[0003]零截断泊松模型是研究零截断型计数数据的主流方法之一。然而，目前有关零截断泊松模型的研究主要基于标准泊松参数来建立对数回归模型而非关于零截断情形下的总体均值来建模，使得感兴趣的影响因子对总体均值的影响无法被直接衡量，从而可能产生较大误差甚至引起令人误导的结果。此外，有关零截断泊松模型下如何提升模型的预测性能缺乏系统的研究，通常的做法只是基于所选择的模型来简单展示预测效果。然而，模型选择本身具有不稳定性，没有证据表明对于样本数据拟合最优的模型其预测误差也一定是最小的。因而，通过模型选择方法挑选出来的模型进行预测存在一定风险。

技术实现思路
<

【技术保护点】

【技术特征摘要】
1.一种基于边际零截断泊松模型的建模分析及预测方法，其特征在于，该方法应用于金融保险中的计数型数据分析，所述方法包括：从零截断泊松分布的总体均值μ出发构建边际零截断泊松模型代替对标准泊松参数建模，建立零截断观测频数与感兴趣的潜在影响因子之间的直接联系；根据所述边际零截断泊松模型，构建参数估计的有效算法；根据所述边际零截断泊松模型，构建模型平均预测理论框架，建立候选模型最优权重筛选准则，以实现对零截断计数特征的总体情况进行预测以指导相关决策和方案的制定。2.根据权利要求1所述的方法，其特征在于，建立边际零截断泊松模型的方法，包括：对零截断泊松分布的总体均值μ建立对数回归模型；发展参数极大似然估计的基于随机表示的EM
‑
FS算法；通过对log(μ
‑
1)建立回归模型以消除对回归系数向量β施加的未知特定约束，以保证μ＞1成立；通过Taylor展式对零截断泊松分布的总体均值μ与标准泊松参数λ之间的非线性超越关系进行线性近似，降低计算复杂度。3.根据权利要求1所述的方法，其特征在于，建立基于所述边际零截断泊松模型的模型平均预测方法的步骤，包括：明确所有潜在影响因子，通过组合确定所有候选模型；建立所述边际零截断泊松模型的候选模型最优权重筛选的Kullback
‑
Leibler近似无偏准则；基于Kullback
‑
Leibler偏差定义预测损失评价指标，利用扰动技术确定Kullback
‑
Leibler偏差的期望的近似无偏估计作为优化目标函数；利用Kullback
‑
Leibler近似无偏准则确定的最优权重组合计算零截断计数数据的模型平均预测。4.根据权利要求2所述的方法，其特征在于，还包括：步骤S101，确定研究对象及感兴趣的潜在影响因子，构建边际零截断泊松模型，具体如下：令W
j
为来自于零截断泊松分布ZTP(λ
j
)的随机变量，j＝1，...，n，且W1，...，W
n
相互独立；则W
j
的总体均值为μ
j
为λ
j
的非线性超越函数；下述回归模型其中，v
j
＝(1，V
1j
，...，V
pj
)
T
为潜在影响因子向量，β＝(β0，β1，...，β
p
)
T
为系数向量。5.根据权利要求4所述的方法，其特征在于，还包括：步骤S102，由于(1)式定义的函数h(λ
j
)可导并可逆，利用Taylor展式得到μ
j
与λ
j
的一阶线性近似如下所示：其中，λ
0j
为λ
j
邻域内的一个近似点。
6.根据权利要求5所述的方法，其特征在于，还包括：步骤S103，基于随机表示引入隐变量U1，...，U
n
来将零截断泊松计数数据补充完整为标准泊松计数数据，从而得到完全观测数据似然函数；其中，X
j
～Poisson(λ
j
)，且U
j
和W
j
相互独立；由此可得隐变量在给定观测数据下的条件预测期望为：由完全观测数据似然函数出发可构建β极大似然估计求解的基于随机表示的EM
‑
FS算法如下：M步：基于完全观测似然函数由Fisher
‑
Scoring算...

【专利技术属性】
技术研发人员：刘寅，李文慧，张新雨，
申请(专利权)人：中南财经政法大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人