【技术实现步骤摘要】
基于随机森林的灵活就业人员公积金缴存方式推荐方法
[0001]本专利技术涉及推荐领域,尤其涉及一种基于随机森林的灵活就业人员公积金缴存方式推荐方法。
技术介绍
[0002]近年来,随着互联网行业的快速发展,大数据、云计算和人工智能等新一代信息技术广泛应用于不同的行业和领域,信息量呈现爆发式增长,而公积金中心的业务量也逐渐增多,公积金缴存人个人信息与不同服务渠道的信息交互,产生了多源异构、规模海量的大数据。公积金中心也不断推出与灵活就业人员缴存公积金相关的政策,旨在为灵活就业人员提供便利,提升服务质量,且在当今的移动互联网时代,更加关注结合人工智能技术的服务应用;因此,为了提前获取灵活就业人员需求,主动提供有针对性的服务,需对真实数据进行充分的分析与挖掘,从而为后续的政策推广提供支持。
[0003]目前,公积金缴存方式一共有三种,分别是“按月定额缴存”、“一次性缴存”以及“自由缴存”。然而,如何向灵活就业人员推荐适合他们的公积金缴存方式仍然是一个难题,该技术旨在运用大数据、人工智能等技术,结合行业相关的海量数据资源,分析用户群体的偏好,将用户与其感兴趣的信息进行连接,帮助用户快速准确地获取感兴趣的信息,实现个性化精准推荐。
[0004]重庆公积金中心顺应时代发展,为进一步提升精准化服务管理水平,利用个性化推荐系统技术,构建公积金缴存方式模型,以便更好地帮助广大缴存人解决和改善住房问题,获得更精准更高效更智能更温馨的公积金服务体验。
[0005]当前没有对灵活就业人员的公积金缴存方式的推荐方法,所
【技术保护点】
【技术特征摘要】
1.一种基于随机森林的灵活就业人员公积金缴存方式推荐方法,其特征在于:包括如下步骤:S100:选用历史公开数据集,数据集包括灵活就业人员信息user和公积金缴存方式信息payment;user包括自变量特征,payment包括因变量特征;S200:采用随机森林模型作为预测模型Mp并进行模型参数初始化,对预测模型Mp进行训练,具体步骤如下:S300:对公开数据集中所有数据进行数据平衡性处理得到数据集Vtrain;S310:从数据集Vtrain中进行T次随机采样,得到T个采样集,选择第t个采样集Dt中的一部分数据作为训练集Dt_train,另一部分作为验证集Dt_valid,其中t∈(1,...,T);S320:从Dt_train中随机选择I个自变量特征组成特征集C,特征集C中的第j个特征包括s个子特征,其中,每个子特征对应一种缴存方式y
m
,j=1,2,
…
,J,J表示C中特征的数量;S321:利用熵值公式计算C的总熵,具体计算表达式如下:其中,|C
i
|表示Dt_train上第i种缴存方式的特征总数,其中,m表示第i种缴存方式的数量;S322:计算C中第j个特征的条件熵H(Dt
‑
train
j
),具体计算表达式如下:其中,n代表特征C
j
中包含的特征值的总数,k=1,...,n,|Dt_traint
j
|代表C
j
中包含的缴存人总数,|Dt_traint
jk
|代表C
j
中值等于k时的缴存人总数,H(Dt_traint
jk
)是代入熵值公式中计算出的C
j
中值等于k时的熵值;S330:利用总熵和条件熵计算第j个特征的信息增益G(j),具体表达式如下:G(j)=H(Dt_train)
‑
H(Dt_train
j
);(3)S340:j遍历所有取值,计算出C中J个特征的信息增益,然后将求得的所有信息增益降序排列,选择信息增益最大值对应的特征作为根节点;将增益最大值对应的特征所包含的p个子特征作为所述该根节点的p个分支节点;将增益最大值对应的特征中的每个子特征所对应的缴存方式作为对应分支节点下的叶节点;S400:由根节点、分支节点和叶节点构成采样集Dt的决策树Mt,将验证集Dt_v...
【专利技术属性】
技术研发人员:刘娟,陈雪,宋阳,杨世利,宋鹏,熊炜,裴劼,洪晓霞,王仁菊,杨颖,李佳,江欣祝,鄢萌,
申请(专利权)人:陈雪宋阳杨世利宋鹏,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。