信息推送模型训练方法以及装置、信息推送方法以及装置制造方法及图纸

技术编号：28420429 阅读：20 留言：0更新日期：2021-05-11 18:27

本发明专利技术涉及预测模型技术领域，揭露了一种信息推送模型训练、信息推送方法、装置、设备及介质。该方法通过将样本信息宽表输入至初始预测模型，确定与各样本分群对应的分群预测分值；运用注意力机制技术，根据样本分群分值以及分群预测分值，调整样本权重；根据调整后的样本权重、分群标签分值以及分群预测分值，确定各样本分群预测损失值；将各样本分群对应的预测损失值输入至总损失函数中，确定初始预测模型的总损失值；在总损失值未达到预设的收敛条件时，更新迭代初始预测模型的初始参数，直至总损失值达到预设的收敛条件时，将收敛之后的初始预测模型记录为信息推送模型。本发明专利技术提高了初始预测模型预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
信息推送模型训练方法以及装置、信息推送方法以及装置
本专利技术涉及预测模型
，尤其涉及一种信息推送模型训练、信息推送方法、装置、计算机设备及存储介质。
技术介绍
随着科学技术的发展，越来越多的应用程序会给各个用户推送各类信息，例如新产品信息、新福利活动信息等推荐信息，进而使得用户可以快速触及新产品或者新活动的内容。目前，针对于用户进行信息推送或者产品推送，均是通过采集与用户信息，进而通过预测模型根据用户信息进行预测，以向用户推送与用户信息相关的信息或者产品。但是该方法存在以下不足：预测模型在预测到与用户信息相关的信息之后，为了提高信息推送效率，会选择将所有信息都推送至用户中，则会存在不能够针对性推送的现象，导致用户根本不会查收那些不感兴趣的信息，进而导致模型预测准确率较低。
技术实现思路
本专利技术实施例提供一种信息推送模型训练、信息推送方法、装置、计算机设备及存储介质，以解决信息推送准确率低的问题。一种信息推送模型训练方法，包括：获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；根据...

【技术保护点】
1.一种信息推送模型训练方法，其特征在于，包括：/n获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；/n将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；/n运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；/n根据与同一样本分群对应的调整后的样本权重、样本分群分值以及分群预测分值，确定与该样本分群的预测损失值；/n将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值；/n在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。/n

【技术特征摘要】
1.一种信息推送模型训练方法，其特征在于，包括：
获取样本信息宽表集；所述样本信息宽表集包含至少一个样本信息宽表；所述样本信息宽表关联至少一个样本分群；一个所述样本分群均关联一个样本分群分值以及一个样本权重；
将所述样本信息宽表输入至包含初始参数的初始预测模型，以根据所述样本信息宽表对各所述样本分群进行意愿预测，确定与各所述样本分群对应的分群预测分值；
运用注意力机制技术，根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值，调整与该样本分群关联的样本权重；
根据与同一样本分群对应的调整后的样本权重、样本分群分值以及分群预测分值，确定与该样本分群的预测损失值；
将各所述样本分群对应的预测损失值输入至总损失函数中，以确定所述初始预测模型的总损失值；
在所述总损失值未达到预设的收敛条件时，更新迭代所述初始预测模型的初始参数，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述初始预测模型记录为信息推送模型。

2.如权利要求1所述的信息推送模型训练方法，其特征在于，所述获取样本信息宽表集之前，包括：
获取多个样本用户的历史动作信息，并确定所述历史动作信息的信息数量；
根据所述信息数量，将各所述样本用户分为历史用户分群以及萌新用户分群；
在第一监测周期中，获取所述历史用户分群中各历史样本用户的第一监测信息；同时，在第二监测周期中，获取所述萌新用户分群中各萌新样本用户的第二监测信息；
执行hivesql脚本对所述第一监测信息以及所述第二监测信息进行信息校验，得到与所述第一监测信息对应的历史特征信息，以及与所述第二监测信息对应的萌新特征信息；
对所述历史特征信息进行预处理，得到与所述历史样本用户对应的历史样本信息宽表；同时，对所述萌新特征信息进行预处理，得到与所述萌新样本用户对应的萌新样本信息宽表。

3.如权利要求2所述的信息推送模型训练方法，其特征在于，所述历史特征信息关联一个历史特征标签；所述对所述历史特征信息进行预处理，得到与所述历史样本用户对应的历史样本信息宽表，包括：
对所述历史特征信息进行冗余特征检测，在所述历史特征信息中包括冗余特征时，剔除包含所述冗余特征的历史特征信息，并将剔除后的历史特征信息记录为剔除特征信息；
对同一历史特征标签的剔除特征信息进行热力图展示，确定各所述剔除特征信息之间的特征重合率；
在所述特征重合率大于或等于预设重合阈值时，确定各所述剔除特征信息与所述历史特征标签之间的特征相关值；
剔除除特征相关值最大的剔除特征信息之外的其它剔除特征信息之后，得到所述历史样本信息宽表。

4.如权利要求1所述的信息推送模型训练方法，其特征在于，所述获取样本信息宽表集之前，还包括：
在用户属性库中爬取与所述样本信息宽表对应的样本用户存在关联的关系人，并将各所述关系人插入关系层级确定序列中；
将与所述样本用户具有直接关系的关系人记录为第一关系层级，并将与所述第一关系层级的关系人存在直接关系的关系人记录为第二关系层级；
在所述关系层级确定序列中的所有所述关系人的关系层级均确定完毕之后，确定与所述样本用户的人际关系图谱构建完成；
自所述人际关系图谱中，对各个关系层级的关系人进行人群聚类，确定与所述样本用户关联的样本分群。

5.如权利要求4所述的信息推送模型...

【专利技术属性】
技术研发人员：张景莲，
申请(专利权)人：平安健康保险股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人