信息推送模型训练方法以及装置、信息推送方法以及装置制造方法及图纸

技术编号:28420429 阅读:20 留言:0更新日期:2021-05-11 18:27
本发明专利技术涉及预测模型技术领域,揭露了一种信息推送模型训练、信息推送方法、装置、设备及介质。该方法通过将样本信息宽表输入至初始预测模型,确定与各样本分群对应的分群预测分值;运用注意力机制技术,根据样本分群分值以及分群预测分值,调整样本权重;根据调整后的样本权重、分群标签分值以及分群预测分值,确定各样本分群预测损失值;将各样本分群对应的预测损失值输入至总损失函数中,确定初始预测模型的总损失值;在总损失值未达到预设的收敛条件时,更新迭代初始预测模型的初始参数,直至总损失值达到预设的收敛条件时,将收敛之后的初始预测模型记录为信息推送模型。本发明专利技术提高了初始预测模型预测的准确性。

【技术实现步骤摘要】
信息推送模型训练方法以及装置、信息推送方法以及装置
本专利技术涉及预测模型
,尤其涉及一种信息推送模型训练、信息推送方法、装置、计算机设备及存储介质。
技术介绍
随着科学技术的发展,越来越多的应用程序会给各个用户推送各类信息,例如新产品信息、新福利活动信息等推荐信息,进而使得用户可以快速触及新产品或者新活动的内容。目前,针对于用户进行信息推送或者产品推送,均是通过采集与用户信息,进而通过预测模型根据用户信息进行预测,以向用户推送与用户信息相关的信息或者产品。但是该方法存在以下不足:预测模型在预测到与用户信息相关的信息之后,为了提高信息推送效率,会选择将所有信息都推送至用户中,则会存在不能够针对性推送的现象,导致用户根本不会查收那些不感兴趣的信息,进而导致模型预测准确率较低。
技术实现思路
本专利技术实施例提供一种信息推送模型训练、信息推送方法、装置、计算机设备及存储介质,以解决信息推送准确率低的问题。一种信息推送模型训练方法,包括:获取样本信息宽表集;所述样本信息宽表集包含至少一个样本信息宽表;所述样本信息宽表关联至少一个样本分群;一个所述样本分群均关联一个样本分群分值以及一个样本权重;将所述样本信息宽表输入至包含初始参数的初始预测模型,以根据所述样本信息宽表对各所述样本分群进行意愿预测,确定与各所述样本分群对应的分群预测分值;运用注意力机制技术,根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值,调整与该样本分群关联的样本权重;根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值,确定与该样本分群的预测损失值;将各所述样本分群对应的预测损失值输入至总损失函数中,以确定所述初始预测模型的总损失值;在所述总损失值未达到预设的收敛条件时,更新迭代所述初始预测模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始预测模型记录为信息推送模型。一种信息推送方法,包括:获取目标用户的目标信息宽表;所述目标信息宽表中包含与所述目标用户关联的各目标分群对应的分群信息;将所述目标信息宽表输入至信息推送模型中,根据各所述目标分群对应的分群信息,对各所述目标分群进行意愿预测,确定与各所述目标分群对应的目标预测分值;所述信息推送模型是根据上述信息推送模型训练方法生成的;将各所述目标分群对应的目标预测分值发送至预设推荐平台,并输出各目标分群推荐的优先级顺序,以令所述预设推荐平台向各所述目标用户进行信息推送。一种信息推送模型训练装置,包括:信息宽表获取模块,用于获取样本信息宽表集;所述样本信息宽表集包含至少一个样本信息宽表;所述样本信息宽表关联至少一个样本分群;一个所述样本分群均关联一个样本分群分值以及一个样本权重;分群意愿预测模块,用于将所述样本信息宽表输入至包含初始参数的初始预测模型,以根据所述样本信息宽表对各所述样本分群进行意愿预测,确定与各所述样本分群对应的分群预测分值;样本权重调整模块,用于运用注意力机制技术,根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值,调整与该样本分群关联的样本权重;预测损失值确定模块,用于根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值,确定与该样本分群的预测损失值;总损失值确定模块,用于将各所述样本分群对应的预测损失值输入至总损失函数中,以确定所述初始预测模型的总损失值;参数更新迭代模块,用于在所述总损失值未达到预设的收敛条件时,更新迭代所述初始预测模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始预测模型记录为信息推送模型。一种信息推送装置,包括:目标宽表获取模块,用于获取目标用户的目标信息宽表;所述目标信息宽表中包含与所述目标用户关联的各目标分群对应的分群信息;意愿预测模块,用于将所述目标信息宽表输入至信息推送模型中,根据各所述目标分群对应的分群信息,对各所述目标分群进行意愿预测,确定与各所述目标分群对应的目标预测分值;所述信息推送模型是根据上述信息推送模型训练方法生成的;信息推送模块,用于将各所述目标分群对应的目标预测分值发送至预设推荐平台,并输出各目标分群推荐的优先级顺序,以令所述预设推荐平台向各所述目标用户进行信息推送。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息推送模型训练方法,或者所述处理器执行所述计算机程序时实现上述信息推送方法。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息推送模型训练方法,或者所述计算机程序被处理器执行时实现上述信息推送方法。上述信息推送模型训练、信息推送方法、装置、计算机设备及存储介质,该信息推送模型训练方法通过获取样本信息宽表集;所述样本信息宽表集包含至少一个样本信息宽表;所述样本信息宽表关联至少一个样本分群;一个所述样本分群均关联一个样本分群分值以及一个样本权重;将所述样本信息宽表输入至包含初始参数的初始预测模型,以根据所述样本信息宽表对各所述样本分群进行意愿预测,确定与各所述样本分群对应的分群预测分值;运用注意力机制技术,根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值,调整与该样本分群关联的样本权重;根据与同一样本分群对应的调整后的样本权重、分群标签分值以及分群预测分值,确定与该样本分群的预测损失值;将各所述样本分群对应的预测损失值输入至总损失函数中,以确定所述初始预测模型的总损失值;在所述总损失值未达到预设的收敛条件时,更新迭代所述初始预测模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始预测模型记录为信息推送模型。本专利技术在对初始预测模型训练过程,通过运用注意力机制技术,调整与样本分群关联的样本权重的方法,可以不断增强样本权重之中对识别有用的权重,并且能够将对抗的样本权重增强以防止过拟合,以增强有用的特征识别的结果,进而提高初始预测模型预测的准确性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中信息推送模型训练方法的一应用环境示意图;图2是本专利技术一实施例中信息推送模型训练方法的一流程图;图3是本专利技术一实施例中信息推送模型训练方法的另一流程图;图4是本专利技术一实施例中信息推送模型训练方法的又一流程图;图5是本专利技术一实施例中信息推送方法的一流程图;图6是本专利技术一实施例中信息推送模型训练装置的一原理框图;图7是本专利技术一实施例中信息推送模型训练装置的另一原理框图;图本文档来自技高网...

【技术保护点】
1.一种信息推送模型训练方法,其特征在于,包括:/n获取样本信息宽表集;所述样本信息宽表集包含至少一个样本信息宽表;所述样本信息宽表关联至少一个样本分群;一个所述样本分群均关联一个样本分群分值以及一个样本权重;/n将所述样本信息宽表输入至包含初始参数的初始预测模型,以根据所述样本信息宽表对各所述样本分群进行意愿预测,确定与各所述样本分群对应的分群预测分值;/n运用注意力机制技术,根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值,调整与该样本分群关联的样本权重;/n根据与同一样本分群对应的调整后的样本权重、样本分群分值以及分群预测分值,确定与该样本分群的预测损失值;/n将各所述样本分群对应的预测损失值输入至总损失函数中,以确定所述初始预测模型的总损失值;/n在所述总损失值未达到预设的收敛条件时,更新迭代所述初始预测模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始预测模型记录为信息推送模型。/n

【技术特征摘要】
1.一种信息推送模型训练方法,其特征在于,包括:
获取样本信息宽表集;所述样本信息宽表集包含至少一个样本信息宽表;所述样本信息宽表关联至少一个样本分群;一个所述样本分群均关联一个样本分群分值以及一个样本权重;
将所述样本信息宽表输入至包含初始参数的初始预测模型,以根据所述样本信息宽表对各所述样本分群进行意愿预测,确定与各所述样本分群对应的分群预测分值;
运用注意力机制技术,根据与同一样本分群对应的所述样本分群分值以及所述分群预测分值,调整与该样本分群关联的样本权重;
根据与同一样本分群对应的调整后的样本权重、样本分群分值以及分群预测分值,确定与该样本分群的预测损失值;
将各所述样本分群对应的预测损失值输入至总损失函数中,以确定所述初始预测模型的总损失值;
在所述总损失值未达到预设的收敛条件时,更新迭代所述初始预测模型的初始参数,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述初始预测模型记录为信息推送模型。


2.如权利要求1所述的信息推送模型训练方法,其特征在于,所述获取样本信息宽表集之前,包括:
获取多个样本用户的历史动作信息,并确定所述历史动作信息的信息数量;
根据所述信息数量,将各所述样本用户分为历史用户分群以及萌新用户分群;
在第一监测周期中,获取所述历史用户分群中各历史样本用户的第一监测信息;同时,在第二监测周期中,获取所述萌新用户分群中各萌新样本用户的第二监测信息;
执行hivesql脚本对所述第一监测信息以及所述第二监测信息进行信息校验,得到与所述第一监测信息对应的历史特征信息,以及与所述第二监测信息对应的萌新特征信息;
对所述历史特征信息进行预处理,得到与所述历史样本用户对应的历史样本信息宽表;同时,对所述萌新特征信息进行预处理,得到与所述萌新样本用户对应的萌新样本信息宽表。


3.如权利要求2所述的信息推送模型训练方法,其特征在于,所述历史特征信息关联一个历史特征标签;所述对所述历史特征信息进行预处理,得到与所述历史样本用户对应的历史样本信息宽表,包括:
对所述历史特征信息进行冗余特征检测,在所述历史特征信息中包括冗余特征时,剔除包含所述冗余特征的历史特征信息,并将剔除后的历史特征信息记录为剔除特征信息;
对同一历史特征标签的剔除特征信息进行热力图展示,确定各所述剔除特征信息之间的特征重合率;
在所述特征重合率大于或等于预设重合阈值时,确定各所述剔除特征信息与所述历史特征标签之间的特征相关值;
剔除除特征相关值最大的剔除特征信息之外的其它剔除特征信息之后,得到所述历史样本信息宽表。


4.如权利要求1所述的信息推送模型训练方法,其特征在于,所述获取样本信息宽表集之前,还包括:
在用户属性库中爬取与所述样本信息宽表对应的样本用户存在关联的关系人,并将各所述关系人插入关系层级确定序列中;
将与所述样本用户具有直接关系的关系人记录为第一关系层级,并将与所述第一关系层级的关系人存在直接关系的关系人记录为第二关系层级;
在所述关系层级确定序列中的所有所述关系人的关系层级均确定完毕之后,确定与所述样本用户的人际关系图谱构建完成;
自所述人际关系图谱中,对各个关系层级的关系人进行人群聚类,确定与所述样本用户关联的样本分群。


5.如权利要求4所述的信息推送模型...

【专利技术属性】
技术研发人员:张景莲
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1