双塔神经网络模型的训练方法、相似度的确定方法技术

技术编号:39297252 阅读:11 留言:0更新日期:2023-11-07 11:05
本申请涉及一种双塔神经网络模型的训练方法、相似度的确定方法,其中,双塔神经网络模型的训练方法包括:构造训练集,其中,训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;基于训练集对双塔神经网络模型进行训练,以使神经网络模型的损失值小于预设阈值。本申请实施例中的双塔神经网络模型不仅能够适应户转化行为较为稀疏的保险场景,还能够适应不同任务下相似度的计算需求,满足了在不用应用场景下相似度计算需求。用应用场景下相似度计算需求。用应用场景下相似度计算需求。

【技术实现步骤摘要】
双塔神经网络模型的训练方法、相似度的确定方法


[0001]本申请涉及计算机领域,尤其涉及一种双塔神经网络模型的训练方法、相似度的确定方法。

技术介绍

[0002]目前对于相似度的计算,通常是通过人工筛选出特定特征组合来确定用户之间的相似度。但人工筛选的方案只能筛选出指定特征组合的用户,且用户间相似度不可比,无法满足当前复杂场景下的相似度计算需求。

技术实现思路

[0003]本申请提供了一种双塔神经网络模型的训练方法、相似度的确定方法,以解决现有技术中通过人工筛选出特定特征组合来确定用户之间的相似度,导致无法满足当前复杂场景下的相似度计算需求。
[0004]第一方面,本申请提供了一种一种双塔神经网络模型的训练方法,构造训练集,其中,所述训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,所述正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;所述用户特征包括所述用户的属性信息,以及用户与保险业务关联的行为特征;基于所述训练集对双塔神经网络模型进行训练,以使所述神经网络模型的损失值小于预设阈值,其中,在基于所述训练集对双塔神经网络模型进行训练的过程中,是将同一组正样本对和负样本对中的主用户特征输入双塔神经网络模型的主塔模型中,将同一组正样本对和负样本对中的副用户特征输入双塔神经网络模型的副塔模型中。
[0005]第二方面,本申请提供了一种基于双塔神经网络模型进行相似度的确定方法,包括:将第一保险用户的第一用户特征输入双塔神经网络模型中的主塔模型,输出第一用户特征向量;将第二保险用户的第二用户特征输入所述双塔神经网络模型中的副塔模型,输出第二用户特征向量;基于所述第一用户特征向量和所述第二用户特征向量确定所述第一保险用户与所述第二保险用户之间的相似度;其中,所述第一保险用户特征包括所述第一保险用户的属性信息,以及所述第一保险用户与所述保险业务关联的行为特征;所述第二保险用户特征包括所述第二保险用户的属性信息,以及所述第二保险用户与所述保险业务关联的行为特征。
[0006]第三方面,提供了一种双塔神经网络模型的训练装置,包括:构造模块,用于构造训练集,其中,所述训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,所述正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;所述用户特征包括所述用户的属性信息,以及用户与保险业务关联的行为特征;训练模块,用于基于所述训练集对双塔神经网络模型进行训练,以使所述神经网络模型的
损失值小于预设阈值,其中,在基于所述训练集对双塔神经网络模型进行训练的过程中,是将同一组正样本对和负样本对中的主用户特征输入双塔神经网络模型的主塔模型中,将同一组正样本对和负样本对中的副用户特征输入双塔神经网络模型的副塔模型中。
[0007]第四方面,提供了一种基于双塔神经网络模型进行相似度的确定装置,包括:第一输入模块,用于将第一保险用户的第一用户特征输入所述双塔神经网络模型中的主塔模型,输出第一用户特征向量;第二输入模块,用于将第二保险用户的第二用户特征输入所述双塔神经网络模型中的副塔模型,输出第二用户特征向量;第一确定模块,用于基于所述第一用户特征向量和所述第二用户特征向量确定所述第一保险用户与所述第二保险用户之间的相似度;其中,所述第一保险用户特征包括所述第一保险用户的属性信息,以及所述第一保险用户与所述保险业务关联的行为特征;所述第二保险用户特征包括所述第二保险用户的属性信息,以及所述第二保险用户与所述保险业务关联的行为特征。
[0008]第五方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0009]存储器,用于存放计算机程序;
[0010]处理器,用于执行存储器上所存放的程序时,实现如第一方面任一项实施例所述的方法的步骤,或实现如第二方面任一项实施例所述的方法的步骤。
[0011]第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的方法的步骤,或实现如第二方面任一项实施例所述的方法的步骤。
[0012]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
[0013]本申请实施例中的训练集能够涵盖各种与保险业务关联的行为特征,即能够全面包括用户特征以适应用户转化行为较为稀疏的保险场景,而且训练集中的正负样本对也可以是根据不同的任务或需求进行相应的调整,进而能够基于双塔神经网络模型计算出不同任务下用户之间的相似度;也就是说,本申请实施例中的双塔神经网络模型不仅能够适应户转化行为较为稀疏的保险场景,还能够适应不同任务下相似度的计算需求,满足了在不用应用场景下相似度计算需求。
附图说明
[0014]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0015]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本申请实施例提供的一种双塔神经网络模型的训练方法的流程示意图;
[0017]图2为本申请实施例提供的样本对构造示意图;
[0018]图3为本申请实施例提供的双塔神经网络模型的示意图;
[0019]图4为本申请实施例提供的基于双塔神经网络模型进行相似度的确定方法的流程示意图;
[0020]图5为本申请实施例提供的一种双塔神经网络模型的训练装置的示意图;
[0021]图6为本申请实施例提供的基于双塔神经网络模型进行相似度的确定装置的示意图;
[0022]图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0023]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0024]图1为本申请实施例提供的一种双塔神经网络模型的训练方法的流程示意图,如图1所示,该训练方法包括:
[0025]步骤101,构造训练集,其中,训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种双塔神经网络模型的训练方法,其特征在于,构造训练集,其中,所述训练集中包括多组用户特征,每一组用户特征中包括构成正样本对所对应的至少两个用户特征以及构成负样本对所对应的至少两个用户特征,所述正样本对中的用户特征为同一类型的相同用户特征,所述负样本对中的用户特征为所述同一类型的不同用户特征;所述用户特征包括所述用户的属性信息,以及用户与保险业务关联的行为特征;基于所述训练集对双塔神经网络模型进行训练,以使所述神经网络模型的损失值小于预设阈值,其中,在基于所述训练集对双塔神经网络模型进行训练的过程中,是将同一组正样本对和负样本对中的主用户特征输入双塔神经网络模型的主塔模型中,将同一组正样本对和负样本对中的副用户特征输入双塔神经网络模型的副塔模型中。2.根据权利要求1所述的方法,其特征在于,所述构造训练集包括:对于保险业务关联的用户行为特征和用户属性信息进行采样,得到采样结果;其中,所述采样结果中包括多个用户特征,每一个用户特征中所包括的行为特征的数量为多个;基于所述多个用户特征构造所述每一组用户特征,其中,所述每一组用户特征中的所述正样本对为具有同一行为结果的目标行为特征的两个用户特征和/或具有相同目标属性信息的两个用户特征的样本对,所述负样本对为具有不同行为结果的所述目标行为特征的两个用户特征和/或具有不同所述目标属性信息的两个用户特征的样本对;所述目标行为特征为多个所述行为特征中的任一行为特征,所述目标属性信息为所述用户的属性信息中的任一种;将所述正样本对和所述负样本对中均出现的用户所对应的用户特征确定为所述主用户特征,将所述正样本对和所述负样本对中除所述主用户特征外的用户特征确定为所述副用户特征;将所述正样本对和所述负样本对确定为一组样本对,基于多组样本对构造所述多组用户特征,以得到所述训练集。3.根据权利要求2所述的方法,其特征在于,将所述正样本对和所述负样本对确定为一组样本对,基于多组样本对所对应的用户特征构造所述训练集包括:为具有同一行为结果的行为特征设置对应的第一权重,其中,所述同一行为结果的行为特征为多个不同类型的行为特征中的任一行为特征;确定具有相同区间范围的属性信息,并设置所述属性信息的第二权重,其中,一个或多个所述第一权重与一个或多个第二权重的和值为1;基于所述第一权重和所述第二权重对多组样本对所对应的用户特征进行采样,得到所述训练集。4.根据权利要求2所述的方法,其特征在于,所述双塔神经网络模型的损失函数公式为:其中,L表示损失值;w(u1)表示用户1所对应的用户特征u1输入双塔神经网模型的主塔模型后输出的特征向量,w(u2)表示用户2所对应的用户特征u2输入双塔神经网模型的副塔模型后输出的特征向量,w(u3)表示用户3所对应的用户特征u3输入双塔神经网模型的副塔
模型后输出的特征向量;u1与u2为正样本对,u1与u3为负样本对。5.根据权利要求4所述的方法,其特征在于,通过以下公式确定所述损失函数的收敛速度:C=b/(1+alog N(f))其中,所述C用于表示收敛速度,a和b为常数,N(f)表示当前来自用户特征f的采样来源的样本对数量;所述用户特征f为用户的任一用户特征。6.一种基于双塔神经网络模型进行相似度的确定方法,其特征在于,包括:将第一保险用户的第一用户特征输入双塔神经网络模型中的主塔模型,输出第一用户特征向量;将第二保险用户的第二用户...

【专利技术属性】
技术研发人员:张懿
申请(专利权)人:微民保险代理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1