一种处理标签数据的方法和装置制造方法及图纸

技术编号:27255919 阅读:17 留言:0更新日期:2021-02-04 12:35
本发明专利技术公开了一种处理标签数据的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取目标用户在第一标签系统中的第一标签向量;根据所述目标用户的第一标签向量,生成所述目标用户的表征向量;将所述目标用户的表征向量输入到经过训练的神经网络中,得到所述目标用户的输出向量;根据所述目标用户的输出向量得到所述目标用户在第二标签系统中的第二标签向量。该实施方式能够解决难以在两个不同的标签系统之间转换用户标签的技术问题。术问题。术问题。

【技术实现步骤摘要】
一种处理标签数据的方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种处理标签数据的方法和装置。

技术介绍

[0002]随着全球信息化进程不断深入,企业发展进入大数据时代。为了更好、更精准的服务用户,大多数企业为自己的用户设立标签体系,根据用户的消费行为和个人公开信息进行分类,把握住用户的核心需求和痛点,针对性提供服务。上述分类方法被广泛应用在各个企业的推荐系统当中。
[0003]然而,随着互联网渠道的多样化,各个渠道均需要对大量用户进行学习和分类,这不可避免的造成了计算资源的浪费。各个企业均需要花费大量的人力物力成立自己的大数据中心,对用户行为和信息进行分析。但是,用户的行为特征和消费需求在相当一段时间中是保持稳定的,所以某一个推荐系统的分析结果同样可以被其他推荐系统,从而为用户提供针对性服务。然而,不同的推荐系统,往往标签体系是不同的,在标签数量、分类等方面存在着差异,难以直接利用其他系统的标签来提供服务。
[0004]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0005]现有技术中没有考虑标签共享,增大了各个企业的计算开销,难以将用户标签直接移植给其他企业使用。即使要转换标签,也只能通过人工的方式,效率低下。

技术实现思路

[0006]有鉴于此,本专利技术实施例提供一种处理标签数据的方法和装置,以解决难以在两个不同的标签系统之间转换用户标签的技术问题。
[0007]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种处理标签数据的方法,包括:
[0008]获取目标用户在第一标签系统中的第一标签向量;
[0009]根据所述目标用户的第一标签向量,生成所述目标用户的表征向量;
[0010]将所述目标用户的表征向量输入到经过训练的神经网络中,得到所述目标用户的输出向量;
[0011]根据所述目标用户的输出向量得到所述目标用户在第二标签系统中的第二标签向量。
[0012]可选地,获取目标用户在第一标签系统中的第一标签向量之前,还包括:
[0013]获取历史用户在第一标签系统中的第一标签向量;
[0014]根据所述历史用户的第一标签向量,生成所述历史用户的表征向量;
[0015]获取所述历史用户在第二标签系统中的第二标签向量;
[0016]根据所述历史用户的第二标签向量,生成所述历史用户的监督向量;
[0017]以所述历史用户的表征向量作为输入,以所述历史用户的监督向量作为输出,对神经网络进行有监督训练,从而得到经过训练的神经网络。
[0018]可选地,所述第一标签向量和所述第二标签向量均采用独热向量表示。
[0019]可选地,所述第一标签向量的各个位置表示所述第一标签系统的标签索引。
[0020]可选地,对于所述第一标签向量的任意一个位置:
[0021]若所述位置的值为1,则表示所述历史用户具有所述位置对应的所述第一标签系统的标签;
[0022]若所述位置的值为0,则表示所述历史用户不具有所述位置对应的所述第一标签系统的标签。
[0023]可选地,所述第二标签向量的各个位置表示所述第二标签系统的标签索引。
[0024]可选地,对于所述第二标签向量的任意一个位置:
[0025]若所述位置的值为1,则表示所述历史用户具有所述位置对应的所述第二标签系统的标签;
[0026]若所述位置的值为0,则表示所述历史用户不具有所述位置对应的所述第二标签系统的标签。
[0027]可选地,根据所述历史用户的第一标签向量,生成所述历史用户的表征向量,包括:
[0028]将所述历史用户的第一标签向量与第一全零向量拼接成所述历史用户的表征向量。
[0029]可选地,所述第一标签向量的维度与所述第一标签系统的标签数量相同;所述第一全零向量的维度与所述第二标签系统的标签数量相同。
[0030]可选地,根据所述历史用户的第二标签向量,生成所述历史用户的监督向量,包括:
[0031]将第二全零向量与所述历史用户的第二标签向量拼接成所述历史用户的监督向量。
[0032]可选地,所述第二全零向量的维度与所述第一标签系统的标签数量相同;所述第二标签向量的维度与所述第二标签系统的标签数量相同。
[0033]可选地,所述神经网络的隐藏层的前三层为全连接层,所述全连接层的神经元个数分别为(n1+n2),2(n1+n2),4(n1+n2),激活函数均为Relu;
[0034]其中,n1为所述第一标签系统的标签数量,n2第二标签系统的标签数量。
[0035]可选地,所述神经网络的隐藏层为10层,所述隐藏层的中间为4层卷积层,所述隐藏层的最后3层为全连接层,激活函数为sigmoid。
[0036]可选地,根据所述目标用户的第一标签向量,生成所述目标用户的表征向量,包括:
[0037]将所述目标用户的第一标签向量与第一全零向量拼接成所述目标用户的表征向量;
[0038]其中,所述目标用户的第一标签向量采用独热向量表示,所述目标用户的第一标签向量的各个位置表示所述第一标签系统的标签索引,所述目标用户的第一标签向量的维度与所述第一标签系统的标签数量相同,所述第一全零向量的维度与所述第二标签系统的标签数量相同。
[0039]可选地,根据所述目标用户的输出向量得到所述目标用户在第二标签系统中的第
二标签向量,包括:
[0040]将所述目标用户的输出向量拆分成第二全零向量和所述目标用户在第二标签系统中的第二标签向量;
[0041]根据所述目标用户的第二标签向量确定所述目标用户在所述第二标签系统中具有的标签;
[0042]其中,所述第二全零向量的维度与所述第一标签系统的标签数量相同,所述目标用户的第二标签向量的维度与所述第二标签系统的标签数量相同,所述目标用户的第二标签向量采用独热向量表示,所述目标用户的第二标签向量的各个位置表示所述第二标签系统的标签索引。
[0043]可选地,根据所述目标用户的第二标签向量确定所述目标用户在所述第二标签系统中具有的标签,包括:
[0044]对于所述目标用户的第二标签向量的任意一个位置:
[0045]若所述位置的值大于等于0.5,则将所述位置的值替换为1;
[0046]若所述位置的值小于0.5,则将所述位置的值替换为0;
[0047]其中,若所述位置的值为1,则表示所述历史用户具有所述位置对应的所述第二标签系统的标签;若所述位置的值为0,则表示所述历史用户不具有所述位置对应的所述第二标签系统的标签。
[0048]另外,根据本专利技术实施例的另一个方面,提供了一种处理标签数据的装置,包括:
[0049]获取模块,用于获取目标用户在第一标签系统中的第一标签向量;
[0050]生成模块,用于根据所述目标用户的第一标签向量,生成所述目标用户的表征向量;
[0051]转本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种处理标签数据的方法,其特征在于,包括:获取目标用户在第一标签系统中的第一标签向量;根据所述目标用户的第一标签向量,生成所述目标用户的表征向量;将所述目标用户的表征向量输入到经过训练的神经网络中,得到所述目标用户的输出向量;根据所述目标用户的输出向量得到所述目标用户在第二标签系统中的第二标签向量。2.根据权利要求1所述的方法,其特征在于,获取目标用户在第一标签系统中的第一标签向量之前,还包括:获取历史用户在第一标签系统中的第一标签向量;根据所述历史用户的第一标签向量,生成所述历史用户的表征向量;获取所述历史用户在第二标签系统中的第二标签向量;根据所述历史用户的第二标签向量,生成所述历史用户的监督向量;以所述历史用户的表征向量作为输入,以所述历史用户的监督向量作为输出,对神经网络进行有监督训练,从而得到经过训练的神经网络。3.根据权利要求2所述的方法,其特征在于,所述第一标签向量和所述第二标签向量均采用独热向量表示。4.根据权利要求3所述的方法,其特征在于,所述第一标签向量的各个位置表示所述第一标签系统的标签索引。5.根据权利要求4所述的方法,其特征在于,对于所述第一标签向量的任意一个位置:若所述位置的值为1,则表示所述历史用户具有所述位置对应的所述第一标签系统的标签;若所述位置的值为0,则表示所述历史用户不具有所述位置对应的所述第一标签系统的标签。6.根据权利要求3所述的方法,其特征在于,所述第二标签向量的各个位置表示所述第二标签系统的标签索引。7.根据权利要求6所述的方法,其特征在于,对于所述第二标签向量的任意一个位置:若所述位置的值为1,则表示所述历史用户具有所述位置对应的所述第二标签系统的标签;若所述位置的值为0,则表示所述历史用户不具有所述位置对应的所述第二标签系统的标签。8.根据权利要求2所述的方法,其特征在于,根据所述历史用户的第一标签向量,生成所述历史用户的表征向量,包括:将所述历史用户的第一标签向量与第一全零向量拼接成所述历史用户的表征向量。9.根据权利要求8所述的方法,其特征在于,所述第一标签向量的维度与所述第一标签系统的标签数量相同;所述第一全零向量的维度与所述第二标签系统的标签数量相同。10.根据权利要求2所述的方法,其特征在于,根据所述历史用户的第二标签向量,生成所述历史用户的监督向量,包括:将第二全零向量与所述历史用户的第二标签向量拼接成所述历史用户的监督向量。11.根据权利要求10所述的方法,其特征在于,所述第二全零向量的维度与所述第一标
签系统的标签数量相同;所述第二标签向量的维度与所述第二标签系统的标签数量相同。12.根据权利要求2所述的方法,其特征在于,所述神经网络的隐藏层的前三层为全连接层,所述全连接层的神经元个数分别为(n1+n2),2(n1+n2),4(n1+n2),激活函数均为Relu;其中,n1为所述第一标签系统的标签数量,n2第二标签系统的标签数量。13.根据权利要求13所述的方法,其特征在于,所述神经网络的隐藏层为10层,所述隐藏层的中间为4层卷积层,所述隐藏层的最后3层为全连接层,激活函数为sigmoid。14.根据权利要求1所述的方法,其特征在于,根据所述目标用户的第一标签向量,生成...

【专利技术属性】
技术研发人员:唐敏邓小茜程浩杨立兴干芸芸何睿列文浩戴定东
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1