目标帐号集合的确定方法和装置、存储介质及电子设备制造方法及图纸

技术编号:26346934 阅读:22 留言:0更新日期:2020-11-13 21:28
本发明专利技术公开了一种目标帐号集合的确定方法和装置、存储介质及电子设备。其中,该方法包括:采用根据帐号的画像特征数据和行为特征数据确定第一组种子帐号的第一组表征向量以及一组候选帐号的第二组表征向量,再根据第一组表征向量与第二组表征向量,确定一组候选帐号与第一组种子帐号之间的距离,进而在一组候选帐号中确定第二组种子帐号,并将目标帐号集合确定为包括第一组种子帐号和第二组种子帐号。本发明专利技术解决了相关技术中存在的难以真正快速、有效的确定传播影响力较大的帐号集合的技术问题。

【技术实现步骤摘要】
目标帐号集合的确定方法和装置、存储介质及电子设备
本专利技术涉及计算机领域,具体而言,涉及一种目标帐号集合的确定方法和装置、存储介质及电子设备。
技术介绍
目前的相关技术中,确定传播影响力较大的种子帐号集合多是通过对全量帐号集合利用图采样技术,通过贪心算法获得种子帐号,但目前确定种子帐号的技术方案只适用于小数据量以及少量种子帐号集合,无法适应大规模帐号集合。此外,目前的相关技术中,需要假设种子集合中所有的帐号在初始时刻都是激活状态,应用条件较为苛刻,难以真正快速、有效的确定传播影响力较大的目标帐号的集合。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种目标帐号集合的确定方法和装置、存储介质及电子设备,以至少解决相关技术中存在的难以真正快速、有效的确定传播影响力较大的帐号集合的技术问题。根据本专利技术实施例的一个方面,提供了一种目标帐号集合的确定方法,包括:获取第一组种子帐号的第一组表征向量,以及一组候选帐号的第二组表征向量,其中,所述第一组表征向量中的表征本文档来自技高网...

【技术保护点】
1.一种目标帐号集合的确定方法,其特征在于,包括:/n获取第一组种子帐号的第一组表征向量,以及一组候选帐号的第二组表征向量,其中,所述第一组表征向量中的表征向量与所述第一组种子帐号中的种子帐号一一对应,所述第二组表征向量中的表征向量与所述一组候选帐号中的候选帐号一一对应,所述第一组表征向量中的表征向量是根据所述第一组种子帐号的第一组画像特征数据和第一组行为特征数据确定得到的向量,所述第二组表征向量中的表征向量是根据所述一组候选帐号的第二组画像特征数据和第二组行为特征数据确定得到的向量;/n根据所述第一组表征向量与所述第二组表征向量,确定所述一组候选帐号与所述第一组种子帐号之间的距离;/n根据所...

【技术特征摘要】
1.一种目标帐号集合的确定方法,其特征在于,包括:
获取第一组种子帐号的第一组表征向量,以及一组候选帐号的第二组表征向量,其中,所述第一组表征向量中的表征向量与所述第一组种子帐号中的种子帐号一一对应,所述第二组表征向量中的表征向量与所述一组候选帐号中的候选帐号一一对应,所述第一组表征向量中的表征向量是根据所述第一组种子帐号的第一组画像特征数据和第一组行为特征数据确定得到的向量,所述第二组表征向量中的表征向量是根据所述一组候选帐号的第二组画像特征数据和第二组行为特征数据确定得到的向量;
根据所述第一组表征向量与所述第二组表征向量,确定所述一组候选帐号与所述第一组种子帐号之间的距离;
根据所述一组候选帐号与所述第一组种子帐号之间的距离,在所述一组候选帐号中确定第二组种子帐号,并将目标帐号集合确定为包括所述第一组种子帐号和所述第二组种子帐号。


2.根据权利要求1所述的方法,其特征在于,所述获取第一组种子帐号的第一组表征向量,包括:
获取与所述第一组种子帐号对应的第一组特征数据,其中,所述第一组特征数据包括所述第一组种子帐号的第一组画像特征数据和第一组行为特征数据;
将所述第一组特征数据输入目标神经网络模型,得到所述第一组表征向量。


3.根据权利要求2所述的方法,其特征在于,所述将所述第一组样本特征数据输入目标神经网络模型,得到所述第一组表征向量,包括:
将所述第一组画像特征数据和所述第一组行为特征数据中的每个特征数据随机初始化,生成第一组向量,其中,所述第一组向量中包括第一类向量、第二类向量和第三类向量,所述第一类向量用于表示所述第一组种子帐号的第一类特征数据,所述第一类特征数据为使用一个标识表示的特征数据,所述第二类向量用于表示所述第一组种子帐号的第二类特征数据,所述第二类特征数据为使用多个标识结合表示的特征数据,所述第三类向量用于表示所述第一组种子帐号的第三类特征数据,所述第三类特征数据为预先配置的特征数据;
对所述第一类向量和所述第三类向量进行全连接转化,生成第二组向量;
对所述第二类向量基于所述多个标识所对应的特征数据分别进行第一目标处理和第二目标处理,再进行所述全连接转化,生成第三组向量,所述第一目标处理用于为所述多个标识所对应的特征数据添加权重系数,所述第二目标处理用于为所述多个标识所对应的特征数据进行求和,并计算平均值;
根据所述第二组向量和所述第二组向量,确定所述第一组表征向量。


4.根据权利要求3所述的方法,其特征在于,所述根据所述第二组向量和所述第二组向量,确定所述第一组表征向量,包括:
将所述第二组向量和所述第三组向量拼接为第一目标向量组;
对所述第一目标向量组进行第三目标处理,得到第二目标向量组,其中,所述第三目标处理用于基于注意力机制对所述第一目标向量组进行处理;
将所述第二目标向量组输入预设的多层感知机,得到第三组目标向量,所述目标神经网络模型包括所述多层感知机;
将第二目标向量组输入预设的特征交叉模型,得到第一交叉特征信息,其中,所述目标神经网络模型包括特征交叉模型,所述特征交叉模型用于获取所述交叉特征信息;
将所述第三组目标向量和所述第一交叉特征信息拼接为所述第一组表征向量。


5.根据权利要求1所述的方法,其特征在于,所述获取一组候选帐号的第二组表征向量,包括:
获取与所述一组候选帐号对应的第二组特征数据,其中,所述第二组特征数据包括所述一组候选帐号的第二组画像特征数据和第二组行为特征数据;
将所述第二组特征数据输入目标神经网络模型,得到所述第二组表征向量。


6.根据权利要求5所述的方法,其特征在于,所述将所述第二组样本特征数据输入目标神经网络模型,得到所述第二组表征向量,包括:
将所述第二组画像特征数据和所述第二组行为特征数据中的每个特征数据随机初始化,生成第四组向量,其中,所述第一组向量中包括第四类向量、第五类向量和第六类向量,所述第四类向量用于表示所述一组候选帐号的第四类特征数据,所述第四类特征数据为使用一个标识表示的特征数据,所述第五类向量用于表示所述一组候选帐号的第五类特征数据,所述第五类特征数据为使用多个标识结合表示的特征数据,所述第六类向量用于表示所述一组候选帐号的第六类特征数据,所述第六类特征数据为预先配置的特征数据;
对所述第四类向量和所述第六类向量进行全连接转化,生成第五组向量;
对所述第五类向量基于所述多个标识所对应的特征数据分别进行第四目标处理和第五目标处理,再进行所述全连接转化,生成第六组向量,所述第四目标处理用于为所述多个标识所对应的特征数据添加权重系数,所述第五目标处理用于为所述多个标识所对应的特征数据进行求和,并计算平均值;
根据所述第五组向量和所述第六组向量,确定所述第二组表征向量。


7.根据权利要求6所述的方法,其特征在于,所述根据所述第五组向量和所述第六组向量,确定所述第一组表征向量,包括:
将所述第五组向量和所述第六组向量拼接为第四目标向量组;
对所述第四目标向量组进行第六目标处理,得到第五目标向量组,其中,所述第六目标处理用于基于注意力机制对所述第四目标向量组进行处理;
将所述第五目标向量组输入预设的...

【专利技术属性】
技术研发人员:杨海力王伟
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1