近邻向量的召回方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:24331848 阅读:26 留言:0更新日期:2020-05-29 19:59
本申请公开了一种近邻向量的召回方法、装置、计算机设备及存储介质,涉及云会议领域。所述方法包括:获取源向量和目标向量集的聚类结果,所述聚类结果包括至少两个类别的聚类向量集,以及所述聚类向量集的质心向量;根据所述源向量和所述聚类向量集的所述质心向量之间的第一相似度,从所述聚类向量集中确定出所述源向量的至少一个近邻向量集;根据所述源向量和所述近邻向量集中的各个候选近邻向量之间的第二相似度,从所述候选近邻向量中召回目标近邻向量。

Recall method, device, computer equipment and storage medium of nearest neighbor vector

【技术实现步骤摘要】
近邻向量的召回方法、装置、计算机设备及存储介质
本申请实施例涉及信息推送领域,特别涉及一种近邻向量的召回方法、装置、计算机设备及存储介质。
技术介绍
近邻向量的召回是根据用户的用户画像和物品维度之间的相似性,向用户推荐可能感兴趣的信息的技术。相关技术中,在针对某个用户A进行推荐时,服务器计算用户的第一向量和物品的第二向量,计算第一向量和第二向量之间的相似度。将第二向量按照与第一向量的相似度由高到低的顺序进行排序,根据排序在前k位的第二向量对应的物品生成该用户A的推荐信息。上述技术在数据量位于百万量级仍然具有较好的性能,但是在用户和物品维度到了亿级,即便有大规模计算集群,计算成本也很高,导致计算性能比较差。
技术实现思路
本申请实施例提供了一种近邻向量的召回方法、装置、计算机设备及存储介质,可以在客户端处于弱网环境时,自动将信息推荐从视频模式切换为语音模式,从而保证信息推荐能够流畅进行。所述技术方案如下:根据本申请的一个方面,提供了一种近邻向量的召回方法,所述方法包括:>获取源向量和目标向本文档来自技高网...

【技术保护点】
1.一种近邻向量的召回方法,其特征在于,所述方法包括:/n获取源向量和目标向量集的聚类结果,所述聚类结果包括至少两个类别的聚类向量集,以及所述聚类向量集的质心向量;/n根据所述源向量和所述聚类向量集的所述质心向量之间的第一相似度,从所述聚类向量集中确定出所述源向量的至少一个近邻向量集;/n根据所述源向量和所述近邻向量集中的各个候选近邻向量之间的第二相似度,从所述候选近邻向量中召回目标近邻向量。/n

【技术特征摘要】
1.一种近邻向量的召回方法,其特征在于,所述方法包括:
获取源向量和目标向量集的聚类结果,所述聚类结果包括至少两个类别的聚类向量集,以及所述聚类向量集的质心向量;
根据所述源向量和所述聚类向量集的所述质心向量之间的第一相似度,从所述聚类向量集中确定出所述源向量的至少一个近邻向量集;
根据所述源向量和所述近邻向量集中的各个候选近邻向量之间的第二相似度,从所述候选近邻向量中召回目标近邻向量。


2.根据权利要求1所述的方法,其特征在于,所述按照所述第一相似度由高到低的顺序,从所述聚类向量集中确定出所述源向量的至少一个近邻向量集,包括:
计算所述源向量和所述聚类向量集的所述质心向量之间的第一相似度;
按照所述第一相似度由高到低的顺序,将排序在前n个的聚类向量集确定为所述源向量的n个近邻向量集,n为正整数。


3.根据权利要求2所述的方法,其特征在于,所述聚类结果还包括:所述聚类向量集中的目标向量的个数;
所述按照所述第一相似度由高到低的顺序,将排序在前n个聚类向量集确定为所述源向量的至少一个近邻向量集,包括:
按照所述第一相似度由高到低的顺序,将排序在第n个的聚类向量集添加至所述源向量的近邻向量集,n的起始值为1;
计算前i个聚类向量集中的目标向量的个数总和;
响应于所述个数总和小于所述目标召回数量,令n等于n+1,再次执行所述将排序在第i个的聚类向量集添加至所述源向量的近邻向量集中的步骤;
响应于所述个数总和大于或等于所述目标召回数量,得到所述源向量的n个近邻向量集。


4.根据权利要求1至3任一所述的方法,其特征在于,所述根据所述源向量和所述近邻向量集中的各个近邻向量之间的第二相似度,从所述近邻向量中召回目标近邻向量,包括:
计算至少两个所述近邻向量集相对于所述源向量之间的相似度分布;
按照所述相似度分布将至少两个所述近邻向量集划分为m个组,不同组对应不同的相似度分布分段;
将所述m个组分配至并列的m个计算节点中进行排序,所述排序包括根据所述源向量和所述近邻向量集中的各个近邻向量之间的第二相似度对所述近邻向量进行排序;
将所述m个计算节点的排序结果按照所述相似度分布分段进行拼接,得到全局排序结果;
将所述全局排序结果中的前q个近邻向量,召回为所述源向量的目标近邻向量。


5.根据权利要求4所述的方法,其特征在于,所述计算至少两个所述近邻向量集...

【专利技术属性】
技术研发人员:洪立涛
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1