【技术实现步骤摘要】
本申请涉及智能推荐技术,具体涉及一种向量查找方法、装置、设备和存储介质。
技术介绍
1、推荐系统中无论是召回还是排序阶段都使用大量大型向量表(embedding table)来捕获和存储用户行为和物品特征,因此,推荐系统都需要对大型向量表进行向量查找操作,然后将查找后的向量经过集成输入到召回或排序模型。但是,由于推荐系统中涉及大量向量表的存储和查找操作,而静态随机存取存储器(static random-access memory,sram)缓存的内容较少,因此,经常会出现待查询向量在sram中无法命中的问题,需要在动态随机存取存储器(dynamic random access memory,dram)中加载,将sram中已有的内容覆盖掉,用于后续向量查询。这样随着向量表的增多,命中率指数级下降,需要频繁在dram加载。由于dram的读写速度慢,频繁的加载导致时延较大,影响向量查询速度。而针对该问题,目前尚无有效解决方案。
技术实现思路
1、有鉴于此,本申请实施例提供了一种向量查找方法、装置
...【技术保护点】
1.一种向量查找方法,其特征在于,应用于存算一体芯片,所述存算一体芯片包括多个第一存储结构,各所述第一存储结构包括多个第二存储结构;所述多个第二存储结构与第一集成单元连接;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述得到所述目标特征类别的第一集成向量之后,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述多个第一存储结构与全局集成单元连接;所述得到所述目标特征类别的第一集成向量之后,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述得到第二集成向量之后,所述方法还包括:
5.
...【技术特征摘要】
1.一种向量查找方法,其特征在于,应用于存算一体芯片,所述存算一体芯片包括多个第一存储结构,各所述第一存储结构包括多个第二存储结构;所述多个第二存储结构与第一集成单元连接;所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述得到所述目标特征类别的第一集成向量之后,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述多个第一存储结构与全局集成单元连接;所述得到所述目标特征类别的第一集成向量之后,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述得到第二集成向量之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述存算一体芯片还包括位于所述第一存储结构之下且位于所述第二存储结构之上的多个第三存储结构,所述第二存储结构从属于所述第三存储结构,所述基于所述第二信息,激活所述第一存储结构中所述目标特征对应的所述第二存储结构,得到所述目标特征对应的特征向量,包括:
6.根据权利要求5所述的方法,其特征在于...
【专利技术属性】
技术研发人员:游树娟,徐青青,李小涛,
申请(专利权)人:中国移动通信有限公司研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。