向量分库方法、装置、设备及存储介质制造方法及图纸

技术编号:26343496 阅读:50 留言:0更新日期:2020-11-13 20:45
本发明专利技术提供了一种向量分库方法、装置、设备及存储介质,其中,方法包括,对训练模型内的所有注册向量建立锚点;根据所述锚点对相识度在预设范围内的所述注册向量进行分库,并对每个分库进行分库编号,以获得多个第一分库编号;获得输入向量的第二分库编号,将所述输入向量与所述第二分库编号相同的第一分库编号对应的分库判定为目标分库,再将所述输入向量与所述目标分库内的所述注册向量进行相识度计算。上述一种向量分库方法,计算时只需计算一个含有注册向量很少的目标分库,提高了计算速度。

Method, device, equipment and storage medium of vector library

【技术实现步骤摘要】
向量分库方法、装置、设备及存储介质
本专利技术涉及智能识别
,特别涉及一种向量分库方法、装置、设备及存储介质。
技术介绍
现有的人脸识别,声纹识别等都主要以神经网络进行模型训练,其最终输出都是向量的形式。两个人脸或声纹的相似度是以表征的向量间进行相似度计算。现有的计算方式有欧式距离,cosine,plda等,当进行1:N检索的时候,即用一个向量库中的向量做相似度计算时,当库中的数据量非常大的时候(几万以上),进行相似度计算就会非常耗时。
技术实现思路
本专利技术的目的是提供一种向量分库方法、装置、设备及存储介质,以解决现有的人脸或声纹的相似度的计算方式非常耗时的问题,实现计算快速的有益效果。本专利技术提供了一种向量分库方法,包括:对训练模型内的所有注册向量建立锚点;根据所述锚点对相识度在预设范围内的所述注册向量进行分库,并对每个分库进行分库编号,以获得多个第一分库编号;获得输入向量的第二分库编号,将所述输入向量与所述第二分库编号相同的第一分库编号对应的分库判定为目标分库,再将所述输入向量与所述目标分库内本文档来自技高网...

【技术保护点】
1.一种向量分库方法,其特征在于,包括:/n对训练模型内的所有注册向量建立锚点;/n根据所述锚点对相识度在预设范围内的所述注册向量进行分库,并对每个分库进行分库编号,以获得多个第一分库编号;/n获得输入向量的第二分库编号,将所述输入向量与所述第二分库编号相同的第一分库编号对应的分库判定为目标分库,再将所述输入向量与所述目标分库内的所述注册向量进行相识度计算。/n

【技术特征摘要】
1.一种向量分库方法,其特征在于,包括:
对训练模型内的所有注册向量建立锚点;
根据所述锚点对相识度在预设范围内的所述注册向量进行分库,并对每个分库进行分库编号,以获得多个第一分库编号;
获得输入向量的第二分库编号,将所述输入向量与所述第二分库编号相同的第一分库编号对应的分库判定为目标分库,再将所述输入向量与所述目标分库内的所述注册向量进行相识度计算。


2.根据权利要求1所述的向量分库方法,其特征在于,所述对训练模型内的所有注册向量建立锚点的步骤包括:
利用聚类算法,计算出n个中心点,并将处于n个中心点的所述注册向量组成矩阵N,其中n的范围在10-10000之间。


3.根据权利要求2所述的向量分库方法,其特征在于,所述根据所述锚点对相识度在预设范围内的所述注册向量进行分库,并对每个分库进行分库编号的步骤包括:
对所述注册向量和矩阵N进行计算,将最相似的一个或多个的所述注册向量的序号作为该注册向量的分库编号,以获得多个第一分库编号。


4.根据权利要求2所述的向量分库方法,其特征在于,所述聚类算法为k-means算法。


5.根据权利要求1所述的向量分库方法,其特征在于,所述对所述注册向量和矩阵N进行计算的步骤包括:
根据公式计算出锚点上的所述注册向量与其他所述注册向量的相识度,其中矩阵N是多个锚点上的所述注册向量组成,m是一个锚点上的所述注册向量,x是任意注册向量。

【专利技术属性】
技术研发人员:洪国强肖龙源李稀敏刘晓葳叶志坚
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1