【技术实现步骤摘要】
声纹数据重排序方法、装置、电子设备及存储介质
本申请涉及数据检索领域,特别是一种声纹数据重排序方法、装置、电子设备及计算机存储介质。
技术介绍
随着技术的发展,重排序已经成为一个研究热点问题,所谓重排序即在原始搜索排序的基础上,通过挖掘数据内在关联、或者借鉴外部知识和人工干预,对原始搜索结果进行重新排序的过程。例如,在图像检索领域,大多数图像检索系统中,用户提供查询文本,检索系统通过从附属于图片的元数据中提取文本信息与查询文本进行匹配,将匹配度高的图片返回给用户,然而这种方法只分析了文本信息,图片本身包含的视觉信息以及返回图片之间在视觉上的联系并没有被充分利用起来。因此,图像重排序通过提取图片的视觉信息并分析图片间的视觉关联,对图片序列进一步优化,极大地提高查询性能。现有的声纹数据检索方法,由于声纹数据的数据库包含的数据量过大,直接采用上述重排序方法会出现内存不足且检索到的结果不准确等情况,大大降低了对声纹数据检索结果的准确性。
技术实现思路
基于上述问题,本申请提出了一种声纹数据重排序方法、装置、电子设备及存储介质,可以先基于目标声纹数据从声纹数据库中选取一定量的相似声纹数据降低占用内存,再基于上述相似声纹数据的最近邻集合进行优化处理,最终得到重排序结果,避免了检索时内存不足的情况,且大大提高了声纹数据重排序结果的准确性。本申请实施例第一方面提供了一种声纹数据重排序方法,所述方法包括:从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;计算所述相似声纹数据与所 ...
【技术保护点】
1.一种声纹数据重排序方法,其特征在于,所述方法包括:/n从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;/n获取所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;/n对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;/n计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;/n基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。/n
【技术特征摘要】
1.一种声纹数据重排序方法,其特征在于,所述方法包括:
从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;
获取所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;
对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;
计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;
基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。
2.根据权利要求1所述的方法,其特征在于,所述从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据,包括:
计算所述目标声纹数据与所述预设声纹数据库中的预设声纹数据之间的余弦距离数据;
基于所述余弦距离数据的大小选取M个预设声纹数据作为所述相似声纹数据,所述M为正整数。
3.根据权利要求2所述的方法,其特征在于,所述计算所述相似声纹数据与所述目标声纹数据之间的第一相似度得分,包括:
基于所述余弦距离数据的大小得到所述目标声纹数据与所述M个相似声纹数据的M个第一相似度得分。
4.根据权利要求2所述的方法,其特征在于,所述对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合,包括:
基于汉明距离和余弦距离检索出所述目标声纹数据对应的目标最近邻集合,以及,基于汉明距离和余弦距离检索出所述M个相似声纹数据对应的M个相似最近邻集合,所述目标最近邻集合包括K个第一相似样本,所述M个相似最近邻集合包括M×K个第二相似样本,所述K为正整数;
基于所述K个第一相似样本对所述目标最近邻集合进行提纯处理得到目标提纯最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似最近邻集合进行提纯处理得到M个相似提纯最近邻集合;
基于所述K个第一相似样本对所述目标提纯最近邻集合进行扩充处理得到目标优化最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似提纯最近邻集合进行扩充处理得到M个相似优化最近邻集合。
5.根据权利要求4所述的方法,其特征在于,所述基于所述K个第一相似样本对所述目标最近邻集合进行提纯处理得到目标提纯最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似最近邻集合进行提纯处理得到M个相似提纯最近邻集合,包括:
获取所述K个第一相似样本对应的K个第一样本最近邻集合,以及获取所述M×K个第二相似样本对应的M×K个第二样本最近邻集合;
计算所述K个第一样本最近邻集合与所述目标最近邻集合的K个第一重合度,以及,计算所述M×K个第二样本最近邻集合与所述M个相似最近邻集合的M×K个第二重合度;
筛选出所述K个第一相似样本中所述第一重合度大于预设重合阈值的第一相似样本作为第一提纯样本,以及,筛选出所述M×K个第二相似样本中所述第二重合度大于所述预设重合阈值的M组第二相似样本作为第二提纯样本;
保留所述第一提纯样本得到所述目标提纯最近邻集合,以及,保留所述第二提纯样本得到所述M个相似提纯最近邻集合。
6.根据权利要求4所述的方法,其特征在于,所述基于所述K个第一相似样本对所述目标最近邻集合进行提纯处理得到目标提纯最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似最近邻集合进行提纯处理得到M个相似提纯最近邻集合,包括:
获取所述K个第一相似样本对应的K个第一样本最近邻集合,以及获取所述M×...
【专利技术属性】
技术研发人员:孙伟,李永超,方昕,黄志华,柳林,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。