声纹数据重排序方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24353703 阅读:48 留言:0更新日期:2020-06-03 02:07
本申请提供了一种声纹数据重排序方法、装置、电子设备及存储介质,首先从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;计算所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;同时,对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;再计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;最后基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。可以降低声纹数据检索过程的复杂度,且大大提高了声纹数据重排序结果的准确性。

Method, device, electronic equipment and storage medium for data reordering of voiceprint

【技术实现步骤摘要】
声纹数据重排序方法、装置、电子设备及存储介质
本申请涉及数据检索领域,特别是一种声纹数据重排序方法、装置、电子设备及计算机存储介质。
技术介绍
随着技术的发展,重排序已经成为一个研究热点问题,所谓重排序即在原始搜索排序的基础上,通过挖掘数据内在关联、或者借鉴外部知识和人工干预,对原始搜索结果进行重新排序的过程。例如,在图像检索领域,大多数图像检索系统中,用户提供查询文本,检索系统通过从附属于图片的元数据中提取文本信息与查询文本进行匹配,将匹配度高的图片返回给用户,然而这种方法只分析了文本信息,图片本身包含的视觉信息以及返回图片之间在视觉上的联系并没有被充分利用起来。因此,图像重排序通过提取图片的视觉信息并分析图片间的视觉关联,对图片序列进一步优化,极大地提高查询性能。现有的声纹数据检索方法,由于声纹数据的数据库包含的数据量过大,直接采用上述重排序方法会出现内存不足且检索到的结果不准确等情况,大大降低了对声纹数据检索结果的准确性。
技术实现思路
基于上述问题,本申请提出了一种声纹数据重排序方法、装置、电子设备及存储介质,可以先基于目标声纹数据从声纹数据库中选取一定量的相似声纹数据降低占用内存,再基于上述相似声纹数据的最近邻集合进行优化处理,最终得到重排序结果,避免了检索时内存不足的情况,且大大提高了声纹数据重排序结果的准确性。本申请实施例第一方面提供了一种声纹数据重排序方法,所述方法包括:从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;计算所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。本申请实施例第二方面提供了一种声纹数据重排序装置,所述装置包括处理单元,所述处理单元用于:从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;计算所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。本申请实施例第三方面提供了一种电子设备,包括处理器、存储器,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如本申请实施例第一方面任一方项所描述的步骤的指令。本申请实施例第四方面提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如本申请实施例第一方面任一项所描述的方法。本申请实施例第五方面提供了一种计算机产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。通过实施上述申请实施例,可以得到以下有益效果:上述声纹数据重排序方法,首先从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;接着,计算所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;同时,对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;再计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;最后基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。可以降低声纹数据检索过程的复杂度,且大大提高了声纹数据重排序结果的准确性。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的声纹数据重排序方法的系统构架图;图2为本申请实施例提供的一种声纹数据重排序方法的流程示意图;图3为本申请实施例提供的一种提纯处理方法的示意图;图4为本申请实施例提供的另一种提纯处理方法的示意图;图5为本申请实施例提供的基于图3和图4的一种提纯处理方法的示意图;图6为本申请实施例提供的一种基于图5的扩充处理方法的示意图;图7为本申请实施例提供的一种电子设备的结构示意图;图8为本申请实施例提供的一种声纹数据重排序装置的功能单元组成框图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本申请实施例所涉及到的电子设备可以是具备通信能力的电子设备,该电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(UserEquipment,UE),移动台(MobileStation,MS),终端设备(terminaldevice)等等。下面结合图1对本申请实施例中的声纹数据重排序方法的系统构架作详细说明,图1为本申请实施例提供的声纹数据重排序方法的系统构架图,包括语音识别单元110、预设声纹数据库120以及重排序单元130,其中,本文档来自技高网
...

【技术保护点】
1.一种声纹数据重排序方法,其特征在于,所述方法包括:/n从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;/n获取所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;/n对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;/n计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;/n基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。/n

【技术特征摘要】
1.一种声纹数据重排序方法,其特征在于,所述方法包括:
从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据;
获取所述相似声纹数据与所述目标声纹数据之间的第一相似度得分;
对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合;
计算所述目标优化最近邻集合与所述相似优化最近邻集合之间的第二相似度得分;
基于所述第一相似度得分和所述第二相似度得分进行计算,得到所述目标声纹数据和所述相似声纹数据的重排序数据。


2.根据权利要求1所述的方法,其特征在于,所述从预设声纹数据库中获取与目标声纹数据对应的相似声纹数据,包括:
计算所述目标声纹数据与所述预设声纹数据库中的预设声纹数据之间的余弦距离数据;
基于所述余弦距离数据的大小选取M个预设声纹数据作为所述相似声纹数据,所述M为正整数。


3.根据权利要求2所述的方法,其特征在于,所述计算所述相似声纹数据与所述目标声纹数据之间的第一相似度得分,包括:
基于所述余弦距离数据的大小得到所述目标声纹数据与所述M个相似声纹数据的M个第一相似度得分。


4.根据权利要求2所述的方法,其特征在于,所述对所述目标声纹数据对应的目标最近邻集合进行优化处理得到目标优化最近邻集合,以及,对所述相似声纹数据对应的相似最近邻集合进行优化处理得到相似优化最近邻集合,包括:
基于汉明距离和余弦距离检索出所述目标声纹数据对应的目标最近邻集合,以及,基于汉明距离和余弦距离检索出所述M个相似声纹数据对应的M个相似最近邻集合,所述目标最近邻集合包括K个第一相似样本,所述M个相似最近邻集合包括M×K个第二相似样本,所述K为正整数;
基于所述K个第一相似样本对所述目标最近邻集合进行提纯处理得到目标提纯最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似最近邻集合进行提纯处理得到M个相似提纯最近邻集合;
基于所述K个第一相似样本对所述目标提纯最近邻集合进行扩充处理得到目标优化最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似提纯最近邻集合进行扩充处理得到M个相似优化最近邻集合。


5.根据权利要求4所述的方法,其特征在于,所述基于所述K个第一相似样本对所述目标最近邻集合进行提纯处理得到目标提纯最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似最近邻集合进行提纯处理得到M个相似提纯最近邻集合,包括:
获取所述K个第一相似样本对应的K个第一样本最近邻集合,以及获取所述M×K个第二相似样本对应的M×K个第二样本最近邻集合;
计算所述K个第一样本最近邻集合与所述目标最近邻集合的K个第一重合度,以及,计算所述M×K个第二样本最近邻集合与所述M个相似最近邻集合的M×K个第二重合度;
筛选出所述K个第一相似样本中所述第一重合度大于预设重合阈值的第一相似样本作为第一提纯样本,以及,筛选出所述M×K个第二相似样本中所述第二重合度大于所述预设重合阈值的M组第二相似样本作为第二提纯样本;
保留所述第一提纯样本得到所述目标提纯最近邻集合,以及,保留所述第二提纯样本得到所述M个相似提纯最近邻集合。


6.根据权利要求4所述的方法,其特征在于,所述基于所述K个第一相似样本对所述目标最近邻集合进行提纯处理得到目标提纯最近邻集合,以及,基于所述M×K个第二相似样本对所述M个相似最近邻集合进行提纯处理得到M个相似提纯最近邻集合,包括:
获取所述K个第一相似样本对应的K个第一样本最近邻集合,以及获取所述M×...

【专利技术属性】
技术研发人员:孙伟李永超方昕黄志华柳林
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1