分布式声纹检索方法及系统技术方案

技术编号：35651073 阅读：18 留言：0更新日期：2022-11-19 16:46

本方案涉及一种分布式声纹检索方法及系统。所述方法包括：中心服务器训练声纹编码器并发给各个分布式存储端；各个分布式存储端构建本地声纹底库，并构建底库矩阵；中心服务器接收声纹查询数据，并根据声纹查询数据构建查询矩阵并广播至各个分布式存储端；各个分布式存储端接收查询矩阵，根据查询矩阵与底库矩阵进行声纹检索计算，得到打分矩阵并发送给中心服务器；中心服务器根据打分矩阵确定与声纹查询数据对应的说话人声纹检索结果。通过将声纹底库数据采用分布式存储的方式存储在各个存储端中，并通过查询矩阵和打分矩阵进行声纹查询，当存在大规模检索数据时，通过分布式存储端进行辅助声纹查询可以提高声纹检索的效率。端进行辅助声纹查询可以提高声纹检索的效率。端进行辅助声纹查询可以提高声纹检索的效率。

全部详细技术资料下载

【技术实现步骤摘要】
分布式声纹检索方法及系统

[0001]本专利技术涉及声纹检索
，特别是涉及一种分布式声纹检索方法及系统。

技术介绍

[0002]随着网络媒体的飞速发展，大量的语音和视频喷涌出现，声纹检索的用途也越来越广泛。声纹检索就是通过给定的语音，检索返回在数据库中与这段语音来自同一个说话人的一条或多条语音，通过进行声纹检索，可以检测各种侵权行为。
[0003]传统的声纹检索算法，通常先建立声纹数据库，然后将待检索的声纹与数据库中的声纹进行比对返回对应的检索结果。然而，传统的声纹检索算法不适用于大规模数据的情况，过高的存储开销和计算时间会降低检索的实用性和效率。

技术实现思路

[0004]基于此，为了解决上述技术问题，提供一种分布式声纹检索方法及系统，可以提高声纹检索的效率。
[0005]一种分布式声纹检索方法，所述方法包括：
[0006]中心服务器基于大规模脱敏录音数据训练声纹编码器，并将所述声纹编码器分发给各个分布式存储端；
[0007]各个所述分布式存储端构建本地声纹底库，并根据所述声纹底库中的声纹数据构建底库矩阵；
[0008]所述中心服务器接收声纹查询数据，并根据所述声纹查询数据构建查询矩阵，将所述查询矩阵广播至各个所述分布式存储端；
[0009]各个所述分布式存储端接收所述查询矩阵，根据所述查询矩阵与所述底库矩阵进行声纹检索计算，得到打分矩阵并发送给所述中心服务器；
[0010]所述中心服务器根据所述打分矩阵确定与所述声纹查询数据对应的说话人...

【技术保护点】

【技术特征摘要】
1.一种分布式声纹检索方法，其特征在于，所述方法包括：中心服务器基于大规模脱敏录音数据训练声纹编码器，并将所述声纹编码器分发给各个分布式存储端；各个所述分布式存储端构建本地声纹底库，并根据所述声纹底库中的声纹数据构建底库矩阵；所述中心服务器接收声纹查询数据，并根据所述声纹查询数据构建查询矩阵，将所述查询矩阵广播至各个所述分布式存储端；各个所述分布式存储端接收所述查询矩阵，根据所述查询矩阵与所述底库矩阵进行声纹检索计算，得到打分矩阵并发送给所述中心服务器；所述中心服务器根据所述打分矩阵确定与所述声纹查询数据对应的说话人声纹检索结果。2.根据权利要求1所述的分布式声纹检索方法，其特征在于，中心服务器基于大规模脱敏录音数据训练声纹编码器，包括：中心服务器接收声纹编码器训练数据，并将所述声纹编码器训练数据划分为第一标签数据和第二标签数据；所述中心服务器通过自监督学习在所述第二标签数据上初始化网络参数，得到基本收敛后的声纹编码器模型；所述中心服务器在所述第一标签数据上进行多分类训练精调网络直至基本收敛后的声纹编码器模型完全收敛，得到声纹编码器；其中，所述第一标签数据为有说话人标记的标签数据，所述第二标签数据为数据来源确定但没有说话人标记的标签数据。3.根据权利要求1所述的分布式声纹检索方法，其特征在于，各个所述分布式存储端构建本地声纹底库，包括：各个所述分布式存储端接收同一说话人的若干条录音样本；各个所述分布式存储端通过质量评估函数对每条所述录音样本的声纹编码进行质量评估，并得到评估分数；各个所述分布式存储端利用所述评估分数对每条所述录音样本的声纹编码进行线性加权融合，得到所述说话人的声纹表征；各个所述分布式存储端根据所述声纹表征构建本地声纹底库。4.根据权利要求3所述的分布式声纹检索方法，其特征在于，各个所述分布式存储端根据所述声纹底库中的声纹数据构建底库矩阵，包括：各个所述分布式存储端根据所述声纹编码器将所述声纹底库划分为若干个子声纹底库；各个所述分布式存储端根据各个所述子声纹底库构成各个子底库矩阵。5.根据权利要求4所述的分布式声纹检索方法，其特征在于，所述中心服务器接收声纹查询数据，并根据所述声纹查询数据构建查询矩阵，包括：所述中心服务器通过所述声纹编码器将待查询录音数据归一化为所述声纹查询数据；所述中心服务器将所述声纹查询数据划分为若干个子声纹查询数据；所述中心服务器根据若干个所...

【专利技术属性】
技术研发人员：张星东，招梓枫，丁卓，
申请(专利权)人：南京龙垣信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人