一种基于测试反馈的核心训练语音选择方法技术

技术编号：29590374 阅读：17 留言：0更新日期：2021-08-06 19:50

本发明专利技术公开了一种基于测试反馈的核心训练语音选择方法，该方法利用获取的测试语音进行训练建立参考模型，然后计算原始训练语音在参考模型上的似然得分，再依据似然得分对各类语音进行排序，按照一定的比例对排序后的各类语音进行选择后得到核心训练语音。通过本发明专利技术提供的数据选择方法，可以根据测试结果反馈来筛选高质量的训练语音，所得的核心训练语音结合了实际应用信息反馈，因而未来的识别性能更佳；本发明专利技术方法适用于语音识别、说话人识别、伪造语音识别等语音分类场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于测试反馈的核心训练语音选择方法
本专利技术属于语音识别
，具体涉及一种基于测试反馈的核心训练语音选择方法。
技术介绍
声纹认证系统作为一种生物认证的方式，具有采集成本低、易于获取、方便远程认证等等优势，已经广泛应用于门禁系统、金融交易和司法鉴定等等领域。随着语音合成技术飞速发展，一方面给人们带来了更方便的服务和更良好的用户体验，如真声智能客服、真声智能导航、有声读物、智能语音呼叫等等，另一方面也给声纹认证系统的安全性带来了巨大的挑战，如利用合成语音攻击声纹认证系统使其性能显著下降，因此关于合成语音检测的研究具有重要的意义。合成语音检测的目的就是从真实语音中将合成语音检测出来。现有的关于合成语音检测的实验研究都是按照比赛设定的训练集进行训练的，通常会使用大量的训练数据；然而在实际情况中，当使用更多的训练数据时，性能反而有所下降，因为训练数据中是存在冗余的，进行数据选择是有必要的。在实际工程问题中，会遇到这样的场景：测试是分阶段进行的，一开始我们可以接触到一小部分测试数据，相当于具备了一些关于测试环境的先验知识，如何根据这一小部分测试数据去选择我们的训练数据，得到更优的模型，以便在后续的测试阶段取得更好的性能，是一个值得探讨的实际问题。
技术实现思路
当语音分类系统在实际运行中获取一定量的测试数据后，如何利用其来更新语音分类模型，使得未来的识别性能更佳；针对这个问题，本专利技术提出了一种基于测试反馈的核心训练语音选择方法，通过该方法可以利用已有的测试数据来选取高质量的核心训练语音...

【技术保护点】
1.一种基于测试反馈的核心训练语音选择方法，包括如下步骤：/nS1.利用已知的部分测试语音进行训练获取参考模型；/nS2.计算所有训练语音在参考模型上的匹配得分；/nS3.对每类集合内的每条训练语音按照其模型得分依次进行排序；/nS4.根据一定比例逐类选取排名靠前的训练语音作为核心训练语音。/n

【技术特征摘要】
20200429 CN 20201035685721.一种基于测试反馈的核心训练语音选择方法，包括如下步骤：
S1.利用已知的部分测试语音进行训练获取参考模型；
S2.计算所有训练语音在参考模型上的匹配得分；
S3.对每类集合内的每条训练语音按照其模型得分依次进行排序；
S4.根据一定比例逐类选取排名靠前的训练语音作为核心训练语音。

2.根据权利要求1所述的核心训练语音选择方法，其特征在于：所述步骤S1的具体实现方式为：对于N类语音分类任务，将已知的部分测试语音按照所属类别划分为N个集合，依次对各个集合中的测试语音提取特征后分别进行训练以获得各类语音的参考模型，即N个参考模型，N为大于1的自然数即设定的语音类别数。

...

【专利技术属性】
技术研发人员：杨莹春，魏含玉，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人