一种基于核心帧筛选的模型得分优化方法技术

技术编号：29679413 阅读：28 留言：0更新日期：2021-08-13 22:02

本发明专利技术公开了一种基于核心帧筛选的模型得分优化方法，具体步骤为：S1.使用训练数据进行训练获取模型参数；S2.计算各帧语音在语音中的重要度权重；S3.按照重要度权重排序选取各个语音的核心帧；S4.使用核心帧数据训练获取模型参数；S5.通过计算重要度权重选取测试语音的核心帧；S6.对测试语音的核心帧进行打分得到语音的得分进行决策。通过本发明专利技术得分优化方法可以选取语音中高质量的核心帧作为打分依据，以提升检测性能，该方法适用于语音识别、说话人识别、伪造语音识别等语音分类场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于核心帧筛选的模型得分优化方法
本专利技术属于语音识别
，具体涉及一种基于核心帧筛选的模型得分优化方法。
技术介绍
声纹认证系统作为一种生物认证的方式，具有采集成本低、易于获取、方便远程认证等等优势，已经广泛应用于门禁系统、金融交易和司法鉴定等等领域。随着语音合成技术飞速发展，一方面给人们带来了更方便的服务和更良好的用户体验，如真声智能客服、真声智能导航、有声读物、智能语音呼叫等等；另一方面也给声纹认证系统的安全性带来了巨大的挑战，如利用合成语音攻击声纹认证系统使其性能显著下降，因此关于合成语音检测的研究具有重要的意义。合成语音检测的目的就是从真实语音中将合成语音检测出来。主流的GMM检测系统中，当进行到测试阶段，首先提取测试语音的语音特征序列，然后通过训练好的GMM模型，计算出各帧得分，然后对各帧的得分求取均值作为该测试语音的得分，进行决策判断；而实际上当通过人耳听辨语音真假的时候，并不会平均关注到每一帧的信息，我们会更多的关注到一些特别的帧，比如停顿连贯性、多音字读音准确性以及断句方式自然性等等，因此GMM均值打分法在合成语音检测中是具有不合理性的，进行得分方法优化成为一个值得关注的课题。
技术实现思路
为了解决得分优化的问题，本专利技术提出了一种基于核心帧筛选的模型得分优化方法，使用该方法可以选取语音中高质量的核心帧作为打分依据，以提升检测性能。一种基于核心帧筛选的模型得分优化方法，包括如下步骤：S1.利用训练语音训练原始模型；S2.利用原始模型计...

【技术保护点】
1.一种基于核心帧筛选的模型得分优化方法，包括如下步骤：/nS1.利用训练语音训练原始模型；/nS2.利用原始模型计算训练语音中各帧的重要度权重；/nS3.按照重要度权重排序选取每条训练语音的核心帧；/nS4.利用训练语音的核心帧训练核心模型；/nS5.利用原始模型计算测试语音中各帧的重要度权重；/nS6.按照重要度权重排序选取每条测试语音的核心帧；/nS7.将测试语音的核心帧输入核心模型中计算匹配得分，该得分即为优化后的模型得分。/n

【技术特征摘要】
20200430 CN 20201036138111.一种基于核心帧筛选的模型得分优化方法，包括如下步骤：
S1.利用训练语音训练原始模型；
S2.利用原始模型计算训练语音中各帧的重要度权重；
S3.按照重要度权重排序选取每条训练语音的核心帧；
S4.利用训练语音的核心帧训练核心模型；
S5.利用原始模型计算测试语音中各帧的重要度权重；
S6.按照重要度权重排序选取每条测试语音的核心帧；
S7.将测试语音的核心帧输入核心模型中计算匹配得分，该得分即为优化后的模型得分。

2.根据权利要求1所述的模型得分优化方法，其特征在于：所述步骤S1的具体实现方式为：对于N类语音识别任务，将所有训练语音按照所属类别划分为N个集合，依次对各个集合中的训练语音提取特征后分别进行训练以获得各类语音的原始模型，即N个原始模型，用于之后计算似然得分，N为大于1的自然数即设定的语音类别数。

3.根据权利要求1所述的模型得分优化方法，其特征在于：所述步骤S2的具体实现方式为：对于任一条训练语音，分别计算其中各帧在对应类别原始模型中的似然得分，进而对各帧的似然得分进行...

【专利技术属性】
技术研发人员：杨莹春，魏含玉，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人