【技术实现步骤摘要】
特定领域的语音识别模型的构建方法
本专利技术涉及语音识别的神经网络算法领域,尤其涉及一种特定领域的语音识别模型的构建方法。
技术介绍
目前,智能呼叫中心通常使用语音识别模型来实现实时语音识别,面对涉及特定领域的对话所产生的交流语音时,普通的语音识别模型对所述特定领域包含的专业名词、术语识别率欠佳,往往需要针对所述特定领域构建语音识别率达标的语音识别模型。若训练一个全新的语音识别模型,并使其满足所述特定领域的语音识别率要求,需要提供大量的训练样本以及占用大量的计算资源,来进行长时间训练计算,因此构建所述语音识别模型所需花费的时间成本和硬件成本一直难以得到控制。
技术实现思路
为了克服现有技术中的上述缺陷,本专利技术提供了一种特定领域的语音识别模型的构建方法,该方法包括:S1.将特定领域的音频数据进行文本转录,以构建所述音频数据及其对应的转录文本组成的训练集;S2.将所述训练集输入一现有的语音识别模型,对所述语音识别模型执行针对所述特定领域的迁移学习训练;S3.选择所述训练集的一个子集 ...
【技术保护点】
1.一种特定领域的语音识别模型的构建方法,该方法包括:/nS1.将特定领域的音频数据进行文本转录,以构建所述音频数据及其对应的转录文本组成的训练集;/nS2.将所述训练集输入一现有的语音识别模型,对所述语音识别模型执行针对所述特定领域的迁移学习训练;/nS3.选择所述训练集的一个子集,将所述子集输入所述语音识别模型进行语音识别测试;/nS4.校准所述语音识别测试的输出结果,根据校准后的输出结果更新所述子集,将所述子集输入所述语音识别模型,对所述语音模型执行迭代训练;/nS5.利用根据所述训练集生成的语言模型,对所述语音识别模型进行超参数调整处理,获得特定领域的语音识别模型。/n
【技术特征摘要】
1.一种特定领域的语音识别模型的构建方法,该方法包括:
S1.将特定领域的音频数据进行文本转录,以构建所述音频数据及其对应的转录文本组成的训练集;
S2.将所述训练集输入一现有的语音识别模型,对所述语音识别模型执行针对所述特定领域的迁移学习训练;
S3.选择所述训练集的一个子集,将所述子集输入所述语音识别模型进行语音识别测试;
S4.校准所述语音识别测试的输出结果,根据校准后的输出结果更新所述子集,将所述子集输入所述语音识别模型,对所述语音模型执行迭代训练;
S5.利用根据所述训练集生成的语言模型,对所述语音识别模型进行超参数调整处理,获得特定领域的语音识别模型。
2.根据权利要求1所述的特定领域的语音识别模型的构建方法,在执行步骤S5之前,该方法还包括:
S6.重复执行步骤S3和步骤S4,直至所述语音识别模型满足预定的准确率。
3.根据权利要求1所述的特定领域的语音识别模型的构建方法,其中,步骤S3中选择所述训练集的一个子集的步骤包括:
从所述训练集中选择多个具有预定准确率的元素组成所述子集。
...
【专利技术属性】
技术研发人员:刘利平,张欣,孔卫东,
申请(专利权)人:北京青牛技术股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。