一种优化语音识别声学模型的方法及系统技术方案

技术编号：8834984 阅读：178 留言：0更新日期：2013-06-22 20:56

本发明专利技术提供了一种优化语音识别声学模型的方法及系统，涉及计算机技术领域，用以解决现有的优化语音识别声学模型的效率低下问题。方法包括：A1、采用语音识别声学模型对输入的语音段进行识别得到识别结果，以及获取所述输入的语音段的标注脚本；A2、将所述识别结果和标注脚本进行比对，获取被识别错误的语音段；A3、以所述被识别错误的语音段及其标注脚本更新语音识别声学模型的训练数据；A4、以更新后的训练数据对所述语音识别声学模型进行重训练。系统包括：获取单元、对比单元、更新单元和训练单元。本发明专利技术优化了语音识别声学模型的训练数据，提高了训练数据的质量，从而提高了对语音识别声学模型的优化效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别涉及一种优化语音识别声学模型的方法及相应的系统。
技术介绍
语音识别是一门交叉学科，语音识别正逐步成为信息技术中人机接口的关键技术，语音识别技术与语音合成技术结合使人们能够甩掉键盘，通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。目前语音识别的几种基本方法包括:基于声道声学和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。在语音搜索或语音输入系统中，用户不断输入语音数据，语音识别得出的识别结果有时会有所偏差，甚至无法正常识别、阅读或理解，因此需要不断对语音识别声学模型进行优化，通常采用的方式是对语音识别声学模型进行重训练。现有技术中采用的优化语音识别声学模型的方式为:对训练数据中的所有语音数据进行人工标注，采用人工标注的结果重训练语音识别声学模型。然而，由于训练数据的更新规模通常非常庞大，如果都采用人工标注的形式显然效率十分低下。
技术实现思路
本专利技术提供了一种优化语音识别声学模型的方法及系统，用以解决现有的优化语音识别声学模型的效率低下问题。具体技术方案如下:—种优化语音识别声学模型的方法，包括下列步骤:Al、采用语音识别声学模型对输入的语音段进行识别得到识别结果，以及获取所述输入的语音段的标注脚本；A2、将所述识别结果和标注脚本进行比对，获取被识别错误的语音段；A3、以所述被识别错误的语音段及其标注脚本更新语音识别声学模型的训练数据；A4、以更新后的训练数据对所述语音识别声学模型进行重训练。根据本专利技术一优选实施例，步骤A3中包括:以全部被识别错误的语音段及其标注脚本更新语音识...

【技术保护点】
一种优化语音识别声学模型的方法，其特征在于，包括下列步骤：A1、采用语音识别声学模型对输入的语音段进行识别得到识别结果，以及获取所述输入的语音段的标注脚本；A2、将所述识别结果和标注脚本进行比对，获取被识别错误的语音段；A3、以所述被识别错误的语音段及其标注脚本更新语音识别声学模型的训练数据；A4、以更新后的训练数据对所述语音识别声学模型进行重训练。

【技术特征摘要】
1.一种优化语音识别声学模型的方法，其特征在于，包括下列步骤: Al、采用语音识别声学模型对输入的语音段进行识别得到识别结果，以及获取所述输入的语音段的标注脚本； A2、将所述识别结果和标注脚本进行比对，获取被识别错误的语音段； A3、以所述被识别错误的语音段及其标注脚本更新语音识别声学模型的训练数据； A4、以更新后的训练数据对所述语音识别声学模型进行重训练。2.根据权利要求1所述的方法，其特征在于，所述步骤A3中包括: 以全部被识别错误的语音段及其标注脚本更新语音识别声学模型的训练数据；或者，对所述被识别错误的语音段进行过滤，以过滤后的语音段及其标注脚本更新语音识别声学模型的训练数据，过滤过程具体包括: A31、以所述标注脚本为依据，将被识别错误的语音段与其标注脚本强制对齐，并获取强制对齐后的语音段中的静音数据时长； A32、如果获取的所述静音数据时长大于预设的阈值，则过滤上述语音段。3.根据权利要求2所述的方法，其特征在于，所述步骤A31之前，还包括: A30、检测所述语音段中语音数据的端点，以及在所述语音数据的前后端各保留预设时长的静音数据。4.根据权利要求2所述的方法，其特征在于，步骤A32中所述的静音数据时长为强制对齐后的语音段中前端静音数据时长，或者为强制对齐后的语音段中后端静音数据时长，或者为强制对齐后的语音段中前、后端静音数据时长之和。5.根据权利要求1所述的方法，其特征在于，在步骤A2中确定被识别错误的语音段的权重；以及在步骤A4中根据所述权重和更新...

【专利技术属性】
技术研发人员：苏丹，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人