声学模型训练方法、装置、设备及计算机可读介质制造方法及图纸

技术编号：20285841 阅读：46 留言：0更新日期：2019-02-10 18:08

本发明专利技术提出一种声学模型训练方法，包括：对输入的语音进行识别，得到所述语音数据对应的文本；当检测到对所述文本的修改操作时，获取修改数据；将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练。本发明专利技术实施例利用客户端上实际收集到的同源数据并将其转换成有效的新训练数据，相对于原始的人工标注数据方式大幅节省时间和人力，同时大量增加数据积累。

Acoustic model training methods, devices, equipment and computer readable media

The present invention proposes an acoustic model training method, which includes: recognizing the input voice and obtaining the corresponding text of the voice data; acquiring the modified data when the modification operation of the text is detected; and inputting the modified data as new training data and original training data into the acoustic model for training. The embodiment of the present invention utilizes the same source data actually collected on the client side and converts it into effective new training data. Compared with the original manual labeling data method, it saves time and manpower greatly, and increases data accumulation substantially.

全部详细技术资料下载

【技术实现步骤摘要】
声学模型训练方法、装置、设备及计算机可读介质
本专利技术涉及人工智能领域，尤其涉及一种声学模型训练方法及装置、设备和计算机可读介质。
技术介绍
目前，随着语音识别技术的发展，越来越多产品采用了语音识别技术。例如，采用语音输入法等。而在具有语音识别功能的程序中，识别结果有时与用户实际想输入的内容不完全一致。为了提高语音识别的准确率，一般采用声学模型对语音识别进行训练。首先通过从数据供应商直接购买或公司内部的标注团队对某一来源的数据进行标注获得训练数据，之后将处理好的训练数据加入到模型训练中，通过调整各种训练数据的比例和训练参数提升模型性能。然而，由于声学模型训练一般数据获取方案需进行人工标注，语音数据需花费大量人力、财力、时间进行标注及重检。另外，无法保证采集到的音频数据与客户端数据同源，可能造成训练有偏。
技术实现思路
本专利技术实施例提供一种声学模型训练方法、装置、设备及计算机可读介质，以解决或缓解现有技术中的一个或多个技术问题。第一方面，本专利技术实施例提供了一种声学模型训练方法，包括：对输入的语音进行识别，得到所述语音数据对应的文本；当检测到对所述文本的修改操作...

【技术保护点】
1.一种声学模型训练方法，其特征在于，包括：对输入的语音进行识别，得到所述语音数据对应的文本；当检测到对所述文本的修改操作时，获取修改数据；将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练。

【技术特征摘要】
1.一种声学模型训练方法，其特征在于，包括：对输入的语音进行识别，得到所述语音数据对应的文本；当检测到对所述文本的修改操作时，获取修改数据；将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练。2.根据权利要求1所述的方法，其特征在于，所述当检测到对所述文本的修改操作时，获取修改数据，包括：检测文本的修改内容，剔除修改数据中对标点符号的修改数据；检测文本中文字的修改后文本字数，保留与修改前文本字数相同的修改数据。3.根据权利要求1所述的方法，其特征在于，所述将所述修改数据作为新的训练数据和原始训练数据一起输入至声学模型进行训练包括：从声学模型的原始数据输入层输入原始训练数据；从声学模型的新数据输入层输入新的训练数据；在声学模型的隐层中对原始训练数据和新的训练数据进行训练；从声学模型的原始数据输出层输出原始训练数据的识别标签；从声学模型的新数据输出层输出新训练数据的识别标签。4.根据权利要求1所述的方法，其特征在于，所述新的训练数据和原始训练数据的数据量比例为：1:1～1:2之间。5.一种声学模型训练装置，其特征在于，包括：识别模块，用于对输入的语音进行识别，得到所述语音数据对应的文本；修改检测模块，用于当检测到对所述文本的修改操作时，获取修改数据；训练模块，用于将所述修改数据作为新的训练数据和原始训练数...

【专利技术属性】
技术研发人员：霍昱光，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人