语音识别结果处理方法、装置、电子设备及介质制造方法及图纸

技术编号：23162911 阅读：43 留言：0更新日期：2020-01-21 22:12

本申请提供一种语音识别结果处理方法及装置、一种电子设备以及一种计算机可读介质。其中，所述方法包括：获取目标用户输入的针对参照词序列文本的待识别语音信息，并对待识别语音信息进行语音识别，得到对应的待标记词序列文本，将待标记词序列文本和参照词序列文本进行比对，得到比对结果，并基于比对结果确定所述语音识别的字错率，将待标记词序列文本进行拼音转换后，得到待标记词序列文本对应的标注拼音序列，基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记，并将标记结果输出。相较于现有技术，能够在一定程度上提升对于专业词汇的语音识别率，提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别结果处理方法、装置、电子设备及介质
本申请涉及语音识别
，具体涉及一种语音识别结果处理方法及装置、一种电子设备以及一种计算机可读介质。
技术介绍
语音识别技术随着计算机和相关软硬件技术的发展，已越来越多的应用在各个领域，其识别率也在不断的提高。在环境安静、发音标准等特定条件下，目前应用在语音识别输入文字系统的识别率已经达到95％以上。常规语音识别技术已比较成熟。但是对于一些专业词汇，若用户本身说话带有口音或者使用了方言、发音不标准的情况下，其识别率将大打折扣，影响精确操控，效果不够理想。若能采用其它方法来辅助判断以提高其语音识别的准确率，那么语音识别的实用性将显著提高。
技术实现思路
本申请的目的是提供一种语音识别结果处理方法及装置、一种电子设备以及一种计算机可读介质。本申请第一方面提供一种语音识别结果处理方法，包括：获取目标用户输入的针对参照词序列文本的待识别语音信息，并对所述待识别语音信息进行语音识别，得到所述待识别语音信息对应的待标记词序列文本；将所述待...

【技术保护点】
1.一种语音识别结果处理方法，其特征在于，包括：/n获取目标用户输入的针对参照词序列文本的待识别语音信息，并对所述待识别语音信息进行语音识别，得到所述待识别语音信息对应的待标记词序列文本；/n将所述待标记词序列文本和所述参照词序列文本进行比对，得到比对结果，并基于所述比对结果确定所述语音识别的字错率；/n将所述待标记词序列文本进行拼音转换后，得到待标记词序列文本对应的标注拼音序列；/n基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记，并将标记结果输出。/n

【技术特征摘要】
1.一种语音识别结果处理方法，其特征在于，包括：
获取目标用户输入的针对参照词序列文本的待识别语音信息，并对所述待识别语音信息进行语音识别，得到所述待识别语音信息对应的待标记词序列文本；
将所述待标记词序列文本和所述参照词序列文本进行比对，得到比对结果，并基于所述比对结果确定所述语音识别的字错率；
将所述待标记词序列文本进行拼音转换后，得到待标记词序列文本对应的标注拼音序列；
基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记，并将标记结果输出。

2.根据权利要求1所述的语音识别方法，其特征在于，所述将所述待标记词序列文本和所述参照词序列文本进行比对得到比对结果，并基于所述比对结果确定所述语音识别的字错率，包括：
对所述待标记词序列文本进行分词，得到多个待识别词单元；
将所述多个待识别词单元与所述参照词序列文本中的参照词单元进行比对，确定将所述待标记词序列文本转换为所述参照词序列文本需要更新的待识别词单元；将所述需要更新的待识别词单元记为所述比对结果；
基于所述需要更新的待识别词单元的个数以及所述参照词序列文本中的参照词单元的个数，确定所述语音识别的字错率。

3.根据权利要求2所述的语音识别方法，其特征在于，所述基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记，包括：
基于所述需要更新的待识别词单元和所述标注拼音序列确定所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音；
基于所述需要更新的待识别词单元在所述参照词序列文本中对应的参照词单元以及所述参照词序列文本对应的参照拼音序列，确定所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音；
根据所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音，以及所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音，确定所述需要更新的待识别词单元的错误类型；
基于所述错误类型以及所述错误类型对应的标记方式，对所述待标记词序列文本进行标记。

4.根据权利要求3所述的语音识别方法，其特征在于，所述方法还包括：
在对所述待标记词序列文本进行标记后，将所述标记结果中的待识别词单元以及该待识别词单元对应的参照拼音和标注拼音进行对应存储。

5.一种语音识别结果处理装置，其特征在于，包括：
识别模块，用于获取目标用户输入的针对参照词序列文本的待识...

【专利技术属性】
技术研发人员：陈剑超，肖龙源，李稀敏，蔡振华，刘晓葳，王静，
申请(专利权)人：厦门快商通科技股份有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人