语音识别结果处理方法、装置、电子设备及介质制造方法及图纸

技术编号:23162911 阅读:24 留言:0更新日期:2020-01-21 22:12
本申请提供一种语音识别结果处理方法及装置、一种电子设备以及一种计算机可读介质。其中,所述方法包括:获取目标用户输入的针对参照词序列文本的待识别语音信息,并对待识别语音信息进行语音识别,得到对应的待标记词序列文本,将待标记词序列文本和参照词序列文本进行比对,得到比对结果,并基于比对结果确定所述语音识别的字错率,将待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列,基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出。相较于现有技术,能够在一定程度上提升对于专业词汇的语音识别率,提升用户体验。

【技术实现步骤摘要】
语音识别结果处理方法、装置、电子设备及介质
本申请涉及语音识别
,具体涉及一种语音识别结果处理方法及装置、一种电子设备以及一种计算机可读介质。
技术介绍
语音识别技术随着计算机和相关软硬件技术的发展,已越来越多的应用在各个领域,其识别率也在不断的提高。在环境安静、发音标准等特定条件下,目前应用在语音识别输入文字系统的识别率已经达到95%以上。常规语音识别技术已比较成熟。但是对于一些专业词汇,若用户本身说话带有口音或者使用了方言、发音不标准的情况下,其识别率将大打折扣,影响精确操控,效果不够理想。若能采用其它方法来辅助判断以提高其语音识别的准确率,那么语音识别的实用性将显著提高。
技术实现思路
本申请的目的是提供一种语音识别结果处理方法及装置、一种电子设备以及一种计算机可读介质。本申请第一方面提供一种语音识别结果处理方法,包括:获取目标用户输入的针对参照词序列文本的待识别语音信息,并对所述待识别语音信息进行语音识别,得到所述待识别语音信息对应的待标记词序列文本;将所述待标记词序列文本和所述参照词序列文本进行比对,得到比对结果,并基于所述比对结果确定所述语音识别的字错率;将所述待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列;基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出。在一些可能的实现方式中,所述将所述待标记词序列文本和所述参照词序列文本进行比对得到比对结果,并基于所述比对结果确定所述语音识别的字错率,包括:对所述待标记词序列文本进行分词,得到多个待识别词单元;将所述多个待识别词单元与所述参照词序列文本中的参照词单元进行比对,确定将所述待标记词序列文本转换为所述参照词序列文本需要更新的待识别词单元;将所述需要更新的待识别词单元记为所述比对结果;基于所述需要更新的待识别词单元的个数以及所述参照词序列文本中的参照词单元的个数,确定所述语音识别的字错率。在一些可能的实现方式中,所述基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,包括:基于所述需要更新的待识别词单元和所述标注拼音序列确定所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音;基于所述需要更新的待识别词单元在所述参照词序列文本中对应的参照词单元以及所述参照词序列文本对应的参照拼音序列,确定所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音;根据所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音,以及所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音,确定所述需要更新的待识别词单元的错误类型;基于所述错误类型以及所述错误类型对应的标记方式,对所述待标记词序列文本进行标记。在一些可能的实现方式中,上述方法还包括:在对所述待标记词序列文本进行标记后,将所述标记结果中的待识别词单元以及该待识别词单元对应的参照拼音和标注拼音进行对应存储。本申请第二方面提供一种语音识别结果处理装置,包括:识别模块,用于获取目标用户输入的针对参照词序列文本的待识别语音信息,并对所述待识别语音信息进行语音识别,得到所述待识别语音信息对应的待标记词序列文本;比对模块,用于将所述待标记词序列文本和所述参照词序列文本进行比对,得到比对结果,并基于所述比对结果确定所述语音识别的字错率;转换模块,用于将所述待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列;标记模块,用于基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出。在一些可能的实现方式中,所述比对模块,具体用于:对所述待标记词序列文本进行分词,得到多个待识别词单元;将所述多个待识别词单元与所述参照词序列文本中的参照词单元进行比对,确定将所述待标记词序列文本转换为所述参照词序列文本需要更新的待识别词单元;将所述需要更新的待识别词单元记为所述比对结果;基于所述需要更新的待识别词单元的个数以及所述参照词序列文本中的参照词单元的个数,确定所述语音识别的字错率。在一些可能的实现方式中,所述标记模块,具体用于:基于所述需要更新的待识别词单元和所述标注拼音序列确定所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音;基于所述需要更新的待识别词单元在所述参照词序列文本中对应的参照词单元以及所述参照词序列文本对应的参照拼音序列,确定所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音;根据所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音,以及所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音,确定所述需要更新的待识别词单元的错误类型;基于所述错误类型以及所述错误类型对应的标记方式,对所述待标记词序列文本进行标记。在一些可能的实现方式中,所述装置还包括存储模块,用于:在对所述待标记词序列文本进行标记后,将所述标记结果中的待识别词单元以及该待识别词单元对应的参照拼音和标注拼音进行对应存储。本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。本申请第四方面提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。相较于现有技术,本申请第一方面提供的语音识别结果处理方法,通过获取目标用户输入的针对参照词序列文本的待识别语音信息,并对所述待识别语音信息进行语音识别,得到所述待识别语音信息对应的待标记词序列文本,将所述待标记词序列文本和所述参照词序列文本进行比对,得到比对结果,并基于所述比对结果确定所述语音识别的字错率,将所述待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列,基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出。由于是基于参照词序列文本进行语音识别结果的标记,使得可以准确对语音识别结果中识别错误的部分进行标记定位,因此,相较于现有技术,能够在一定程度上提升对于专业词汇的语音识别率,提升用户体验。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本申请的一些实施方式所提供的一种语音识别结果处理方法的流程图;图2示出了本申请的一些实施方式所提供的一种语音本文档来自技高网...

【技术保护点】
1.一种语音识别结果处理方法,其特征在于,包括:/n获取目标用户输入的针对参照词序列文本的待识别语音信息,并对所述待识别语音信息进行语音识别,得到所述待识别语音信息对应的待标记词序列文本;/n将所述待标记词序列文本和所述参照词序列文本进行比对,得到比对结果,并基于所述比对结果确定所述语音识别的字错率;/n将所述待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列;/n基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出。/n

【技术特征摘要】
1.一种语音识别结果处理方法,其特征在于,包括:
获取目标用户输入的针对参照词序列文本的待识别语音信息,并对所述待识别语音信息进行语音识别,得到所述待识别语音信息对应的待标记词序列文本;
将所述待标记词序列文本和所述参照词序列文本进行比对,得到比对结果,并基于所述比对结果确定所述语音识别的字错率;
将所述待标记词序列文本进行拼音转换后,得到待标记词序列文本对应的标注拼音序列;
基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,并将标记结果输出。


2.根据权利要求1所述的语音识别方法,其特征在于,所述将所述待标记词序列文本和所述参照词序列文本进行比对得到比对结果,并基于所述比对结果确定所述语音识别的字错率,包括:
对所述待标记词序列文本进行分词,得到多个待识别词单元;
将所述多个待识别词单元与所述参照词序列文本中的参照词单元进行比对,确定将所述待标记词序列文本转换为所述参照词序列文本需要更新的待识别词单元;将所述需要更新的待识别词单元记为所述比对结果;
基于所述需要更新的待识别词单元的个数以及所述参照词序列文本中的参照词单元的个数,确定所述语音识别的字错率。


3.根据权利要求2所述的语音识别方法,其特征在于,所述基于所述比对结果、所述参照词序列文本对应的参照拼音序列、所述标注拼音序列对所述待标记词序列文本进行标记,包括:
基于所述需要更新的待识别词单元和所述标注拼音序列确定所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音;
基于所述需要更新的待识别词单元在所述参照词序列文本中对应的参照词单元以及所述参照词序列文本对应的参照拼音序列,确定所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音;
根据所述需要更新的待识别词单元中每个待识别词单元对应的标注拼音,以及所述需要更新的待识别词单元对应的参照词单元中每个参照词单元对应的参照拼音,确定所述需要更新的待识别词单元的错误类型;
基于所述错误类型以及所述错误类型对应的标记方式,对所述待标记词序列文本进行标记。


4.根据权利要求3所述的语音识别方法,其特征在于,所述方法还包括:
在对所述待标记词序列文本进行标记后,将所述标记结果中的待识别词单元以及该待识别词单元对应的参照拼音和标注拼音进行对应存储。


5.一种语音识别结果处理装置,其特征在于,包括:
识别模块,用于获取目标用户输入的针对参照词序列文本的待识...

【专利技术属性】
技术研发人员:陈剑超肖龙源李稀敏蔡振华刘晓葳王静
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1