语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:21955272 阅读:37 留言:0更新日期:2019-08-24 19:07
本发明专利技术涉及语音交互技术领域,公开了一种语音识别方法、装置、设备及计算机可读存储介质,所述语音识别方法包括:获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果;将所述原始文字识别结果转换成原始拼音字符串;查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串;从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。通过本发明专利技术,在得到语音识别结果后,进一步对语音识别结果进行纠错处理,避免了因音调识别错误而造成语音识别结果出错,提高了语音识别的准确率。

Speech Recognition Method, Device, Equipment and Computer Readable Storage Media

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读存储介质
本专利技术涉及语音交互
,尤其涉及一种语音识别方法、装置、设备及计算机可读存储介质。
技术介绍
目前,在语音交互业务中,一般是将用户语音识别为文字,然后根据识别到的文字进行业务处理。单对中文语音进行识别时,因为用户发音不标准或当前识别机制的缺陷,往往会将某个字的声调识别错误,例如,用户想要表达的是“补领驾驶证”,若识别为“不领驾驶证”,则导致业务处理出错,影响用户体验。
技术实现思路
本专利技术的主要目的在于提供一种语音识别方法、装置、设备及计算机可读存储介质,旨在解决现有技术中由于识别机制的缺陷,往往会将某个字的声调识别错误的技术问题。为实现上述目的,本专利技术提供一种语音识别方法,所述语音识别方法包括以下步骤:获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果将所述原始文字识别结果转换成原始拼音字符串;查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。可选地,所述查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串的步骤包括:显示业务主题选择界面,接收选择指令;基于所述选择指令,确定目标业务主题;根据所述目标业务主题,查找所述预置数据库中的对应目标数据表;确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串。可选地,在所述查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串的步骤之前,还包括:创建业务主题对应的数据表;获取业务主题对应的历史业务提问记录,所述历史业务提问记录中包含若干个业务提问;获取每个业务提问对应的拼音字串符;将业务提问及对应的拼音字串符关联存储至所述数据表中;基于所述数据表,构建所述预置数据库。可选地,所述确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串的步骤包括:计算所述原始拼音字符串与所述目标数据表中存储的各个拼音字符串的编辑距离;基于所述编辑距离,得到所述原始拼音字符串与所述各个拼音字符串的相似度;确定最高相似度对应的拼音字符串为目标字符串。可选地,在所述确定最高相似度对应的拼音字符串为目标字符串的步骤之后,还包括:检测所述最高相似度是否大于或等于预设阈值;若所述最高相似度大于或等于预设阈值,则执行获取所述目标拼音字符串对应的目标文字,并输出所述目标文字的步骤。可选地,在所述检测所述最高相似度是否大于或等于预设阈值的步骤之后,还包括:若所述最高相似度小于预设阈值,则显示文字输入界面;接收基于所述文字输入界面输入的文字信息,并输出所述文字信息。可选地,在所述接收基于所述文字输入界面输入的文字信息,并输出所述文字信息之后,还包括:获取所述文字信息对应的拼音字符串,并将所述文字信息以及所述文字信息对应的拼音字符串关联保存至所述目标数据表。此外,为实现上述目的,本专利技术还提供一种语音识别装置,所述语音识别装置包括:识别模块,用于获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果;转换模块,用于将所述原始文字识别结果转换成原始拼音字符串;查找模块,用于查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串;输出模块,用于从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。可选地,所述查找模块包括:指令接收单元,用于显示业务主题选择界面,接收选择指令;主题确定单元,用于基于所述选择指令,确定目标业务主题;数据表确定单元,用于根据所述目标业务主题,查找所述预置数据库中的对应目标数据表;拼音字符串确定单元,用于确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串。可选地,所述语音识别装置还包括:创建模块,用于创建业务主题对应的数据表;获取模块,用于获取业务主题对应的历史业务提问记录,所述历史业务提问记录中包含若干个业务提问;获取每个业务提问对应的拼音字串符;存储模块,用于将业务提问及对应的拼音字串符关联存储至所述数据表中;构建模块,用于基于所述数据表,构建预置数据库。可选地,所述拼音字符串确定单元包括:计算子单元,用于计算所述原始拼音字符串与所述目标数据表中存储的各个拼音字符串的编辑距离;换算子单元,用于基于所述编辑距离,得到所述原始拼音字符串与所述各个拼音字符串的相似度;确定子单元,用于确定最高相似度对应的拼音字符串为目标字符串。可选地,所述语音识别装置还包括:检测模块,用于检测所述最高相似度是否大于或等于预设阈值;第一判定模块,用于若所述最高相似度大于或等于预设阈值,则执行获取所述目标拼音字符串对应的目标文字,并输出所述目标文字的步骤。可选地,所述语音识别装置还包括:第一判定模块,用于若所述最高相似度小于预设阈值,则显示文字输入界面;所述输出模块,还用于接收基于所述文字输入界面输入的文字信息,并输出所述文字信息。可选地,所述语音识别装置还包括:更新模块,用于获取所述文字信息对应的拼音字符串,并将所述文字信息以及所述文字信息对应的拼音字符串关联保存至所述目标数据表。此外,为实现上述目的,本专利技术还提供一种语音识别设备,所述语音识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音识别程序,所述语音识别程序被所述处理器执行时实现如上所述的语音识别方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音识别程序,所述语音识别程序被处理器执行时实现如上所述的语音识别方法的步骤。本专利技术中,将接收到的语音识别为原始文字后,将原始文字转化成原始拼音,然后从数据库中查找与原始拼音最相似的目标拼音,最后输出目标拼音对应的目标文字。即在本专利技术中,在得到语音识别结果后,进一步对语音识别结果进行纠错处理,避免了因音调识别错误而造成语音识别结果出错,提高了语音识别的准确率。附图说明图1为本专利技术实施例方案涉及的硬件运行环境的语音识别设备结构示意图;图2为本专利技术语音识别方法一实施例的流程示意图;图3为本专利技术语音识别装置一实施例的功能模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1为本专利技术实施例方案涉及的硬件运行环境的语音识别设备结构示意图。本专利技术实施例语音识别设备可以是PC,也可以是智能手机、平板电脑、便携计算机等终端设备。如图1所示,该语音识别设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选地还可以是独立于前述处本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤:获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果;将所述原始文字识别结果转换成原始拼音字符串;查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串;从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤:获取语音信息,并对所述语音信息进行语音识别,得到原始文字识别结果;将所述原始文字识别结果转换成原始拼音字符串;查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串;从所述预置数据库中获取所述目标拼音字符串对应的目标文字,并输出所述目标文字以作为语音识别的最终结果。2.如权利要求1所述的语音识别方法,其特征在于,所述查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串的步骤包括:显示业务主题选择界面,接收选择指令;基于所述选择指令,确定目标业务主题;根据所述目标业务主题,查找所述预置数据库中的对应目标数据表;确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串。3.如权利要求2所述的语音识别方法,其特征在于,在所述查找预置数据库中与所述原始拼音字符串相似度最高的目标拼音字符串的步骤之前,还包括:创建业务主题对应的数据表;获取业务主题对应的历史业务提问记录,所述历史业务提问记录中包含若干个业务提问;获取每个业务提问对应的拼音字串符;将业务提问及对应的拼音字串符关联存储至所述数据表中;基于所述数据表,构建所述预置数据库。4.如权利要求2所述的语音识别方法,其特征在于,所述确定所述目标数据表中与所述原始拼音字符串相似度最高的拼音字符串为目标拼音字符串的步骤包括:计算所述原始拼音字符串与所述目标数据表中存储的各个拼音字符串的编辑距离;基于所述编辑距离,得到所述原始拼音字符串与所述各个拼音字符串的相似度;确定最高相似度对应的拼音字符串为目标字符串。5.如权利要求4所述的语音识别方法,其特征在于,在所述确定最高相...

【专利技术属性】
技术研发人员:魏韬马骏王少军
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1