一种语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号:21435557 阅读:29 留言:0更新日期:2019-06-22 12:58
本发明专利技术实施例提出一种语音识别方法、装置、设备及存储介质,其中方法包括:接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据;所述常用文本数据为出现次数超过预设阈值的语音识别结果;如果存在,则采用所述常用文本数据替换所述第一文本数据。发明专利技术实施例能够提高语音识别的准确率。

【技术实现步骤摘要】
一种语音识别方法、装置、设备及存储介质
本专利技术涉及语音识别
,尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
语音识别识别技术是一种对用户的语音数据进行识别的技术。语音识别作为一种常用的人机交互技术,目前已广泛应用于各类电子产品中。但是,现有的语音识别结果经常会出现错误,极大地影响用户使用体验。特别是在进行离线语音识别时,由于终端设备的计算能力相比服务器较弱,出现语音识别错误的可能性更大。
技术实现思路
本专利技术实施例提供一种语音识别方法及装置,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种语音识别方法,包括:接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据;所述常用文本数据为出现次数超过预设阈值的语音识别结果;如果存在,则采用所述常用文本数据替换所述第一文本数据。在一种实施方式中,所述对所述语音数据进行语音识别,包括:对所述语音数据进行离线语音识别;所述常用文本数据为出现次数超过预设阈值的在线语音识别的结果。在一种实施方式中,预先设置所述固定数据表的方式为:对语音数据进行在线语音识别,得到所述语音数据对应的第二文本数据;判断所述第二文本数据的语义类型是否为可离线处理的语义类型;如果是,则对所述第二文本数据进行分词处理;针对分词处理后的各个词语及所述第二文本数据,判断所述固定数据表中是否包含所述词语或第二文本数据;如果不包含,则更新临时数据表记录的所述词语或第二文本数据的出现次数,并将出现次数达到预设阈值的词语或第二文本数据记录至所述固定数据表,作为所述固定数据表中的常用文本数据。在一种实施方式中,上述方法还包括:当所述临时数据表的存储量达到存储上限时,按照最近最少使用方式释放所述临时数据表的存储空间。在一种实施方式中,所述固定数据表还保存所述常用文本数据对应的语义解析结果;所述判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据之后,还包括:如果存在,则从所述固定数据表中提取所述常用文本数据对应的语义解析结果。在一种实施方式中,所述判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据,包括:将所述第一文本数据分别与所述固定数据表中的各个常用文本数据进行对比,所述对比的方式为将相同位置的音素逐一进行对比;当音素对比结果相同的比例超过预设比例门限时,判定所述常用文本数据与所述第一文本数据的发音相似度达到预设条件。第二方面,本专利技术实施例还提供了一种语音识别装置,包括:初步识别模块,用于接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断模块,用于判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据;所述常用文本数据为出现次数超过预设阈值的语音识别结果;替换模块,用于在所述固定数据表中存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据时,采用所述常用文本数据替换所述第一文本数据。在一种实施方式中,所述初步识别模块,用于对所述语音数据进行离线语音识别;所述装置还包括:数据库设置模块,用于设置所述固定数据表,所述固定数据表包含一个以上常用文本数据,所述常用文本数据为出现次数超过预设阈值的在线语音识别的结果。在一种实施方式中,所述数据库设置模块,用于针对对语音数据进行在线语音识别得到的第二文本数据,判断所述第二文本数据的语义类型是否为可离线处理的语义类型;如果是,则对所述第二文本数据进行分词处理;针对分词处理后的各个词语及所述第二文本数据,判断所述固定数据表中是否包含所述词语或第二文本数据;如果不包含,则更新临时数据表记录的所述词语或第二文本数据的出现次数,并将出现次数达到预设阈值的词语或第二文本数据记录至所述固定数据表,作为所述固定数据表中的常用文本数据。在一种实施方式中,所述数据库设置模块,还用于当所述临时数据表的存储量达到存储上限时,按照最近最少使用方式释放所述临时数据表的存储空间。在一种实施方式中,所述固定数据表还保存所述常用文本数据对应的语义解析结果;所述替换模块还用于,在所述固定数据表中存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据时,从所述固定数据表中提取所述常用文本数据对应的语义解析结果。在一种实施方式中,所述判断模块用于,将所述第一文本数据分别与所述固定数据表中的各个常用文本数据进行对比,所述对比的方式为将相同位置的音素逐一进行对比;当音素对比结果相同的比例超过预设比例门限时,判定所述常用文本数据与所述第一文本数据的发音相似度达到预设条件。第三方面,本专利技术实施例提供了一种语音识别设备,所述设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述设备的结构中包括处理器和存储器,所述存储器用于存储支持所述语音识别设备执行上述语音识别方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述设备还可以包括通信接口,用于与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储语音识别设备所用的计算机软件指令,其包括用于执行上述语音识别方法所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:本专利技术实施例提出的语音识别方法和装置,在对语音数据进行语音识别并得到第一文本数据后,如果在固定数据表中查找到与该第一文本数据发音相似的常用文本数据,则采用该常用文本数据替换第一文本数据。通过这种方式,可以实现对语音识别结果的修正,从而提高语音识别的准确率。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例的一种语音识别方法实现流程图;图2为本专利技术实施例的固定数据表中常用文本数据的更新方式实现流程图;图3为本专利技术实施例的临时数据表及固定数据表中数据更新的实现流程图;图4为本专利技术实施例的应用于车载语音交互的语音识别实现流程图;图5为本专利技术实施例的一种语音识别装置结构示意图;图6为本专利技术实施例的另一种语音识别装置结构示意图;图7为本专利技术实施例的语音识别设备结构示意图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。本专利技术实施例主要提供了一种语音识别方法和装置,下面分别通过以下实施例进行技术方案的展开描述。如图1为本专利技术实施例的一种语音识别方法实现流程图,包括以下步骤:S11:接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括:接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据;所述常用文本数据为出现次数超过预设阈值的语音识别结果;如果存在,则采用所述常用文本数据替换所述第一文本数据。

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据;所述常用文本数据为出现次数超过预设阈值的语音识别结果;如果存在,则采用所述常用文本数据替换所述第一文本数据。2.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行语音识别,包括:对所述语音数据进行离线语音识别;所述常用文本数据为出现次数超过预设阈值的在线语音识别的结果。3.根据权利要求2所述的方法,其特征在于,预先设置所述固定数据表的方式为:对语音数据进行在线语音识别,得到所述语音数据对应的第二文本数据;判断所述第二文本数据的语义类型是否为可离线处理的语义类型;如果是,则对所述第二文本数据进行分词处理;针对分词处理后的各个词语及所述第二文本数据,判断所述固定数据表中是否包含所述词语或第二文本数据;如果不包含,则更新临时数据表记录的所述词语或第二文本数据的出现次数,并将出现次数达到预设阈值的词语或第二文本数据记录至所述固定数据表,作为所述固定数据表中的常用文本数据。4.根据权利要求3所述的方法,其特征在于,还包括:当所述临时数据表的存储量达到存储上限时,按照最近最少使用方式释放所述临时数据表的存储空间。5.根据权利要求1至4任一所述的方法,其特征在于,所述固定数据表还保存所述常用文本数据对应的语义解析结果;所述判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据之后,还包括:如果存在,则从所述固定数据表中提取所述常用文本数据对应的语义解析结果。6.根据权利要求1至4任一所述的方法,其特征在于,所述判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达到预设条件的常用文本数据,包括:将所述第一文本数据分别与所述固定数据表中的各个常用文本数据进行对比,所述对比的方式为将相同位置的音素逐一进行对比;当音素对比结果相同的比例超过预设比例门限时,判定所述常用文本数据与所述第一文本数据的发音相似度达到预设条件。7.一种语音识别装置,其特征在于,包括:初步识别模块,用于接收语音数据,对所述语音数据进行语音识别,得到所述语音数据对应的第一文本数据;判断模块,用于判断预先设置的固定数据表中是否存在与所述第一文本数据的发音相似度达...

【专利技术属性】
技术研发人员:宋晔张龙揭朋朋
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1