语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号:37110009 阅读:20 留言:0更新日期:2023-04-01 05:07
本发明专利技术公开了一种语音识别方法、装置、设备及存储介质。该方法包括:针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;基于预设的用户词典和分词器对所述修正语句文本进行语句回测;根据语句回测结果确定对应的语音识别结果。本发明专利技术结合同义词词典进行词条匹配,增加对用户口语化表达的泛化匹配能力,同时利用用户词典和分词器对修正语句进行回测验证,确保修正结果的正确性,从而提高了语音识别的准确性。从而提高了语音识别的准确性。从而提高了语音识别的准确性。

【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种语音识别方法、装置、设备及存储介质。

技术介绍

[0002]ASR(Automatic Speech Recognition),即自动语音识别,是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。
[0003]近年来,ASR在许多行业中均有应用。例如,现有的智能问答系统平台通常会用到ASR进行语音转文本,以实现智能客服。但是在实践中,由于客服系统上线后,用户自定义的词汇在原有语料中未曾出现过,尤其是新增业务名称或产品名称,这就导致ASR识别的准确性较差,并进一步导致后续的意图识别、文本匹配的效果也变差,从而影响智能问答的效果。

技术实现思路

[0004]本专利技术的主要目的在于提供一种语音识别方法、装置、设备及存储介质,旨在解决现有的语音识别方法准确性较差的问题。
[0005]为实现上述目的,本专利技术提供一种语音识别方法,所述语音识别方法包括:
[0006]针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;
[0007]基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;
[0008]基于预设的用户词典和分词器对所述修正语句文本进行语句回测;
[0009]根据语句回测结果获得对应的语音识别结果。
[0010]可选地,所述对所述初始语句文本进行第一分词处理,得到第一分词结果的步骤,包括:
[0011]通过n

gram分词法对所述初始语句文本进行第一分词处理,得到第一分词结果。
[0012]可选地,所述第一分词结果包括第一分词词条,所述基于预设的同义词词典对分词结果进行分词匹配的步骤,包括:
[0013]基于预设的同义词词典,分别对各第一分词词条进行字符匹配和拼音匹配,得到各第一分词词条对应的词组。
[0014]可选地,所述根据匹配情况对所述初始语句文本进行修正,得到修正语句文本的步骤包括:
[0015]利用所述词组中的标准词条替换所述第一分词词条,并根据替换结果得到修正语句文本。
[0016]可选地,所述基于预设的用户词典和分词器对所述修正语句文本进行语句回测的步骤,包括:
[0017]通过所述分词器对所述修正语句文本进行第二分词处理,得到第二分词结果;
[0018]通过所述第二分词结果和用户词典进行语句回测,确定所述第二分词结果与标准词条的对应情况。
[0019]可选地,所述第二分词结果包括第二分词词条,所述根据语句回测结果确定对应的语音识别结果的步骤,包括:
[0020]在所述第二分词词条包含完整的标准词条的情况下,将所述修正语句文本确定为语音识别结果。
[0021]此外,为实现上述目的,本专利技术还提供一种语音识别装置,所述语音识别装置包括:
[0022]分词模块10,用于针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;
[0023]修正模块20,用于基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;
[0024]回测模块30,用于基于预设的用户词典和分词器对所述修正语句文本进行语句回测;
[0025]确定模块40,用于根据语句回测结果获得对应的语音识别结果。
[0026]此外,为实现上述目的,本专利技术还提供一种语音识别设备,所述语音识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的语音识别方法的步骤。
[0027]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的语音识别方法的步骤。
[0028]此外,为实现上述目的,本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的语音识别方法的步骤。
[0029]本专利技术实施例提供一种针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;基于预设的用户词典和分词器对所述修正语句文本进行语句回测;根据语句回测结果确定对应的语音识别结果。通过以上方式,结合同义词词典进行词条匹配,增加对用户口语化表达的泛化匹配能力,同时利用用户词典和分词器对修正语句进行回测验证,确保修正结果的正确性,从而提高了语音识别的准确性,有利于后续进行准确地意图识别、文本匹配,提高用户体验。
附图说明
[0030]图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;
[0031]图2为本专利技术语音识别方法第一实施例的流程示意图;
[0032]图3为本专利技术语音识别装置第一实施例的功能模块示意图。
[0033]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0034]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0035]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的设备结构示意图。
[0036]本专利技术实施例的语音识别设备可以是服务器,也可以是PC(PersonalComputer,个人计算机)、平板电脑、便携计算机、可移动终端等终端设备。
[0037]如图1所示,该语音识别设备可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线 1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏 (Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi

Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non

volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0038]本领域技术人员可以理解,图1中示出的语音识别设备结构并不构成对语音识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0039]如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
[0040]在图1所示的终端中,网络接口1004主要用于连接后台服务器和/或数据库,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述语音识别方法包括:针对待识别语音,获取对应的初始语句文本,并对所述初始语句文本进行第一分词处理,得到第一分词结果;基于预设的同义词词典对所述第一分词结果进行分词匹配,并根据匹配情况对所述初始语句文本进行修正,得到修正语句文本;基于预设的用户词典和分词器对所述修正语句文本进行语句回测;根据语句回测结果获得对应的语音识别结果。2.如权利要求1所述的语音识别方法,其特征在于,所述对所述初始语句文本进行第一分词处理,得到第一分词结果的步骤,包括:通过n

gram分词法对所述初始语句文本进行第一分词处理,得到第一分词结果。3.如权利要求1所述的语音识别方法,其特征在于,所述第一分词结果包括第一分词词条,所述基于预设的同义词词典对分词结果进行分词匹配的步骤,包括:基于预设的同义词词典,分别对各第一分词词条进行字符匹配和拼音匹配,得到各第一分词词条对应的词组。4.如权利要求3所述的语音识别方法,其特征在于,所述根据匹配情况对所述初始语句文本进行修正,得到修正语句文本的步骤包括:利用所述词组中的标准词条替换所述第一分词词条,并根据替换结果得到修正语句文本。5.如权利要求1所述的语音识别方法,其特征在于,所述基于预设的用户词典和分词器对所述修正语句文本进行语句回测的步骤,包括:通过所述分词器对所述修正语句...

【专利技术属性】
技术研发人员:贾敬伍赵国庆周长安
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1