语音识别的方法、装置、设备和计算机可读介质制造方法及图纸

技术编号:29092930 阅读:38 留言:0更新日期:2021-06-30 10:01
本发明专利技术公开了语音识别的方法、装置、设备和计算机可读介质,涉及人工智能技术领域。该方法的一具体实施方式包括:将用户语音输入至声学模型中;所述声学模型输出用户音素至语言模型中,所述语言模型输出用户文字序列;通过词典替换所述用户文字序列中的文字,得到多个语音近似词;输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列。该实施方式能够提高语音识别的准确率。语音识别的准确率。语音识别的准确率。

【技术实现步骤摘要】
语音识别的方法、装置、设备和计算机可读介质


[0001]本专利技术涉及人工智能
,尤其涉及一种语音识别的方法、装置、设备和计算机可读介质。

技术介绍

[0002]通过语音识别输出文本,已成为一种逐渐流行的人机交互方式。但由于目前语音识别系统缺少说话人的语言背景或上下文环境,在识别多音词组时容易产生错误。如“龙信“识别为”农信“,进而会降低总体识别准确率影响功能正常使用。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:语音识别的准确率较低。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种语音识别的方法、装置、设备和计算机可读介质,能够提高语音识别的准确率。
[0005]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种语音识别的方法,包括:
[0006]将用户语音输入至声学模型中;
[0007]所述声学模型输出用户音素至语言模型中,所述语言模型输出用户文字序列;
[0008]通过词典替换所述用户文字序列中的文字,得到多个语音近似词;
[0009]输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列。
[0010]所述将用户语音输入至声学模型中之前,还包括:
[0011]对用户原始语音进行滤波和分帧处理,得到所述用户语音。
[0012]所述用户原始语音是通过移动终端或语音采集设备获取的。
[0013]所述将用户语音输入至声学模型中,包括:
[0014]将预设时间段内的用户语音输入至声学模型中。
[0015]所述预设时间段是由用户预先设置的。
[0016]所述通过词典替换所述用户文字序列中的文字,得到多个语音近似词,包括:
[0017]通过词典替换所述用户文字序列中的同音字和/或近音字,得到多个语音近似词。
[0018]所述通过词典替换所述用户文字序列中的同音字和/或近音字,得到多个语音近似词,包括:
[0019]通过词典替换所述用户文字序列中的同音字和/或近音字;
[0020]在替换后的用户文字序列中词语中,剔除非常用词语,得到多个语音近似词。
[0021]所述在替换后的用户文字序列中词语中,剔除非常用词语,得到多个语音近似词,包括:
[0022]遍历替换后的用户文字序列中词语,采用常用词语词典剔除非常用词语,得到多
个语音近似词。
[0023]所述输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列,包括:
[0024]输出所述多个语音近似词,并接收指令,所述指令包括所述多个语音近似词中的一个或多个语音近似词;
[0025]基于所述多个语音近似词中的一个或多个语音近似词和所述用户文字序列,确定所述用户语音的输出文字序列。
[0026]所述输出所述多个语音近似词,包括:
[0027]按照所述语音近似词的使用频率,输出所述多个语音近似词。
[0028]所述接收的指令是用户通过移动终端发送的。
[0029]所述多个语音近似词中的一个或多个近似词是默认语音近似词,所述默认语音近似词是所述多个语音近似词中采用预设规则确定的。
[0030]所述预设规则包括应用场景和/或使用频率。
[0031]所述基于所述多个语音近似词中的一个或多个语音近似词和所述用户文字序列,确定所述用户语音的输出文字序列,包括:
[0032]基于所述多个语音近似词中的一个或多个语音近似词,确定文字序列所使用的语音近似词;
[0033]所述所使用的语音近似词和所述用户文字序列相结合,确定所述用户语音的输出文字序列。
[0034]所述基于所述多个语音近似词中的一个或多个近似词,确定文字序列所使用的语音近似词,包括:
[0035]将所述多个语音近似词中的一个或多个近似词,作为所述文字序列所使用的语音近似词。
[0036]所述所使用的语音近似词和所述用户文字序列相结合,确定所述用户语音的输出文字序列,包括:
[0037]在所述用户文字序列中,以所述所使用的语音近似词替换所述多个语音近似词,确定所述用户语音的输出文字序列。
[0038]所述语音近似词的数量小于预设近似词阈值。
[0039]根据本专利技术实施例的第二方面,提供了一种语音识别的装置,包括:
[0040]输入模块,用于将用户语音输入至声学模型中;
[0041]识别模块,用于控制所述声学模型输出用户音素至语言模型中,所述语言模型输出用户文字序列;
[0042]替换模块,用于通过词典替换所述用户文字序列中的文字,得到多个语音近似词;
[0043]确定模块,用于输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列。
[0044]根据本专利技术实施例的第三方面,提供了一种语音识别的电子设备,包括:
[0045]一个或多个处理器;
[0046]存储装置,用于存储一个或多个程序,
[0047]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理
器实现如上述的方法。
[0048]根据本专利技术实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。
[0049]上述专利技术中的一个实施例具有如下优点或有益效果:将用户语音输入至声学模型中;所述声学模型输出用户音素至语言模型中,所述语言模型输出用户文字序列;通过词典替换所述用户文字序列中的文字,得到多个语音近似词;输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列。结合用户发送的指令确定近似词,进而能够提高语音识别的准确率。
[0050]上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0051]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0052]图1是根据本专利技术实施例的语音识别的方法的主要流程的示意图;
[0053]图2是根据本专利技术实施例的得到多个语音近似词的流程示意图;
[0054]图3是根据本专利技术实施例的确定用户语音的输出文字序列的流程示意图;
[0055]图4是根据本专利技术实施例的基于语音近似词和用户文字序列,确定用户语音的输出文字序列的流程示意图;
[0056]图5是根据本专利技术实施例的语音识别的装置的主要结构的示意图;
[0057]图6是本专利技术实施例可以应用于其中的示例性系统架构图;
[0058]图7是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
[0059]以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别的方法,其特征在于,包括:将用户语音输入至声学模型中;所述声学模型输出用户音素至语言模型中,所述语言模型输出用户文字序列;通过词典替换所述用户文字序列中的文字,得到多个语音近似词;输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列。2.根据权利要求1所述语音识别的方法,其特征在于,所述将用户语音输入至声学模型中之前,还包括:对用户原始语音进行滤波和分帧处理,得到所述用户语音。3.根据权利要求2所述语音识别的方法,其特征在于,所述用户原始语音是通过移动终端或语音采集设备获取的。4.根据权利要求1所述语音识别的方法,其特征在于,所述将用户语音输入至声学模型中,包括:将预设时间段内的用户语音输入至声学模型中。5.根据权利要求4所述语音识别的方法,其特征在于,所述预设时间段是由用户预先设置的。6.根据权利要求1所述语音识别的方法,其特征在于,所述通过词典替换所述用户文字序列中的文字,得到多个语音近似词,包括:通过词典替换所述用户文字序列中的同音字和/或近音字,得到多个语音近似词。7.根据权利要求6所述语音识别的方法,其特征在于,所述通过词典替换所述用户文字序列中的同音字和/或近音字,得到多个语音近似词,包括:通过词典替换所述用户文字序列中的同音字和/或近音字;在替换后的用户文字序列中词语中,剔除非常用词语,得到多个语音近似词。8.根据权利要求6所述语音识别的方法,其特征在于,所述在替换后的用户文字序列中词语中,剔除非常用词语,得到多个语音近似词,包括:遍历替换后的用户文字序列中词语,采用常用词语词典剔除非常用词语,得到多个语音近似词。9.根据权利要求1所述语音识别的方法,其特征在于,所述输出所述多个语音近似词,并基于接收到的指令和所述多个语音近似词,确定所述用户语音的输出文字序列,包括:输出所述多个语音近似词,并接收指令,所述指令包括所述多个语音近似词中的一个或多个语音近似词;基于所述多个语音近似词中的一个或多个语音近似词和所述用户文字序列,确定所述用户语音的输出文字序列。10.根据权利要求9所述语音识别的方法,其特征在于,所述输出所述多个语音近似词,包括:按照所述语音近似词的使用频率,输出所述多个语音近似词。11.根据权利要求9所述语音识别的方法,其特征在于,...

【专利技术属性】
技术研发人员:周永吉郭敏鸿范会善王炼马亮亮章铃娜姜京京
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1