语音识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:30441120 阅读:10 留言:0更新日期:2021-10-24 18:28
本申请公开了一种语音识别方法、装置、设备及计算机可读存储介质,属于计算机技术领域,该方法包括:获取语音数据;识别语音数据对应的第一文本数据;响应于第一文本数据包括第一场景标识,基于第一场景标识对应的第一场景字典,获取语音数据对应的第二文本数据;基于第二文本数据进行输入。该方法使得识别得到的输入文本数据更符合应用场景,提高了语音识别的准确率。的准确率。的准确率。

【技术实现步骤摘要】
语音识别方法、装置、设备及计算机可读存储介质


[0001]本申请涉及计算机
,特别涉及一种语音识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着计算机技术的发展,语音识别技术在社交应用、智能客服或语音助手等领域越来越普遍。在语音识别的语音输入场景中,需要将语音数据转化为文本数据,以将文本数据作为相应输入文本实现语音输入。
[0003]相关技术中,使用传统语音识别方法对语音数据进行识别,传统语音识别方法通常由声学模型、发音词典以及语言模型等多个模块组合而成,通过语音特征、音素、词语、词串之间的依次映射关系来将语音数据转化为文本数据,然后将传统语音识别方法识别的文本数据直接作为输入文本实现语音输入。
[0004]但是,由于传统语音识别方法可能导致识别的文本数据与语音数据指示的输入文本不相符,例如,当用户想要输入“@”时,由传统语音识别系统识别的输入文本为“at”,导致语音识别的准确率较低。

技术实现思路

[0005]本申请提供了一种语音识别方法、装置、设备及计算机可读存储介质,能够解决相关技术中的问题。
[0006]第一方面,提供一种语音识别方法,所述方法包括:获取语音数据;识别所述语音数据对应的第一文本数据;响应于所述第一文本数据包括第一场景标识,基于所述第一场景标识对应的第一场景字典,获取所述语音数据对应的第二文本数据,所述第一场景标识用于指示所述语音数据对应的应用场景,所述第一场景字典用于指示所述应用场景对应的文本字典;基于所述第二文本数据进行输入。
[0007]在一种可能的实施方式中,所述识别所述语音数据对应的第一文本数据之后,还包括:基于场景标识与场景字典的对应关系,查找所述第一文本数据包括的第一场景标识,所述第一场景标识为所述场景标识与场景字典的对应关系中包括的场景标识;基于所述第一场景标识,获取所述第一场景标识对应的第一场景字典。
[0008]在一种可能的实施方式中,所述基于场景标识与场景字典的对应关系,查找所述第一文本数据包括的第一场景标识之前,还包括:建立场景标识和与所述场景标识分别对应的场景字典;基于所述场景标识和与所述场景标识对应的场景字典,得到场景标识与场景字典的对应关系。
[0009]在一种可能的实施方式中,所述第一场景字典包括至少一个识别文本与至少一个场景文本的映射关系;所述基于所述第一场景标识对应的第一场景字典,获取所述语音数据对应的第二文本数据,包括:基于所述至少一个识别文本与至少一个场景文本的映射关系,查找所述第一文本数据中包括的第一识别文本,所述第一识别文本为所述至少一个识
别文本与至少一个场景文本的映射关系中包括的识别文本;基于所述第一识别文本,获取所述第一识别文本对应的第一场景文本;基于所述第一场景文本获取所述语音数据对应的第二文本数据。
[0010]在一种可能的实施方式中,所述基于所述第一场景文本获取所述语音数据对应的第二文本数据,包括:将所述第一文本数据中的所述第一识别文本替换为对应的所述第一场景文本,得到所述语音数据对应的第二文本数据。
[0011]第二方面,提供了一种语音识别装置,所述装置包括:
[0012]第一获取模块,用于获取语音数据;
[0013]识别模块,用于识别所述语音数据对应的第一文本数据;
[0014]第二获取模块,用于响应于所述第一文本数据包括第一场景标识,基于所述第一场景标识对应的第一场景字典,获取所述语音数据对应的第二文本数据,所述第一场景标识用于指示所述语音数据对应的应用场景,所述第一场景字典用于指示所述应用场景对应的文本字典;
[0015]输入模块,用于基于所述第二文本数据进行输入。
[0016]在一种可能的实施方式中,所述识别模块,还用于基于场景标识与场景字典的对应关系,查找所述第一文本数据包括的第一场景标识,所述第一场景标识为所述场景标识与场景字典的对应关系中包括的场景标识;基于所述第一场景标识,获取所述第一场景标识对应的第一场景字典。
[0017]在一种可能的实施方式中,所述识别模块,还用于建立场景标识和与所述场景标识对应的场景字典;基于所述场景标识和与所述场景标识对应的场景字典,得到场景标识与场景字典的对应关系。
[0018]在一种可能的实施方式中,所述第一场景字典包括至少一个识别文本与至少一个场景文本的映射关系;
[0019]所述第二获取模块,用于基于所述至少一个识别文本与至少一个场景文本的映射关系,查找所述第一文本数据中包括的第一识别文本,所述第一识别文本为所述至少一个识别文本与至少一个场景文本的映射关系中包括的识别文本;基于所述第一识别文本,获取所述第一识别文本对应的第一场景文本;基于所述第一场景文本获取所述语音数据对应的第二文本数据。
[0020]在一种可能的实施方式中,所述第二获取模块,用于将所述第一文本数据中的所述第一识别文本替换为对应的所述第一场景文本,得到所述语音数据对应的第二文本数据。
[0021]第三方面,还提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以使计算机设备实现上述任一项所述的语音识别方法。
[0022]第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以使计算机实现上述任一项所述的语音识别方法。
[0023]第五方面,还提供了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备
的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述任一所述的语音识别方法。
[0024]本申请提供的技术方案至少可以带来如下有益效果:
[0025]本申请提供的技术方案通过场景标识与场景字典的应用,将基于语音数据识别得到的第一文本数据转换为第二文本数据,使得第二文本数据更符合语音数据对应的应用场景,提高了根据语音数据获取对应的文本数据的准确率,进而提高了语音识别的准确率。
附图说明
[0026]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是本申请实施例提供的一种语音识别方法的实施环境的示意图;
[0028]图2是本申请实施例提供的一种语音识别方法的流程图;
[0029]图3是本申请实施例提供的一种语音识别方法的交互示意图;
[0030]图4是本申请实施例提供的一种语音识别装置的示意图;
[0031]图5是本申请实施例提供的一种计算机设备的结构示意图;
[0032]图6是本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取语音数据;识别所述语音数据对应的第一文本数据;响应于所述第一文本数据包括第一场景标识,基于所述第一场景标识对应的第一场景字典,获取所述语音数据对应的第二文本数据,所述第一场景标识用于指示所述语音数据对应的应用场景,所述第一场景字典用于指示所述应用场景对应的文本字典;基于所述第二文本数据进行输入。2.根据权利要求1所述的方法,其特征在于,所述识别所述语音数据对应的第一文本数据之后,还包括:基于场景标识与场景字典的对应关系,查找所述第一文本数据包括的第一场景标识,所述第一场景标识为所述场景标识与场景字典的对应关系中包括的场景标识;基于所述第一场景标识,获取所述第一场景标识对应的第一场景字典。3.根据权利要求2所述的方法,其特征在于,所述基于场景标识与场景字典的对应关系,查找所述第一文本数据包括的第一场景标识之前,还包括:获取场景标识和与所述场景标识对应的场景字典;基于所述场景标识和与所述场景标识对应的场景字典,得到场景标识与场景字典的对应关系。4.根据权利要求1

3任一所述的方法,其特征在于,所述第一场景字典包括至少一个识别文本与至少一个场景文本的映射关系;所述基于所述第一场景标识对应的第一场景字典,获取所述语音数据对应的第二文本数据,包括:基于所述至少一个识别文本与至少一个场景文本的映射关系,查找所述第一文本数据中包括的第一识别文本,所述第一识别文本为所述至少一个识别文本与至少一个场景文本的映射关系中包括的识别文本;基于所述第一识别文本,获取所述第一识别文本对应的第一场景文本;基于所述第一场景文本获取所述语音数据对应的第二文本数据。5.根据权利要求4所述的方法,其特征在于,所述基于所述第一场景文本获取所述语音数据对应的第二文本数据,包括:将所述第一文本数据中的所述第一识别文本替换为对...

【专利技术属性】
技术研发人员:秦红伟
申请(专利权)人:北京梧桐车联科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1