语音识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37606489 阅读:20 留言:0更新日期:2023-05-18 11:58
本申请公开了一种语音识别方法、装置、电子设备和存储介质,属于语音识别技术领域。语音识别方法,包括:响应于接收到的语音数据,将语音数据转换为第一文本数据;获取第一文本数据中第一词组数据的读音信息;根据读音信息和第一对应关系,对第一文本数据中的第一词组数据添加标识编码,得到第二文本数据,其中,第一对应关系为读音信息与标识编码的对应关系,每个标识编码对应至少两个读音信息;基于第二文本数据识别,识别语音数据相应的控制指令。识别语音数据相应的控制指令。识别语音数据相应的控制指令。

【技术实现步骤摘要】
语音识别方法、装置、电子设备和存储介质


[0001]本申请属于语音识别
,具体涉及一种语音识别方法、装置、电子设备和存储介质。

技术介绍

[0002]人机对话是自然语言处理中一个重要的领域,比如机器人客服、订餐、订票等等,其中最关键的是要让机器理解人说话的含义,即自然语言理解。
[0003]相关技术中的语音识别功能存在泛化性不足的问题,在接收到的语音指令发音存在偏差的情况下,无法准确识别语音指令。

技术实现思路

[0004]本申请实施例的目的是提供一种语音识别方法、装置、电子设备和存储介质,提高了电子设备对发音不准的语音指令识别的准确性。
[0005]第一方面,本申请实施例提供了一种语音识别方法,包括:接收语音数据,将语音数据转换为第一文本数据;获取第一文本数据中第一词组数据的读音信息;根据读音信息和第一对应关系,对第一文本数据中的第一词组数据添加标识编码,得到第二文本数据,其中,第一对应关系为读音信息与标识编码的对应关系,每个标识编码对应至少两个读音信息;基于第二文本数据识别,识别语音数据相应的控制指令。
[0006]第二方面,本申请实施例提供了一种语音识别装置,包括:处理模块,用于接收语音数据,将语音数据转换为第一文本数据;获取模块,用于获取第一文本数据中第一词组数据的读音信息;处理模块,用于根据读音信息和第一对应关系,对第一文本数据中的第一词组数据添加标识编码,得到第二文本数据,其中,第一对应关系为读音信息与标识编码的对应关系,每个标识编码对应至少两个读音信息;处理模块,用于基于第二文本数据识别,识别语音数据相应的控制指令。
[0007]第三方面,本申请实施例提供了一种电子设备,包括:处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的语音识别方法的步骤。
[0008]第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,该程序或指令被处理器执行时实现如第一方面的语音识别方法的步骤。
[0009]第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通讯接口,该通讯接口和该处理器耦合,该处理器用于运行程序或指令,实现如第一方面的语音识别方法的步骤。
[0010]第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面的语音识别方法的步骤。
[0011]本申请实施例中,电子设备在接收到语音数据的情况下,将接收到的语音数据转化为第一文本数据,并对第一文本数据中的第一词组数据添加与读音信息相匹配的标识编
码,生成第二文本数据,由于第二文本数据中的标识编码与多个相近的读音信息相对应,使电子设备能够基于标识编码确定第一词组数据的真实含义,实现了即使电子设备接收到的第一词组数据的发音不准确的情况下,依然能够准确识别包括第一词组数据的语音数据的真实意图,从而提高了识别语音数据中控制指令的准确性。
附图说明
[0012]图1示出了根据本申请的一些实施例的语音识别方法的流程图;
[0013]图2示出了本申请的一些实施例提供的预设模板示意图;
[0014]图3示出了本申请的一些实施例提供的显示界面示意图之一;
[0015]图4示出了本申请的一些实施例提供的显示界面示意图之二;
[0016]图5示出了本申请的一些实施例提供的显示界面示意图之三;
[0017]图6示出了根据本申请实施例的语音识别装置的结构框图;
[0018]图7示出了根据本申请实施例的电子设备的结构框图;
[0019]图8实现本申请实施例的一种电子设备的硬件结构示意图。
具体实施方式
[0020]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0021]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0022]下面结合附图1至附图8,通过具体的实施例及其应用场景对本申请实施例提供的语音识别方法、装置、电子设备和存储介质进行详细地说明。
[0023]在本申请的一些实施例中,提供了一种语音识别方法,图1示出了根据本申请的一些实施例的语音识别方法的流程图,如图1所示,语音识别方法包括:
[0024]步骤102,接收语音数据,将语音数据转换为第一文本数据;
[0025]本申请实施例中,电子设备能够接收到用户发出的语音数据,语音数据为用户对电子设备进行控制的语音指令。电子设备在接收到语音数据之后,通过语音识别技术将语音数据转换为第一文本数据。第一文本数据与语音数据相对应,第一文本数据为一串字符段。
[0026]步骤104,获取第一文本数据中第一词组数据的读音信息;
[0027]本申请实施例中,第一文本数据中包括多个词组数据,每个词组数据具有单独的语义,电子设备能够对多个词组数据中的第一词组数据进行识别,在识别到第一词组数据的情况下,解析该第一词组数据的读音信息。读音信息为第一词组数据对应的拼音等信息。
[0028]具体来说,第一词组数据可以为名词词组,由于语音指令中名词词组通常为语音
指令中代表控制目标的词组,例如:语音指令为“请帮我打开通讯录”,其中“通讯录”即为第一词组。
[0029]步骤106,根据读音信息和第一对应关系,对第一文本数据中的第一词组数据添加标识编码,得到第二文本数据;
[0030]其中,第一对应关系为读音信息与标识编码的对应关系,每个标识编码对应至少两个读音信息;
[0031]本申请实施例中,标识编码用于表示第一词组数据的读音信息,使电子设备通过标识编码能够准确确定语音数据相应的意图。电子设备中配置有第一对应关系,第一对应关系为读音信息与标识编码的对应关系,每个标识编码均对应多个读音信息,且同一标识编码对应的多个读音信息为相近的读音信息,或易混淆的读音信息。
[0032]示例性地,拼音“nong”、“long”、“rong”设置为同一标识编码。“kang”、“kan”设置为同一标识编码。
[0033]步骤108,基于第二文本数据,识别语音数据相应的控制指令。
[0034]本申请实施例中,第一文本数据通过添加标识编码生成第二文本数据,即第二文本数据中包括读音相关的标识编码,从而提高电子设备通过第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:接收语音数据,将所述语音数据转换为第一文本数据;获取所述第一文本数据中第一词组数据的读音信息;根据所述读音信息和第一对应关系,对所述第一文本数据中的所述第一词组数据添加标识编码,得到第二文本数据,其中,所述第一对应关系为读音信息与所述标识编码的对应关系,每个所述标识编码对应至少两个所述读音信息;基于所述第二文本数据,识别所述语音数据相应的控制指令。2.根据权利要求1所述的语音识别方法,其特征在于,所述获取所述第一文本数据中第一词组数据的读音信息,包括:对所述第一文本数据进行分词处理,得到至少两个词组数据;将所述至少两个词组数据中的名词词组数据,确定为所述第一词组数据;获取所述第一词组数据的读音信息。3.根据权利要求1所述的语音识别方法,其特征在于,所述第一对应关系包括第一子对应关系和第二子对应关系;所述根据所述读音信息和第一对应关系,对所述第一文本数据中的所述第一词组数据添加标识编码,包括:获取所述读音信息中的拼音信息;根据所述第一子对应关系,查找所述拼音信息中的声母信息对应的第一子编码,每个所述第一子编码对应至少两个所述声母信息;根据所述第二子对应关系,查找所述拼音信息中的韵母信息对应的第二子编码,每个所述第二子编码对应至少两个所述韵母信息;根据所述第一子编码和所述第二子编码,生成所述标识编码,并将所述标识编码添加至所述第一文本数据中。4.根据权利要求1至3中任一项所述的语音识别方法,其特征在于,所述基于所述第二文本数据识别,识别所述语音数据相应的控制指令,包括:根据所述第二文本数据中的第二词组数据,识别所述语音数据的控制意图信息,所述第二词组数据包括所述第二文本数据中的动词词组数据;根据所述第二文本数据中的所述第一词组数据和所述标识编码,确定所述语音数据的第一应用信息,所述第一应用信息为执行所述控制指令的应用程序的信息;根据所述控制意图信息和所述第一应用信息,生成所述控制指令。5.根据权利要求4所述的语音识别方法,其特征在于,所述根据所述第二文本数据中的所述第一词组数据和所述标识编码,确定所述语音数据的第一应用信息,包括:在通过所述第一词组数据查找到和所述标识编码对应的至少两个第二应用信息的情况下,显示至少两个应用标识,所述至少两个应用标识与所述至少两个第二应用信息一一对应;响应于对所述至少两个应用标识中的目标应用标识的第一输入,确定所述目标应用标识对应的第一应用信息,所述第一应用信息为所述第二应用信息中的一个。6.根据权利要求4所述的语音识别方法,其特征在于,所述根据所述第二文本数据中的所述第一词组数据和所述标识编码,确定所述语音数据的第一应用信息,包括:
在通过所述第一词组数据和所述标识编码查找到至少两个第二应用信息的情况下,确定所述至少两个第二应用信息的运行优先级,所述运行优先级与所述至少两个第二应用信息中的历史运行记录相关联;基于所述运行优先级,确定所述至少两个第二应用信息中的所述第一应用信息。7.一种语音识别装置,其特征在于,包括:处理模块,用于接收语音数据,将所述语音数据转换为第一文本数据;获...

【专利技术属性】
技术研发人员:曹磊
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1