【技术实现步骤摘要】
语音识别方法、装置、计算机设备及存储介质
本专利技术涉及人工智能
,特别涉及一种语音识别方法、装置、计算机设备及存储介质。
技术介绍
语音识别技术是指识别人的语音以得到文字信息的过程。随着人工智能技术的发展,语音识别技术被广泛应用于多种场景,例如,手机中输入法应用可以识别用户语音,以显示对应文字,智能音箱、智能电视等识别用户语音,以执行对应指令。相关技术中,语音识别过程可以包括:用户发出语音时,终端将实时采集的语音数据封装为多个数据包并向服务器发送。服务器实时识别每个数据包所对应的文字,并向终端返回该多个数据包对应的文字。上述语音识别时,需要对每个数据包均进行语音识别,导致语音识别的响应时间较长,语音识别效率较低。本领域中,经常采用丢弃最后一个数据包的方式,以节省最后一个数据包的处理时间,然而,由于丢弃了最后一个数据包,使得识别实际上并不完整,也就导致识别结果不准确,使得上述语音识别过程的准确率和识别效率二者之间矛盾激增,导致语音识别过程要么存在准确率低的问题,要么存在识别效率低的问题。
技术实现思路
本专利技术实施例提供了一种语音识别方法、装置、计算机设备及存 ...
【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:获取至少两个数据包,所述至少两个数据包用于承载目标语音消息;基于每个数据包所承载语音消息的信号能量,确定所述至少两个数据包中第一数据包的有效指示信息,所述有效指示信息用于指示所述第一数据包承载有效语音消息的可能程度,所述有效语音消息是指除噪音以外的语音消息,所述第一数据包为所述至少两个数据包中最后一个数据包;当所述第一数据包的有效指示信息满足第一目标条件时,基于所述至少两个数据包中第二数据包,确定所述目标语音消息的语音识别结果,所述第二数据包为所述至少两个数据包中除最后一个数据包以外的数据包。
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:获取至少两个数据包,所述至少两个数据包用于承载目标语音消息;基于每个数据包所承载语音消息的信号能量,确定所述至少两个数据包中第一数据包的有效指示信息,所述有效指示信息用于指示所述第一数据包承载有效语音消息的可能程度,所述有效语音消息是指除噪音以外的语音消息,所述第一数据包为所述至少两个数据包中最后一个数据包;当所述第一数据包的有效指示信息满足第一目标条件时,基于所述至少两个数据包中第二数据包,确定所述目标语音消息的语音识别结果,所述第二数据包为所述至少两个数据包中除最后一个数据包以外的数据包。2.根据权利要求1所述的方法,其特征在于,所述基于每个数据包所承载语音消息的信号能量,确定所述至少两个数据包中第一数据包的有效指示信息包括:基于所述第一数据包与所述第二数据包所包括每帧语音数据的信号强度,确定所述第一数据包所承载语音消息的第一信号能量和所述第二数据包所承载语音消息的第二信号能量;基于所述第一信号能量与所述第二信号能量之间的相对大小,确定所述第一数据包的有效指示信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一数据包与所述第二数据包所包括每帧语音数据的信号强度,确定所述第一数据包所承载语音消息的第一信号能量和所述第二数据包所承载语音消息的第二信号能量包括:对于所述第一数据包,根据所述第一数据包中每帧语音数据的信号强度,获取所述第一数据包所承载语音消息的第一信号能量;对于每个第二数据包,根据所述第二数据包与所述第一数据包之间的关联强度以及所述第二数据包中每帧语音数据的信号强度,获取所述第二数据包所承载语音消息的第二信号能量,所述关联强度用于指示所述第二数据包中语音数的信号强度对所述第一数据包中语音数据的信号强度的影响程度。4.根据权利要求3所述的方法,其特征在于,所述根据所述第二数据包与所述第一数据包之间的关联强度以及所述第二数据包中每帧语音数据的信号强度,获取所述第二数据包所承载语音消息的第二信号能量包括:获取所述第二数据包在所述至少两个数据包中的排列位置;根据所述第二数据包中每帧语音数据的信号强度和所述第二数据包在所述至少两个数据包的排列位置,获取所述第二数据包所承载语音消息的第二信号能量;其中,所述排列位置用于指示所述第二数据包与所述第一数据包的关联强度,所述第二数据包的排列位置越靠后,与所述第一数据包之间的关联强度越大;所述第二数据包的排列位置越靠前,与所述第一数据包之间的关联强度越小。5.根据权利要求2所述的方法,其特征在于,所述基于所述第一信号能量与所述第二信号能量之间的相对大小,确定所述第一数据包的有效指示信息包括:根据每个第二数据包所承载语音消息的第二信号能量,确定至少两个第二数据包对应的平均信号能量;根据所述平均信号能量和所述第一信号能量,确定所述第一信号能量相对于所述第一信号能量和所述平均信号能量的和值的相对比值,将所述相对比值确定为所述有效指示信息。6.根据权利要求1所述的方法,其特征在于,所述第一目标条件包括:所述有效指示信息指示所述第一数据包未承载有效语音消息,和,所述有效指示信息小于第一阈值中的至少一项。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述第一数据包的有效指示信息满足第二目标条件时,基于所述第一数据包和所述第二数据包,确定所述目标语音消息的语音识别结果;其中,所述第二目标条件包括:所述有效指示信息指示所述第一数据包承载有效语音消息,和,所述有效指示信息不小于第一阈值中的至少一项。8.根据权利要求7所述的方法,其特征在于,所述当所述第一数据包的有效指示信息满足第二目标条件时,基于所述第一数据包和所述第二数据包,确定所述目标语音消息的语音识别结果包括:根据所述第一数据包的有效指示信息,获取所述第一数据包所承载语音消息对应的至少两个语音单元;...
【专利技术属性】
技术研发人员:唐立亮,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。