System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音识别方法及装置、电子设备和计算机可读存储介质制造方法及图纸_技高网

语音识别方法及装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:41278528 阅读:8 留言:0更新日期:2024-05-11 09:30
本公开提供了一种语音识别方法及装置、电子设备和计算机可读存储介质,可以应用于计算机技术和语音处理技术领域。该方法包括:响应于接收到语音识别请求,对语音识别请求中的待识别语音进行处理,得到与第一语音通道对应的第一语音段和与第二语音通道对应的第二语音段;对第一语音段和第二语音段分别进行处理,得到至少一个第一语音语句和至少一个第二语音语句,其中,每个第一语音语句和每个第二语音语句各自对应有语音通道标识、起始时间和结束时间;根据起始时间,对至少一个第一语音语句和至少一个第二语音语句进行排序,得到初始排序结果;以及,根据语音通道标识和结束时间,对初始排序结果进行处理,得到语音识别结果。

【技术实现步骤摘要】

本公开涉及计算机技术和语音处理,更具体地,涉及一种语音识别方法及装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、随着计算机技术的发展,语音识别技术应运而生。语音识别技术可以指机器通过识别和理解的过程,将语音信号转换为相应的文本或命令的技术。例如,可以将语音识别技术应用于质检。

2、质检可以指对对客服接听用户的电话所产生的电话录音文件进行语音识别和基于语音识别结果进行质检项目检测的过程,以便于确定客服地话术是否符合要求。但是,由于质检过程中来自于不同通道的语音可能存在重叠情况,导致识别的文本顺序与实际语音顺序存在不一致。

3、在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:在不同通道的语音存在重叠情况的场景下,难以清晰地展示语音识别结果,导致用户体验较差。


技术实现思路

1、有鉴于此,本公开提供了一种语音识别方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

2、根据本公开的一个方面,提供了一种语音识别方法,包括:响应于接收到语音识别请求,对上述语音识别请求中的待识别语音进行处理,得到与第一语音通道对应的第一语音段和与第二语音通道对应的第二语音段;对上述第一语音段和上述第二语音段分别进行处理,得到至少一个第一语音语句和至少一个第二语音语句,其中,每个上述第一语音语句和每个上述第二语音语句各自对应有语音通道标识、起始时间和结束时间;根据上述起始时间,对上述至少一个第一语音语句和上述至少一个第二语音语句进行排序,得到初始排序结果;以及,根据上述语音通道标识和上述结束时间,对上述初始排序结果进行处理,得到语音识别结果。

3、根据本公开的实施例,上述根据上述起始时间,对上述至少一个第一语音语句和上述至少一个第二语音语句进行排序,得到初始排序结果包括:根据每个上述第一语音语句各自的起始时间和每个上述第二语音语句各自的起始时间,对上述至少一个第一语音语句和上述至少一个第二语音语句进行排序,得到上述初始排序结果。

4、根据本公开的实施例,初始排序结果包括按照起始时间排列的至少一个初始语音语句和与每个初始语音语句各自对应的语音通道标识。

5、根据本公开的实施例,上述根据上述语音通道标识和上述结束时间,对上述初始排序结果进行处理,得到语音识别结果包括:在上述至少一个第一语音语句中确定第p个语音语句,其中,p为正整数;在上述至少一个第二语音语句中确定第p+1个语音语句;对上述第p个语音语句和上述第p+1个语音语句进行语音通道标识检测,得到语音通道标识检测结果;响应于上述语音通道标识检测结果表征上述第p个语音语句和上述第p+1个语音语句具有相同的上述语音通道标识,对上述第p个语音语句和上述第p+1个语音语句进行语音语句时间检测,得到语音语句时间检测结果;以及,响应于上述语音语句时间检测结果表征上述第p个语音语句的语句结束时间与上述第p+1个语音语句的语句起始时间相匹配,将上述第p个语音语句和上述第p+1个语音语句进行合并处理,得到合并后的第p个语音语句。

6、根据本公开的实施例,上述语音识别结果包括至少一个语音语句和与每个上述语音语句各自对应的语音通道标识。

7、根据本公开的实施例,上述方法还包括,在上述根据上述语音通道标识和上述结束时间,对上述初始排序结果进行处理,得到语音识别结果之后:在上述至少一个语音语句中依次确定第q个语音语句,其中,q为正整数;响应于与上述语音语句对应的语音通道标识表征属于第一语音通道,将上述语音语句在目标页面的第一目标区域进行展示;以及,响应于与上述语音语句对应的语音通道标识表征属于第二语音通道,将上述语音语句在上述目标页面的第二目标区域进行展示。

8、根据本公开的实施例,上述待识别语音包括至少两个语音通道。

9、根据本公开的实施例,上述响应于接收到语音识别请求,对上述语音识别请求中的待识别语音进行处理,得到与第一语音通道对应的第一语音段和与第二语音通道对应的第二语音段包括:响应于接收到上述语音识别请求,对上述待识别语音进行通道拆分处理,得到与上述第一语音通道对应的第一待识别语音和与上述第二语音通道对应的第二待识别语音;对上述第一待识别语音和上述第二语音段分别进行语音激活检测处理,得到至少一个第一待识别子语音和至少一个第二待识别子语音;以及,对上述至少一个第一待识别子语音和上述至少一个第二待识别子语音分别进行语音识别处理,得到至少一个上述第一语音段和至少一个上述第二语音段。

10、根据本公开的实施例,上述对上述至少一个第一待识别子语音和上述至少一个第二待识别子语音分别进行语音识别处理,得到至少一个上述第一语音段和至少一个上述第二语音段包括:针对上述至少一个第一待识别子语音中的每个第一待识别子语音,对上述第一待识别子语音进行语音识别处理,得到第一数目个第一字符和第二数目个第一词汇,其中,上述每个第一词汇各自对应有第一词汇时间戳信息;以及,针对上述至少一个第二待识别子语音中的每个第二待识别子语音,对上述第二待识别子语音进行语音识别处理,得到第三数目个第二字符和第四数目个第二词汇,其中,上述每个第二词汇各自对应有第二词汇时间戳信息。

11、根据本公开的实施例,上述第一词汇时间戳信息包括第一词汇起始时间和第一词汇结束时间。

12、根据本公开的实施例,上述对上述第一语音段和上述第二语音段分别进行处理,得到至少一个第一语音语句和至少一个第二语音语句包括:根据预定字符,对上述第一语音段中的上述第一数目个第一字符进行字符检测处理,得到第一字符检测结果;响应于上述第一字符检测结果表征上述第一字符与上述预定字符相匹配,确定与上述第一字符对应的第五数目个第一词汇;根据上述第五数目个第一词汇,对上述第一语音段进行拆分处理,得到上述第一语音语句;以及,根据与上述第五数目个第一词汇各自对应的上述第一词汇起始时间和上述第一词汇结束时间,确定与上述第一语音语句对应的起始时间和结束时间。

13、根据本公开的实施例,上述第二词汇时间戳信息包括第二词汇起始时间和第二词汇结束时间。

14、根据本公开的实施例,上述对上述第一语音段和上述第二语音段分别进行处理,得到至少一个第一语音语句和至少一个第二语音语句包括:根据上述预定字符,对上述第二语音段中的上述第二数目个第二字符进行字符检测处理,得到第二字符检测结果;响应于上述第二字符检测结果表征上述第二字符与上述预定字符相匹配,确定与上述第二字符对应的第六数目个第二词汇;根据上述第六数目个第二词汇,对上述第二语音段进行拆分处理,得到上述第二语音语句;以及,根据与上述第六数目个第二词汇各自对应的上述第二词汇起始时间和上述第二词汇结束时间,确定与上述第二语音语句对应的起始时间和结束时间。

15、根据本公开的另一个方面,提供了一种语音识别装置,包括:第一处理模块,用于响应于接收到语音识别请求,对所述语音识别请求中的待识别语音进行处理,得到与第一语音通道对应的第一语音段和与第二语本文档来自技高网...

【技术保护点】

1.一种语音识别方法,包括:

2.根据权利要求1所述的方法,其中,所述根据所述起始时间,对所述至少一个第一语音语句和所述至少一个第二语音语句进行排序,得到初始排序结果包括:

3.根据权利要求2所述的方法,其中,所述初始排序结果包括按照起始时间排列的至少一个初始语音语句和与每个所述初始语音语句各自对应的语音通道标识;

4.根据权利要求1至3中任一项所述的方法,其中,所述语音识别结果包括至少一个语音语句和与每个所述语音语句各自对应的语音通道标识;

5.根据权利要求1至3中任一项所述的方法,其中,所述待识别语音包括至少两个语音通道;

6.根据权利要求5所述的方法,其中,所述对所述至少一个第一待识别子语音和所述至少一个第二待识别子语音分别进行语音识别处理,得到至少一个所述第一语音段和至少一个所述第二语音段包括:

7.根据权利要求6所述的方法,其中,所述第一词汇时间戳信息包括第一词汇起始时间和第一词汇结束时间;

8.根据权利要求6所述的方法,其中,所述第二词汇时间戳信息包括第二词汇起始时间和第二词汇结束时间

9.一种语音识别装置,包括:

10.一种电子设备,包括:

11.一种计算机可读存储介质,其上存储有可执行指令,所述可执行指令被处理器执行时使处理器实现权利要求1至8中任一项所述的方法。

12.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述计算机可执行指令在被执行时用于实现权利要求1至8中任一项所述的方法。

...

【技术特征摘要】

1.一种语音识别方法,包括:

2.根据权利要求1所述的方法,其中,所述根据所述起始时间,对所述至少一个第一语音语句和所述至少一个第二语音语句进行排序,得到初始排序结果包括:

3.根据权利要求2所述的方法,其中,所述初始排序结果包括按照起始时间排列的至少一个初始语音语句和与每个所述初始语音语句各自对应的语音通道标识;

4.根据权利要求1至3中任一项所述的方法,其中,所述语音识别结果包括至少一个语音语句和与每个所述语音语句各自对应的语音通道标识;

5.根据权利要求1至3中任一项所述的方法,其中,所述待识别语音包括至少两个语音通道;

6.根据权利要求5所述的方法,其中,所述对所述至少一个第一待识别子语音和所述至少一个第二待识...

【专利技术属性】
技术研发人员:全刚王佳李奇龙
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1