语音识别方法、装置、存储介质和电子设备制造方法及图纸

技术编号:37604335 阅读:22 留言:0更新日期:2023-05-18 11:56
本公开提供了一种语音识别方法、装置、存储介质和电子设备,涉及人工智能技术领域。该语音识别方法先将待识别语音通话的媒体流划分为主叫媒体流与被叫媒体流,分别对主叫媒体流与被叫媒体流进行切片,在得到多个主叫音频切片与多个被叫音频切片后,分别对多个主叫音频切片与多个被叫音频切片进行语音识别,最后对多个识别文本进行整合即可得到待识别语音通话对应的目标通话记录,避免了传统技术中存在的目前的语音识别方法准确率较低的技术问题,达到了提高语音识别准确性的技术效果。达到了提高语音识别准确性的技术效果。达到了提高语音识别准确性的技术效果。

【技术实现步骤摘要】
语音识别方法、装置、存储介质和电子设备


[0001]本公开涉及人工智能
,尤其涉及一种语音识别方法、装置、存储介质和电子设备。

技术介绍

[0002]一般商家针对安装维修等工作是通过对用户与工作人员的通话进行录音并转译为文本,然后对转译后的文本进行语义识别以确定用户期望的服务类别与服务细节,从而通知相关工作人员进行对应的服务工作。
[0003]但是在实际质检中经常会出现用户和工作人员角色定位错误等问题,针对角色定位错误的问题,目前主要通过各种语音训练、用户场景模拟、音频解析等方式来降低角色定位错误率,但是效果甚微,错误率一直保持在60%以上。
[0004]因此,目前的语音识别方法准确率较低。

技术实现思路

[0005]本公开提供了一种语音识别方法、装置、存储介质和电子设备,进而提高语音识别准确率。
[0006]第一方面,本公开一个实施例提供了一种语音识别方法,包括:
[0007]将待识别语音通话的媒体流划分为主叫媒体流与被叫媒体流;
[0008]分别对主叫媒体流与被叫媒体流进行切片,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:将待识别语音通话的媒体流划分为主叫媒体流与被叫媒体流;分别对所述主叫媒体流与所述被叫媒体流进行切片,得到多个主叫音频切片与多个被叫音频切片;分别对所述多个主叫音频切片与所述多个被叫音频切片进行语音识别,得到多个识别文本;对所述多个识别文本进行整合,得到所述待识别语音通话对应的目标通话记录。2.根据权利要求1所述的语音识别方法,其特征在于,所述将待识别语音通话的媒体流划分为主叫媒体流与被叫媒体流,包括:将所述待识别语音通话中的通话信令划分为信令流与所述媒体流;基于所述信令流的信令方向将所述媒体流划分为主叫媒体流与被叫媒体流。3.根据权利要求2所述的语音识别方法,其特征在于,所述分别对所述主叫媒体流与所述被叫媒体流进行切片,得到多个主叫音频切片与多个被叫音频切片,包括:按照所述信令流的信令时序对所述主叫媒体流进行切片,得到所述多个主叫音频切片;按照所述信令流的信令时序对所述被叫媒体流进行切片,得到所述多个被叫音频切片。4.根据权利要求2所述的语音识别方法,其特征在于,所述基于所述信令流的信令方向将所述媒体流划分为主叫媒体流与被叫媒体流,包括:对所述信令流进行信令解析,以确定所述信令流的主叫信令方向与被叫信令方向;将所述主叫信令方向对应的媒体流确定为所述主叫媒体流;将所述被叫信令方向对应的媒体流确定为所述被叫媒体流。5.根据权利要求1所述的语音识别方法,其特征在于,所述对所述多个识别文本进行整合,得到所述待识别语音通话对应的目标通话记录,包括:按照所述待识别语音通话的信令时序对所述多个识别文本进行整合,得到初始通话记录;按照预先配置的文本校正模型对所述初始通话记录进行文本校正,得到所述待识别语音通话对应的所述目标通话记录。6.根据权利要求5所述的语音识别方法,其特征在于,所述按照预先配置...

【专利技术属性】
技术研发人员:赵干朱剑飞闫虎年
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1