语音识别方法、语音识别系统及存储介质技术方案

技术编号：33795800 阅读：42 留言：0更新日期：2022-06-16 09:58

本发明专利技术提供语音识别方法、语音识别系统及存储介质。语音识别方法包括：语音流处理步骤，接收语音流，将所述语音流分割为语音帧；语音帧处理步骤，对所述语音帧进行静音判断；以及语音识别步骤，根据所述静音判断的结果，与语音识别引擎交互消息。音识别引擎交互消息。音识别引擎交互消息。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、语音识别系统及存储介质

[0001]本专利技术总体上涉及语音的自动化处理领域，更具体地涉及语音识别方法、语音识别系统及存储介质。

技术介绍

[0002]语音识别技术已经广泛应用于生产生活的各个方面。例如，在呼叫场景下，实时语音识别技术的主要应用场景包括但不限于智能坐席助手、实时质检等话务中心智能应用的实时语音识别场景。实现这些业务场景的基础是要利用语音识别引擎将呼叫中的主被叫语音识别为文字，作为后续业务处理模块的输入，并且，这些场景对语音识别的实时性要求比较高，基本都要做到所说即所得。呼叫场景是双人对话场景，分为主叫与被叫，目前实现方式一般为一通呼叫占用两路语音识别引擎并发能力，包括一路主叫语音及一路被叫语音。这种机制下，一路引擎支持一条语音。转换成呼叫数，语音识别引擎支持的最大呼叫数＝语音识别引擎并发数/2。
[0003]在呼叫数量快速增加的情况下，对于语音识别引擎的并发数要求也更多，这对于软硬件资源均提出了更高的要求。

技术实现思路

[0004]在下文中给出了关于本专利技术的简要概述...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，包括：语音流处理步骤，接收语音流，将所述语音流分割为语音帧；语音帧处理步骤，对所述语音帧进行静音判断；以及语音识别步骤，根据所述静音判断的结果，与语音识别引擎交互消息。2.根据权利要求1所述的语音识别方法，其中，还包括：识别结果处理步骤，从所述语音识别引擎获取识别结果后，计算所述识别结果在原语音流中的时间位置。3.根据权利要求2所述的实时语音识别方法，其中，在所述识别结果处理步骤中，根据所述语音识别引擎返回的时间位置及存储的静音时长信息计算所述识别结果在原语音流中的时间位置。4.根据权利要求3所述的实时语音识别方法，其中，在所述语音识别步骤中，与所述语音识别引擎交互消息包括新建语音识别会话、发送待识别语音帧、获取识别结果、结束语音识别会话。5.根据权利要求4所述的实时语音识别方法，其中，新建的所述语音识别会话的会话信息包括：会话标识、语音标识、语音的呼叫随路信息、语音的处理位置。6.根据权利要求1所述的语音识别方法，其中，在所述语音帧处理步骤中，通过语音端点检测对所述语音帧进行静音判断。7.根据权利要求6所述的语音识别方法，其中，如果所述语音帧不是静音帧，上一帧语音是静音帧时，新建所述语音识别会话，如果所述语音帧不是静音帧，上一帧语音不是静音帧时，继续进行所述语音识别；如果所述语音帧是静音帧，上一帧语音不是静音帧时，结束所述语音识别会话，如果所述语音帧是静音帧，上一帧语音是静音帧时，计算静音段时长。8.根据权利要求5所述的语音识别方法，其中，在新建所述语音识别会话时，增加所述语音识别引擎的当前并发数，结束所述语音识别会话时，减少所述语音识别引擎的当前并发数。9.根据权利要求8所述的语音识别方法，其中，如果所述语音识别引擎的并发数达到上限则将新的所述语音帧进行缓存，丢弃早期的所述语音帧。10.根据...

【专利技术属性】
技术研发人员：朱云峰，严秋红，陆东明，张亮，董斌，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人