语音识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：36038410 阅读：18 留言：0更新日期：2022-12-21 10:43

本申请提供一种语音识别方法、装置、电子设备及存储介质，通过对语音数据进行端点检测，实现了语音数据的筛选，并根据端点检测结果将语音引擎的长语音识别转化为短语音识别，从而能够使得语音识别服务和语音引擎之间的线路实现多路复用，提高了语音引擎的利用率；根据语音识别状态对语音数据进行缓存或语音识别，通过语音引擎对缓存数据的识别，解决了不同语音识别状态导致的语音引擎识别数据遗漏的问题，提高了语音数据识别结果的全面性。提高了语音数据识别结果的全面性。提高了语音数据识别结果的全面性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、电子设备及存储介质

[0001]本申请涉及语音数据处理
，尤其涉及一种语音识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在基于语音交互的人工智能应用场景中，接收到语音数据的语音识别服务器会通过长连接向语音引擎发送语音数据，语音引擎实时地将语音数据转化为文本内容并将文本内容发送到语音识别服务器，其中，语音引擎在转化过程中可以对文本内容进行语义处理。
[0003]通常，为了保证语音数据识别为文本内容的效果，语音识别服务器需要配置最大交互数量的线路数来进行支持与语音引擎的数据传输。但是，语音交互场景中的语音数据中存在短时间的停顿或长时间的停顿，停顿会导致语音引擎的资源浪费，而语音引擎会根据与语音识别服务器的最大连接数进行资源统计，同时语音引擎支持的线路数越高，语音识别服务器配置要求也会对应增加，增加了语音识别的资源占用。

技术实现思路

[0004]有鉴于此，本申请的目的在于提出一种语音识别方法、装置、电子设备及存储介质，用以解决或部分解决上述技术问题。
[0005]基于上述目的，本申请的第一方面提供了一种语音识别方法，包括：
[0006]接收语音数据；
[0007]对所述语音数据进行端点检测，得到端点检测结果；
[0008]获取语音引擎的连接状态，其中，所述语音引擎被配置为识别所述语音数据；
[0009]根据所述端点检测结果和所述连接状态设置语音识别状态；
[0010]根据所述语音识别状态对所述语音数据进行缓存或...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：接收语音数据；对所述语音数据进行端点检测，得到端点检测结果；获取语音引擎的连接状态，其中，所述语音引擎被配置为识别所述语音数据；根据所述端点检测结果和所述连接状态设置语音识别状态；根据所述语音识别状态对所述语音数据进行缓存或语音识别。2.根据权利要求1所述的方法，其特征在于，所述根据所述端点检测结果和语音引擎连接状态设置语音识别状态，包括：获取所述端点检测结果中的语音开始端点和语音结束端点的存在状态；根据所述存在状态和所述连接状态设置所述语音识别状态。3.根据权利要求2所述的方法，其特征在于，所述根据所述存在状态和所述连接状态设置所述语音识别状态，包括：响应于确定所述存在状态为所述语音数据中不存在所述语音开始端点和所述语音结束端点且所述连接状态为未连接，将所述语音识别状态设置为等待开始状态；响应于确定所述存在状态为所述语音数据中存在所述语音开始端点且所述连接状态为未连接，将所述语音识别状态设置为识别开始状态；响应于确定所述存在状态为所述语音数据中存在所述语音开始端点且所述连接状态为已连接，将所述语音识别状态设置为识别进行状态；响应于确定所述存在状态为所述语音数据中不存在所述语音开始端点和所述语音结束端点且所述连接状态为已连接，将所述语音识别状态设置为识别保持状态；响应于确定所述存在状态为所述语音数据中存在语音结束端点且所述连接状态为已连接，将所述语音识别状态设置为识别结束状态。4.根据权利要求3所述的方法，其特征在于，所述根据所述语音识别状态对所述语音数据进行缓存或语音识别，包括：响应于确定所述语音识别状态为等待开始状态，根据预先设置的缓存时间对所述语音数据进行缓存，得到第一缓存数据；响应于确定所述语音识别状态为识别开始状态，根据所述语音开始端点对应的第一时间点和所述已连接状态对应的第二时间点对所述语音数据进行缓存，得到第二缓存数据；响应于确定所述语音识别状态为识别进行状态，对所述第一缓存数据、所述第二缓存...

【专利技术属性】
技术研发人员：李杭泰，
申请(专利权)人：贵州小爱机器人科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人