语音识别处理方法及装置制造方法及图纸

技术编号：13504631 阅读：49 留言：0更新日期：2016-08-10 04:44

本申请提出一种语音识别处理方法和装置，其中，该方法包括：从语音处理库的语音数据中获取待识别的数据块，标记与数据块对应的识别标签，识别标签包括：根据语音检测的端点时刻为数据块归属的语音分句分配的分句标识，以及数据块在语音分句中的块标识；向语音识别服务器发送携带所述识别标签的数据块识别请求，并接收携带所述识别标签的数据块识别结果；根据所有数据块识别结果中的识别标签，将属于同一语音分句中的多个数据块进行整合，以及将所有的语音分句进行整合。实现了利用现有的语音处理库对长时间的连续语音进行识别处理，提高了语音识别的稳健性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别处理
，尤其涉及一种语音识别处理方法及装置。
技术介绍
随着语音识别技术的发展，连续无限语音识别的应用领域越来越广，例如:会议记录，录音备份等场合，往往一个会议或者访谈需要持续半个小时甚至更长时间，而且中间可能会有持续I分钟或者以上的静默时间。在上述应用场景下，需要使用连续无限语音识别功能，在用户开启语音识别之后持续工作。然而，目前的语音识别功能仅限于短暂的语音识别场景，比如:语音搜搜系统、智能家居系统等。在目前的语音识别的过程中，根据端点检测语音处理库的资源限制，只能识别比较短的句子(例如60秒)，无法对长时间连续输入的语音进行识别。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本申请的第一个目的在于提出一种语音识别处理方法，该方法实现了利用现有的语音处理库对长时间的连续语音进行识别处理，提高了语音识别的稳健性。本申请的第二个目的在于提出一种语音识别处理装置。为达上述目的，本申请第一方面实施例提出了一种语音识别处理方法，包括:在语音连续输入过程中，从语音处理库的语音数据中获取待识别的数据块，标记与所述数据块对应的识别标签，其中，所述识别标签包括:根据语音检测的端点时刻为所述数据块归属的语音分句分配的分句标识，以及所述数据块在所述语音分句中的块标识；向语音识别服务器发送携带所述识别标签的数据块识别请求，并接收所述语音服务器返回的携带所述识别标签的数据块识别结果;根据所有数据块识别结果中的识别标签，将属于同一语音分句中的多个数据块进行整合，以及将所有的语音分句进行整合。本申请实施例的语音识别处...

【技术保护点】
一种语音识别处理方法，其特征在于，包括以下步骤：在语音连续输入过程中，从语音处理库的语音数据中获取待识别的数据块，标记与所述数据块对应的识别标签，其中，所述识别标签包括：根据语音检测的端点时刻为所述数据块归属的语音分句分配的分句标识，以及所述数据块在所述语音分句中的块标识；向语音识别服务器发送携带所述识别标签的数据块识别请求，并接收所述语音服务器返回的携带所述识别标签的数据块识别结果；根据所有数据块识别结果中的识别标签，将属于同一语音分句中的多个数据块进行整合，以及将所有的语音分句进行整合。

【技术特征摘要】

【专利技术属性】
技术研发人员：白晶亮，穆向禹，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人