基于音视频录制的语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：26036760 阅读：15 留言：0更新日期：2020-10-23 21:15

本发明专利技术公开了一种基于音视频录制的语音识别方法、装置、设备及存储介质，所述方法包括：当接收到音视频录制请求时，实时获取视频数据以及音频数据；将所述音频数据复制为目标音频数据，并将所述目标音频数据存储到内存队列中；将所述视频数据和所述音频数据生成为音视频文件，并从所述内存队列中读取所述目标音频数据进行识别，生成识别结果，以对音视频录制时的语音进行识别。本发明专利技术通过将音频数据复制到内存队列，从内存队列中读取视频数据即可进行识别，使得音视频录制和语音识别功能同时实现，提升了音视频录制和语音识别的整体处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于音视频录制的语音识别方法、装置、设备及存储介质
本专利技术涉及音视频处理
，尤其涉及一种基于音视频录制的语音识别方法、装置、设备及存储介质。
技术介绍
随着技术的发展，音视频录制的使用场景越来越多，如执法过程中通过录制音视频记录执法人员对执法事项的处理，或者金融机构通过录制音视频记录客户对金融事项的处理。该类记录除了录制音视频之外，还需要对所录制音视频中的语音进行识别，以确保事项处理过程中的语言合法准确。目前，音视频录制功能和语音识别功能都需要占用音频通道，对于某些录制终端并不支持两者的同时进行，若音视频录制对音频通道占用，则不能通过音频通道读取音频数据进行语音识别；或者通过音频通道输入音频数据进行语音识别，则不能通过音频通道实现音视频录制。如此一来，导致对于音视频录制功能和语音识别功能，在获取到音频数据后分别先后处理实现，在先处理功能的异常性或耗时较长直接影响到在后处理功能的实现时长。
技术实现思路
本专利技术的主要目的在于提供一种基于音视频录制的语音识别方法、装置、设备及存储介质，旨在解决现有技术中对于音视频录制功能和语音识别功能的先后处理机制，导致在后处理功能的实现时长受在先处理功能的处理时长影响的技术问题。为实现上述目的，本专利技术提供一种基于音视频录制的语音识别方法，所述基于音视频录制的语音识别方法包括以下步骤：当接收到音视频录制请求时，实时获取视频数据以及音频数据；将所述音频数据复制为目标音频数据，并将所述目标音频数据存储到内存队列中；...

【技术保护点】
1.一种基于音视频录制的语音识别方法，其特征在于，所述基于音视频录制的语音识别方法包括以下步骤：/n当接收到音视频录制请求时，实时获取视频数据以及音频数据；/n将所述音频数据复制为目标音频数据，并将所述目标音频数据存储到内存队列中；/n将所述视频数据和所述音频数据生成为音视频文件，并从所述内存队列中读取所述目标音频数据进行识别，生成识别结果，以对音视频录制时的语音进行识别。/n

【技术特征摘要】
1.一种基于音视频录制的语音识别方法，其特征在于，所述基于音视频录制的语音识别方法包括以下步骤：
当接收到音视频录制请求时，实时获取视频数据以及音频数据；
将所述音频数据复制为目标音频数据，并将所述目标音频数据存储到内存队列中；
将所述视频数据和所述音频数据生成为音视频文件，并从所述内存队列中读取所述目标音频数据进行识别，生成识别结果，以对音视频录制时的语音进行识别。

2.如权利要求1所述的基于音视频录制的语音识别方法，其特征在于，所述从所述内存队列中读取所述目标音频数据进行识别，生成识别结果的步骤包括：
逐一从所述内存队列中读取所述音频数据，并对所述音频数据进行过滤，生成待处理音频数据；
检测预设音频库中是否存在与所述待处理音频数据对应的参考音频，若存在所述参考音频，则调用与所述参考音频对应的文字信息，并将所述文字信息生成为所述识别结果。

3.如权利要求2所述的基于音视频录制的语音识别方法，其特征在于，所述检测预设音频库中是否存在与所述待处理音频数据对应的参考音频的步骤包括：
将所述待处理音频数据逐一和所述预设音频库中各项音频元素进行对比，确定所述待处理音频数据与各项所述音频元素之间的匹配率；
根据各项所述匹配率，确定所述预设音频库中是否存在与所述待处理音频数据对应的参考音频。

4.如权利要求3所述的基于音视频录制的语音识别方法，其特征在于，所述根据各项所述匹配率，确定所述预设音频库中是否存在与所述待处理音频数据对应的参考音频的步骤包括：
从各项所述匹配率中确定出最大匹配率，并判断所述最大匹配率是否大于预设阈值；
若所述最大匹配率大于预设阈值，则将所述最大匹配率对应的音频元素确定为所述参考音频，判定所述预设音频库中存在所述参考音频；
若所述最大匹配率小于或等于预设阈值，则判定所述预设音频库中不存在所述参考音频。

5.如权利要求3所述的基于音视频录制的语音识别方法，其特征在于，所述将所述待处理音频数据逐一和所述预设音频库中各项音频元素进行对比，确定所述待处理音频数据与各项所述音频元素之间的匹配率的步骤包括：
调用所述预设音频库的各项音频元素，并针对各项...

【专利技术属性】
技术研发人员：陈俣作，朱健英，
申请(专利权)人：前海人寿保险股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人