一种安卓终端支持实时语音识别的双录方法技术

技术编号：34773671 阅读：24 留言：0更新日期：2022-08-31 19:40

本发明专利技术公开了一种安卓终端支持实时语音识别的双录方法，包含以下步骤：1)通过终端摄像头获取双录人员的视频数据，并全屏显示在屏幕上；2)将终端屏幕摄像头预览视图和双录交互视图一起进行屏幕录制；3)录制屏幕的同时，通过终端麦克风获取音频数据并加以处理，进行实时语音识别；4)将步骤二里录制的视频流数据和步骤三的音频流数据进行合流，生成mp4文件。本发明专利技术解决了在使用双录功能的过程中，既可以把双录人员在手机上的操作都录制到视频里，又可以做到实时采集双录里的音频流进行分析，用于识别双录人员的回答，在提升了双录用户使用体验的同时，又为双录智能质检提供了一项语音识别的能力。别的能力。别的能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种安卓终端支持实时语音识别的双录方法

[0001]本专利技术涉及一种音频采集技术，具体是一种安卓终端支持实时语音识别的双录方法

技术介绍

[0002]目前市场上的同类产品(保险本地双录)一般有以下2种做法
[0003]1.通过Android的摄像头和麦克风采集双录人员(销售人员和投保人)的画面及声音，也能对终端麦克风的声音进行识别，但无法将手机屏幕里的操作内容录制进视频
[0004]2.通过MediaRecorder，MediaProjection实现录屏，能够采集双录人员(销售人员和投保人)的画面及声音，也能把手机屏幕里的操作内容录制进视频，但无法做到对视频里的声音进行语音识别。
[0005]上述方法能够将当前双录人员(销售人员和投保人)的画面和声音采集后上传到到服务器，供保险销售的回溯使用。但是双录的内容很容易受到限制，要么放弃手机屏幕里的操作内容的展示，要么舍弃语音识别功能，两者不可兼得。
[0006]因此，亟需提出一种双录方法，同时实现手机屏幕里的操作内容的展示和语音识别。

技术实现思路

[0007]本专利技术的目的在于提供一种安卓终端支持实时语音识别的双录方法，以解决上述
技术介绍
中提出的问题。
[0008]本专利技术的目的是通过以下技术方案来实现的：本专利技术实施例的第一方面提供了一种安卓终端支持实时语音识别的双录方法，包含以下步骤：
[0009](1)通过终端屏幕摄像头获取双录人员的视频数据，并全屏显示在屏幕上；
[0010](2)...

【技术保护点】

【技术特征摘要】
1.一种安卓终端支持实时语音识别的双录方法，其特征在于，包含以下步骤：(1)通过终端屏幕摄像头获取双录人员的视频数据，并全屏显示在屏幕上；(2)将终端屏幕摄像头预览视图和双录交互视图一起进行屏幕录制，得到视频流数据；(3)录制屏幕的同时，通过终端麦克风获取音频数据并加以处理，进行实时语音识别，得到音频流数据；(4)将步骤(2)里录制的视频流数据和步骤(3)采集的音频流数据进行合流，生成mp4文件。2.根据权利要求1所述的一种安卓终端支持实时语音识别的双录方法，其特征在于，使用SurfaceView将终端摄像头获取双录人员的视频数据通过setPreviewSurface(surface)函数进行展示，并利用startPreview()函数开启预览。3.根据权利要求2所述的一种安卓终端支持实时语音识别的双录方法，其特征在于，开启预览后的预览视图上覆盖有透明度的双录交互视图，用于对双录人员进行引导提示。4.根据权利要求1所述的一种安卓终端支持实时语音识别的双录方法，其特征在于，利用VirtualDisplay软件获取屏幕和终端屏幕摄像头的图像元数据；再利用MediaCodec对获取的图像元数据进行编码封装成视频数据流。5.根据权利要求1所述的一种安卓终端支持实时语音识别的双录方法，其特征在于，所述步骤(3)通过以下子步骤来实现：(3.1)录屏过程中，VirtualDisplay会将图像渲染到Surface中，该Surface由MediaCodec创建，MediaCodec用于提供对音视频压缩编码和解码功能；(3.2)将系统产生的音频数据交于...

【专利技术属性】
技术研发人员：谢春江，周光辉，
申请(专利权)人：杭州微易信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人