直播音频流的获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34087228 阅读:24 留言:0更新日期:2022-07-11 20:18
本申请实施例提供了一种直播音频流的获取方法、装置、电子设备及存储介质,涉及互联网应用技术领域。该方法包括:获取图像采集组件实时采集的图像流数据;对图像流数据的当前帧进行人脸识别,当识别到目标用户的人脸时,确定目标用户的人脸姿态角;当目标用户的人脸姿态角符合预设条件时,控制开启音频采集组件,获取音频采集组件实时采集的音频流数据。本申请实施例能够在用户面对音频采集组件,想要与另一方沟通时,自动将用户的语音信息传输至另一方,提高了用户的体验。提高了用户的体验。提高了用户的体验。

【技术实现步骤摘要】
直播音频流的获取方法、装置、电子设备及存储介质


[0001]本申请涉及互联网应用
,具体而言,本申请涉及一种直播音频流的获取方法、装置、电子设备及存储介质。

技术介绍

[0002]随着移动互联网的不断发展,视频直播类的应用也越来越广泛。
[0003]在目前视频直播或视频通话过程中,也存在关闭或打开麦克风的情况,一个终端用户通过手动设置静音与否来传递或屏蔽自己的声音。同时也可以调用语音识别技术,实现实时的语音对话转文字,从而提高交互体验。但是目前的操作需要人为手动进行设置,当用户需要反复开关设置时,操作较为繁琐。

技术实现思路

[0004]本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的直播音频流的获取方法、装置、电子设备及存储介质。
[0005]第一方面,提供了一种直播音频流的获取方法,该方法包括:
[0006]获取图像采集组件实时采集的图像流数据;
[0007]对图像流数据的当前帧进行人脸识别,当识别到目标用户的人脸时,确定目标用户的人脸姿态角;
>[0008]当目标本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种直播音频流的获取方法,其特征在于,包括:获取图像采集组件实时采集的图像流数据;对所述图像流数据的当前帧进行人脸识别,当识别到目标用户的人脸时,确定所述目标用户的人脸姿态角;当所述目标用户的人脸姿态角符合预设条件时,控制开启音频采集组件,获取所述音频采集组件实时采集的音频流数据。2.根据权利要求1所述的直播音频流的获取方法,其特征在于,获取所述音频采集组件实时采集的音频流数据,之后还包括:对音频流数据进行语音识别,获取语音识别文本。3.根据权利要求1所述的直播音频流的获取方法,其特征在于,所述确定目标用户的人脸姿态角,之后还包括:当确定目标用户的人脸姿态角不符合预设条件时,关闭所述音频采集组件实时采集音频流数据。4.根据权利要求1所述的直播音频流的获取方法,其特征在于,所述确定目标用户的人脸姿态角,之后还包括:当确定目标用户的人脸姿态角不符合预设条件,且确定所述目标用户处于说话状态时,则控制开启音频采集组件;根据所述目标用户的人脸姿态角,获取并调整所述音频采集组件实时采集的音频流数据的音量。5.根据权利要求1所述的直播音频流的获取方法,其特征在于,所述当所述目标用户的人脸姿态角符合预设条件时,包括:若所述目标用户的人脸姿态角小于预先确定的人脸姿态角阈值,则确定所述目标用户的人脸姿态角符合预设条件。6.根据权利要求5所述的直播音频流的获取方法,其特征在于,所述控制开启音频采集组件,之前还包括:确定所述目标用户的肩部围绕预设坐标轴的偏转角,作为肩部偏转角,所述预设坐标轴的方向为人的头部顶端指向脖子的方向;所述控制开启音频采集组件,包括:当所述目标用户的人脸姿态角符合预设条件,且所述肩部偏转角小于预设的肩部偏转角阈值时,则控制开启音频采集组件。7.根据权利要求6所述的直播音频流的获取方法,其特征在于,所述确定所述目标用户的人脸姿态角,之前还包括:对所述目标用户进行体态识别,确定所述用户的体态信息,所述体态信息用于表征所述用户为坐姿或者站姿;根据所述用户的体态信息确定对应的人脸姿态角阈值和肩部偏转角阈值:若所述用户的姿态信息为坐姿,则对应的人脸姿态角阈值为第一人脸姿态角阈值,对应的肩部偏转角阈值为第一肩部偏转角阈值;若所述用户的姿态信息为站姿,则对应的人脸姿态角阈值为第二人脸姿态角...

【专利技术属性】
技术研发人员:张明远
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1