一种直播间的音量调节方法及客户端技术

技术编号：19704238 阅读：162 留言：0更新日期：2018-12-08 14:48

本申请实施方式公开了一种直播间的音量调节方法及客户端，其中，所述方法包括：从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流，并从直播服务器处下载直播音视频流；将下载的所述语音流合成为一股语音流，并对合成后的语音流进行解码，得到人声音轨，并对下载的所述直播音视频流进行解码，得到直播音轨；识别所述人声音轨的音量，并根据识别出的所述音量，调节所述直播音轨的音量大小；将所述人声音轨和调节音量之后的直播音轨合并为一个音轨，并输出合并之后的音轨。本申请提供的技术方案，能够提高用户的视听体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种直播间的音量调节方法及客户端
本申请涉及互联网
，特别涉及一种直播间的音量调节方法及客户端。
技术介绍
随着视频直播的兴起，涌现出大量的视频直播平台。在视频直播平台中，可以划分多个视频直播间，这些视频直播间通常由主播主持。主播可以将直播内容推送至直播服务器，然后视频直播间内的用户可以从直播服务器处下载并观看该视频直播间的直播内容。当前，用户观看的直播内容中，可能会有主持人在讲解该直播内容。例如，在某个足球转播的直播间内，主持人与用户通常在观看足球赛，同时，主持人还需要对球赛进行解说。在这种情况下，用户的客户端会接收到球赛的直播内容，同时还会接收到主持人解说的语音内容。通常而言，用户只能统一调整直播间内的音量，而不能单独调整直播内容或者解说的语音内容各自的音量。这就导致有时候直播内容音量过大，会覆盖解说的语音内容。此外，通过用户手动调整音量的方式，会加重用户的负担。因此，目前的直播间的音量调节方式，具备较差的视听体验。
技术实现思路
本申请实施方式的目的是提供一种直播间的音量调节方法及客户端，能够提高用户的视听体验。为实现上述目的，本申请实施方式提供一种直播间的音量调节方法，所述方法包括：从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流，并从直播服务器处下载直播音视频流；将下载的所述语音流合成为一股语音流，并对合成后的语音流进行解码，得到人声音轨，并对下载的所述直播音视频流进行解码，得到直播音轨；识别所述人声音轨的音量，并根据识别出的所述音量，调节所述直播音轨的音量大小；将所述人声音轨和调节音量之后的直播音轨合并为一个音轨，并输出合并之后的...

【技术保护点】
1.一种直播间的音量调节方法，其特征在于，所述方法包括：从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流，并从直播服务器处下载直播音视频流；将下载的所述语音流合成为一股语音流，并对合成后的语音流进行解码，得到人声音轨，并对下载的所述直播音视频流进行解码，得到直播音轨；识别所述人声音轨的音量，并根据识别出的所述音量，调节所述直播音轨的音量大小；将所述人声音轨和调节音量之后的直播音轨合并为一个音轨，并输出合并之后的音轨。

【技术特征摘要】
1.一种直播间的音量调节方法，其特征在于，所述方法包括：从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流，并从直播服务器处下载直播音视频流；将下载的所述语音流合成为一股语音流，并对合成后的语音流进行解码，得到人声音轨，并对下载的所述直播音视频流进行解码，得到直播音轨；识别所述人声音轨的音量，并根据识别出的所述音量，调节所述直播音轨的音量大小；将所述人声音轨和调节音量之后的直播音轨合并为一个音轨，并输出合并之后的音轨。2.根据权利要求1所述的方法，其特征在于，根据识别出的所述音量，调节所述直播音轨的音量大小包括：若识别出的所述人声音轨的音量大于或者等于指定音量阈值，将所述直播音轨的音量调节至第一音量；在所述直播音轨的音量处于所述第一音量时，若识别出的所述人声音轨的音量小于所述指定音量阈值，将所述直播音轨的音量调节至第二音量；其中，所述第一音量小于所述第二音量。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：采集所述当前用户的音频信息，并去除所述音频信息中表征环境噪音的信息，得到表征语音的语音信息；识别所述语音信息中的回音信号，并从所述语音信息中将所述回音信号去除；从去除回音信号的语音信息中将除所述当前用户以外的其他用户的语音信息去除，得到所述当前用户的语音信息；将所述当前用户的语音信息上传至语音服务器，以使得所述语音服务器将所述当前用户的语音信息转换为所述当前用户的语音流。4.根据权利要求3所述的方法，其特征在于，去除所述音频信息中表征环境噪音的信息包括：识别所述音频信息中的音频特征，并确定所述音频特征与标准人声特征之间的差异值；若所述差异值大于或者等于指定阈值，将所述音频特征对应的信息从所述音频信息中去除。5.根据权利要求4所述的方法，其特征在于，识别所述音频信息中的音频特征，并确定所述音频特征与标准人声特征之间的差异值包括：将处于时间域的所述音频信息转换至频率域，并从频率域的音频信息中识别出信号强度达到指定强度阈值的信息对应的目标频率，并将识别出的所述目标频率作为所述音频信息中包含的音频特征；计算所述目标频率与标准人声频率之间的频率差值，并将所述频率差值作为所述音频特征与标准人声特征之间的差异值。6.根据权利要求3所述的方法，其特征在于，在得到表征语音的语音信息之后，所述方法还包括：在所述语音信息中识别目标语音段，所述目标语音段中任一信息的强度值均低于指定强度阈值；若所述目标语音段的时长大于或者等于指定时长阈值，在所述目标语音段...

【专利技术属性】
技术研发人员：潘璠，
申请(专利权)人：北京优酷科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人