一种直播间的音量调节方法及客户端技术

技术编号:19704238 阅读:162 留言:0更新日期:2018-12-08 14:48
本申请实施方式公开了一种直播间的音量调节方法及客户端,其中,所述方法包括:从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流,并从直播服务器处下载直播音视频流;将下载的所述语音流合成为一股语音流,并对合成后的语音流进行解码,得到人声音轨,并对下载的所述直播音视频流进行解码,得到直播音轨;识别所述人声音轨的音量,并根据识别出的所述音量,调节所述直播音轨的音量大小;将所述人声音轨和调节音量之后的直播音轨合并为一个音轨,并输出合并之后的音轨。本申请提供的技术方案,能够提高用户的视听体验。

【技术实现步骤摘要】
一种直播间的音量调节方法及客户端
本申请涉及互联网
,特别涉及一种直播间的音量调节方法及客户端。
技术介绍
随着视频直播的兴起,涌现出大量的视频直播平台。在视频直播平台中,可以划分多个视频直播间,这些视频直播间通常由主播主持。主播可以将直播内容推送至直播服务器,然后视频直播间内的用户可以从直播服务器处下载并观看该视频直播间的直播内容。当前,用户观看的直播内容中,可能会有主持人在讲解该直播内容。例如,在某个足球转播的直播间内,主持人与用户通常在观看足球赛,同时,主持人还需要对球赛进行解说。在这种情况下,用户的客户端会接收到球赛的直播内容,同时还会接收到主持人解说的语音内容。通常而言,用户只能统一调整直播间内的音量,而不能单独调整直播内容或者解说的语音内容各自的音量。这就导致有时候直播内容音量过大,会覆盖解说的语音内容。此外,通过用户手动调整音量的方式,会加重用户的负担。因此,目前的直播间的音量调节方式,具备较差的视听体验。
技术实现思路
本申请实施方式的目的是提供一种直播间的音量调节方法及客户端,能够提高用户的视听体验。为实现上述目的,本申请实施方式提供一种直播间的音量调节方法,所述方法包括:从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流,并从直播服务器处下载直播音视频流;将下载的所述语音流合成为一股语音流,并对合成后的语音流进行解码,得到人声音轨,并对下载的所述直播音视频流进行解码,得到直播音轨;识别所述人声音轨的音量,并根据识别出的所述音量,调节所述直播音轨的音量大小;将所述人声音轨和调节音量之后的直播音轨合并为一个音轨,并输出合并之后的音轨。为实现上述目的,本申请实施方式还提供一种客户端,所述客户端包括:数据下载单元,用于从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流,并从直播服务器处下载直播音视频流;解码单元,用于将下载的所述语音流合成为一股语音流,并对合成后的语音流进行解码,得到人声音轨,并对下载的所述直播音视频流进行解码,得到直播音轨;音量调节单元,用于识别所述人声音轨的音量,并根据识别出的所述音量,调节所述直播音轨的音量大小;音轨输出单元,用于将所述人声音轨和调节音量之后的直播音轨合并为一个音轨,并输出合并之后的音轨。为实现上述目的,本申请实施方式还提供一种客户端,所述客户端包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的直播间的音量调节方法。由上可见,本申请提供的技术方案,客户端可以从语音服务器处下载同一直播组其他用户的语音流,并可以从直播服务器处下载直播音视频流。然后,将这两种不同的数据流分别解码,从而得到人声音轨和直播音轨。然后,可以识别所述人声音轨的音量,并根据识别出的所述音量,调节所述直播音轨的音量大小。具体地,当出现人声音轨时,可以适当调低直播音轨的音量;而当不存在人声音轨时,可以适当调高直播音轨的音量。最终,可以将所述人声音轨和调节音量之后的直播音轨合并为一个音轨,并输出合并之后的音轨。由上可见,客户端可以针对人声音轨当前的音量情况,对直播音轨进行动态调整,使得用户能够听清人声音轨的内容,从而能够提高用户的视听体验。附图说明为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施方式中语音连麦的直播系统示意图;图2为本申请实施方式中直播间的音量调节方法步骤图;图3为本申请实施方式中客户端的功能模块示意图;图4为本申请实施方式中客户端的结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。本申请提供一种直播间的音量调节方法,该方法可以应用于如图1所示的系统中。请参阅图1,视频直播系统可以包括语音服务器、直播服务器以及客户端。其中,所述客户端可以是用户使用的终端设备,在所述终端设备中,可以具备视频直播软件,并且所述终端设备上可以具备用于收录用户的语音信息的麦克风。此外,所述客户端还可以指所述终端设备中运行的视频直播软件。该视频直播软件可以调用所述终端设备上的麦克风,从而收录用户的语音信息。所述语音服务器,可以用于接收各个客户端上传的用户的语音信息,并可以将这些语音信息根据预设的流媒体协议,转换为语音流。所述直播服务器,则可以接收主播的终端设备发来的直播内容,并可以将该直播内容转换为直播音视频流。请参阅图2,本申请提供的直播间的音量调节方法可以包括以下步骤。S1:从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流,并从直播服务器处下载直播音视频流。在本实施方式中,处于同一视频直播间内的部分用户加入同一直播组之后,可以开启组内语音连麦的功能。在组内语音连麦功能开启的情况下,用户的麦克风可以实时采集用户的语音信息。采集的语音信息可以被用户的客户端上传至语音服务器。在语音服务器中,可以按照预设的流媒体协议,将语音信息转换为用户的语音流。该预设的流媒体协议例如可以是HLS(HTTPLiveStreaming,HTTP直播流)协议。当然,该预设的流媒体协议还可以按照实际情况进行更改。例如,该预设的流媒体协议还可以是WebRTC(WebReal-TimeCommunication,页面实时通信)协议。当然,视频直播间内的主持人也可以视为与用户处于同一直播组中,主持人现场录制的语音信息同样会被上传至语音服务器,从而由语音服务器下发至直播组中的其他用户。在本实施方式中,开启语音连麦功能的用户需要收听同一直播组中其他用户的语音信息。此时,用户的客户端可以向语音服务器发起数据获取请求。该数据获取请求中可以携带该用户的用户标识。这样,语音服务器在接收到该数据获取请求后,可以识别出其中包含的用户标识。通过该用户标识,语音服务器可以确定该用户标识所处的直播组,然后可以将该直播组中除该用户标识表征的语音流之外的其他用户的语音流提供给该用户的客户端。一方面可以使得该用户能够听到同一直播组中其他用户的实时语音信息,另一方面也避免该用户会收听到自身的语音信息。在本实施方式中,用户在收听同一直播组中其他用户的语音信息时,还需要观看直播内容。因此,用户的客户端可以从直播服务器处下载直播音视频流。S3:将下载的所述语音流合成为一股语音流,并对合成后的语音流进行解码,得到人声音轨,并对下载的所述直播音视频流进行解码,得到直播音轨。在本实施方式中,由于同一直播组中其他用户的数量可能不止一个,因此从语音服务器处下载的语音流的数量也可以不止一个。在这种情况下,客户端可以将下载的语音流合成为一股语音流,并对合成后的语音流进行解码,从而得到人声音轨。此外,客户端还可以对所述直播音视频流进行解码,得到直播音轨。S5:本文档来自技高网
...

【技术保护点】
1.一种直播间的音量调节方法,其特征在于,所述方法包括:从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流,并从直播服务器处下载直播音视频流;将下载的所述语音流合成为一股语音流,并对合成后的语音流进行解码,得到人声音轨,并对下载的所述直播音视频流进行解码,得到直播音轨;识别所述人声音轨的音量,并根据识别出的所述音量,调节所述直播音轨的音量大小;将所述人声音轨和调节音量之后的直播音轨合并为一个音轨,并输出合并之后的音轨。

【技术特征摘要】
1.一种直播间的音量调节方法,其特征在于,所述方法包括:从语音服务器处下载与当前用户处于同一直播组的其他用户的语音流,并从直播服务器处下载直播音视频流;将下载的所述语音流合成为一股语音流,并对合成后的语音流进行解码,得到人声音轨,并对下载的所述直播音视频流进行解码,得到直播音轨;识别所述人声音轨的音量,并根据识别出的所述音量,调节所述直播音轨的音量大小;将所述人声音轨和调节音量之后的直播音轨合并为一个音轨,并输出合并之后的音轨。2.根据权利要求1所述的方法,其特征在于,根据识别出的所述音量,调节所述直播音轨的音量大小包括:若识别出的所述人声音轨的音量大于或者等于指定音量阈值,将所述直播音轨的音量调节至第一音量;在所述直播音轨的音量处于所述第一音量时,若识别出的所述人声音轨的音量小于所述指定音量阈值,将所述直播音轨的音量调节至第二音量;其中,所述第一音量小于所述第二音量。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:采集所述当前用户的音频信息,并去除所述音频信息中表征环境噪音的信息,得到表征语音的语音信息;识别所述语音信息中的回音信号,并从所述语音信息中将所述回音信号去除;从去除回音信号的语音信息中将除所述当前用户以外的其他用户的语音信息去除,得到所述当前用户的语音信息;将所述当前用户的语音信息上传至语音服务器,以使得所述语音服务器将所述当前用户的语音信息转换为所述当前用户的语音流。4.根据权利要求3所述的方法,其特征在于,去除所述音频信息中表征环境噪音的信息包括:识别所述音频信息中的音频特征,并确定所述音频特征与标准人声特征之间的差异值;若所述差异值大于或者等于指定阈值,将所述音频特征对应的信息从所述音频信息中去除。5.根据权利要求4所述的方法,其特征在于,识别所述音频信息中的音频特征,并确定所述音频特征与标准人声特征之间的差异值包括:将处于时间域的所述音频信息转换至频率域,并从频率域的音频信息中识别出信号强度达到指定强度阈值的信息对应的目标频率,并将识别出的所述目标频率作为所述音频信息中包含的音频特征;计算所述目标频率与标准人声频率之间的频率差值,并将所述频率差值作为所述音频特征与标准人声特征之间的差异值。6.根据权利要求3所述的方法,其特征在于,在得到表征语音的语音信息之后,所述方法还包括:在所述语音信息中识别目标语音段,所述目标语音段中任一信息的强度值均低于指定强度阈值;若所述目标语音段的时长大于或者等于指定时长阈值,在所述目标语音段...

【专利技术属性】
技术研发人员:潘璠
申请(专利权)人:北京优酷科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1