声音的处理方法、装置、终端设备和存储介质制造方法及图纸

技术编号:22412075 阅读:56 留言:0更新日期:2019-10-30 00:20
本申请实施例公开了一种声音的处理方法、装置、终端设备和存储介质,上述声音的处理方法包括:获得用户设置的聊天背景图;对所述聊天背景图进行场景识别;获得与所述场景识别的结果匹配的背景声音;在所述用户视频聊天的过程中,播放所述背景声音。本申请可以实现对视频聊天过程中的聊天背景图进行场景识别,从服务器获得与上述场景识别的结果匹配的背景声音,并自动播放上述背景声音,可以给用户带来个性化的视频体验。

【技术实现步骤摘要】
声音的处理方法、装置、终端设备和存储介质
本申请涉及计算机应用
,尤其涉及一种声音的处理方法、装置、终端设备和存储介质。
技术介绍
伴随着新经济的发展,互联网逐渐成为了世界的主导,在短短数十年的时间里,网络变得越来越完善,越来越可爱,网络拉近了人与人之间的距离,让更多的人体会到了“身隔千里远,情系一线间”的快感。网络的发展也促进了通讯手段的变化,传统的交流方式已经不能满足人们的要求,网络带来了通讯速度的提升,更降低了通讯成本。而随着宽带网络的普及,人们对网络通讯也有了进一步的要求,宽带网络的发展,改变了传统网络通讯的质量和形式,使交流不再只是局限于普通语言文字,利用视频可以让天各一方的朋友能够彼此相见。视频聊天就是利用网页技术和客户端技术,通过可视化的数码工具来聊天,现在,用户有在视频聊天过程中添加背景声音和/或改变自身声音的需求,现有相关技术中,QQ电话功能提供“变声”入口,在用户选择音效之后,变声图标将变为所选择的音效的图标,用户说出来的声音也随之发生变化。
技术实现思路
现有技术提供的“变声”的技术方案中,音效是固定的,需要用户主动去选择,无法达到真正的个性化,用户难以融入个人创意,用户在将固定的音效都体验过后,难以被持续的吸引,另外,这种方案只能改变用户自身的声音,无法实现为上述用户的视频聊天过程添加背景声音。为此,本申请的实施例提供一种声音的处理方法、装置、终端设备和存储介质,可以实现对视频聊天过程中的聊天背景图进行场景识别,从服务器获得与上述场景识别的结果匹配的背景声音,并自动播放上述背景声音,可以给用户带来个性化的视频体验。本申请实施例采用如下技术方案:第一方面,本申请实施例提供一种声音的处理方法,包括:获得用户设置的聊天背景图;对所述聊天背景图进行场景识别;获得与所述场景识别的结果匹配的背景声音;在所述用户视频聊天的过程中,播放所述背景声音。其中在一种具体的实施方式中,所述对所述聊天背景图进行场景识别之后,还包括:如果所述场景识别的结果中包括所述聊天背景图所关联的背景人物,则获得所述背景人物的声音特征;根据所述背景人物的声音特征对所述用户的声音特征进行处理,将所述用户声音改变为所述背景人物的声音后,在所述用户视频聊天的过程中输出所述背景人物的声音;所述声音特征包括:基音频率、共振峰位置、共振峰带宽、基音频率和音调之一或组合。其中在一种具体的实施方式中,所述对所述聊天背景图进行场景识别包括:识别所述聊天背景图中的景物和场景类别;和/或识别所述聊天背景图中的拍摄信息。其中在一种具体的实施方式中,所述获得与所述场景识别的结果匹配的背景声音包括:根据所述场景识别的结果生成场景描述标签;将所述场景描述标签发送给服务器;接收所述服务器根据所述场景描述标签搜索获得的与所述场景识别的结果匹配的背景声音。其中在一种具体的实施方式中,所述获得所述背景人物的声音特征包括:提取所述聊天背景图中所述背景人物的特征和所述聊天背景图的图片内容特征;将所述背景人物的特征和所述聊天背景图的图片内容特征发送给所述服务器;接收所述服务器发送的所述背景人物的声音特征。第二方面,本申请实施例提供一种声音的处理装置,包括:获得模块,用于获得用户设置的聊天背景图;识别模块,用于对所述获得模块获得的聊天背景图进行场景识别;所述获得模块,还用于获得与所述场景识别的结果匹配的背景声音;播放模块,用于在所述用户视频聊天的过程中,播放所述获得模块获得的背景声音。其中在一种具体的实施方式中,所述声音的处理装置还包括:变声模块;所述获得模块,还用于当所述场景识别的结果中包括所述聊天背景图所关联的背景人物时,从所述服务器获得所述背景人物的声音特征;所述变声模块,用于根据所述获得模块获得的所述背景人物的声音特征对所述用户的声音特征进行处理;所述播放模块,还用于在所述变声模块将所述用户声音改变为所述背景人物的声音后,在所述用户视频聊天的过程中输出所述背景人物的声音;所述声音特征包括:基音频率、共振峰位置、共振峰带宽、基音频率和音调之一或组合。其中在一种具体的实施方式中,所述识别模块,具体用于识别所述聊天背景图中的景物和场景类别;和/或识别所述聊天背景图中的拍摄信息。其中在一种具体的实施方式中,所述获得模块包括:生成子模块,用于根据所述场景识别的结果生成场景描述标签;发送子模块,用于将所述场景描述标签发送给服务器;接收子模块,用于接收所述服务器根据所述场景描述标签搜索获得的与所述场景识别的结果匹配的背景声音。其中在一种具体的实施方式中,所述获得模块包括:提取子模块,用于提取所述聊天背景图中所述背景人物的特征和所述聊天背景图的图片内容特征;发送子模块,用于将所述提取子模块提取的所述背景人物的特征和所述聊天背景图的图片内容特征发送给所述服务器;接收子模块,用于接收所述服务器发送的所述背景人物的声音特征。第三方面,本申请实施例提供一种终端设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上所述的方法。第四方面,本申请实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。第五方面,本申请实施例提供一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如上所述的方法。本申请实施例提供的声音的处理方法、装置和终端设备,通过对用户设置的聊天背景图进行场景识别,获得与上述场景识别的结果匹配的背景声音,然后在上述用户视频聊天的过程中,播放上述背景声音,从而可以实现根据用户设置的聊天背景图,在上述用户视频聊天的过程中,自动播放与上述聊天背景图匹配的背景声音,给用户带来个性化的视频体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请声音的处理方法一个实施例的流程图;图2为本申请声音的处理方法另一个实施例的流程图;图3为本申请声音的处理方法再一个实施例的流程图;图4为本申请声音的处理方法再一个实施例的流程图;图5为本申请声音的处理方法再一个实施例的流程图;图6为本申请声音的处理方法的应用场景一个实施例的示意图;图7为本申请声音的处理方法的应用场景另一个实施例的示意图;图8为本申请声音的处理装置一个实施例的结构示意图;图9为本申请声音的处理装置另一个实施例的结构示意图;图10为本申请终端设备一个实施例的结构示意图;图11为本申请手机10内部部分一个实施例的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况本文档来自技高网...

【技术保护点】
1.一种声音的处理方法,其特征在于,包括:获得用户设置的聊天背景图;对所述聊天背景图进行场景识别;获得与所述场景识别的结果匹配的背景声音;在所述用户视频聊天的过程中,播放所述背景声音;所述对所述聊天背景图进行场景识别之后,所述方法还包括:如果所述场景识别的结果中包括所述聊天背景图所关联的背景人物,则获得所述背景人物的声音特征;根据所述背景人物的声音特征对所述用户的声音特征进行处理,将所述用户声音改变为所述背景人物的声音后,在所述用户视频聊天的过程中输出所述背景人物的声音;所述声音特征包括:基音频率、共振峰位置、共振峰带宽、基音频率和音调之一或组合。

【技术特征摘要】
1.一种声音的处理方法,其特征在于,包括:获得用户设置的聊天背景图;对所述聊天背景图进行场景识别;获得与所述场景识别的结果匹配的背景声音;在所述用户视频聊天的过程中,播放所述背景声音;所述对所述聊天背景图进行场景识别之后,所述方法还包括:如果所述场景识别的结果中包括所述聊天背景图所关联的背景人物,则获得所述背景人物的声音特征;根据所述背景人物的声音特征对所述用户的声音特征进行处理,将所述用户声音改变为所述背景人物的声音后,在所述用户视频聊天的过程中输出所述背景人物的声音;所述声音特征包括:基音频率、共振峰位置、共振峰带宽、基音频率和音调之一或组合。2.根据权利要求1所述的方法,其特征在于,所述对所述聊天背景图进行场景识别包括:识别所述聊天背景图中的景物和场景类别;和/或识别所述聊天背景图中的拍摄信息。3.根据权利要求1-2任意一项所述的方法,其特征在于,所述获得与所述场景识别的结果匹配的背景声音包括:根据所述场景识别的结果生成场景描述标签;将所述场景描述标签发送给服务器;接收所述服务器根据所述场景描述标签搜索获得的与所述场景识别的结果匹配的背景声音。4.根据权利要求1所述的方法,其特征在于,所述获得所述背景人物的声音特征包括:提取所述聊天背景图中所述背景人物的特征和所述聊天背景图的图片内容特征;将所述背景人物的特征和所述聊天背景图的图片内容特征发送给服务器;接收所述服务器发送的所述背景人物的声音特征。5.一种声音的处理装置,其特征在于,包括:获得模块,用于获得用户设置的聊天背景图;识别模块,用于对所述获得模块获得的聊天背景图进行场景识别;所述获得模块,还用于获得与所述场景识别的结果匹配的背景声音;播放模块,用于在所述用户视频聊天的过程中,播放所述获得模块获得...

【专利技术属性】
技术研发人员:陈小清郭佳楠厉源侯雯佩李源甘彧乔立焦弟琴余芝兰巩雪朱铭恩
申请(专利权)人:北京金山安全软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1