音量调整方法及装置、存储介质、电子设备制造方法及图纸

技术编号:18663110 阅读:28 留言:0更新日期:2018-08-11 16:39
本公开提供一种音量调整方法及装置、存储介质、电子设备。该方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。如此方案,有助于提高音量调整的灵活性,使其满足用户的多样化需求,提高用户体验。

Volume adjusting method and device, storage medium, and electronic device

The present disclosure provides a volume adjustment method and device, a storage medium, and an electronic device. The method comprises acquiring at least two viewing images and extracting the human body image region from each viewing image, analyzing the user's current behavior action by using each human body image region, which is used to represent the user's current viewing state, and when the current behavior action occurs relative to the last behavior action. Adjust the volume according to the changes. This scheme helps to improve the flexibility of volume adjustment, to meet the diversified needs of users, and to improve the user experience.

【技术实现步骤摘要】
音量调整方法及装置、存储介质、电子设备
本公开涉及智能控制
,具体地,涉及一种音量调整方法及装置、存储介质、电子设备。
技术介绍
随着智能技术的不断发展,智能设备在日常生活中也越来越普及,尤其是智能家居中各种智能设备的出现,大大的提高了家庭生活的便利性。以智能家居中的电视机为例,可以为用户提供人机交互、多屏互动、内容共享等多种个性化智能服务,提高用户的使用体验。为了进一步提高用户体验,现有技术提供一种自动调节电视机音量的方案,具体地,可以基于电视节目的输入音量、外界环境的噪声音量,利用电视内部的AVC(英文:AutomaticVolumeControl,中文:自动音量控制AutoVolumeControl)实现音量的自动调节。通常,电视节目的输入音量越小、外界环境的噪声音量越大,AVC可以控制调大电视机的输出音量。如此方案,将输入音量和外界音量作为唯一的音量调整标准,灵活性较差,无法适应用户的多样化需求。
技术实现思路
本公开的主要目的是提供一种音量调整方法及装置、存储介质、电子设备,有助于提高音量调整的灵活性,使其满足用户的多样化需求,提高用户体验。为了实现上述目的,本公开提供一种音量调整方法,所述方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。可选地,所述行为动作包括整体行为动作和/或局部行为动作,所述整体行为动作包括站立、坐姿、躺卧中的至少一种,所述局部行为动作包括四肢动作、头部动作、眼部动作中的至少一种。可选地,所述利用各人体图像区域分析用户的当前行为动作,包括:将所述人体图像区域作为输入,经预先构建的动作响应模型处理后,输出用户的动作区域响应图,所述动作区域响应图用于标识发生动作变化的区域;划分所述动作区域响应图中的响应区域,将响应值不低于预设值的响应区域确定为待识别区域,所述响应值用于表示动作变化的幅度;将所述待识别区域作为输入,经预先构建的动作分类模型处理后,输出所述待识别区域表示的当前行为动作。可选地,所述将所述人体图像区域作为输入,包括:将所述人体图像区域进行无损放大后,作为所述动作响应模型的输入。可选地,所述观影图像中包括至少两名用户,获得每名用户的动作区域响应图,并划分出各动作区域响应图中的响应区域后,所述方法还包括:判断所述响应区域的面积是否与预设面积相符;如果所述响应区域的面积与所述预设面积相符,则保留该响应区域所属的动作区域响应图;判断是否仅保留一名用户的动作区域响应图;如果仅保留一名用户的动作区域响应图,则将该动作区域响应图确定为当前动作区域响应图;所述将响应值不低于预设值的响应区域确定为待识别区域,包括:将所述当前动作区域响应图中响应值不低于预设值的响应区域确定为待识别区域。可选地,如果保留至少两名用户的动作区域响应图,所述方法还包括:获取每名用户的人体图像区域在所述观影图像中的位置,将靠近中心区域的用户确定为当前用户,将当前用户的动作区域响应图确定为当前动作区域响应图;或者,将响应值最大的响应区域所属的动作区域响应图,确定为当前动作区域响应图;或者,从每个保留的动作区域响应图中确定出各自的待识别区域,通过所述动作分类模型得到各待识别区域表示的行为动作,将优先级最高的行为动作确定为所述当前行为动作。本公开提供一种音量调整装置,所述装置包括:人体图像区域截取模块,用于获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;当前行为动作分析模块,用于利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;音量调整模块,用于当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。可选地,所述行为动作包括整体行为动作和/或局部行为动作,所述整体行为动作包括站立、坐姿、躺卧中的至少一种,所述局部行为动作包括四肢动作、头部动作、眼部动作中的至少一种。可选地,所述当前行为动作分析模块包括:动作区域响应图输出模块,用于将所述人体图像区域作为输入,经预先构建的动作响应模型处理后,输出用户的动作区域响应图,所述动作区域响应图用于标识发生动作变化的区域;待识别区域确定模块,用于划分所述动作区域响应图中的响应区域,将响应值不低于预设值的响应区域确定为待识别区域,所述响应值用于表示动作变化的幅度;当前行为动作输出模块,用于将所述待识别区域作为输入,经预先构建的动作分类模型处理后,输出所述待识别区域表示的当前行为动作。可选地,所述当前行为动作分析模块还包括:无损放大模块,用于将所述人体图像区域进行无损放大后,作为所述动作响应模型的输入。可选地,所述观影图像中包括至少两名用户,获得每名用户的动作区域响应图,并划分出各动作区域响应图中的响应区域后,所述当前行为动作分析模块还包括:当前动作区域响应图确定模块,用于判断所述响应区域的面积是否与预设面积相符;如果所述响应区域的面积与所述预设面积相符,则保留该响应区域所属的动作区域响应图;判断是否仅保留一名用户的动作区域响应图;如果仅保留一名用户的动作区域响应图,则将该动作区域响应图确定为当前动作区域响应图;所述待识别区域确定模块,用于将所述当前动作区域响应图中响应值不低于预设值的响应区域确定为待识别区域。可选地,如果保留至少两名用户的动作区域响应图,所述当前动作区域响应图确定模块,还用于获取每名用户的人体图像区域在所述观影图像中的位置,将靠近中心区域的用户确定为当前用户,将当前用户的动作区域响应图确定为当前动作区域响应图;或者,所述当前动作区域响应图确定模块,还用于将响应值最大的响应区域所属的动作区域响应图,确定为当前动作区域响应图;或者,所述当前行为动作分析模块还包括:当前行为动作确定模块,用于从每个保留的动作区域响应图中确定出各自的待识别区域,通过所述动作分类模型得到各待识别区域表示的行为动作,将优先级最高的行为动作确定为所述当前行为动作。本公开提供一种存储介质,其中存储有多条指令,所述指令由处理器加载,执行上述音量调整方法的步骤。本公开提供一种电子设备,所述电子设备包括;上述的存储介质;以及处理器,用于执行所述存储介质中的指令。本公开方案中,可以将用户观影状态作为音量调整的依据,观影状态可以具体体现为用户的行为动作,即,可以根据用户行为动作的变化,进行音量调整。具体地,可以获取至少两张观影图像,利用从每张观影图像中截取出的人体图像区域,分析得到用户的当前行为动作,当用户的当前行为动作相对上次行为动作发生变化时,可以根据该变化进行音量调整。如此方案,有助于提高音量调整的灵活性,使其满足用户的多样化需求,提高用户体验。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1为本公开方案音量调整方法的流程示意图;图2为本公开方案中分析用户的当前行为动作的流程示意图;图3为本公开方案音量调整装置的构成示意图;图4为本公开方案用于音量调整的电子设备的结构示意图。具体本文档来自技高网...

【技术保护点】
1.一种音量调整方法,其特征在于,所述方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。

【技术特征摘要】
1.一种音量调整方法,其特征在于,所述方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。2.根据权利要求1所述的方法,其特征在于,所述行为动作包括整体行为动作和/或局部行为动作,所述整体行为动作包括站立、坐姿、躺卧中的至少一种,所述局部行为动作包括四肢动作、头部动作、眼部动作中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述利用各人体图像区域分析用户的当前行为动作,包括:将所述人体图像区域作为输入,经预先构建的动作响应模型处理后,输出用户的动作区域响应图,所述动作区域响应图用于标识发生动作变化的区域;划分所述动作区域响应图中的响应区域,将响应值不低于预设值的响应区域确定为待识别区域,所述响应值用于表示动作变化的幅度;将所述待识别区域作为输入,经预先构建的动作分类模型处理后,输出所述待识别区域表示的当前行为动作。4.根据权利要求3所述的方法,其特征在于,所述将所述人体图像区域作为输入,包括:将所述人体图像区域进行无损放大后,作为所述动作响应模型的输入。5.根据权利要求3或4所述的方法,其特征在于,所述观影图像中包括至少两名用户,获得每名用户的动作区域响应图,并划分出各动作区域响应图中的响应区域后,所述方法还包括:判断所述响应区域的面积是否与预设面积相符;如果所述响应区域的面积与所述预设面积相符,则保留该响应区域所属的动作区域响应图;判断是否仅保留一名用户的动作区域响应图;如果仅保留一名用户的动作区域响应图,则将该动作区域响应图确定为当前动作区域响应图;所述将响应值不低于预设值的响应区域确定为待识别区域,包括:将所述当前动作区域响应图中响应值不低于预设值的响应区域确定为待识别区域。6.根据权利要求5所述的方法,其特征在于,如果保留至少两名用户的动作区域响应图,所述方法还包括:获取每名用户的人体图像区域在所述观影图像中的位置,将靠近中心区域的用户确定为当前用户,将当前用户的动作区域响应图确定为当前动作区域响应图;或者,将响应值最大的响应区域所属的动作区域响应图,确定为当前动作区域响应图;或者,从每个保留的动作区域响应图中确定出各自的待识别区域,通过所述动作分类模型得到各待识别区域表示的行为动作,将优先级最高的行为动作确定为所述当前行为动作。7.一种音量调整装置,其特征在于,所述装置包括:人体图像区域截取模块,用于获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;当前行为动作分析模块,用于利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;音量调整模...

【专利技术属性】
技术研发人员:花群吴子扬舒翔严亚路
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1