The present disclosure provides a volume adjustment method and device, a storage medium, and an electronic device. The method comprises acquiring at least two viewing images and extracting the human body image region from each viewing image, analyzing the user's current behavior action by using each human body image region, which is used to represent the user's current viewing state, and when the current behavior action occurs relative to the last behavior action. Adjust the volume according to the changes. This scheme helps to improve the flexibility of volume adjustment, to meet the diversified needs of users, and to improve the user experience.
【技术实现步骤摘要】
音量调整方法及装置、存储介质、电子设备
本公开涉及智能控制
,具体地,涉及一种音量调整方法及装置、存储介质、电子设备。
技术介绍
随着智能技术的不断发展,智能设备在日常生活中也越来越普及,尤其是智能家居中各种智能设备的出现,大大的提高了家庭生活的便利性。以智能家居中的电视机为例,可以为用户提供人机交互、多屏互动、内容共享等多种个性化智能服务,提高用户的使用体验。为了进一步提高用户体验,现有技术提供一种自动调节电视机音量的方案,具体地,可以基于电视节目的输入音量、外界环境的噪声音量,利用电视内部的AVC(英文:AutomaticVolumeControl,中文:自动音量控制AutoVolumeControl)实现音量的自动调节。通常,电视节目的输入音量越小、外界环境的噪声音量越大,AVC可以控制调大电视机的输出音量。如此方案,将输入音量和外界音量作为唯一的音量调整标准,灵活性较差,无法适应用户的多样化需求。
技术实现思路
本公开的主要目的是提供一种音量调整方法及装置、存储介质、电子设备,有助于提高音量调整的灵活性,使其满足用户的多样化需求,提高用户体验。为了实现上述目的,本公开提供一种音量调整方法,所述方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。可选地,所述行为动作包括整体行为动作和/或局部行为动作,所述整体行为动作包括站立、坐姿、躺卧中的至少一种,所述局部行为动作包括四肢 ...
【技术保护点】
1.一种音量调整方法,其特征在于,所述方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。
【技术特征摘要】
1.一种音量调整方法,其特征在于,所述方法包括:获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;当所述当前行为动作相对上次行为动作发生变化时,根据所述变化进行音量调整。2.根据权利要求1所述的方法,其特征在于,所述行为动作包括整体行为动作和/或局部行为动作,所述整体行为动作包括站立、坐姿、躺卧中的至少一种,所述局部行为动作包括四肢动作、头部动作、眼部动作中的至少一种。3.根据权利要求1所述的方法,其特征在于,所述利用各人体图像区域分析用户的当前行为动作,包括:将所述人体图像区域作为输入,经预先构建的动作响应模型处理后,输出用户的动作区域响应图,所述动作区域响应图用于标识发生动作变化的区域;划分所述动作区域响应图中的响应区域,将响应值不低于预设值的响应区域确定为待识别区域,所述响应值用于表示动作变化的幅度;将所述待识别区域作为输入,经预先构建的动作分类模型处理后,输出所述待识别区域表示的当前行为动作。4.根据权利要求3所述的方法,其特征在于,所述将所述人体图像区域作为输入,包括:将所述人体图像区域进行无损放大后,作为所述动作响应模型的输入。5.根据权利要求3或4所述的方法,其特征在于,所述观影图像中包括至少两名用户,获得每名用户的动作区域响应图,并划分出各动作区域响应图中的响应区域后,所述方法还包括:判断所述响应区域的面积是否与预设面积相符;如果所述响应区域的面积与所述预设面积相符,则保留该响应区域所属的动作区域响应图;判断是否仅保留一名用户的动作区域响应图;如果仅保留一名用户的动作区域响应图,则将该动作区域响应图确定为当前动作区域响应图;所述将响应值不低于预设值的响应区域确定为待识别区域,包括:将所述当前动作区域响应图中响应值不低于预设值的响应区域确定为待识别区域。6.根据权利要求5所述的方法,其特征在于,如果保留至少两名用户的动作区域响应图,所述方法还包括:获取每名用户的人体图像区域在所述观影图像中的位置,将靠近中心区域的用户确定为当前用户,将当前用户的动作区域响应图确定为当前动作区域响应图;或者,将响应值最大的响应区域所属的动作区域响应图,确定为当前动作区域响应图;或者,从每个保留的动作区域响应图中确定出各自的待识别区域,通过所述动作分类模型得到各待识别区域表示的行为动作,将优先级最高的行为动作确定为所述当前行为动作。7.一种音量调整装置,其特征在于,所述装置包括:人体图像区域截取模块,用于获取至少两张观影图像,分别从每张观影图像中截取出人体图像区域;当前行为动作分析模块,用于利用各人体图像区域分析用户的当前行为动作,所述当前行为动作用于表示用户的当前观影状态;音量调整模...
【专利技术属性】
技术研发人员:花群,吴子扬,舒翔,严亚路,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。