一种终端上的智能音量控制方法和装置制造方法及图纸

技术编号:21183564 阅读:29 留言:0更新日期:2019-05-22 14:39
本申请公开了一种终端上的智能音量控制方法,包括:步骤a,采集所述终端的当前位置信息;获取当前环境的图片并输入通过训练生成的图片识别模型,根据照片模型仓库进行图片识别得到图片识别结果;通过图片识别结果确定当前的环境信息;采集当前环境的声音信号,并确定所采集声音信号的音量值;步骤b,根据所述环境信息、所述音量值和所述当前位置信息,确定当前概率最高的场景,若所述场景的概率大于设定的概率阈值,则按照预先设定的场景与音量设置间的对应关系,确定所述场景对应的音量设置进行推荐或直接设置;否则,返回步骤a。应用本申请,能够根据当前环境状况自适应建议或调节音量。

An Intelligent Volume Control Method and Device on Terminal

This application discloses an intelligent volume control method on a terminal, which includes: step a, collecting the current location information of the terminal; acquiring pictures of the current environment and inputting the image recognition model generated by training, obtaining the image recognition result according to the image model warehouse; determining the current environmental information through the image recognition result; collecting the sound of the current environment. The sound signal and the volume value of the collected sound signal are determined; step B determines the scene with the highest current probability according to the environmental information, the volume value and the current location information. If the probability of the scene is greater than the set probability threshold, the corresponding volume setting of the scene is determined according to the corresponding relationship between the preset scene and the volume setting. Set it directly; otherwise, go back to step A. With this application, you can recommend or adjust the volume adaptively according to the current environmental conditions.

【技术实现步骤摘要】
一种终端上的智能音量控制方法和装置
本申请涉及智能终端技术,特别涉及一种终端上的智能音量控制方法和装置。
技术介绍
当前人工智能的研究是行业热点,而依靠机器学习的智能领域也受到越来越多的关注。伴随着越来越多的智能化要求及大数据的发展,人工智能展现出新的活力。2016年3月Google公司的智能机器人AlphaGo,在与韩国棋手李世石的围棋对决中以4:1获胜,这表明在逻辑与运算方面,智能机器人可能超过人类。从人工智能角度看,目前AI的高级认知功能还远弱于人类,但是目前的技术可以实现基于AI智能技术,使智能手机更加智能化,以方便人们的使用。目前在终端上进行音量调节时,通常是在手机框架层进行区分,手机硬件抽像层进行不同逻辑设备的定义,把不同的铃声做为不同的声音类型,用户可通过实体按键或虚拟触摸的方式分别进行调节。但是,目前手机上的音量类型众多,有来电铃声、媒体播放音量、按键音、闹铃、通话音等等,有些音共用一个逻辑设备进行音量调节,有些音则单独使用一个逻辑设备进行调节。在不同的场景下,用户不得不进行不同的设置,比如在吵闹的环境下,用户不断地调高通话音量,有时甚至需要插上耳机,而在安静地环境下播放歌曲,可能需要不断地尝试调整音量,以达到一个自己认为最合理的值。这个过程无疑是复杂且无奈的。对于手机熟练使用的人来讲,虽然也略感无奈,但总体来讲,调节各种音量也算得心应手,但对于不熟练使用手机的人,这么多音量的设置无疑是一个痛苦的过程,想达到一个自己称心的音量,需要不停地学习、尝试及调整。
技术实现思路
本申请提供一种终端上的智能音量控制方法和装置,能够根据当前环境状况自适应建议或调节音量。为实现上述目的,本申请采用如下技术方案:一种终端上的智能音量控制方法,包括:步骤a,采集所述终端的当前位置信息;获取当前环境的图片并输入通过训练生成的图片识别模型,根据照片模型仓库进行图片识别得到图片识别结果;通过图片识别结果确定当前的环境信息;采集当前环境的声音信号,并确定所采集声音信号的音量值;步骤b,根据所述环境信息、所述分贝值和所述当前位置信息,确定当前概率最高的场景,若所述场景的概率大于设定的概率阈值,则按照预先设定的场景与音量设置间的对应关系,确定所述场景对应的音量设置进行推荐或直接设置;否则,返回步骤a。较佳地,在每次得到图片识别结果后,所述步骤a进一步包括:根据所述图片识别结果更新所述图片识别模型的参数,并将所述当前环境的图片加入所述照片模型仓库,用于下一次图片识别。较佳地,周期性执行所述获取当前环境的图片并进行图片识别的处理;和/或,所述图片识别模型为卷积神经网络。较佳地,获取当前环境的图片包括:实时采集当前环境的图片,或者,将所述当前位置信息下所述终端曾经拍摄的照片作为所述当前环境的图片。较佳地,所述通过图片识别结果确定所述第一环境信息包括:从所有图片识别结果中选择概率最大的一个识别结果作为所述第一环境信息;和/或,当图片识别失败的次数小于预设的阈值时,返回步骤a;当图片识别失败的次数达到或超过预设的阈值时,人工设置所述当前环境图片的环境信息。较佳地,步骤b中所述确定当前概率最高的场景的方式包括:在数据库中选择与所述环境信息匹配的第一场景类型,并将各第一场景类型的第一概率设置为1/N,所述N为与所述第一环境信息匹配的场景类型的个数;根据所述当前位置信息与各所述第一场景类型所在位置间的距离,计算相应第一场景类型的位置概率;根据每个第一场景类型的第一概率和位置概率,按照预设的位置概率和第一概率在环境概率中所占的比重,计算各第一场景类型的环境概率;根据每个第一场景类型的环境概率和位置概率,按照预设的环境概率和位置概率在最终概率中所占的比重,计算各第一场景类型的最终概率,并选择最终概率最高的第一场景类型作为最终场景类型;确定与最终场景类型匹配的所有场景,并从中选择满足所述音量值的场景作为当前概率最高的场景,将所述最终场景类型的概率作为该场景的概率。较佳地,在选择出第一场景类型后、计算各第一场景类型的环境概率前,该方法进一步包括:对当前环境的声音信号进行语音识别,通过语音识别结果确定各所述第一场景类型的语音概率;在计算各第一场景类型的环境概率时,进一步根据各第一场景类型的语音概率,按照预设的语音概率在环境概率中所占的比重进行。较佳地,在对当前环境的声音信号进行语音识别时,若语音识别失败,则在计算各第一场景环境的环境概率时,不再根据语音概率进行。较佳地,在所述步骤b之前,该方法进一步包括:接收用户对于当前场景的音量设置;将所述当前概率最高的场景下对应的音量设置为接收的音量设置。一种智能音量控制装置,包括:定位单元、图片处理单元、声音处理单元、场景选择单元和音量处理单元;所述定位单元,用于采集所述终端的当前位置信息;所述图片处理单元,用于获取当前环境的图片并输入通过训练生成的图片识别模型,根据照片模型仓库进行图片识别得到图片识别结果,通过图片识别结果确定当前的环境信息;所述声音处理单元,用于采集当前环境的声音信号进行语音识别,并确定所采集声音的音量值;所述场景选择单元,用于根据所述第一环境信息、所述音量值和所述当前位置信息,确定当前概率最高的场景,若所述场景的概率大于设定的概率阈值,则通知所述音量处理单元;否则,通知所述定位单元和所述图片处理单元重新执行各自操作;所述音量处理单元,用于在接收到所述场景选择单元的通知后,按照预先设定的场景与音量设置间的对应关系,确定所述场景选择单元确定的场景所对应的音量设置进行推荐或直接设置。较佳地,所述场景选择单元包括:环境概率计算子单元、最终概率计算子单元和场景确定子单元;所述环境概率计算子单元,用于在数据库中选择与所述第一环境信息匹配的第一场景类型,并将各第一场景类型的第一概率设置为1/N,所述N为与所述第一环境信息匹配的场景类型的个数;根据所述当前位置信息与各所述第一场景类型所在位置间的距离,计算相应第一场景类型的位置概率;根据每个第一场景类型的第一概率和位置概率,按照预设的位置概率和第一概率在环境概率中所占的比重,计算各第一场景类型的环境概率;所述最终概率计算子单元,用于根据每个第一场景类型的环境概率和位置概率,按照预设的环境概率和位置概率在最终概率中所占的比重,计算各第一场景类型的最终概率,并选择最终概率最高的第一场景类型作为最终场景类型;所述场景确定子单元,用于确定与最终场景类型匹配的所有场景,并从中选择满足所述音量值的场景作为当前概率最高的场景,将所述最终场景类型的概率作为该场景的概率。较佳地,所述声音处理单元,还用于对所述当前环境的声音信号进行语音识别,通过语音识别结果确定各所述第一场景类型的语音概率;所述环境概率计算子单元在计算各第一场景类型的环境概率时,进一步根据各第一场景类型的语音概率,按照预设的语音概率在环境概率中所占的比重进行。由上述技术方案可见,本申请中,采集终端的当前位置信息;获取当前环境的图片并输入通过训练生成的图片识别模型,根据照片模型仓库进行图片识别得到图片识别结果,通过图片识别结果确定当前的第一环境信息;采集当前环境的声音信号,并确定所采集声音信号的音量值;接下来,根据第一环境信息、声音信号的音量值和当前位置信息,确定当前概率最高的场景,若该场景本文档来自技高网...

【技术保护点】
1.一种终端上的智能音量控制方法,其特征在于,包括:步骤a,采集所述终端的当前位置信息;获取当前环境的图片并输入通过训练生成的图片识别模型,根据照片模型仓库进行图片识别得到图片识别结果;通过图片识别结果确定当前的环境信息;采集当前环境的声音信号,并确定所采集声音信号的音量值;步骤b,根据所述环境信息、所述分贝值和所述当前位置信息,确定当前概率最高的场景,若所述场景的概率大于设定的概率阈值,则按照预先设定的场景与音量设置间的对应关系,确定所述场景对应的音量设置进行推荐或直接设置;否则,返回步骤a。

【技术特征摘要】
1.一种终端上的智能音量控制方法,其特征在于,包括:步骤a,采集所述终端的当前位置信息;获取当前环境的图片并输入通过训练生成的图片识别模型,根据照片模型仓库进行图片识别得到图片识别结果;通过图片识别结果确定当前的环境信息;采集当前环境的声音信号,并确定所采集声音信号的音量值;步骤b,根据所述环境信息、所述分贝值和所述当前位置信息,确定当前概率最高的场景,若所述场景的概率大于设定的概率阈值,则按照预先设定的场景与音量设置间的对应关系,确定所述场景对应的音量设置进行推荐或直接设置;否则,返回步骤a。2.根据权利要求1所述的方法,其特征在于,在每次得到图片识别结果后,所述步骤a进一步包括:根据所述图片识别结果更新所述图片识别模型的参数,并将所述当前环境的图片加入所述照片模型仓库,用于下一次图片识别。3.根据权利要求1所述的方法,其特征在于,周期性执行所述获取当前环境的图片并进行图片识别的处理;和/或,所述图片识别模型为卷积神经网络。4.根据权利要求1所述的方法,其特征在于,获取当前环境的图片包括:实时采集当前环境的图片,或者,将所述当前位置信息下所述终端曾经拍摄的照片作为所述当前环境的图片。5.根据权利要求1、2、3或4所述的方法,其特征在于,所述通过图片识别结果确定所述第一环境信息包括:从所有图片识别结果中选择概率最大的一个识别结果作为所述第一环境信息;和/或,当图片识别失败的次数小于预设的阈值时,返回步骤a;当图片识别失败的次数达到或超过预设的阈值时,人工设置所述当前环境图片的环境信息。6.根据权利要求1所述的方法,其特征在于,步骤b中所述确定当前概率最高的场景的方式包括:在数据库中选择与所述环境信息匹配的第一场景类型,并将各第一场景类型的第一概率设置为1/N,所述N为与所述第一环境信息匹配的场景类型的个数;根据所述当前位置信息与各所述第一场景类型所在位置间的距离,计算相应第一场景类型的位置概率;根据每个第一场景类型的第一概率和位置概率,按照预设的位置概率和第一概率在环境概率中所占的比重,计算各第一场景类型的环境概率;根据每个第一场景类型的环境概率和位置概率,按照预设的环境概率和位置概率在最终概率中所占的比重,计算各第一场景类型的最终概率,并选择最终概率最高的第一场景类型作为最终场景类型;确定与最终场景类型匹配的所有场景,并从中选择满足所述音量值的场景作为当前概率最高的场景,将所述最终场景类型的概率作为该场景的概率。7.根据权利要求6所述的方法,其特征在于,在选择出第一场景类型后、计算各第一场景类型的环境概率前,该方法进一步包括:对当前环境的声音信号进行语音识别,通过语音识别结果确定各所述第一场景类型的语音概率;在计算各第一场景类型的环境概率时,进一步根据各第一场景类型的语音概...

【专利技术属性】
技术研发人员:龚嵩杰
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1