音量控制方法、装置、设备、语音交互设备和存储介质制造方法及图纸

技术编号:34845419 阅读:13 留言:0更新日期:2022-09-08 07:43
本发明专利技术提供了一种音量控制方法、装置、设备、语音交互设备和存储介质,包括获取当前环境的噪音值、上一次交互语音的语音值和当次交互语音的语音值;根据上一次交互语音的语音值和当次交互语音的语音值,确定音量修正系数;根据音量修正系数、当前环境的噪音值和预设的环境系数,确定当次响应音量,实现了同时利用当前环境的噪音值和相邻两次交互语音的语音值,自动调节当次响应音量,使得语音交互设备的响应音量随着用户音量的增大和环境噪音值的增大而增大,随着用户音量的减小和环境噪音值的减小而减小,满足用户的实际需求。采用本发明专利技术的技术方案,能够快捷准确地调整语音交互设备响应音量,提高音量调整的及时性,进而提高用户体验。高用户体验。高用户体验。

【技术实现步骤摘要】
音量控制方法、装置、设备、语音交互设备和存储介质


[0001]本专利技术涉及音频处理
,具体提供一种音量控制方法、装置、设备、语音交互设备和存储介质。

技术介绍

[0002]随着人工智能的兴起,智能音箱等语音交互设备也开始流行,目前在使用语音方式与语音交互设备进行交互时,语音交互设备的语音音量是固定值,通常都是用户上一次设定的音量,这样就会出现设定音量小时,当环境嘈杂时,语音交互设备响应音量用户听不清,若设定音量大,当环境安静时,语音交互设备响应音量太大,影响用户体验。
[0003]因此,现有的音量调节方法,过程繁琐,及时性较差。

技术实现思路

[0004]为了克服上述缺陷,提出了本专利技术,以提供解决或至少部分地解决手动调整音量的过程繁琐,及时性较差的技术问题的音量控制方法、装置、设备、语音交互设备和存储介质。
[0005]在第一方面,本专利技术提供一种音量控制方法,包括:
[0006]获取当前环境的噪音值、上一次交互语音的语音值和当次交互语音的语音值;
[0007]根据所述上一次交互语音的语音值和所述当次交互语音的语音值,确定音量修正系数;
[0008]根据所述音量修正系数、所述当前环境的噪音值和预设的环境系数,确定当次响应音量。
[0009]进一步地,上述所述的音量控制方法中,根据所述上一次交互语音的语音值和所述当次交互语音的语音值,确定音量修正系数,包括:
[0010]确定所述当次交互语音的语音值与所述上一次交互语音的语音值之间的比值;
[0011]将所述比值与预设的语音系数的乘积,作为所述音量修正系数。
[0012]进一步地,上述所述的音量控制方法中,根据所述音量修正系数、所述当前环境的噪音值和预设的环境系数,确定当次响应音量,包括:
[0013]将所述音量修正系数、所述当前环境的噪音值和预设的环境系数的乘积作为所述当次响应音量。
[0014]进一步地,上述所述的音量控制方法,还包括:
[0015]若所述当次响应音量与上一次响应音量之间的差值大于预设阈值,获取当次响应内容所需的响应时长;
[0016]若所述响应时长大于预设时长,在输出所述当次响应内容时,以所述上一次响应音量为起始音量,并按照预设的音量调节步长逐步调整至所述当次响应音量。
[0017]进一步地,上述所述的音量控制方法,还包括:
[0018]在按照预设的音量调节步长逐步调整至所述当次响应音量的过程中,若检测到音
量不符的反馈信息,按照预设的音量调节步长反向调整一次响应音量得到目标响应音量;
[0019]基于所述目标响应音量,输出所述当次响应内容中的未响应内容。
[0020]进一步地,上述所述的音量控制方法中,每一次交互语音的语音值为每一次交互语音中所有交互词的平均能量值;
[0021]所述当前环境的噪音值为当前时刻之前预设时间段内噪音的平均能量值;
[0022]其中,所述当前时刻为接收所述当次交互语音的时刻。
[0023]在第二方面,本专利技术提供一种音量控制装置,包括:
[0024]获取模块,用于获取当前环境的噪音值、上一次交互语音的语音值和当次交互语音的语音值;
[0025]第一确定模块,用于根据所述上一次交互语音的语音值和所述当次交互语音的语音值,确定音量修正系数;
[0026]第二确定模块,用于根据所述音量修正系数、所述当前环境的噪音值和预设的环境系数,确定当次响应音量。
[0027]在第三方面,提供一种音量控制设备,包括处理器和存储装置,所述存储装置适于存储多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行上述任一项所述的语音交互方法。
[0028]在第四方面,提供一种语音交互设备,包括上述所述的音量控制设备。
[0029]在第五方面,提供一种计算机可读存储介质,该计算机可读存储介质其中存储有多条程序代码,所述程序代码适于由处理器加载并运行以执行上述任一项技术方案所述的音量控制方法。
[0030]本专利技术上述一个或多个技术方案,至少具有如下一种或多种有益效果:
[0031]在实施本专利技术的技术方案中,通过获取当前环境的噪音值、上一次交互语音的语音值和当次交互语音的语音值;根据所述上一次交互语音的语音值和所述当次交互语音的语音值,确定音量修正系数;根据所述音量修正系数、所述当前环境的噪音值和预设的环境系数,确定当次响应音量,实现了同时利用当前环境的噪音值和相邻两次交互语音的语音值,自动调节当次响应音量,使得语音交互设备的响应音量随着用户音量的增大和环境噪音值的增大而增大,随着用户音量的减小和环境噪音值的减小而减小,满足用户的实际需求。采用本专利技术的技术方案,能够快捷准确地调整语音交互设备响应音量,提高音量调整的及时性,进而提高用户体验。
附图说明
[0032]参照附图,本专利技术的公开内容将变得更易理解。本领域技术人员容易理解的是:这些附图仅仅用于说明的目的,而并非意在对本专利技术的保护范围组成限制。此外,图中类似的数字用以表示类似的部件,其中:
[0033]图1是根据本专利技术的一个实施例的音量控制方法的主要步骤流程示意图;
[0034]图2是根据本专利技术的另一个实施例的音量控制方法的主要步骤流程示意图;
[0035]图3是根据本专利技术的一个实施例的音量控制装置的主要结构框图;
[0036]图4是根据本专利技术的一个实施例的音量控制设备的主要结构框图。
具体实施方式
[0037]下面参照附图来描述本专利技术的一些实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本专利技术的技术原理,并非旨在限制本专利技术的保护范围。
[0038]在本专利技术的描述中,“模块”、“处理器”可以包括硬件、软件或者两者的组合。一个模块可以包括硬件电路,各种合适的感应器,通信端口,存储器,也可以包括软件部分,比如程序代码,也可以是软件和硬件的组合。处理器可以是中央处理器、微处理器、图像处理器、数字信号处理器或者其他任何合适的处理器。处理器具有数据和/或信号处理功能。处理器可以以软件方式实现、硬件方式实现或者二者结合方式实现。非暂时性的计算机可读存储介质包括任何合适的可存储程序代码的介质,比如磁碟、硬盘、光碟、闪存、只读存储器、随机存取存储器等等。术语“A和/或B”表示所有可能的A与B的组合,比如只是A、只是B或者A和B。术语“至少一个A或B”或者“A和B中的至少一个”含义与“A和/或B”类似,可以包括只是A、只是B或者A和B。单数形式的术语“一个”、“这个”也可以包含复数形式。
[0039]随着人工智能的兴起,智能音箱等语音交互设备也开始流行,目前在使用语音方式与语音交互设备进行交互时,语音交互设备的语音音量是固定值,通常都是用户上一次设定的音量,这样就会出现设定音量小时,当环境嘈杂时,语音交互设备响应音量用户听不清,若设定音量大,当环境安静时,语音交互设备响应音量太大,影响用户体验。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音量控制方法,其特征在于,包括:获取当前环境的噪音值、上一次交互语音的语音值和当次交互语音的语音值;根据所述上一次交互语音的语音值和所述当次交互语音的语音值,确定音量修正系数;根据所述音量修正系数、所述当前环境的噪音值和预设的环境系数,确定当次响应音量。2.根据权利要求1所述的音量控制方法,其特征在于,根据所述上一次交互语音的语音值和所述当次交互语音的语音值,确定音量修正系数,包括:确定所述当次交互语音的语音值与所述上一次交互语音的语音值之间的比值;将所述比值与预设的语音系数的乘积,作为所述音量修正系数。3.根据权利要求1所述的音量控制方法,其特征在于,根据所述音量修正系数、所述当前环境的噪音值和预设的环境系数,确定当次响应音量,包括:将所述音量修正系数、所述当前环境的噪音值和预设的环境系数的乘积作为所述当次响应音量。4.根据权利要求1所述的音量控制方法,其特征在于,还包括:若所述当次响应音量与上一次响应音量之间的差值大于预设阈值,获取当次响应内容所需的响应时长;若所述响应时长大于预设时长,在输出所述当次响应内容时,以所述上一次响应音量为起始音量,并按照预设的音量调节步长逐步调整至所述当次响应音量。5.根据权利要求4所述的音量控制方法,其特征在于,还包括:在按照预设的音量调节步长逐步调整至所述当次...

【专利技术属性】
技术研发人员:丁万超肖成进
申请(专利权)人:青岛海尔空调器有限总公司海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1