一种电子设备控制方法、装置及电子设备制造方法及图纸

技术编号:38321086 阅读:14 留言:0更新日期:2023-07-29 09:03
本申请提供了一种电子设备控制方法、装置及电子设备,涉及AI技术领域。该方法包括:通过摄像头获取电子设备所处第一空间的第一图像,以及通过麦克风获取第一空间中的第一声音;根据第一图像,确定第一空间的空间参数,以及根据第一声音,确定第一空间对应的声音参数;根据空间参数和声音参数,确定声场环境参数,声场环境参数包括目标混响系数、目标吸收系数和第一空间的目标大小中的至少一种,目标吸收系数用于表征第一空间内的物体的材料对应的吸收系数;根据声场环境参数,对电子设备进行控制。由此使得电子设备内的语音识别模型、音频播放参数等统一模型可以自应的声场环境,避免了这些统一的模型在各种不同的环境下发生性能退化。能退化。能退化。

【技术实现步骤摘要】
一种电子设备控制方法、装置及电子设备


[0001]本申请涉及人工智能
,尤其涉及一种电子设备控制方法、装置及电子设备。

技术介绍

[0002]智慧屏、智能音箱等电子设备正快速进入千家万户,人们可以通过这些设备来观看电视节目或者收听音乐等。为了使用户更加便捷地使用这些设备,通常会预置一些常用的语音识别模型、音频播放声学参数等到设备内,如唤醒词检测(keyword spotting,KWS)模型、语音识别(automatic speech recognition,ASR)模型、均衡(equalize,EQ)参数、动态范围控制(dynamic range compression,DRC)参数、各个拾音器(比如麦克风等)对应的传输通道时延参数等。
[0003]当前电子设备内的语音识别模型、音频播放参数等主要是通过实验室场景仿真、声学环境模拟等方式来调试获取的,这种方式为了适应一般的家庭场景,会选择泛化性较好的模型或参数统一部署到端侧,以满足大多数用户的使用体验。但每个用户实际的家庭环境空间大小、整体布局,装修材料不尽相同,从而导致了声场环境的差异性。由于这种差异性的存在,统一的模型在各种不同的环境可能会发生性能退化,影响用户体验。

技术实现思路

[0004]本申请提供了一种电子设备控制方法、装置、电子设备、计算机存储介质和计算机程序产品,能够使得电子设备内的语音识别模型、音频播放参数等统一模型可以自适应不同的声场环境,避免了这些统一的模型在各种不同的环境下发生性能退化,提升了用户体验。
[0005]第一方面,本申请提供一种电子设备控制方法,方法包括:通过摄像头获取电子设备所处第一空间的第一图像,以及通过麦克风获取第一空间中的第一声音;根据第一图像,确定第一空间的空间参数,以及根据第一声音,确定第一空间对应的声音参数,空间参数包括第一空间的第一大小和第一空间内的物体的材料类型,声音参数包括用于表征第一空间中混响大小的第一混响系数;根据空间参数和声音参数,确定声场环境参数,声场环境参数包括目标混响系数、目标吸收系数和第一空间的目标大小中的至少一种,目标吸收系数用于表征第一空间内的物体的材料对应的吸收系数;根据声场环境参数,对电子设备进行控制。
[0006]这样,通过视觉和声学多模态结合的方式,相互校验视觉和声学参数估计的结果(即空间参数和声音参数),使得获取到的声场环境参数的可靠性更高,为后续对电子设备进行控制提供了坚实的基础,从而可以较大程度提升用户体验。比如:可以有效提升语音识别服务、减小音频播放效果受声场环境的影响,提升电子设备的唤醒率和ASR的识别率,以及明显改善听音效果。
[0007]在一种可能的实现方式中,声场环境参数为目标混响系数,根据空间参数和声音
参数,确定声场环境参数,具体包括:当第一混响系数的置信度大于第一混响值时,确定目标混响系数为第一混响系数;当第一混响系数的置信度小于或等于第一混响值,且大于第二混响值时,根据第一空间的第一大小和第一空间内的物体的材料类型,得到第二混响系数,以及根据第一混响系数和第二混响系数,得到目标混响系数;当第一混响系数的置信度小于或等于第二混响值时,根据第一混响系数、第二混响系数和第一混响系数的置信度,得到目标混响系数。
[0008]在一种可能的实现方式中,声场环境参数为目标吸收系数,根据空间参数和声音参数,确定声场环境参数,具体包括:当第一吸收系数的置信度大于第一吸收值时,确定目标吸收系数为第一吸收系数,其中,第一吸收系数根据第一空间内的物体的材料类型得到;当第一吸收系数的置信度小于或等于第一吸收值,且大于第二吸收值时,根据第一空间的第一大小和第一混响系数,得到第二吸收系数,以及根据第一吸收系数和第二吸收系数,得到目标吸收系数;当第一吸收系数的置信度小于或等于第二吸收值时,根据第一吸收系数、第二吸收系数和第一吸收系数的置信度,得到目标吸收系数。
[0009]在一种可能的实现方式中,声场环境参数为第一空间的目标大小,根据空间参数和声音参数,确定声场环境参数,具体包括:当第一空间的第一大小的置信度大于第一尺寸值时,确定目标大小为第一大小,其中,第一大小根据第一空间内的物体的材料类型得到;当第一大小的置信度小于或等于第一尺寸值,且大于第二尺寸值时,根据第一混响系数和第一空间内的物体的材料类型,得到第二大小,以及根据第一大小和第二大小,得到目标大小;当第一大小的置信度小于或等于第二尺寸值时,根据第一大小、第二大小和第一大小的置信度,得到目标大小。
[0010]在一种可能的实现方式中,根据声场环境参数,对电子设备进行控制,具体包括:根据声场环境参数,确定与声场环境参数相匹配的目标语音识别模型;将电子设备中的语音识别模型更新为目标语音识别模型。这样,电子设备即可以在进行语音识别时,根据当前的环境中的声场环境参数自适应优化语音识别模型,以及使用与当前的声场环境相匹配的语音识别模型进行语音识别,实现了语音识别功能对用户实际使用环境的自适应,避免了由于声场环境差异导致模型识别性能退化的情况,为良好的语音识别服务体验提供了保障,改善用户的使用体验。
[0011]在一种可能的实现方式中,根据声场环境参数,对电子设备进行控制,具体包括:根据声场环境参数,对电子设备所处的声场环境进行建模,得到第一空间的空间模型;基于空间模型进行声场模拟,得到位于第一空间中目标位置处对应的第一频响曲线;基于声场环境参数,从预置的理想声学频响库中确定出与声场环境参数相匹配的第二频响曲线;将第一频响曲线拟合为第二频响曲线。这样,当电子设备在播放声音时,即可以对音频播放效果进行自适应调参,从而使得用户的听音效果达到最佳,提升用户体验。示例性的,目标位置可以为在当前的声场环境下声音的响度、空间感、力度、清晰度均最优的位置。
[0012]在一种可能的实现方式中,根据声场环境参数,对电子设备进行控制,具体包括:将声场环境参数作为电子设备中对语音数据进行处理的增强算法的输入。这样,在用户通过电子设备进行语音通话时,通过增强算法根据输入的声场环境参数对用户通话时语音信号进行自适应增强,以改善通话质量,提升了户体验。
[0013]第二方面,本申请提供一种电子设备控制装置,包括:至少一个存储器,用于存储
程序;至少一个处理器,用于执行存储器存储的程序,当存储器存储的程序被执行时,处理器用于执行如第一方面中所提供的方法。
[0014]第三方面,本申请提供一种电子设备,该电子设备包括至少一个用于存储程序的存储器和至少一个用于执行存储器存储的程序的处理器。其中,当存储器存储的程序被执行时,处理器用于执行如第一方面中所提供的方法。
[0015]第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行如第一方面中所提供的方法。
[0016]第五方面,本申请提供一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行如第一方面中所提供的方法。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电子设备控制方法,其特征在于,所述方法包括:通过摄像头获取电子设备所处第一空间的第一图像,以及通过麦克风获取所述第一空间中的第一声音;根据所述第一图像,确定所述第一空间的空间参数,以及根据所述第一声音,确定所述第一空间对应的声音参数,所述空间参数包括所述第一空间的第一大小和所述第一空间内的物体的材料类型,所述声音参数包括用于表征所述第一空间中混响大小的第一混响系数;根据所述空间参数和所述声音参数,确定所述声场环境参数,所述声场环境参数包括目标混响系数、目标吸收系数和所述第一空间的目标大小中的至少一种,所述目标吸收系数用于表征所述第一空间内的物体的材料对应的吸收系数;根据所述声场环境参数,对所述电子设备进行控制。2.根据权利要求1所述的方法,其特征在于,所述声场环境参数为目标混响系数,所述根据所述空间参数和所述声音参数,确定所述声场环境参数,具体包括:当所述第一混响系数的置信度大于第一混响值时,确定所述目标混响系数为所述第一混响系数;当所述第一混响系数的置信度小于或等于所述第一混响值,且大于第二混响值时,根据所述第一空间的第一大小和所述第一空间内的物体的材料类型,得到第二混响系数,以及根据所述第一混响系数和所述第二混响系数,得到所述目标混响系数;当所述第一混响系数的置信度小于或等于所述第二混响值时,根据所述第一混响系数、所述第二混响系数和所述第一混响系数的置信度,得到所述目标混响系数。3.根据权利要求1或2所述的方法,其特征在于,所述声场环境参数为目标吸收系数,所述根据所述空间参数和所述声音参数,确定所述声场环境参数,具体包括:当第一吸收系数的置信度大于第一吸收值时,确定所述目标吸收系数为所述第一吸收系数,其中,所述第一吸收系数根据所述第一空间内的物体的材料类型得到;当所述第一吸收系数的置信度小于或等于所述第一吸收值,且大于第二吸收值时,根据所述第一空间的第一大小和所述第一混响系数,得到第二吸收系数,以及根据所述第一吸收系数和所述第二吸收系数,得到所述目标吸收系数;当所述第一吸收系数的置信度小于或等于所述第二吸收值时,根据所述第一吸收系数、所述第二吸收系数和所述第一吸收系数的置信度,得到所述目标吸收系数。4.根据权利要求1

3任一所述的方法,其特征在于,所述声场环境参数为所述第一空间的目标大小,所述根据所述空间参数和所述声音参数,确定所述声场环境参数,具体包括:当所述第一空间的第一大小的置信度大于第一尺寸值时,确定所述目标大小为所述...

【专利技术属性】
技术研发人员:孙晨吕帅林周小鹏李伟
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1