System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种智能体唤醒系统技术方案_技高网

一种智能体唤醒系统技术方案

技术编号:39932368 阅读:4 留言:0更新日期:2024-01-08 21:55
本发明专利技术属于语音处理领域,公开了一种智能体唤醒系统,包括多个智能体的唤醒装置,唤醒装置包括监听模块、获取模块、近场通信模块、计算模块和响应模块;每个智能体在处于低功耗运行的状态时,唤醒装置均执行如下运算:监听模块获取音量大于自适应音量阈值的声音信号;获取模块计算的声音信号的平均音量;近场通信模块与其它的智能体交换平均音量;计算模块计算智能体的响应系数;近场通信模块与其它的智能体交换响应系数;响应模块根据响应系数对智能体进行唤醒。本发明专利技术仅由响应系数最大的智能体来响应用户的唤醒,因此,本发明专利技术能够避免采用同一个唤醒词的多个智能体同时被唤醒的情况的发生,从而实现了智能体的智能唤醒,有效地提高了用户的体验。

【技术实现步骤摘要】

本专利技术涉及语音处理领域,尤其涉及一种智能体唤醒系统


技术介绍

1、为了降低功耗,智能体在没有被唤醒之前会以低功耗的方式运行。通过语音的方式对智能体进行唤醒是一种常见的技术手段,但是,若在一个比较小的空间内(例如10平方米以下的空间)同时存在多个智能体时,那么采用唤醒词进行唤醒的话,就可能会出现多个智能体同时应答的情况,这就影响了用户的正常使用。可以通过为不同的智能体设定不同的唤醒词来解决这种问题,但是,在智能体的数量比较多时,设定多个唤醒词容易导致用户在使用时混淆唤醒词,可能在使用设备a时,采用了设备b的唤醒词来对设备a进行唤醒,这就会严重影响用户的体验。

2、因此,如何在存在多个智能体时,实现智能体的智能唤醒便成为需要解决的技术问题。


技术实现思路

1、本专利技术的目的在于公开一种智能体唤醒系统,解决在一个比较小的空间内同时存在多个智能体时,如何避免所有的智能体都对唤醒词进行响应,影响用户使用的问题。

2、为了达到上述目的,本专利技术提供如下技术方案:

3、本专利技术提供了一种智能体唤醒系统,包括多个智能体的唤醒装置,唤醒装置包括监听模块、获取模块、近场通信模块、计算模块和响应模块;

4、每个智能体在处于低功耗运行的状态时,均执行如下运算:

5、监听模块获取音量大于自适应音量阈值的声音信号;

6、获取模块计算的声音信号的平均音量;

7、近场通信模块将获取模块获取的平均音量发送至其它处于自身的通信范围内的智能体;以及接收其它的智能体发送过来的平均音量;

8、计算模块根据获取模块获取的平均音量与其它智能体发送过来的平均音量计算智能体的响应系数;

9、近场通信模块还将计算模块计算得到的响应系数发送至其它处于自身的通信范围内的智能体;以及接收其它的智能体发送过来的响应系数;

10、响应模块在计算模块计算得到的响应系数大于其它智能体发送过来的的响应系数时,判断监听模块获得的声音信号是否包含预设的唤醒词,若是,则根据预设的规则对智能体进行唤醒。

11、可选的,自适应音量阈值的获取方式为:

12、采用自适应的采样间隔获取智能体所处环境的声音的环境音量;

13、基于环境音量以及预设的基础音量计算自适应音量阈值。

14、可选的,自适应的采样间隔的计算函数为:

15、

16、其中,adptima和adptima+1表示第a个和第a+1采样间隔的时间长度,avrvola和avrvola-1分别表示在第a个和第a-1个采样间隔所获得的环境音量,max表示取括号内的较大值,stbtim为预先设置的时间长度,cmp表示比较函数,cmp(avrvola,avrvola-1)表示avrvola和avrvola-1之间的比较值,k表示预设的辅助系数;k(0.1,0.3);

17、若adptima+1<adptimmin,则将adptima+1的值修改为adptimmin;若adptima+1>adptimmax,则将adptima+1的值修改为adptimmax,adptimmin和adptimmax分别表示采样间隔的下限值和上限值。

18、可选的,基于环境音量以及预设的基础音量计算自适应音量阈值,包括:

19、自适应音量阈值的计算函数为:

20、adpvol=avrvol+stdvol

21、adpvol表示自适应音量阈值,avrvol表示环境音量,stdvol表示预设的基础音量。

22、可选的,根据监听模块获取的声音信号计算智能体与声源之间的平均音量,包括:

23、用sigvol表示平均音量,则sigset表示声音信号的采样时刻的集合,nsigset表示sigset中的采样时刻的总数,volumb表示b时刻的声音信号的音量,

24、采样时刻的确定方式为:

25、用[tsigs,tsige]表示声音信号的采样时间区间,在[tsigs,tsige]中,从tsigs开始,每隔s秒为一个采样时刻,tsigs和tsige分别表示采样时间区间的起始时刻和结束时刻。

26、可选的,响应系数的计算函数为:

27、

28、resfacc表示智能体c的响应系数,α表示取值范围在0到1之间的权重参数,sigvolc表示智能体c的获取模块所得到的平均音量,sigvolu表示近场通信模块接收到的其它智能体发送过来的平均音量的集合,top(sigvolu)表示获取sigvolu中的平均音量的最大值,rankc表示智能体c的障碍物系数的排名,nsigvolu表示sigvolu中的平均音量的总数。

29、可选的,障碍物系数的排名的确定过程包括:

30、获取sigvolu中的每个元素所对应的智能体的障碍物系数;

31、将障碍物系数从大到小进行排序,得到每个智能体的障碍物系数的排名。

32、可选的,响应模块包括第一判断单元、第二判断单元和唤醒单元;

33、第一判断单元用于判断计算模块计算得到的响应系数是否大于其它智能体发送过来的的响应系数;

34、第二判断单元用于在计算模块计算得到的响应系数大于其它智能体发送过来的的响应系数时,判断监听模块获得的声音信号是否包含预设的唤醒词;

35、唤醒单元用于在监听模块获得的声音信号包含预设的唤醒词时,根据预设的规则对智能体进行唤醒。

36、有益效果:

37、本专利技术在比较小的空间中同时存在多个智能体时,通过智能体的唤醒装置来获取智能体所处环境的声音信号,然后基于声音信号的平均音量来计算响应系数,响应系数越大,则表示当前的智能体被选为被唤醒的智能体的概率越大。由于本专利技术仅由响应系数最大的智能体来响应用户的唤醒,因此,本专利技术能够避免采用同一个唤醒词的多个智能体同时被唤醒的情况的发生,从而实现了智能体的智能唤醒,有效地提高了用户的体验。

本文档来自技高网...

【技术保护点】

1.一种智能体唤醒系统,其特征在于,包括多个智能体的唤醒装置,唤醒装置包括监听模块、获取模块、近场通信模块、计算模块和响应模块;

2.根据权利要求1所述的一种智能体唤醒系统,其特征在于,自适应音量阈值的获取方式为:

3.根据权利要求2所述的一种智能体唤醒系统,其特征在于,自适应的采样间隔的计算函数为:

4.根据权利要求2所述的一种智能体唤醒系统,其特征在于,基于环境音量以及预设的基础音量计算自适应音量阈值,包括:

5.根据权利要求1所述的一种智能体唤醒系统,其特征在于,根据监听模块获取的声音信号计算智能体与声源之间的平均音量,包括:

6.根据权利要求1所述的一种智能体唤醒系统,其特征在于,响应系数的计算函数为:

7.根据权利要求6所述的一种智能体唤醒系统,其特征在于,障碍物系数的排名的确定过程包括:

8.根据权利要求1所述的一种智能体唤醒系统,其特征在于,响应模块包括第一判断单元、第二判断单元和唤醒单元;

【技术特征摘要】

1.一种智能体唤醒系统,其特征在于,包括多个智能体的唤醒装置,唤醒装置包括监听模块、获取模块、近场通信模块、计算模块和响应模块;

2.根据权利要求1所述的一种智能体唤醒系统,其特征在于,自适应音量阈值的获取方式为:

3.根据权利要求2所述的一种智能体唤醒系统,其特征在于,自适应的采样间隔的计算函数为:

4.根据权利要求2所述的一种智能体唤醒系统,其特征在于,基于环境音量以及预设的基础音量计算自适应音量阈值,包括...

【专利技术属性】
技术研发人员:孙志明陈海涛雷铜王彬
申请(专利权)人:南京汇智互娱网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1