确定麦克风波束成型角度的方法及相关装置制造方法及图纸

技术编号:18255322 阅读:40 留言:0更新日期:2018-06-20 07:31
本发明专利技术实施例涉及图像处理技术领域,公开了一种确定麦克风波束成型角度的方法及相关装置。其中,确定麦克风波束成型角度的方法包括:检测环境中的声音信号,若检测到声音信号且确定声音信号中存在唤醒指示信息,则根据声音信号的来源方向确定麦克风阵列波束成型的角度,否则,判断环境中是否存在交互对象,若存在,确定交互对象的位置,根据交互对象的位置确定麦克风阵列波束成型的角度。机器人可以结合声音信号和交互对象的存在与否确定麦克风阵列波束成型的角度,从而实现了机器人与交互对象之间的自由交互,解决了现有技术中机器人仅在检测到关键词后才会被唤醒,造成的只能实现被动式交流的问题,避免了交互频繁和具有滞后性的问题。

Method for determining the beamforming angle of microphone and related device

The embodiment of the invention relates to the field of image processing technology, and discloses a method for determining the shaping angle of a microphone beam and a related device. Among them, the method of determining the angle of the microphone beamforming includes detecting sound signals in the environment. If the sound signal is detected and the wake-up indication information exists in the sound signal, the angle of the microphone array beamforming is determined according to the source direction of the sound signal, otherwise, the existence of an interactive object in the environment is judged. If it exists, determine the location of the interaction object and determine the angle of the beamforming of the microphone array according to the location of the interaction object. The robot can combine the sound signal and the interaction object to determine the angle of the microphone array beam forming, thus realizing the free interaction between the robot and the interactive object. The robot can only be awakened only after the detection of the key words in the existing technology, and the problem of passive communication can only be realized. The problem of frequent interaction and lagging is avoided.

【技术实现步骤摘要】
确定麦克风波束成型角度的方法及相关装置
本专利技术实施例涉及人工智能
,特别涉及一种确定麦克风波束成型角度的方法及相关装置。
技术介绍
随着人工智能的迅速发展,智能机器人的应用越来越广泛。机器人通过多种传感器感知周边的环境,例如通过声音传感器感知环境中的声音,以及通过图像传感器感知环境中的人或物。目前,智能机器人如何定位交互对象的位置,是业界普遍关注的问题。而基于麦克风阵列的声源定位和波束成型(Beamforming)是目前主要的声源定位方式。该定位方式的主要定位过程为:机器人检测声音信号,并在检测到声音信号中包含设定的关键词后唤醒,进一步通过麦克风阵列和波束成型技术定位声音信号的来源方向。专利技术人发现现有技术中至少存在以下问题:基于关键词唤醒后定位的方式中,机器人只有检测到声音信号中的关键词(如机器人的名字)后才会被唤醒,属于被动唤醒,交互繁琐,具有滞后性。并且,实际交互场景中,也需要实现机器人与交互对象的主动交流。可见,如何使得机器人具备自由交互的能力,是需要解决的问题。
技术实现思路
本专利技术实施方式的目的在于提供一种确定麦克风波束成型角度的方法及相关装置,用以实现机器人与交互对象之间的自由交互。为解决上述技术问题,本专利技术的实施方式提供了一种确定麦克风波束成型角度的方法,包括:检测环境中的声音信号;若检测到声音信号且确定声音信号中存在唤醒指示信息,则根据声音信号的来源方向确定麦克风阵列波束成型的角度;否则,判断环境中是否存在交互对象,若存在,确定交互对象的位置,根据交互对象的位置确定麦克风阵列波束成型的角度。本专利技术的实施方式还提供了一种确定麦克风波束成型角度的装置,包括:检测模块,用于检测环境中的声音信号;第一确定模块,用于若确定检测模块检测到声音信号且确定声音信号中存在唤醒指示信息,则根据声音信号的来源方向确定麦克风阵列波束成型的角度;第二确定模块包括判断子模块、确定子模块和计算子模块,判断子模块用于若不满足检测到声音信号且确定声音信号中存在唤醒指示信息的条件,则判断环境中是否存在交互对象;确定子模块用于若判断子模块确定存在交互对象,确定交互对象的位置;计算子模块用于根据交互对象的位置确定麦克风阵列波束成型的角度。本专利技术的实施方式还提供了一种机器人,包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行确定麦克风波束成型角度的方法。本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现确定麦克风波束成型角度的方法。本专利技术的实施方式相对于现有技术而言,机器人可以结合声音信号和交互对象的存在与否确定麦克风阵列波束成型的角度,从而实现了机器人与交互对象之间的自由交互,解决了现有技术中机器人仅在检测到关键词后才会被唤醒,造成的只能实现被动式交流的问题,避免了交互频繁和具有滞后性的问题。另外,交互对象的位置为交互对象在世界坐标下的坐标;根据交互对象的位置确定麦克风阵列波束成型的角度,包括:将交互对象在世界坐标下的坐标转换为麦克风坐标系下的坐标;采用交互对象在麦克风坐标系下的坐标修正麦克风阵列的声源位置;基于修正后的麦克风阵列的声源位置,确定麦克风阵列波束成型的角度。通过交互对象的世界坐标下的坐标位置最终确定出麦克风阵列波束成型的角度,使得机器人能够主动定位交互对象。另外,判断环境中是否存在交互对象,包括:若检测到声音信号且确定声音信号中不存在唤醒指示信息,判断声音信号的来源方向上是否存在交互对象,若不存在,进一步判断环境除声音信号来源方向之外的其它方向上是否存在交互对象。该方式中,在有声音信号的情况下优先在声音信号来源方向上检测交互对象,提高了检测效率。另外,判断环境中是否存在交互对象,包括:通过图像传感器在环境中拍摄获得图像;判断图像中是否存在交互对象。该方式中,通过图像传感器在环境中拍摄的图像内容,直接判断环境中交互对象的存在情况,避免了增加额外的传感器导致的成本增加。另外,判断环境中是否存在交互对象,包括:采用接近传感器在环境中检测;根据接近传感器的检测结果,判断环境中是否存在交互对象。通过接近传感器在环境中进行检测所获得的检测结果,直接判断环境中交互对象的存在情况,判断过程简单、快速。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。图1是本专利技术第一实施方式的确定麦克风波束成型角度的方法流程图;图2是本专利技术第二实施方式的确定麦克风波束成型角度的方法流程图;图3是本专利技术第二实施方式的坐标转换示意图;图4是本专利技术第三实施方式的确定麦克风波束成型角度的装置结构图;图5是本专利技术第四实施方式的机器人的结构示例图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。本专利技术的第一实施方式涉及一种确定麦克风波束成型角度的方法,应用于机器人,该机器人具体可以是聊天机器人、智能音箱等。需要说明的是,本专利技术实施例中所称的机器人也可以称之为智能终端,对于所有具备人机交互能力的智能终端都属于这里所称的机器人的范畴。如图1所示,具体流程如下:步骤101,进入人机交互状态。当机器人启动并处于正常使用状态时,即进入人机交互状态,并在人机交互状态下感知周边环境中的人或物。具体地,机器人可以在特定触发事件发生时进入人机交互状态,例如检测到用户发出的进入人机交互状态的遥控指令,或者检测到用户对进入人机交互状态的触摸按键的触控操作等。步骤102,检测环境中的声音信号。其中,机器人在进入人机交互状态后会实时检测环境中的声音信号,并判断是否检测到声音信号。具体地,机器人可以通过声音传感器检测环境中的声音信号。当然,这并不意味着必须使用声音传感器进行检测,理论上所有能够检测到声音信号的器件都可以应用到本实施例中,本实施例的保护范围并不受采用的声音信号检测方式的限制。步骤103,判断是否检测到声音信号且声音信号中存在唤醒指示信息,若是,执行步骤104,否则,执行步骤105。其中,唤醒指示信息具体可以是预设的唤醒词或预设的声音特征信息,例如,唤醒指示信息为机器人的名字,或者唤醒指示信息为指定用户的声音特征信息(音色、音调等)。步骤104,根据声音信号的来源方向确定麦克风阵列波束成型的角度,结束本次确定过程。具体地,当检测到声音信号并且确定声音信号中存在唤醒指示信息时,定位声音信号的来源方向,并根据声音信号的来源方向确定出麦克风阵列波束成型的角度。其中,声音信号的来源方向的确定方式有多种,本实施例不限制具体采用哪种确定方式。例如,基于麦克风阵列确定声音信号的来源方向,具体过程为:麦克风阵列中的每个麦克风在接收到声音信号后,根据每个麦克风接收到的声音信号的强度的大小以及麦克风阵列中各麦克风的分本文档来自技高网...
确定麦克风波束成型角度的方法及相关装置

【技术保护点】
1.一种确定麦克风波束成型角度的方法,应用于机器人,其特征在于,包括:检测环境中的声音信号;若检测到声音信号且确定所述声音信号中存在唤醒指示信息,则根据所述声音信号的来源方向确定麦克风阵列波束成型的角度;否则,判断环境中是否存在交互对象,若存在,确定所述交互对象的位置,根据所述交互对象的位置确定麦克风阵列波束成型的角度。

【技术特征摘要】
1.一种确定麦克风波束成型角度的方法,应用于机器人,其特征在于,包括:检测环境中的声音信号;若检测到声音信号且确定所述声音信号中存在唤醒指示信息,则根据所述声音信号的来源方向确定麦克风阵列波束成型的角度;否则,判断环境中是否存在交互对象,若存在,确定所述交互对象的位置,根据所述交互对象的位置确定麦克风阵列波束成型的角度。2.如权利要求1所述的确定麦克风波束成型角度的方法,其特征在于,所述交互对象的位置为所述交互对象在世界坐标下的坐标;根据所述交互对象的位置确定麦克风阵列波束成型的角度,包括:将所述交互对象在世界坐标下的坐标转换为麦克风坐标系下的坐标;采用所述交互对象在所述麦克风坐标系下的坐标修正所述麦克风阵列的声源位置;基于修正后的所述麦克风阵列的声源位置,确定所述麦克风阵列波束成型的角度。3.如权利要求1所述的确定麦克风波束成型角度的方法,其特征在于,所述判断环境中是否存在交互对象,包括:若检测到声音信号且确定所述声音信号中不存在唤醒指示信息,判断所述声音信号的来源方向上是否存在交互对象,若不存在,进一步判断环境除所述声音信号来源方向之外的其它方向上是否存在交互对象。4.如权利要求1~3任一项所述的确定麦克风波束成型角度的方法,其特征在于,所述判断环境中是否存在交互对象,包括:通过图像传感器在环境中拍摄获得图像;判断所述图像中是否存在所述交互对象。5.如权利要求1~3任一项所述的确定麦克风波束成型角度的方法,其特征在于,所述判断环境中是否存在交互对象,包括:采用接近传感器在环境中检测;根据所述接近传感器的检测结果,判断环境中是否存在交互对象。6.一种确定麦克风波束成型角度的装置,应用于机器人,其特征在于,包括:检测模块,用于检测环境中的声音信号;第一确定...

【专利技术属性】
技术研发人员:张含波
申请(专利权)人:达闼科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1