用于获取音频信息的方法及装置制造方法及图纸

技术编号:18595287 阅读:20 留言:0更新日期:2018-08-04 20:25
本申请实施例公开了用于获取音频信息的方法及装置。该方法的一具体实施方式包括:实时获取待处理音频,并对待处理音频进行音频识别;响应于检测到待处理音频中存在唤醒信号,获取上述唤醒信号的第一方向信息,并获取上述第一方向信息对应的声源的音频信息,上述第一方向信息用于表征发出上述唤醒信号的声源所在的方向;响应于音频信息的第二方向信息与上述唤醒信号的第一方向信息相同,对上述音频信息进行数据处理,其中,上述第二方向信息用于表征发出音频信息的声源所在的方向。该实施方式提高了获取声源的音频信息的效率。

A method and device for obtaining audio information

The application embodiment discloses a method and device for acquiring audio information. A specific implementation method of the method includes: obtaining the audio to be processed in real time and performing audio recognition to the processed audio, in response to detecting the wake-up signal in the audio to be processed, obtaining the first direction information of the aaaaaaaaaaaaaaaaaaaa, and obtaining the audio information of the first direction information to the sound source, first mentioned above. The direction information is used to characterize the direction of the sound source that emits the wake-up signal, and the second direction information in response to the audio information is the same as the first direction of the wake-up signal, and the above audio information is processed, in which the second direction information is used to characterize the direction of the sound source that emits the audio information. . The implementation method improves the efficiency of obtaining audio information of the sound source.

【技术实现步骤摘要】
用于获取音频信息的方法及装置
本申请实施例涉及计算机
,具体涉及音频处理
,尤其涉及用于获取音频信息的方法及装置。
技术介绍
随着科技的发展,智能设备为用户的工作和生活提供了多种便利。通过智能设备,用户可以获取最新的新闻信息、与他人进行即时聊天、查找专业资料等。通常情况下,智能设备的操作需要手动完成。为了进一步提高用户的工作效率,部分智能设备可以支持用户与智能设备之间的语音交互。支持语音交互的智能设备可以获取用户的音频信息,并从音频信息中获取到相关的指令,实现对应的操作。
技术实现思路
本申请实施例的目的在于提出了用于获取音频信息的方法及装置。第一方面,本申请实施例提供了一种用于获取音频信息的方法,该方法包括:实时获取待处理音频,并对待处理音频进行音频识别;响应于检测到待处理音频中存在唤醒信号,获取上述唤醒信号的第一方向信息,并获取上述第一方向信息对应的声源的音频信息,上述第一方向信息用于表征发出上述唤醒信号的声源所在的方向;响应于音频信息的第二方向信息与上述唤醒信号的第一方向信息相同,对上述音频信息进行数据处理,其中,上述第二方向信息用于表征发出音频信息的声源所在的方向。在一些实施例中,上述方法还包括:从上述麦克风阵列中选择一个麦克风作为唤醒信号监测麦克风,上述唤醒信号监测麦克风用于采集待处理音频。在一些实施例中,上述获取上述唤醒信号的第一方向信息包括:获取麦克风阵列中每个麦克风采集的待处理音频,确定上述唤醒信号在每个待处理音频中的标记时间,得到标记时间集合;按照时间先后顺序对标记时间集合中的标记时间进行排序,得到标记时间序列;根据上述标记时间序列中前设定个标记时间对应的麦克风的空间指向设定上述唤醒信号的第一方向信息,上述空间指向用于表征麦克风采集音频的方向。在一些实施例中,上述根据上述标记时间序列中前设定个标记时间对应的麦克风的空间指向设定上述唤醒信号的第一方向信息包括:查询麦克风空间指向表,得到每个麦克风的空间指向对应的空间角度,上述麦克风空间指向表用于表征麦克风的空间指向与麦克风所在空间位置处采集音频的空间角度之间的对应关系;通过上述标记时间序列中前设定个标记时间对应的麦克风的空间指向对应的空间角度构成的角度范围,并根据上述角度范围设定为上述唤醒信号的第一方向信息。在一些实施例中,上述方法还包括:响应于音频信息的第二方向信息与上述唤醒信号的第一方向信息不相同,则在检测到音频信息中存在唤醒信号时,重新获取唤醒信号的第一方向信息。第二方面,本申请实施例提供了一种用于获取音频信息的装置,该装置包括:音频识别单元,用于实时获取待处理音频,并对待处理音频进行音频识别;第一方向信息获取单元,响应于检测到待处理音频中存在唤醒信号,用于获取上述唤醒信号的第一方向信息,并获取上述第一方向信息对应的声源的音频信息,上述第一方向信息用于表征发出上述唤醒信号的声源所在的方向;音频信息采集单元,响应于音频信息的第二方向信息与上述唤醒信号的第一方向信息相同,用于对上述音频信息进行数据处理,其中,上述第二方向信息用于表征发出音频信息的声源所在的方向。在一些实施例中,上述装置还包括:麦克风设置单元,用于从上述麦克风阵列中选择一个麦克风作为唤醒信号监测麦克风,上述唤醒信号监测麦克风用于采集待处理音频。在一些实施例中,上述第一方向信息获取单元包括:待处理音频获取子单元,用于获取上述麦克风阵列中每个麦克风采集的待处理音频,确定上述唤醒信号在每个待处理音频中的标记时间,得到标记时间集合;标记时间序列获取子单元,用于按照时间先后顺序对标记时间集合中的标记时间进行排序,得到标记时间序列;第一方向信息设置子单元,用于根据上述标记时间序列中前设定个标记时间对应的麦克风的空间指向设定上述唤醒信号的第一方向信息,上述空间指向用于表征麦克风采集音频的方向。在一些实施例中,上述第一方向信息设置子单元包括:空间角度查询模块,用于查询麦克风空间指向表,得到每个麦克风的空间指向对应的空间角度,上述麦克风空间指向表用于表征麦克风的空间指向与麦克风所在空间位置处采集音频的空间角度之间的对应关系;第一方向信息设定模块,用于通过上述标记时间序列中前设定个标记时间对应的麦克风的空间指向对应的空间角度构成的角度范围,并根据上述角度范围设定为上述唤醒信号的第一方向信息。在一些实施例中,上述装置还包括:第一方向信息更新单元,响应于音频信息的第二方向信息与上述唤醒信号的第一方向信息不相同,用于在检测到音频信息中存在唤醒信号时,重新获取唤醒信号的第一方向信息。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储器,用于存储一个或多个程序;麦克风阵列,用于采集声源的音频信息;当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于获取音频信息的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于获取音频信息的方法。本申请实施例提供的用于获取音频信息的方法及装置,从待处理音频中检测到唤醒信号后,得到唤醒信号的第一方向信息;之后在音频信息的第二方向信息与唤醒信号的第一方向信息相同时对音频信息进行数据处理。本实施例方法只要检测到一次唤醒信号就可以实现持续采集声源的音频信息,避免了对唤醒信号的频繁检测,以及在检测到唤醒信号后对第一方向信息的频繁检测,提高了获取声源的音频信息的效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于获取音频信息的方法的一个实施例的流程图;图3是根据本申请的用于获取音频信息的方法的一个应用场景的示意图;图4是根据本申请的用于获取音频信息的装置的一个实施例的结构示意图;图5是适于用来实现本申请实施例的服务器的系统结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于获取音频信息的方法或用于获取音频信息的装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括音频采集设备101、网络102和服务器103。网络102用以在音频采集设备101和服务器103之间提供通信链路的介质。其中,服务器103用于对音频采集设备101采集的数据进行数据处理。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。音频采集设备101可以采集音频信息;服务器103用于在音频采集设备101采集的待处理音频中存在唤醒信号时,采集音频信息,并在音频信息的方向信息与唤醒信号的方向信息相同时,对音频信息进行数据处理。音频采集设备101可以是独立的麦克风阵列、集成在电子设备上的麦克风阵列等;服务器103可以是提供各种服务的服务器,例如对音频采集设备101采集的数据进行本文档来自技高网...

【技术保护点】
1.一种用于获取音频信息的方法,其特征在于,所述方法包括:实时获取待处理音频,并对待处理音频进行音频识别;响应于检测到待处理音频中存在唤醒信号,获取所述唤醒信号的第一方向信息,并获取所述第一方向信息对应的声源的音频信息,所述第一方向信息用于表征发出所述唤醒信号的声源所在的方向;响应于音频信息的第二方向信息与所述唤醒信号的第一方向信息相同,对所述音频信息进行数据处理,其中,所述第二方向信息用于表征发出音频信息的声源所在的方向。

【技术特征摘要】
1.一种用于获取音频信息的方法,其特征在于,所述方法包括:实时获取待处理音频,并对待处理音频进行音频识别;响应于检测到待处理音频中存在唤醒信号,获取所述唤醒信号的第一方向信息,并获取所述第一方向信息对应的声源的音频信息,所述第一方向信息用于表征发出所述唤醒信号的声源所在的方向;响应于音频信息的第二方向信息与所述唤醒信号的第一方向信息相同,对所述音频信息进行数据处理,其中,所述第二方向信息用于表征发出音频信息的声源所在的方向。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:从所述麦克风阵列中选择一个麦克风作为唤醒信号监测麦克风,所述唤醒信号监测麦克风用于采集待处理音频。3.根据权利要求1所述的方法,其特征在于,所述获取所述唤醒信号的第一方向信息包括:获取麦克风阵列中每个麦克风采集的待处理音频,确定所述唤醒信号在每个待处理音频中的标记时间,得到标记时间集合;按照时间先后顺序对标记时间集合中的标记时间进行排序,得到标记时间序列;根据所述标记时间序列中前设定个标记时间对应的麦克风的空间指向设定所述唤醒信号的第一方向信息,所述空间指向用于表征麦克风采集音频的方向。4.根据权利要求3所述的方法,其特征在于,所述根据所述标记时间序列中前设定个标记时间对应的麦克风的空间指向设定所述唤醒信号的第一方向信息包括:查询麦克风空间指向表,得到每个麦克风的空间指向对应的空间角度,所述麦克风空间指向表用于表征麦克风的空间指向与麦克风所在空间位置处采集音频的空间角度之间的对应关系;通过所述标记时间序列中前设定个标记时间对应的麦克风的空间指向对应的空间角度构成的角度范围,并根据所述角度范围设定为所述唤醒信号的第一方向信息。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于音频信息的第二方向信息与所述唤醒信号的第一方向信息不相同,则在检测到音频信息中存在唤醒信号时,重新获取唤醒信号的第一方向信息。6.一种用于获取音频信息的装置,其特征在于,所述装置包括:音频识别单元,用于实时获取待处理音频,并对待处理音频进行音频识别;第一方向信息获取单元,响应于检测到待处理音频中存在唤醒信号,用于获取所述唤醒信号的第一方向信息,并获取所述第一方向信息对应的声源的...

【专利技术属性】
技术研发人员:耿雷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1