音频流的处理方法、装置、移动终端及存储介质制造方法及图纸

技术编号:22081539 阅读:43 留言:0更新日期:2019-09-12 16:13
本申请公开了一种音频流的处理方法、装置、移动终端及存储介质,该方法应用于移动终端,移动终端包括第一麦克风以及第二麦克风,该方法包括:通过第一麦克风采集语音信息生成第一音频流,同时通过第二麦克风采集语音信息生成第二音频流;获取第一音频流对应的第一能量值,并获取第二音频流对应的第二能量值;比较第一能量值和第二能量值获得比较结果,基于比较结果确定语音信息的音源方向;基于音源方向,确定移动终端的响应策略。当移动终端在进行音频活动时,本方法可根据双麦克风生成的音频流确定音源方向,以根据音源方向,自动执行对应的响应策略,简化用户操作。

Audio stream processing methods, devices, mobile terminals and storage media

【技术实现步骤摘要】
音频流的处理方法、装置、移动终端及存储介质
本申请涉及移动终端
,更具体地,涉及一种音频流的处理方法、装置、移动终端及存储介质。
技术介绍
移动终端,例如手机,已经成为人们日常生活中最常用的消费型电子产品之一。且随着用户对便捷化和智能化的要求越来越高,更多的移动终端厂商开始对移动终端的多样化功能进行扩展。因此,如何提升移动终端的智能化水平(如通过移动终端实现自动识别语音进行翻译)是移动终端领域的重要研究方向。
技术实现思路
鉴于上述问题,本申请提出了一种音频流的处理方法、装置、移动终端及存储介质,能够在移动终端进行音频活动时,根据音源的不同方向,自动执行不同的响应策略,简化了用户操作。第一方面,本申请实施例提供了一种音频流的处理方法,应用于移动终端,移动终端包括第一麦克风以及第二麦克风,方法包括:通过第一麦克风采集语音信息生成第一音频流,同时通过第二麦克风采集语音信息生成第二音频流;获取第一音频流对应的第一能量值,并获取第二音频流对应的第二能量值;比较第一能量值和第二能量值获得比较结果,基于比较结果确定语音信息的音源方向;基于音源方向,确定移动终端的响应策略。第二方面,本申请实施例提供了一种音频流的处理装置,其特征在于,应用于移动终端,移动终端包括第一麦克风以及第二麦克风,装置包括:音频获取模块,用于通过第一麦克风采集语音信息生成第一音频流,同时通过第二麦克风采集语音信息生成第二音频流;音频分析模块,用于获取第一音频流对应的第一能量值,并获取第二音频流对应的第二能量值;音源确定模块,用于比较第一能量值和第二能量值获得比较结果,基于比较结果确定语音信息的音源方向;策略确定模块,用于基于音源方向,确定移动终端的响应策略。第三方面,本申请实施例提供了一种移动终端,包括一个或多个处理器;存储器;一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于执行上述第一方面提供的音频流的处理方法。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的音频流的处理方法。本申请实施例提供的一种音频流的处理方法、装置、移动终端及存储介质,通过第一麦克风采集语音信息生成第一音频流,同时通过第二麦克风采集语音信息生成第二音频流,然后获取第一音频流对应的第一能量值,以及第二音频流对应的第二能量值,通过比较第一能量值和第二能量值获得比较结果,并基于比较结果确定语音信息的音源方向,以基于音源方向,确定移动终端的响应策略,从而当移动终端在进行音频活动时,可根据双麦克风生成的音频流确定音源方向,并根据音源方向,自动执行对应的响应策略,简化了用户操作。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了根据本申请一个实施例的音频流的处理方法流程图。图2示出了一种适用于本申请实施例的应用环境示意图。图3示出了根据本申请另一个实施例的音频流的处理方法流程图。图4示出了根据本申请实施例的音频流的处理方法中步骤S240的流程图。图5示出了一种适用于本申请实施例的移动终端的界面示意图。图6示出了根据本申请再一个实施例的音频流的处理方法流程图。图7示出了一种适用于本申请实施例的应用环境示意图。图8示出了根据本申请又一个实施例的音频流的处理方法流程图。图9示出了根据本申请还一个实施例的音频流的处理方法流程图。图10示出了根据本申请一个实施例的音频流的处理装置的框图。图11是本申请实施例的用于执行根据本申请实施例的音频流的处理方法的移动终端的框图。图12是本申请实施例的用于保存或者携带实现根据本申请实施例的音频流的处理方法的程序代码的存储单元。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。目前使用手机上的翻译软件作为翻译助手时,需要不停切换翻译语言方向,以及需要手机在用户之间传来传去,屏幕转来转去,操作十分复杂。例如,手机上的翻译软件通常需要用户手动选择要翻译的语言,例如汉译英,然后按住录音键,说出汉语,等待软件将汉语翻译成英语显示在屏幕上后拿给对方看,然后再手动改变翻译语言的方向,让对方说英语,自己看翻译结果,达到交流和沟通的目的,操作十分繁琐。针对上述问题,专利技术人经过研究,提出了本申请实施例中的音频流的处理方法、装置、移动终端及存储介质,当移动终端在进行音频活动时,能够根据双麦克风生成的音频流确定音源方向,以根据音源方向,自动切换翻译语言以及翻译结果显示方向,简化用户操作。请参阅图1,本申请实施例提供了一种音频流的处理方法,可应用于移动终端,该移动终端包括第一麦克风以及第二麦克风,该方法可以包括:步骤S110:通过第一麦克风采集语音信息生成第一音频流,同时通过第二麦克风采集语音信息生成第二音频流。在本申请实施例中,移动终端可以同时启动第一麦克风和第二麦克风对语音信息进行采集,以通过不同的麦克风采集相同的语音信息,对应生成不同的音频流。其中,第一音频流对应第一麦克风采集到的语音信息,第二音频流对应第二麦克风采集的语音信息。可以理解的是,为提高声音采集的范围,第一麦克风和第二麦克风通常处于移动终端的不同位置,从而在第一麦克风和第二麦克风同时采集同一音源对应语音信息时,由于与音源的距离不同,导致采集到的语音信息的音量也不同,对应生成的音频流也不同。其中,语音信息可以是使用移动终端的用户输入的语音信息,例如,请参阅图2,移动终端100为手机时,用户通过拿着手机从手机底部输入语音;也可以是移动终端所处环境的环境声音(如其他用户的声音),在此不作限定。在一些实施例中,上述第一音频流和第二音频流可以由数字形式的音频数据组成。例如,移动终端可通过脉冲编码调制(PCM,PulseCodeModulation)分别将第一麦克风采集到语音信息和第二麦克风采集到语音信息数字化,对应生成第一音频流和第二音频流。在一些实施例中,第一麦克风和第二麦克风采集语音信息,可以是移动终端在运行预设应用程序(如语音翻译软件)时自动触发采集,也可以是用户手动触发采集。其中,手动触发可以是按压实体按键或点击虚拟按键,也可以是摇晃移动终端,在此不作限定。例如,用户可通过移动终端的实体按键或虚拟按键启动录音功能。在一些实施例中,由于移动终端所处环境可能存在环境噪音(如陌生人的声音),导致麦克风采集的语音信息可能会包括该环境噪音,因此,可以对该语音信息进行声纹识别,以提取出用户的语音信息。在一些实施方式中,对该语音信息进行声纹识别,可以是获取语音信息中的所有声纹信息,然后将所有声纹信息与预先存储的用于匹配的声纹特征信息进行匹配,将匹配成功的声纹信息对应的语音信息提取出,即可获取到用户的语音信息。其中,声纹特征信息为用户的声纹信息。步骤S120:获取第一音频流对应的第一能量值,并获取第二音频流对应的第二能量值。在申请实施例中,移动终端在生成第一音频流和第二音频本文档来自技高网
...

【技术保护点】
1.一种音频流的处理方法,其特征在于,应用于移动终端,所述移动终端包括第一麦克风以及第二麦克风,所述方法包括:通过所述第一麦克风采集语音信息生成第一音频流,同时通过所述第二麦克风采集所述语音信息生成第二音频流;获取所述第一音频流对应的第一能量值,并获取所述第二音频流对应的第二能量值;比较所述第一能量值和所述第二能量值获得比较结果,基于所述比较结果确定所述语音信息的音源方向;基于所述音源方向,确定所述移动终端的响应策略。

【技术特征摘要】
1.一种音频流的处理方法,其特征在于,应用于移动终端,所述移动终端包括第一麦克风以及第二麦克风,所述方法包括:通过所述第一麦克风采集语音信息生成第一音频流,同时通过所述第二麦克风采集所述语音信息生成第二音频流;获取所述第一音频流对应的第一能量值,并获取所述第二音频流对应的第二能量值;比较所述第一能量值和所述第二能量值获得比较结果,基于所述比较结果确定所述语音信息的音源方向;基于所述音源方向,确定所述移动终端的响应策略。2.根据权利要求1所述的方法,其特征在于,所述基于所述音源方向,确定所述移动终端的响应策略,包括:基于所述音源方向,确定所述移动终端的语言翻译策略,所述语言翻译策略包括本地语言翻译成外语以及外语翻译成本地语言;基于所述语言翻译策略,对所述语音信息进行翻译,得到所述语音信息的翻译结果。3.根据权利要求2所述的方法,其特征在于,所述基于所述音源方向,确定所述移动终端的语言翻译策略,包括:当所述比较结果指示所述音源方向对应的音源靠近所述移动终端的底部时,确定所述语言翻译策略为本地语言翻译成外语,并确定所述翻译结果的显示方式为倒置显示;当所述比较结果指示所述音源方向对应的音源靠近所述移动终端的顶部时,确定所述语言翻译策略为外语翻译成本地语言,并确定所述显示方式为正向显示。4.根据权利要求3所述的方法,其特征在于,所述移动终端的显示屏包括第一显示区域以及第二显示区域,所述第一显示区域靠近所述移动终端的顶部,所述第二显示区域靠近所述移动终端的底部,所述确定所述翻译结果的显示方式为倒置显示,包括:确定所述翻译结果的显示方式为倒置显示,并将所述翻译结果倒置显示于所述第一显示区域;所述确定所述显示方式为正向显示,包括:确定所述翻译结果的显示方式为正向显示,并将所述翻译结果正向显示于所述第二显示区域。5.根据权利要求1所述的方法,其特征在于,所述比较所述第一能量值和所述第二能量值获得比较结果,基于所述比较结果确定所述语音信息的音源方向,包括:当所述移动终端运行有指定应用程序时,在所述指定应用程序的运行过程中,持续获取所述第一能量值和所述第二能量值的多个比较结果;基于所述多个比较结果确定所述语音信息的音源方向;所述基于所述音源方向,确定所述移动终端的响应策略,包括:当所述多个比较结果指示所述音源方向对应的音源为两个,且分别靠近所述移动终端的顶部和底部时,同时在所...

【专利技术属性】
技术研发人员:姚坤
申请(专利权)人:深圳市锐尔觅移动通信有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1