一种语音信息的处理方法及装置制造方法及图纸

技术编号:14891665 阅读:247 留言:0更新日期:2017-03-29 00:30
本发明专利技术公开了一种语音信息的处理方法及装置,该语音信息的处理方法包括:获取声源的语音信息和目标位置信息;根据目标位置信息确定目标翻译策略;利用该目标翻译策略对语音信息进行翻译,得到翻译信息;输出该翻译信息。上述语音信息的处理方法无需用户反复选择翻译方式即可实现翻译操作,操作简单,对话效率高。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种语音信息的处理方法及装置
技术介绍
随着世界经济的快速发展,使用不同语言的人们之间的交流越来越多,在双人对话场景中,若对话双方均不懂对方的语言,往往需要借助翻译人员对双方的交谈内容进行翻译,以实现两人的沟通。这种采用翻译人员进行翻译的方式虽然可以较准确的传达双方交谈内容,但是费用较高。为实现低成本沟通,目前更倾向于借助翻译软件翻译,也即,在对话过程中,通过麦克风采集用户的对话内容,并经由翻译软件对该对话内容进行分析,之后利用用户指定的翻译语种对分析出的对话内容进行翻译,并将翻译后的数据通过语音播放,实现两人的沟通。但是,这种沟通方式存在一个极大的缺陷:每次采集完语音之后,用户都要停下来手动选择所需的翻译语言,导致对话操作繁琐,对话效率低。
技术实现思路
本专利技术的目的在于提供一种语音信息的处理方法及装置,以解决现有语音翻译方法操作繁琐、对话效率低的技术问题。为解决上述技术问题,本专利技术实施例提供以下技术方案:一种语音信息的处理方法,其包括:获取声源的语音信息和目标位置信息;根据所述目标位置信息确定目标翻译策略;利用所述目标翻译策略对所述语音信息进行翻译,得到翻译信息;输出所述翻译信息。为解决上述技术问题,本专利技术实施例还提供以下技术方案:一种语音信息的处理装置,其包括:获取模块,用于获取声源的语音信息和目标位置信息;确定模块,用于根据所述目标位置信息确定目标翻译策略;翻译模块,用于利用所述目标翻译策略对所述语音信息进行翻译,得到翻译信息;输出模块,用于输出所述翻译信息。本专利技术所述的语音信息的处理方法及装置,通过获取声源的语音信息和目标位置信息,并根据目标位置信息确定目标翻译策略,之后,利用该目标翻译策略对语音信息进行翻译,得到翻译信息,并输出该翻译信息,从而无需用户反复输入翻译方式即可实现翻译操作,操作简单,对话效率高。附图说明下面结合附图,通过对本专利技术的具体实施方式详细描述,将使本专利技术的技术方案及其它有益效果显而易见。图1a是本专利技术实施例提供的语音信息的处理系统的场景示意图。图1b为本专利技术实施例提供的语音信息的处理方法的流程示意图。图2a为本专利技术实施例提供的语音信息的处理方法的流程示意图。图2b为本专利技术实施例提供的双麦克风采集过程示意图。图3a为本专利技术实施例提供的语音信息的处理装置的结构示意图。图3b为本专利技术实施例提供的语音信息的另一处理装置的结构示意图。图4为本专利技术实施例提供的终端的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供一种语音信息的处理方法、装置及系统。请参阅图1a,该语音信息的处理系统可以包括本专利技术实施例所提供的任一种语音信息的处理装置,该语音信息的处理装置具体可以集成在终端中,该终端可以是手机、平板电脑或者其它具有翻译功能的设备。其中,终端可以获取声源的语音信息和目标位置信息,并根据目标位置信息确定目标翻译策略,之后,利用该目标翻译策略对语音信息进行翻译,得到翻译信息,并输出该翻译信息。其中,该声源可以包括人或者可发声物体,比如可以为视频通话过程中的语音播放设备。该目标位置信息可以指声源与终端的相对位置,主要用于辨别不同的说话对象。该目标翻译策略可以根据实际需求而定,其通常包括待翻译的初始语言和最终翻译成的目标语言,比如若该目标翻译策略为“将中文翻译成英文”,则初始语言为中文,目标语言为英文。当对话双方P1和P2位于终端两边进行对话时,可以根据说话对象相对于终端的位置信息来判断当前说话者是谁,从而选择合适的目标翻译策略进行翻译,并且,可以进一步将翻译出的内容通过喇叭播放出来,以便对话双方P1和P2可以听到。以下将分别进行详细说明。需说明的是,以下实施例的序号不作为实施例优先顺序的限定。第一实施例本实施例将从语音信息的处理装置的角度进行描述,该语音信息的处理装置可以集成在终端中。请参阅图1b,图1b具体描述了本专利技术第一实施例提供的语音信息的处理方法,其可以包括:S101、获取声源的语音信息和目标位置信息。本实施例中,该声源可以包括人或者可发声物体,比如可以为视频通话过程中的语音播放设备。该语音信息可以包括语音内容、音量和音色等信息。该目标位置信息可以指声源与终端(或终端中内置部件)的相对位置,主要用于辨别不同位置的说话对象。该语音信息可以通过声音采集设备获取,该目标位置信息可以根据采集的语音信息得到,也可以通过一些检测装置检测得到,比如可以通过终端内置的红外设备感应得到。例如,上述步骤S101具体可以包括:1-1、分别利用多个音频采集单元对声源所发出的声音进行采集,得到多个具有同一语音内容的语音信息。本实施例中,该音频采集单元可以包括麦克风,该多个音频采集单元可以表现为麦克风阵列,其中每一音频采集单元在终端中具有不同的安装位置,该多个音频采集单元的数量可以根据实际需求而定,比如可以为2个或者3个,等等。1-2、根据该语音信息和音频采集单元确定目标位置信息。例如,上述步骤1-2具体可以包括:获取每一语音信息的音量值,以及每一音频采集单元的标识;根据该音量值的大小和标识确定目标位置信息。本实施例中,可以对语音信息进行数字化处理(比如傅里叶变换)来获取音量值。该标识主要用于区分不同的音频采集单元,其可以按照音频采集单元在终端中的安装位置来设定,比如从左往右该音频采集单元的标识可以依次设定为M1、M2直至Mn。该目标位置信息主要指声源相对于音频采集单元的位置,其可以有多种表现形式,比如可以表现为方位“左”、“中”或“右”,或者标识M1、M2或Mn,其中每一标识表示一个位置,当然,为提高精准度,还可以表现为具有排序规则的标识集,比如M1M2M3或M1M3M2,等等。需要说明的是,由于每个音频采集单元在终端中具有不同的安装位置,且离声源越近,音频采集单元采集到的音量越大,故对于同一声源,每个音频采集单元采集到的语音信息的内容和音色相同,音量不同,从而只要知道每个音频采集单元采集的语音的音量值就可确定声源的目标位置信息,也即可以根据音量值确定该声源相对于音频采集单元的位置。例如,上述步骤“根据该音量值的大小和标识确定目标位置信息”具体可以包括:2-1、获取最大音量值对应的音频采集单元的标识,或者根据音量值的大小对音频采集单元的标识进行排序,以获取排序后标识集;2-2、将获取的标识或者排序后标识集确定为目标位置信息。本实施例中,可以按音量值从大到小或从小到大顺序对标识进行排序,得到排序后标识集。容易理解的是,由于目标位置信息的表现形式有多种,故该目标位置信息的确定方式也可以有多种,比如当目标位置信息表现为标识或者具有排序规则的标识集时,该目标位置信息可以直接是获取的标识或者排序后标识集。比如当当目标位置信息表现为方位信息时,需要进一步根据获取的标识或者排序后标识集从预设的方位信息库中查找对应的方位信息作为目标位置信息,其中该方位信息库中保存的是标识或者标识集与方位信息之间的关联关系,其可以是终端出厂时厂家已经设本文档来自技高网...
一种语音信息的处理方法及装置

【技术保护点】
一种语音信息的处理方法,其特征在于,包括:获取声源的语音信息和目标位置信息;根据所述目标位置信息确定目标翻译策略;利用所述目标翻译策略对所述语音信息进行翻译,得到翻译信息;输出所述翻译信息。

【技术特征摘要】
1.一种语音信息的处理方法,其特征在于,包括:获取声源的语音信息和目标位置信息;根据所述目标位置信息确定目标翻译策略;利用所述目标翻译策略对所述语音信息进行翻译,得到翻译信息;输出所述翻译信息。2.根据权利要求1所述的语音信息的处理方法,其特征在于,所述获取声源的语音信息和目标位置信息,包括:分别利用多个音频采集单元对声源所发出的声音进行采集,得到多个具有同一语音内容的语音信息;根据所述语音信息和音频采集单元确定目标位置信息。3.根据权利要求2所述的语音信息的处理方法,其特征在于,所述根据所述语音信息和音频采集单元确定目标位置信息,包括:获取每一语音信息的音量值,以及每一音频采集单元的标识;根据所述音量值的大小和标识确定目标位置信息。4.根据权利要求1所述的语音信息的处理方法,其特征在于,所述根据所述目标位置信息确定目标翻译策略,包括:根据目标位置信息从已建立的翻译策略集合中选择对应的翻译策略;将选择的翻译策略确定为目标翻译策略。5.根据权利要求4所述的语音信息的处理方法,其特征在于,在获取声源的目标位置信息之前,还包括:利用所述音频采集单元采集声源的首次语音信息;获取用户输入的当前翻译策略;根据首次语音信息和当前翻译策略建立翻译策略集合。6.根据权利要求5所述的语音信息的处理方法,其特征在于,所述根据首次语音信息和当前翻译策略建立翻译策略集合,包括:获取首次语音信息的音量值;根据首次语音信息的音量值和音频采集单元的标识确定当前位置信息;根据当前位置信息和当前翻译策略建立翻译策略集合。7.根据权利要求6所述的语音信息的处理方法,其特征在于,所述根据当前位置信息和当前翻译策略建立翻译策略集合,包括:建立当前位置信息和当前翻译策略之间的关联关系;将所述关联关系存储在翻译策略集合中;所述根据目标位置信息从已建立的翻译策略集合中选择对应的翻译策略,包括:根据所述关联关系从已建立的翻译策略集合中选择与所述目标位置信息对应的翻译策略。8.一种语音信息的处理装置,其特征在于,包括:获取...

【专利技术属性】
技术研发人员:薄川川赵千千张熙文
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1