一种语音数据处理方法及其设备技术

技术编号:17561769 阅读:49 留言:0更新日期:2018-03-28 12:16
本发明专利技术实施例公开一种语音数据处理方法及其设备,其中方法包括如下步骤:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。采用本发明专利技术,可以结合语音数据的上下文信息确定识别的文本数据,提升对语音数据的识别的准确性,进而保证翻译结果的准确性。

A speech data processing method and its equipment

The embodiment of the invention discloses a voice data processing method and apparatus, wherein the method comprises the following steps: acquiring input source voice data, text data and homophone of the voice data recognition processing to obtain the source speech data corresponding to the set of context information; the voice data of the source to generate the analytical results; according to the analytical results in determining the source text data of the voice data corresponding to the set of the same text data; the data source text translation the target text in the target language data, generate the target speech data of the target text data, the output of the target text and data the goal of speech data. The invention can combine the context information of voice data to determine the recognized text data, enhance the accuracy of the recognition of voice data, and further ensure the accuracy of translation results.

【技术实现步骤摘要】
一种语音数据处理方法及其设备
本专利技术涉及计算机
,尤其涉及一种语音数据处理方法及其设备。
技术介绍
随着计算机技术不断的开发和完善,手机和平板电脑等终端可以对用户所输入的语音数据进行识别以生成文本数据,方便了用户对文本数据的输入,同时还可以进行文本数据的翻译,方便了用户间的交流。现有的语音数据识别过程中,往往都是对语音数据直接进行识别,并输出默认的文本数据,因此往往无法很好的对同音字词进行识别,降低了对语音数据的识别的准确性,进而导致在对文本数据进行翻译时出现不符合语境的翻译结果,影响了翻译结果的准确性。
技术实现思路
本专利技术实施例提供一种语音数据处理方法及其设备,可以结合语音数据的上下文信息确定识别的文本数据,提升对语音数据的识别的准确性,进而保证翻译结果的准确性。本专利技术实施例第一方面提供了一种语音数据处理方法,可包括:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。本专利技术实施例第二方面提供了一种语音数据处理设备,可包括:集合获取单元,用于获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;结果生成单元,用于对所述源语音数据的上下文信息进行解析以生成解析结果;数据确定单元,用于根据所述解析结果在所述同音文本数据集合中确定所述语音数据对应的源文本数据;数据输出单元,用于将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。在本专利技术实施例中,通过对所输入的源语音数据进行识别以获取同音文本数据集合,并根据源语音数据的上下文信息在同音文本数据集合中确定语音数据对应的源文本数据,最终将源文本数据翻译处理为目标语言的目标文本数据,生成目标文本数据的目标语音数据,对目标文本数据和所述目标语音数据进行输出。通过基于语音数据的上下文信息在识别得到的同音文本数据集合确定文本数据,可以准确识别同音字词,提升了对语音数据的识别的准确性,进而可以保证对文本数据进行翻译所得到的翻译结果符合当前语境,保证了翻译结果的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种语音数据处理方法的流程示意图;图2是本专利技术实施例提供的另一种语音数据处理方法的流程示意图;图3是本专利技术实施例提供的一种语音数据处理设备的结构示意图;图4是本专利技术实施例提供的另一种语音数据处理设备的结构示意图;图5是本专利技术实施例提供的一种结果生成单元的结构示意图;图6是本专利技术实施例提供的另一种结果生成单元的结构示意图;图7是本专利技术实施例提供的数据输出单元的结构示意图;图8是本专利技术实施例提供的又一种语音数据处理设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供的语音数据处理方法可以应用于出境游中智能语音识别及翻译的场景,例如:语音数据处理设备获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合,所述语音数据处理设备对所述源语音数据的上下文信息进行解析以生成解析结果,所述语音数据处理设备根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据,所述语音数据处理设备将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出的场景等。通过基于语音数据的上下文信息在识别得到的同音文本数据集合确定文本数据,可以准确识别同音字词,提升了对语音数据的识别的准确性,进而可以保证对文本数据进行翻译所得到的翻译结果符合当前语境,保证了翻译结果的准确性。本专利技术实施例涉及的语音数据处理设备可以为语音识别翻译应用的后台服务设备,用于对所上报的源语音数据进行识别和翻译为目标语音数据;所述源语音数据用于表示当前用户基于自身掌握语言所输入的语音数据,所述目标语音数据用于表示基于目标语言翻译得到的语音数据,所述目标语言与所述自身掌握语言为不相同的语言。下面将结合附图1和附图2,对本专利技术实施例提供的语音数据处理方法进行详细介绍。请参见图1,为本专利技术实施例提供了一种语音数据处理方法的流程示意图。如图1所示,本专利技术实施例的所述方法可以包括以下步骤S101-S104。S101,获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;具体的,语音数据处理设备可以基于语音识别翻译应用获取用户所输入的源语音数据,所述语音识别翻译应用优选为即时通信应用中的语音获取功能,用户可以通过用户终端调用所述语音识别翻译应用录入源语音数据,所述用户终端可以基于所述语音识别翻译应用将所录入的源语音数据上报至所述语音数据处理设备,所述语音数据处理设备获取所述用户终端上报的所述源语音数据,所述用户终端可以包括平板电脑、个人计算机(PC)、智能手机、掌上电脑以及移动互联网设备(MID)等具备录音功能的终端设备。所述语音数据处理设备可以对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合,可以理解的是,所述语音数据处理设备可以预先基于训练语料进行训练所生成的源文本数据库,优选的,针对训练语料进行训练还可以包括对不同的口音进行分析以及学习等,所述源文本数据库存储有语音数据和文本数据以及两者的对应关系,可以理解的是,由于在识别过程中容易出现同音字词的情况,因此针对同一个源语音数据,可以识别出多个版本的文本数据,所述语音数据处理设备获取包含多个版本的文本数据的同音文本数据集合,需要说明的是,对所述语音数据进行识别处理不仅可以包括对所述语音数据中的声纹等特征进行分析,还可以包括对所述语音数据中的口音进行分析,同时,可以将所述语音数据作为训练语料进行学习。S102,对所述源语音数据的上下文信息进行解析以生成解析结果;具体的,所述语音数据处理设备可以对所述源语音数据的上下文信息进行解析以生成解析结果,所述上下文信息可以为在所述源语音数据之前上报的历史源语音数据,也可以为当前所述源语音数据,解析所述上下文信息可以得到包括所述历史源语音数据中的关键字段信息、所述源语音数据中的字词属性(例如:名词、形容词等)和所述源语音数据中的字词位置(例如:句首、句尾等)中的至少一种信息,所述语音数据处理设备可以解析所述上下文信息,并判断所述同音文本数据集合本文档来自技高网...
一种语音数据处理方法及其设备

【技术保护点】
一种语音数据处理方法,其特征在于,包括:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。

【技术特征摘要】
1.一种语音数据处理方法,其特征在于,包括:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。2.根据权利要求1所述的方法,其特征在于,所述获取所输入的源语音数据之前,还包括:在存储有至少一个文本数据的源文本数据库中,设置所述至少一个文本数据中各文本数据的映射语义信息。3.根据权利要求2所述的方法,其特征在于,所述对所述源语音数据的上下文信息进行解析以生成解析结果,包括:解析所述源语音数据的上下文信息以获取所述上下文信息中的关键字段信息;判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述关键字段信息相匹配的第一映射语义信息,并在判断后生成解析结果。4.根据权利要求2所述的方法,其特征在于,所述对所述源语音数据的上下文信息进行解析以生成解析结果,包括:解析所述源语音数据的上下文信息以获取所述上下文信息的语义规则信息;判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述语义规则信息相匹配的第一映射语义信息,并在判断后生成解析结果。5.根据权利要求3或4所述的方法,其特征在于,所述根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据,包括:当所述解析结果表示为存在相匹配的第一映射语义信息时,获取所述第一映射语义信息对应的同音文本数据,并将所述第一映射语义信息对应的同音文本数据确定为所述源语音数据对应的源文本数据。6.根据权利要求1所述的方法,其特征在于,所述将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出,包括:获取所上报的终端位置信息,确定所述终端位置信息对应的目标语言;将所述源文本数据翻译处理为目标语言的初始翻译文本数据;基于所述目标语言的语法定义规则修改所述初始翻译文本数据以生成目标文本数据;生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。7.根据权利要求6所述的方法,其特征在于,所述将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出之后,还...

【专利技术属性】
技术研发人员:康亮
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1