The embodiment of the invention discloses a voice data processing method and apparatus, wherein the method comprises the following steps: acquiring input source voice data, text data and homophone of the voice data recognition processing to obtain the source speech data corresponding to the set of context information; the voice data of the source to generate the analytical results; according to the analytical results in determining the source text data of the voice data corresponding to the set of the same text data; the data source text translation the target text in the target language data, generate the target speech data of the target text data, the output of the target text and data the goal of speech data. The invention can combine the context information of voice data to determine the recognized text data, enhance the accuracy of the recognition of voice data, and further ensure the accuracy of translation results.
【技术实现步骤摘要】
一种语音数据处理方法及其设备
本专利技术涉及计算机
,尤其涉及一种语音数据处理方法及其设备。
技术介绍
随着计算机技术不断的开发和完善,手机和平板电脑等终端可以对用户所输入的语音数据进行识别以生成文本数据,方便了用户对文本数据的输入,同时还可以进行文本数据的翻译,方便了用户间的交流。现有的语音数据识别过程中,往往都是对语音数据直接进行识别,并输出默认的文本数据,因此往往无法很好的对同音字词进行识别,降低了对语音数据的识别的准确性,进而导致在对文本数据进行翻译时出现不符合语境的翻译结果,影响了翻译结果的准确性。
技术实现思路
本专利技术实施例提供一种语音数据处理方法及其设备,可以结合语音数据的上下文信息确定识别的文本数据,提升对语音数据的识别的准确性,进而保证翻译结果的准确性。本专利技术实施例第一方面提供了一种语音数据处理方法,可包括:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。本专利技术实施例第二方面提供了一种语音数据处理设备,可包括:集合获取单元,用于获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;结果生成单元,用于对所述源语音数据的上下文信息进行解析以生成解析结果;数据确定单元,用于根据所述解析结果 ...
【技术保护点】
一种语音数据处理方法,其特征在于,包括:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。
【技术特征摘要】
1.一种语音数据处理方法,其特征在于,包括:获取所输入的源语音数据,并对所述语音数据进行识别处理以获取所述源语音数据对应的同音文本数据集合;对所述源语音数据的上下文信息进行解析以生成解析结果;根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据;将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。2.根据权利要求1所述的方法,其特征在于,所述获取所输入的源语音数据之前,还包括:在存储有至少一个文本数据的源文本数据库中,设置所述至少一个文本数据中各文本数据的映射语义信息。3.根据权利要求2所述的方法,其特征在于,所述对所述源语音数据的上下文信息进行解析以生成解析结果,包括:解析所述源语音数据的上下文信息以获取所述上下文信息中的关键字段信息;判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述关键字段信息相匹配的第一映射语义信息,并在判断后生成解析结果。4.根据权利要求2所述的方法,其特征在于,所述对所述源语音数据的上下文信息进行解析以生成解析结果,包括:解析所述源语音数据的上下文信息以获取所述上下文信息的语义规则信息;判断所述同音文本数据集合的各同音文本数据的映射语义信息中是否存在与所述语义规则信息相匹配的第一映射语义信息,并在判断后生成解析结果。5.根据权利要求3或4所述的方法,其特征在于,所述根据所述解析结果在所述同音文本数据集合中确定所述源语音数据对应的源文本数据,包括:当所述解析结果表示为存在相匹配的第一映射语义信息时,获取所述第一映射语义信息对应的同音文本数据,并将所述第一映射语义信息对应的同音文本数据确定为所述源语音数据对应的源文本数据。6.根据权利要求1所述的方法,其特征在于,所述将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出,包括:获取所上报的终端位置信息,确定所述终端位置信息对应的目标语言;将所述源文本数据翻译处理为目标语言的初始翻译文本数据;基于所述目标语言的语法定义规则修改所述初始翻译文本数据以生成目标文本数据;生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出。7.根据权利要求6所述的方法,其特征在于,所述将所述源文本数据翻译处理为目标语言的目标文本数据,生成所述目标文本数据的目标语音数据,对所述目标文本数据和所述目标语音数据进行输出之后,还...
【专利技术属性】
技术研发人员:康亮,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。