一种数据处理方法、装置和用于数据处理的装置制造方法及图纸

技术编号:20045318 阅读:31 留言:0更新日期:2019-01-09 04:17
本发明专利技术实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:确定用户的触发操作对应的第一词汇;依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇分别位于页面的不同区域,所述区域包括:源语言文本区域和翻译结果区域;依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。本发明专利技术实施例可以降低翻译结果的修改难度,进而可以提高翻译结果的修改效率。

【技术实现步骤摘要】
一种数据处理方法、装置和用于数据处理的装置
本专利技术涉及翻译
,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
技术介绍
随着社会科技与经济的高速发展,不同语言之间的信息交流已经成为信息交往中的重要组成部分,随之而来的对各种语言服务,尤其是翻译服务的需求也越来越广泛。翻译服务是指将一种自然语言(一般称为源语言)的原文翻译为另一种自然语言(一般称为目标语言)的译文的服务。目前的翻译服务,可以针对用户的源语言文本,输出该源语言文本对应的翻译结果(目标语言文本)。例如,针对源语言文本“今天天气怎么样?我觉得天气不错。”,输出的翻译结果可以为“How'stheweathertoday?Ithinktheweatherisgood.”。然而,在实际应用中,输出的翻译结果可能不符合用户需求。例如,一个源语言词汇通常具有多种翻译可能,用户需求具体为:符合语境的翻译可能;而若该翻译结果中包括不符合语境的翻译可能,则将不符合用户需求。在翻译结果不符合用户需求的情况下,用户需要对翻译结果进行修改;然而,用户通常需要从翻译结果中确定需要修改的翻译可能1,然后将翻译可能1修改为翻译可能2,因此修改难度较大。
技术实现思路
本专利技术实施例提供一种数据处理方法、装置和用于数据处理的装置,可以向用户呈现分属于页面的不同区域的第一词汇和第二词汇在翻译过程中的对应关系,上述对应关系可以帮助用户进行翻译结果的质量审核和修改,因此可以降低翻译结果的修改难度,进而可以提高翻译结果的修改效率。为了解决上述问题,本专利技术实施例公开了一种数据处理方法,包括:确定用户的触发操作对应的第一词汇;依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇分别位于页面的不同区域,所述区域包括:源语言文本区域和翻译结果区域;依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。另一方面,本专利技术实施例公开了一种数据处理装置,包括:第一词汇确定模块,用于确定用户的触发操作对应的第一词汇;目标映射信息确定模块,用于依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇分别位于页面的不同区域,所述区域包括:源语言文本区域和翻译结果区域;以及标记处理模块,用于依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。再一方面,本专利技术实施例公开了一种用于数据处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定用户的触发操作对应的第一词汇;依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇分别位于页面的不同区域,所述区域包括:源语言文本区域和翻译结果区域;依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。又一方面,本专利技术实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的数据处理方法。本专利技术实施例包括以下优点:本专利技术实施例的目标映射信息可以反映第一词汇与第二词汇在翻译过程中的关系,因此,基于该目标映射信息的标记处理,可以向用户提供第一词汇在对端对应的第二词汇的信息,进而可以向用户呈现分属于页面的不同区域的第一词汇和第二词汇在翻译过程中的对应关系,上述对应关系可以帮助用户进行翻译结果的质量审核和修改,因此可以降低翻译结果的修改难度,进而可以提高翻译结果的修改效率。例如,在第一词汇位于翻译结果区域的情况下,可以使用户得知翻译结果区域中的第一词汇是从源语言文本区域中的哪个(哪些)第二词汇翻译而来,上述第一词汇和第二词汇在翻译过程中的对应关系可以帮助用户判断第一词汇的准确性、以及在第一词汇不准确的情况下如何依据第二词汇的其他翻译可能对第一词汇进行修改,因此可以降低翻译结果的修改难度,进而可以提高翻译结果的修改效率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的一种翻译服务场景的示意;图2是本专利技术实施例的一种数据处理方法的应用环境的示意;图3是本专利技术的一种数据处理方法实施例一的步骤流程图;图4是本专利技术实施例的一种神经网络机器翻译系统的结构示意图,;图5是本专利技术的一种数据处理方法实施例二的步骤流程图;图6是本专利技术的一种数据处理装置实施例的结构框图;图7是本专利技术的一种用于数据处理的装置800的框图;及图8是本专利技术的一些实施例中服务器的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例提供了一种数据处理方案,该方案可以包括:确定用户的触发操作对应的第一词汇;依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇可以分别位于页面的不同区域,所述区域可以包括:源语言文本区域和翻译结果区域;以及依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。本专利技术实施例可以适用于翻译服务场景。翻译服务场景的端可以包括:源语言对应的源端和目标语言对应的目标端,源端和目标端可以互为对端。参照图1,示出了本专利技术实施例的一种翻译服务场景的示意,该翻译服务场景中页面的区域具体可以包括:源语言文本区域101和翻译结果区域102。其中,源语言文本区域101用于承载源语言文本,在实际应用中,可以接收用户通过键盘方式、或者手写方式、或者语音方式、或者粘贴方式输入的源语言文本。翻译结果区域102用于承载翻译结果,翻译结果可以为目标语言形式。源语言和目标语言可由用户设置得到。例如,源语言为中文、目标语言为英文等,可以理解,源语言和目标语言可以为不同的任意语言,本专利技术实施例对于具体的源语言和目标语言不加以限制。本专利技术实施例可以采用机器翻译方法,确定源语言文本对应的翻译结果。上述机器翻译方法可以包括但不限于:规则机器翻译方法、SMT(统计机器翻译,StatisticalMachineTranslation)方法和NMT(神经网络机器翻译,NeuralMachineTranslation)方法等。其中,规则机器翻译方法利用翻译规则进行翻译,然而,翻译规则的确定往往需要语言专家的参与,而且通常每更换一个翻译领域就需要重本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:确定用户的触发操作对应的第一词汇;依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇分别位于页面的不同区域,所述区域包括:源语言文本区域和翻译结果区域;依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:确定用户的触发操作对应的第一词汇;依据源语言文本中源语言词汇与翻译结果中目标语言词汇之间的映射信息,确定所述第一词汇与第二词汇之间的目标映射信息;其中,所述第一词汇与所述第二词汇分别位于页面的不同区域,所述区域包括:源语言文本区域和翻译结果区域;依据所述目标映射信息,在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理。2.根据权利要求1所述的方法,其特征在于,所述第一词汇位于翻译结果区域,所述第二词汇位于源语言文本区域;或者所述第一词汇位于源语言文本区域,所述第二词汇位于翻译结果区域。3.根据权利要求1或2所述的方法,其特征在于,所述在所述源语言文本区域和所述翻译结果区域中对所述第一词汇和所述第二词汇进行标记处理,包括:依据所述目标映射信息,确定所述第二词汇对应的标记参数;按照所述标记参数,在所述源语言文本区域、或者所述翻译结果区域中对所述第二词汇进行标记处理。4.根据权利要求3所述的方法,其特征在于,不同的目标映射信息对应有不同的标记参数。5.根据权利要求3所述的方法,其特征在于,所述目标映射信息包括:目标映射概率;所述标记参数包括:标记颜色,第一目标映射概率大于第二目标映射概率,所述第一目标映射概率对应的标记颜色的明度大于所述第二目标映射概率对应的标记颜色的明度;或者,所述第一目标映射概率对应的标记颜色的亮度大于所述第二目标映射概率对应的标记颜色的亮度;或者,所述标记参数包括:字体粗细值,第一目标映射概率大于第二目标映射概率,所述第一目标映射概率对应的字体粗细值大于所述第二目标映射概率对应的字体粗细值。6.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:...

【专利技术属性】
技术研发人员:姜里羊王宇光阳家俊施亮亮卫林钰陈伟
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1