一种单词翻译方法、装置、设备和一种可读存储介质制造方法及图纸

技术编号:28559965 阅读:20 留言:0更新日期:2021-05-25 17:54
本申请公开了一种单词翻译方法、装置、设备和介质,该方法包括:获取目标语句并确定目标语句中的待翻译单词;利用特征提取模型提取得到待翻译单词在目标语句中的上下文特征向量;将上下文特征向量输入预先训练得到的分类预测模型中,预测得到待翻译单词对应的翻译结果。本申请在确定目标语句中的待翻译单词之后,将利用特征提取模型对该待翻译单词在目标语句中的上下文特征向量进行提取,并以此进行分类预测得到待翻译单词对应的翻译结果,也即,本申请能够结合待翻译单词及其前后位置的文本,识别出在当前上下文中最恰当的单词释义,较为准确地给出单词在不同上下文中对应的中文释义,显著提高了单词翻译的准确性,为用户提供更精确的翻译服务。

【技术实现步骤摘要】
一种单词翻译方法、装置、设备和一种可读存储介质
本申请涉及英语学习
,更具体地说,涉及一种单词翻译方法、装置、设备和一种计算机可读存储介质。
技术介绍
在传统单词翻译时,一种常见的方案是查询该单词在词典中的释义,并全部展示给用户,这种方案导致向用户返回的释义过于冗余,用户难以直接获知该单词在当前场景下的释义,需要从多种释义中辨别筛选得到该单词在当前场景下的正确释义;另一种方案是根据该单词多个释义的出现频率将其中频率最高的释义进行展示,但是这种方案下,仅仅通过出现频率确定最终的单词释义过于片面,很可能出现翻译并不准确的情况。
技术实现思路
本申请的目的在于提供一种单词翻译方法、装置及设备和一种计算机可读存储介质,能够较为准确地给出单词在不同上下文中对应的中文释义,显著提高了单词翻译的准确性。为实现上述目的,本申请提供了一种单词翻译方法,包括:获取目标语句并确定所述目标语句中的待翻译单词;利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量;将所述上下文特征向量输入预先训练得到的分类预测模型中,预测得到所述待翻译单词对应的翻译结果。可选的,所述利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量,包括:以所述待翻译单词为中心,从所述目标语句中截取预设大小的文本内容;将所述文本内容输入所述特征提取模型中,得到所述待翻译单词在所述目标语句中的上下文特征向量。可选的,所述分类预测模型的训练过程,包括:<br>获取所有目标单词和对应的例句;利用所述特征提取模型提取每个目标单词在对应例句中的上下文特征向量,得到训练样本数据;利用所述训练样本数据训练得到所述分类预测模型。可选的,所述获取所有目标单词和对应的例句,包括:确定主要词典,获取所述主要词典中记录的所有目标单词和所述目标单词的所有释义,以及每个单词释义对应的例句;确定次要词典,并将所述次要词典中每个所述目标单词对应的例句映射到所述主要词典中对应的单词释义下。可选的,所述利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量之前,还包括:获取部分目标单词和对应的例句,得到测试样本;利用所述测试样本对预训练的特征提取模型进行测试和调整,得到调整后特征提取模型;所述利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量,包括:利用所述调整后特征提取模型提取所述待翻译单词在所述目标语句中的上下文特征向量。可选的,所述预训练的特征提取模型为ContextVec模型或Bert模型。可选的,所述分类预测模型为利用K近邻算法进行分类预测的模型。为实现上述目的,本申请提供了一种单词翻译装置,包括:单词确定模块,用于获取目标语句并确定所述目标语句中的待翻译单词;特征提取模块,用于利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量;分类预测模块,用于将所述上下文特征向量输入预先训练得到的分类预测模型中,预测得到所述待翻译单词对应的翻译结果。为实现上述目的,本申请提供了一种单词翻译设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现前述公开的任一种单词翻译方法的步骤。为实现上述目的,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述公开的任一种单词翻译方法的步骤。通过以上方案可知,本申请提供的一种单词翻译方法,包括:获取目标语句并确定所述目标语句中的待翻译单词;利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量;将所述上下文特征向量输入预先训练得到的分类预测模型中,预测得到所述待翻译单词对应的翻译结果。由上可知,本申请在确定目标语句中的待翻译单词之后,将利用特征提取模型对该待翻译单词在目标语句中的上下文特征向量进行提取,并以此进行分类预测得到待翻译单词对应的翻译结果,也即,本申请能够结合待翻译单词及其前后位置的文本,得到待翻译单词的上下文特征向量,并利用分类预测模型根据上下文特征向量识别出待翻译单词在当前上下文中最为恰当的单词释义,从而较为准确地给出单词在不同上下文中对应的中文释义,显著提高了单词翻译的准确性,为用户提供更为精确化的翻译服务,提升了用户体验度。本申请还公开了一种单词翻译装置及设备和一种计算机可读存储介质,同样能实现上述技术效果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例公开的一种单词翻译方法的流程图;图2为本申请实施例公开的分类预测模型的训练过程的流程图;图3为本申请实施例公开的一种单词翻译装置的结构图;图4为本申请实施例公开的一种单词翻译设备的结构图;图5为本申请实施例公开的另一种单词翻译设备的结构图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在现有技术传统的单词翻译过程中,一种常见的方案是查询该单词在词典中的释义并全部展示给用户,导致向用户返回的释义过于冗余,用户难以直接获知该单词在当前场景下的释义,需要从多种释义中辨别筛选得到该单词在当前场景下的正确释义;另一种方案是根据该单词多个释义的出现频率将其中频率最高的释义进行展示,然而仅仅通过出现频率确定最终的单词释义过于片面,很可能出现翻译并不准确的情况。因此,本申请实施例公开了一种单词翻译方法,能够较为准确地给出单词在不同上下文中对应的中文释义,显著提高了单词翻译的准确性。下面对本申请实施例的应用场景进行详细阐述,用户可以通过客户端进行英语学习,客户端可以在显示界面上显示用户待学习的内容,并且还可以通过扬声器等音频播放装置向用户输出语音形式的音频内容。在用户进行英语学习时,客户端可以在用户发起查看单词翻译的请求之后执行单词翻译操作,并向用户返回单词翻译结果。可以理解的是,执行单词翻译操作的主体可以为客户端,也可以为服务端,这均不影响本申请的实现。本申请实施例中,客户端可以包括但不限于:智能手机、平板电脑、MP4、MP3、PC、PDA、可穿戴设备和头戴显示设备等;服务端可以包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算由大量计本文档来自技高网...

【技术保护点】
1.一种单词翻译方法,其特征在于,包括:/n获取目标语句并确定所述目标语句中的待翻译单词;/n利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量;/n将所述上下文特征向量输入预先训练得到的分类预测模型中,预测得到所述待翻译单词对应的翻译结果。/n

【技术特征摘要】
1.一种单词翻译方法,其特征在于,包括:
获取目标语句并确定所述目标语句中的待翻译单词;
利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量;
将所述上下文特征向量输入预先训练得到的分类预测模型中,预测得到所述待翻译单词对应的翻译结果。


2.根据权利要求1所述的单词翻译方法,其特征在于,所述利用特征提取模型提取得到所述待翻译单词在所述目标语句中的上下文特征向量,包括:
以所述待翻译单词为中心,从所述目标语句中截取预设大小的文本内容;
将所述文本内容输入所述特征提取模型中,得到所述待翻译单词在所述目标语句中的上下文特征向量。


3.根据权利要求1所述的单词翻译方法,其特征在于,所述分类预测模型的训练过程,包括:
获取所有目标单词和对应的例句;
利用所述特征提取模型提取每个目标单词在对应例句中的上下文特征向量,得到训练样本数据;
利用所述训练样本数据训练得到所述分类预测模型。


4.根据权利要求3所述的单词翻译方法,其特征在于,所述获取所有目标单词和对应的例句,包括:
确定主要词典,获取所述主要词典中记录的所有目标单词和所述目标单词的所有释义,以及每个单词释义对应的例句;
确定次要词典,并将所述次要词典中每个所述目标单词对应的例句映射到所述主要词典中对应的单词释义下。


5.根据权利要求3所述的单词翻译方法,其特征在于,所述利用特征提取模型提取得到所述待翻译单词在所述目标语...

【专利技术属性】
技术研发人员:邢永伟
申请(专利权)人:上海流利说信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1