翻译方法、装置、设备和存储介质制造方法及图纸

技术编号：21399336 阅读：15 留言：0更新日期：2019-06-19 07:05

本发明专利技术提供一种翻译方法、装置、设备和存储介质，该方法包括：获取待翻译的第一字符串，将待翻译的第一字符串输入到预先获得的翻译模型中，得到对该第一字符串的翻译结果，其中，该翻译模型为基于神经网络对字符串样本进行训练得到的模型，字符串样本的语言与第一字符串的语言一致。本发明专利技术实施例提供的翻译方法、装置、设备和存储介质，提高了翻译的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
翻译方法、装置、设备和存储介质
本专利技术涉及机器翻译技术，尤其涉及一种翻译方法、装置、设备和存储介质。
技术介绍
随着经济的全球化发展，各国之间的交流越来越密切，因此准确的翻译显得格外重要。现有技术中，为了提高翻译的准确度，引入了先验知识，具体地，采用独热编码将先验知识的类别标签表示成一个独热向量，或者将先验知识的类别标签直接映射成一个随机向量，然后将该向量和词向量直接进行拼接，从而得到一个更大的词向量，参与到神经网络机器翻译(NeuralMachineTranslation，NMT)中。然而，采用现有直接拼接的方式将先验知识引入翻译中，会导致翻译结果不准确。
技术实现思路
为解决现有技术中存在的问题，本专利技术提供一种翻译方法、装置、设备和存储介质，以完成对字符串的翻译，提高翻译的准确度。第一方面，本专利技术实施例提供一种翻译方法，包括：获取待翻译的第一字符串；将所述待翻译的第一字符串输入到预先获得的翻译模型中，得到对所述第一字符串的翻译结果；其中，所述翻译模型为基于神经网络对字符串样本进行训练得到的模型，所述字符串样本的语言与所述第一字符串的语言一致。可选的，所述翻译模型是按照如下训练方式得到：获取多个字符串样本；采用开源工具对所述多个字符串样本进行分类，获取每个字符串样本的先验知识对应的向量；将所述先验知识对应的向量和编码层进行拼接，得到每个字符串样本的多个新向量；对所述多个新向量的权重进行训练，得到所述翻译模型。可选的，所述将所述先验知识对应的向量和编码层进行拼接，得到每个字符串样本的多个新向量，包括：将所述先验知识对应的向量和编码层的隐含向量进行拼...

【技术保护点】
1.一种翻译方法，其特征在于，包括：获取待翻译的第一字符串；将所述待翻译的第一字符串输入到预先获得的翻译模型中，得到对所述第一字符串的翻译结果；其中，所述翻译模型为基于神经网络对字符串样本进行训练得到的模型，所述字符串样本的语言与所述第一字符串的语言一致。

【技术特征摘要】
1.一种翻译方法，其特征在于，包括：获取待翻译的第一字符串；将所述待翻译的第一字符串输入到预先获得的翻译模型中，得到对所述第一字符串的翻译结果；其中，所述翻译模型为基于神经网络对字符串样本进行训练得到的模型，所述字符串样本的语言与所述第一字符串的语言一致。2.根据权利要求1所述的方法，其特征在于，所述翻译模型是按照如下训练方式得到：获取多个字符串样本；采用开源工具对所述多个字符串样本进行分类，获取每个字符串样本的先验知识对应的向量；将所述先验知识对应的向量和编码层进行拼接，得到每个字符串样本的多个新向量；对所述多个新向量的权重进行训练，得到所述翻译模型。3.根据权利要求2所述的方法，其特征在于，所述将所述先验知识对应的向量和编码层进行拼接，得到每个字符串样本的多个新向量，包括：将所述先验知识对应的向量和编码层的隐含向量进行拼接，得到每个字符串样本的多个新向量，其中，所述隐含向量和所述每个字符串样本对应的词向量之间的关系为预设函数关系；所述编码层包括每个字符串样本对应的词向量和所述词向量对应的隐含向量。4.根据权利要求3所述的方法，其特征在于，对所述多个新向量的权重进行训练，得到所述翻译模型，包括：根据所述多个新向量和每个字符串样本的翻译结果，对所述多个新向量的权重进行训练，得到所述翻译模型。5.根据权利要求4所述的方法，其特征在于，所述采用开源工具对所述多个字符串样本进行分类，获取每个字符串样本的先验知识对应的向量，包括：采用所述开源工具对所述多个字符串样本进行分类，得到每个字符串样本的先验知识对应的分类概率；根据所述分类...

【专利技术属性】
技术研发人员：张传强，毕天驰，熊皓，何中军，李芝，王海峰，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人