文本翻译方法、装置、设备及存储介质制造方法及图纸

技术编号:30326805 阅读:11 留言:0更新日期:2021-10-10 00:12
本发明专利技术涉及人工智能,提供一种文本翻译方法、装置、设备及存储介质。该方法能够当接收到文本翻译请求时,根据所述文本翻译请求获取待处理文本;根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域;根据所述分析领域获取初始翻译模型,并基于预设热词调整所述初始翻译模型,得到目标翻译模型;基于所述目标翻译模型分析所述待处理文本,得到已翻译文本;计算所述已翻译文本的文本通顺度;若所述文本通顺度小于预设阈值,基于预先训练好的纠错模型对所述已翻译文本进行纠错处理,得到目标文本。本发明专利技术能够提高目标文本的质量及流畅度。此外,本发明专利技术还涉及区块链技术,所述目标文本可存储于区块链中。文本可存储于区块链中。文本可存储于区块链中。

【技术实现步骤摘要】
文本翻译方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本翻译方法、装置、设备及存储介质。

技术介绍

[0002]文本翻译,是指将待翻译文本从一种语言类型转换为另一种语言类型的方式,通过文本翻译有利于辅助用户快速理解各类文档。在目前的文本翻译方式中,通常是利用机器对待处理的文本进行翻译,然而这种方式在各类专业领域以及新词汇上的适应性较低,导致翻译出的文本质量较低。

技术实现思路

[0003]鉴于以上内容,有必要提供一种文本翻译方法、装置、设备及存储介质,能够提高目标文本的翻译质量及通顺度。
[0004]一方面,本专利技术提出一种文本翻译方法,所述文本翻译方法包括:
[0005]当接收到文本翻译请求时,根据所述文本翻译请求获取待处理文本;
[0006]根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域;
[0007]根据所述分析领域获取初始翻译模型,并基于预设热词调整所述初始翻译模型,得到目标翻译模型;
[0008]基于所述目标翻译模型分析所述待处理文本,得到已翻译文本;
[0009]计算所述已翻译文本的文本通顺度;
[0010]若所述文本通顺度小于预设阈值,基于预先训练好的纠错模型对所述已翻译文本进行纠错处理,得到目标文本。
[0011]根据本专利技术优选实施例,所述根据所述文本翻译请求获取待处理文本包括:
[0012]解析所述文本翻译请求的报文,得到数据信息;
[0013]从所述数据信息中提取存储路径及文本编号;
[0014]将所述文本编号写入查询模板中,得到查询语句;
[0015]基于所述存储路径运行所述查询语句,得到所述待处理文本。
[0016]根据本专利技术优选实施例,所述根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域包括:
[0017]对所述待处理文本进行向量化处理,得到文本表征向量;
[0018]基于正向长短期记忆网络提取所述文本表征向量的正向特征,并基于反向长短期记忆网络提取所述文本表征向量的反向特征;
[0019]将所述正向特征及所述反向特征输入至预先训练好的语义识别模型中,得到所述文本语义;
[0020]计算所述文本语义与每个待选领域的领域相似度;
[0021]将所述领域相似度最高的待选领域确定为所述分析领域。
[0022]根据本专利技术优选实施例,所述基于预设热词调整所述初始翻译模型,得到目标翻译模型包括:
[0023]获取所述文本翻译请求的接收时间,并获取所述初始翻译模型的调整时间;
[0024]若所述调整时间有多个,从多个所述调整时间中选取与所述接收时间的时间差最小的时间作为更新时间;
[0025]根据所述更新时间及所述接收时间生成时间区间需求;
[0026]根据所述时间区间需求及预设标识从预设网站中获取所述预设热词及所述预设热词的翻译词汇;
[0027]基于所述初始翻译模型处理所述预设热词,得到预测词汇;
[0028]根据所述预测词汇与所述翻译词汇的词汇相似度调整所述初始翻译模型,直至所述词汇相似度不再升高,得到所述目标翻译模型。
[0029]根据本专利技术优选实施例,所述目标翻译模型包括编码器及解码器,所述基于所述目标翻译模型分析所述待处理文本,得到已翻译文本包括:
[0030]基于所述编码器对所述待处理文本中每个文本词汇进行编码处理,得到所述文本词汇的词向量;
[0031]分析每个文本词汇在所述待处理文本中的词汇权值;
[0032]基于所述词汇权值对所述词向量进行加权和运算,得到所述待处理文本的句向量;
[0033]基于所述解码器处理所述句向量,得到所述已翻译文本。
[0034]根据本专利技术优选实施例,所述计算所述已翻译文本的文本通顺度包括:
[0035]对于所述已翻译文本中每个目标词汇,获取所述目标词汇在所述已翻译文本中的最近邻词汇;
[0036]根据所述目标词汇与所述最近邻词汇在所述已翻译文本中的拼接关系生成组合词汇;
[0037]计算所述组合词汇在预设语料库中的词汇概率,并计算所述词汇概率的总和,得到所述已翻译文本的文本概率;
[0038]计算所述文本概率在所述已翻译文本的文本长度中的概率比值,并计算所述概率比值的倒数,得到所述文本通顺度。
[0039]根据本专利技术优选实施例,在基于预先训练好的纠错模型对所述已翻译文本进行纠错处理之前,所述方法还包括:
[0040]获取训练样本,所述训练样本中包括待训练文本及所述待训练文本的标准翻译文本;
[0041]将所述待训练文本输入至预先构建好的学习器中,得到预测文本;
[0042]基于预设数量拆分所述预测文本,得到所述预测文本的预测词汇;
[0043]统计每个所述预测词汇在所述预测文本中的第一数量,并统计每个所述预测词汇在所述标准翻译文本中的第二数量;
[0044]从所述第一数量及所述第二数量中筛选取值最小的数量作为每个所述预测词汇的目标数量;
[0045]统计所述预测词汇的词汇总量,并计算所述目标数量在所述词汇总量中的数量比
值;
[0046]计算所述预测文本与所述标准翻译文本的长度差值;
[0047]根据所述长度差值及所述数量比值计算所述学习器的准确度:
[0048]B=e
a
×
e
b

[0049]其中,B是指所述准确度,a是指所述长度差值,b是指所述数量比值;
[0050]根据所述准确度调整所述学习器中的模型参数,直至所述准确度不再增高,得到所述纠错模型。
[0051]另一方面,本专利技术还提出一种文本翻译装置,所述文本翻译装置包括:
[0052]获取单元,用于当接收到文本翻译请求时,根据所述文本翻译请求获取待处理文本;
[0053]确定单元,用于根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域;
[0054]调整单元,用于根据所述分析领域获取初始翻译模型,并基于预设热词调整所述初始翻译模型,得到目标翻译模型;
[0055]分析单元,用于基于所述目标翻译模型分析所述待处理文本,得到已翻译文本;
[0056]计算单元,用于计算所述已翻译文本的文本通顺度;
[0057]处理单元,用于若所述文本通顺度小于预设阈值,基于预先训练好的纠错模型对所述已翻译文本进行纠错处理,得到目标文本。
[0058]另一方面,本专利技术还提出一种电子设备,所述电子设备包括:
[0059]存储器,存储计算机可读指令;及
[0060]处理器,执行所述存储器中存储的计算机可读指令以实现所述文本翻译方法。
[0061]另一方面,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本翻译方法,其特征在于,所述文本翻译方法包括:当接收到文本翻译请求时,根据所述文本翻译请求获取待处理文本;根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域;根据所述分析领域获取初始翻译模型,并基于预设热词调整所述初始翻译模型,得到目标翻译模型;基于所述目标翻译模型分析所述待处理文本,得到已翻译文本;计算所述已翻译文本的文本通顺度;若所述文本通顺度小于预设阈值,基于预先训练好的纠错模型对所述已翻译文本进行纠错处理,得到目标文本。2.如权利要求1所述的文本翻译方法,其特征在于,所述根据所述文本翻译请求获取待处理文本包括:解析所述文本翻译请求的报文,得到数据信息;从所述数据信息中提取存储路径及文本编号;将所述文本编号写入查询模板中,得到查询语句;基于所述存储路径运行所述查询语句,得到所述待处理文本。3.如权利要求1所述的文本翻译方法,其特征在于,所述根据所述待处理文本的文本语义确定所述待处理文本所属的分析领域包括:对所述待处理文本进行向量化处理,得到文本表征向量;基于正向长短期记忆网络提取所述文本表征向量的正向特征,并基于反向长短期记忆网络提取所述文本表征向量的反向特征;将所述正向特征及所述反向特征输入至预先训练好的语义识别模型中,得到所述文本语义;计算所述文本语义与每个待选领域的领域相似度;将所述领域相似度最高的待选领域确定为所述分析领域。4.如权利要求1所述的文本翻译方法,其特征在于,所述基于预设热词调整所述初始翻译模型,得到目标翻译模型包括:获取所述文本翻译请求的接收时间,并获取所述初始翻译模型的调整时间;若所述调整时间有多个,从多个所述调整时间中选取与所述接收时间的时间差最小的时间作为更新时间;根据所述更新时间及所述接收时间生成时间区间需求;根据所述时间区间需求及预设标识从预设网站中获取所述预设热词及所述预设热词的翻译词汇;基于所述初始翻译模型处理所述预设热词,得到预测词汇;根据所述预测词汇与所述翻译词汇的词汇相似度调整所述初始翻译模型,直至所述词汇相似度不再升高,得到所述目标翻译模型。5.如权利要求1所述的文本翻译方法,其特征在于,所述目标翻译模型包括编码器及解码器,所述基于所述目标翻译模型分析所述待处理文本,得到已翻译文本包括:基于所述编码器对所述待处理文本中每个文本词汇进行编码处理,得到所述文本词汇的词向量;
分析每个文本词汇在所述待处理文本中的词汇权值;基于所述词汇权值对所述词向量进行加权和运算,得到所述待处理文本的句向量;基于所述解码器处理所述句向量,得到所述已翻译文本。6.如权利要求1所述的文本翻译方法,其特征在于,所述计算...

【专利技术属性】
技术研发人员:卢春曦王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1