基于人工智能的文本翻译方法、装置、计算机设备及介质制造方法及图纸

技术编号:38663191 阅读:13 留言:0更新日期:2023-09-02 22:45
本发明专利技术涉及数字医疗技术领域,尤其涉及一种基于人工智能的文本翻译方法、装置、计算机设备及介质。该方法对文本样本和翻译标签遮挡,得到遮挡样本和遮挡标签,通过编码器提取遮挡样本的样本特征,将样本特征输入翻译解码器和重构解码器,得到翻译样本和重构样本,根据遮挡标签、文本样本、翻译样本和重构样本,训练编码器、翻译解码器和重构解码器,根据训练结果生成文本翻译模型和文本重构模型,根据生成的模型分别对遮挡样本处理根据处理得到的文本翻译结果和文本重构结果的关联程度,调整文本翻译模型的参数,得到目标翻译模型,提高文本翻译的准确率,提高医疗场景下为跨语种人员提供医疗服务的便捷性,进而提高跨语种人员的医疗服务体验。的医疗服务体验。的医疗服务体验。

【技术实现步骤摘要】
基于人工智能的文本翻译方法、装置、计算机设备及介质


[0001]本专利技术涉及数字医疗
,尤其涉及一种基于人工智能的文本翻译方法、装置、计算机设备及介质。

技术介绍

[0002]目前,随着人工智能技术的发展,基于神经网络的智能翻译模型也逐渐应用于数字医疗平台中,数字医疗平台可以支持疾病辅助诊断、健康管理、远程会诊等功能,从而提高医疗机构的效率,方便居民就医。
[0003]智能翻译技术能够应用于数字医疗平台中的智能交互任务中,例如在部署有智能终端的医疗场景中,智能翻译模型能够有助于实现跨语种的信息交流,为跨语种人群提供诊疗、问询等医疗服务,现有的智能翻译模型通常采用编码器和解码器组合的架构,根据待翻译词项以及其前一词项,为待翻译词项的翻译过程提供情景信息。
[0004]但是,现有的情景信息仅属于局部情景信息,也即仅依据待翻译词项及其相邻信息进行文本翻译,在面对情景较为复杂的文本或者文本长度较长的文本时,难以提供可靠的上下文信息辅助文本进行逐词项翻译,从而导致文本翻译的准确率较低,因此,如何提高文本翻译的准确率成为亟待解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种基于人工智能的文本翻译方法、装置、计算机设备及介质,以解决现有文本翻译的准确率较低的问题。
[0006]第一方面,本专利技术实施例提供一种基于人工智能的文本翻译方法,所述文本翻译方法包括:
[0007]获取文本样本及其对应的翻译标签,在预设位置对所述文本样本和所述翻译标签分别进行遮挡,得到遮挡样本及其对应的遮挡标签;
[0008]将所述遮挡样本输入预设的编码器中进行特征提取,得到样本特征,将所述样本特征输入预设的翻译解码器中进行特征解码,得到翻译样本,将所述样本特征输入预设的重构解码器中进行特征重构,得到重构样本;
[0009]以所述遮挡标签和所述文本样本为依据,根据所述翻译样本和所述重构样本,对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,得到训练好的编码器、训练好的翻译解码器和训练好的重构解码器;
[0010]使用所述训练好的编码器和所述训练好的翻译解码器生成文本翻译模型,使用所述训练好的编码器和所述训练好的重构解码器生成文本重构模型;
[0011]将所述遮挡样本输入所述文本翻译模型,得到文本翻译结果,将所述遮挡样本输入所述文本重构模型,得到文本重构结果,根据所述文本翻译结果和所述文本重构结果的关联程度,调整所述文本翻译模型的参数,直至满足预设的生成条件,得到生成的目标翻译模型,所述目标翻译模型用于对获取的待翻译文本进行翻译。
[0012]第二方面,本专利技术实施例提供一种基于人工智能的文本翻译装置,所述文本翻译装置包括:
[0013]样本遮挡模块,用于获取文本样本及其对应的翻译标签,在预设位置对所述文本样本和所述翻译标签分别进行遮挡,得到遮挡样本及其对应的遮挡标签;
[0014]样本处理模块,用于将所述遮挡样本输入预设的编码器中进行特征提取,得到样本特征,将所述样本特征输入预设的翻译解码器中进行特征解码,得到翻译样本,将所述样本特征输入预设的重构解码器中进行特征重构,得到重构样本;
[0015]联合训练模块,用于以所述遮挡标签和所述文本样本为依据,根据所述翻译样本和所述重构样本,对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,得到训练好的编码器、训练好的翻译解码器和训练好的重构解码器;
[0016]第一模型生成模块,用于使用所述训练好的编码器和所述训练好的翻译解码器生成文本翻译模型,使用所述训练好的编码器和所述训练好的重构解码器生成文本重构模型;
[0017]第二模型生成模块,用于将所述遮挡样本输入所述文本翻译模型,得到文本翻译结果,将所述遮挡样本输入所述文本重构模型,得到文本重构结果,根据所述文本翻译结果和所述文本重构结果的关联程度,调整所述文本翻译模型的参数,直至满足预设的生成条件,得到生成的目标翻译模型,所述目标翻译模型用于对获取的待翻译文本进行翻译。
[0018]第三方面,本专利技术实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于人工智能的文本翻译方法。
[0019]第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于人工智能的文本翻译方法。
[0020]本专利技术实施例与现有技术相比存在的有益效果是:
[0021]获取文本样本及其对应的翻译标签,在预设位置对文本样本和翻译标签分别进行遮挡,得到遮挡样本及其对应的遮挡标签,将遮挡样本输入预设的编码器中进行特征提取,得到样本特征,将样本特征输入预设的翻译解码器中进行特征解码,得到翻译样本,将样本特征输入预设的重构解码器中进行特征重构,得到重构样本,以遮挡标签和文本样本为依据,根据翻译样本和重构样本,对编码器、翻译解码器和重构解码器进行联合训练,得到训练好的编码器、训练好的翻译解码器和训练好的重构解码器,使用训练好的编码器和训练好的翻译解码器生成文本翻译模型,使用训练好的编码器和训练好的重构解码器生成文本重构模型,将遮挡样本输入文本翻译模型,得到文本翻译结果,将遮挡样本输入文本重构模型,得到文本重构结果,根据文本翻译结果和文本重构结果的关联程度,调整文本翻译模型的参数,直至满足预设的生成条件,得到生成的目标翻译模型,通过共享编码器进行多任务训练,能够有效提高编码器提取特征的能力,根据文本重构模型的输出对文本翻译模型的再次训练进行监督,实现知识蒸馏的效果,确保编码器所提取的特征能够有效表征语义信息并且翻译解码器能够学习到语义信息,进一步提高了文本翻译模型的翻译精度,从而提高了文本翻译的准确率,提高医疗场景下为跨语种人员提供医疗服务的便捷性,进而提高跨语种人员的医疗服务体验。
附图说明
[0022]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本专利技术实施例一提供的一种基于人工智能的文本翻译方法的一应用环境示意图;
[0024]图2是本专利技术实施例一提供的一种基于人工智能的文本翻译方法的流程示意图;
[0025]图3是本专利技术实施例二提供的一种基于人工智能的文本翻译装置的结构示意图;
[0026]图4是本专利技术实施例三提供的一种计算机设备的结构示意图。
具体实施方式
[0027]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的文本翻译方法,其特征在于,所述文本翻译方法包括:获取文本样本及其对应的翻译标签,在预设位置对所述文本样本和所述翻译标签分别进行遮挡,得到遮挡样本及其对应的遮挡标签;将所述遮挡样本输入预设的编码器中进行特征提取,得到样本特征,将所述样本特征输入预设的翻译解码器中进行特征解码,得到翻译样本,将所述样本特征输入预设的重构解码器中进行特征重构,得到重构样本;以所述遮挡标签和所述文本样本为依据,根据所述翻译样本和所述重构样本,对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,得到训练好的编码器、训练好的翻译解码器和训练好的重构解码器;使用所述训练好的编码器和所述训练好的翻译解码器生成文本翻译模型,使用所述训练好的编码器和所述训练好的重构解码器生成文本重构模型;将所述遮挡样本输入所述文本翻译模型,得到文本翻译结果,将所述遮挡样本输入所述文本重构模型,得到文本重构结果,根据所述文本翻译结果和所述文本重构结果的关联程度,调整所述文本翻译模型的参数,直至满足预设的生成条件,得到生成的目标翻译模型,所述目标翻译模型用于对获取的待翻译文本进行翻译。2.根据权利要求1所述的文本翻译方法,其特征在于,所述文本样本包括至少一个样本词项,所述翻译标签包括至少一个标签词项;所述在预设位置对所述文本样本和所述翻译标签分别进行遮挡,得到遮挡样本及其对应的遮挡标签包括:根据所述预设位置,确定所述文本样本中所述预设位置对应的样本词项为第一遮挡词项,在所述文本样本中对所述第一遮挡词项进行遮挡,得到所述遮挡样本;确定所述翻译标签中所述预设位置对应的标签词项为第二遮挡词项,在所述翻译标签中对所述第二遮挡词项进行遮挡,得到所述遮挡标签,所述遮挡标签和所述遮挡样本存在对应关系。3.根据权利要求1所述的文本翻译方法,其特征在于,所述以所述遮挡标签和所述文本样本为依据,根据所述翻译样本和所述重构样本,对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,得到训练好的编码器、训练好的翻译解码器和训练好的重构解码器包括:根据所述遮挡标签、所述翻译样本和预设的翻译损失函数,计算得到翻译损失;根据所述文本样本、所述重构样本和预设的重构损失函数,计算得到重构损失;以所述翻译损失和所述重构损失为依据,对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,得到所述训练好的编码器、所述训练好的翻译解码器和所述训练好的重构解码器。4.根据权利要求3所述的文本翻译方法,其特征在于,所述以所述翻译损失和所述重构损失为依据,对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,得到所述训练好的编码器、所述训练好的翻译解码器和所述训练好的重构解码器包括:将所述翻译损失和预设的第一权重相乘,得到第一相乘结果,将所述重构损失和预设的第二权重相乘,得到第二相乘结果;将所述第一相乘结果和所述第二相乘结果相加,确定相加结果为训练损失,以所述训
练损失为依据,采用梯度下降法对所述编码器、所述翻译解码器和所述重构解码器进行联合训练,直至所述训练损失收敛,得到所述训练好的编码器、所述训练好的翻译解码器和所述训练好的重构解码器。5.根据权利要求1至4任一项所述的文本翻译方法,其特征在于,所述遮挡样本包括至少一个未遮挡词项;所述将所述遮挡样本输入所述文本翻译模型,得到文本翻译结果,将所述遮挡样本输入所述文本重构模型,得到文本重构结果,根据所述文本翻译结果和所述文本重构结果的关联程度,调整所述文本翻译模型的参数,直至满足预设的生成条件,得到生成的目标翻译模型包括:通过所述文本翻译模型,对所述遮挡样本中的每个未遮挡词项进行翻译结果预测,得到每个未遮挡词项对应的第一概率...

【专利技术属性】
技术研发人员:凌天东王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1