语句处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39317888 阅读:6 留言:0更新日期:2023-11-12 16:00
本申请提供了一种语句处理方法、装置、计算机设备及存储介质,属于计算机技术领域,可应用于人工智能的自然语言处理方面。所述方法包括:通过大型语言模型,对样本语句和所述样本语句的标签进行学习,确定语句与关键词、例句和领域知识之间的关系;获取属于源语种的待翻译语句;通过所述大型语言模型,基于语句与关键词、例句和领域知识之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词、例句和领域知识;基于所述关键词、所述例句和所述领域知识,将所述待翻译语句翻译成属于目标语种的语句。上述技术方案使得大型语言模型能够充分理解待翻译语句,在此基础上对待翻译语句进行翻译,提高了翻译的准确性和效率。提高了翻译的准确性和效率。提高了翻译的准确性和效率。

【技术实现步骤摘要】
语句处理方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,特别涉及一种语句处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着科技的发展,不同种类的语言之间的交流越来越多,翻译服务也应运而生。由于人工翻译需要花费大量的时间,翻译服务逐渐由人工转变为机器。如何实现机器翻译是本领域研究的重点。
[0003]目前,通常采用的方式是利用神经网络机器翻译(Neural Machine Translation,NMT)来实现。具体地,通过大量双语平行语料库对神经网络进行训练,以自动地学习源语种到目标语种的映射,从而能够生成流利的翻译结果。
[0004]但是,上述方案是基于语句对匹配进行训练的,使得神经网络机器翻译主要关注源语种和目标语种之间的统计关系,而并未真正理解语言的内在语义,从而导致翻译结果的准确率低。比如,翻译得到语句与原文语义不符。

技术实现思路

[0005]本申请实施例提供了一种语句处理方法、装置、计算机设备及存储介质,能够在充分理解待翻译语句的基础上,对待翻译语句进行翻译,提高了翻译的准确性。所述技术方案如下:
[0006]一方面,提供了一种语句处理方法,所述方法包括:
[0007]通过大型语言模型,对样本语句和所述样本语句的标签进行学习,确定语句与关键词、例句和领域知识之间的关系,所述样本语句的标签用于表示所述样本语句的关键词、例句和领域知识,所述关键词用于表示对应的语句的核心信息,所述例句用于表示对应的语句的上下文信息,所述领域知识用于表示对应的语句的主题;
[0008]获取属于源语种的待翻译语句;
[0009]通过所述大型语言模型,基于语句与关键词、例句和领域知识之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词、例句和领域知识;
[0010]基于所述关键词、所述例句和所述领域知识,将所述待翻译语句翻译成属于目标语种的语句。
[0011]另一方面,提供了一种语句处理装置,所述装置包括:
[0012]确定模块,用于通过大型语言模型,对样本语句和所述样本语句的标签进行学习,确定语句与关键词、例句和领域知识之间的关系,所述样本语句的标签用于表示所述样本语句的关键词、例句和领域知识,所述关键词用于表示对应的语句的核心信息,所述例句用于表示对应的语句的上下文信息,所述领域知识用于表示对应的语句的主题;
[0013]获取模块,用于获取属于源语种的待翻译语句;
[0014]分析模块,用于通过所述大型语言模型,基于语句与关键词、例句和领域知识之间
的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词、例句和领域知识;
[0015]翻译模块,用于基于所述关键词、所述例句和所述领域知识,将所述待翻译语句翻译成属于目标语种的语句。
[0016]在一些实施例中,所述分析模块,用于通过所述大型语言模型,基于语句与关键词之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词;通过所述大型语言模型,基于语句与例句之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的例句;通过所述大型语言模型,基于语句与领域知识之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的领域知识。
[0017]在一些实施例中,所述翻译模块,包括:
[0018]第一确定单元,用于基于所述关键词,确定关键词组,所述关键词组包括属于所述源语种的所述关键词和属于所述目标语种的目标词,所述关键词和所述目标词的语义相同;
[0019]第二确定单元,用于基于所述例句,确定例句组合,所述例句组合包括属于所述源语种的所述例句和属于所述目标语种的目标例句,所述例句和所述目标例句的语义相同;
[0020]翻译单元,用于基于所述关键词组、所述例句组合和所述领域知识,将所述待翻译语句翻译成属于所述目标语种的语句。
[0021]在一些实施例中,所述翻译单元,用于获取所述待翻译语句的相关知识,所述相关知识用于表示所述待翻译语句的内容;基于所述相关知识,对所述关键词组、所述例句组合和所述领域知识进行过滤;基于过滤后的所述关键词组、所述例句组合和所述领域知识,将所述待翻译语句翻译成属于所述目标语种的语句。
[0022]在一些实施例中,所述翻译单元,用于基于所述待翻译语句的内容和所述待翻译语句的上下文信息,预测所述待翻译语句的相关知识。
[0023]在一些实施例中,所述翻译单元,用于基于所述关键词组和所述目标语种,对所述待翻译语句进行翻译,得到第一语句;基于所述例句组合和所述目标语种,对所述待翻译语句进行翻译,得到第二语句;基于所述领域知识和所述目标语种,对所述待翻译语句进行翻译,得到第三语句;对所述第一语句、所述第二语句以及所述第三语句进行评估,得到各个语句对应的评估分数,所述评估分数用于表示翻译的准确性;将评估分数最高的语句作为所述待翻译语句最终的翻译结果。
[0024]在一些实施例中,所述翻译模块,还用于基于所述关键词组、所述例句组合以及所述领域知识的整合结果,对所述待翻译语句进行翻译,得到第四语句;对所述第四语句进行评估。
[0025]另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段计算机程序,所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的语句处理方法。
[0026]另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一段计算机程序,所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中语句处理方法。
[0027]另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取该计算机程序,处
理器执行该计算机程序,使得该计算机设备执行上述各个方面或者各个方面的各种可选实现方式中提供的语句处理方法。
[0028]本申请实施例提供了一种语句处理方法,通过对样本语句和样本语句的标签进行学习,使得大型语言模型能够学习到语句与标签中的关键词、例句和领域知识之间的关系,然后,再通过大型语言模型对待翻译语句进行分析,使得能够基于之前学习到的语句与关键词、例句和领域知识之间的关系,确定待翻译语句的关键词、例句和领域知识,实现了基于样本语句的提示学习,来学习待翻译语句的知识的目的;然后,根据关键词、例句和领域知识等三种角度的信息,使得大型语言模型能够充分理解待翻译语句,在此基础上对待翻译语句进行翻译,使得翻译得到的语句与原来的待翻译语义相符,提高了翻译的准确性;并且,由于大型语言模型具有丰富的语言基础,通过大型语言模型对待翻译语句进行分析,能够快速得到翻译结果,提高了翻译效率。
附图说明
[0029]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语句处理方法,其特征在于,所述方法包括:通过大型语言模型,对样本语句和所述样本语句的标签进行学习,确定语句与关键词、例句和领域知识之间的关系,所述样本语句的标签用于表示所述样本语句的关键词、例句和领域知识,所述关键词用于表示对应的语句的核心信息,所述例句用于表示对应的语句的上下文信息,所述领域知识用于表示对应的语句的主题;获取属于源语种的待翻译语句;通过所述大型语言模型,基于语句与关键词、例句和领域知识之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词、例句和领域知识;基于所述关键词、所述例句和所述领域知识,将所述待翻译语句翻译成属于目标语种的语句。2.根据权利要求1所述的方法,其特征在于,所述通过所述大型语言模型,基于语句与关键词、例句和领域知识之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词、例句和领域知识,包括:通过所述大型语言模型,基于语句与关键词之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的关键词;通过所述大型语言模型,基于语句与例句之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的例句;通过所述大型语言模型,基于语句与领域知识之间的关系,对所述待翻译语句进行分析,得到所述待翻译语句的领域知识。3.根据权利要求1所述的方法,其特征在于,所述基于所述关键词、所述例句和所述领域知识,将所述待翻译语句翻译成属于目标语种的语句,包括:基于所述关键词,确定关键词组,所述关键词组包括属于所述源语种的所述关键词和属于所述目标语种的目标词,所述关键词和所述目标词的语义相同;基于所述例句,确定例句组合,所述例句组合包括属于所述源语种的所述例句和属于所述目标语种的目标例句,所述例句和所述目标例句的语义相同;基于所述关键词组、所述例句组合和所述领域知识,将所述待翻译语句翻译成属于所述目标语种的语句。4.根据权利要求3所述的方法,其特征在于,所述基于所述关键词组、所述例句组合和所述领域知识,将所述待翻译语句翻译成属于所述目标语种的语句,包括:获取所述待翻译语句的相关知识,所述相关知识用于表示所述待翻译语句的内容;基于所述相关知识,对所述关键词组、所述例句组合和所述领域知识进行过滤;基于过滤后的所述关键词组、所述例句组合和所述领域知识,将所述待翻译语句翻译成属于所述目标语种的语句。5.根据权利要求4所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:王星何志威梁添焦文祥涂兆鹏杨余久王瑞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1