基于端到端的深度学习解码方法、装置、设备及产品制造方法及图纸

技术编号:37044116 阅读:30 留言:0更新日期:2023-03-29 19:23
本发明专利技术提供一种基于端到端的深度学习解码方法、装置、设备及产品,所述方法包括:获取编码语句,并提取所述编码语句的编码数据特征;基于神经网络模型映射所述编码数据特征至解码容器;所述解码容器输出与所述编码语句对应的目标语句。本发明专利技术通过在使用神经网络直接将编码语句映射至解码容器,进而生成自然语言,实现了从数据中进行自然语句的解码,提高了机器翻译的效率。了机器翻译的效率。了机器翻译的效率。

【技术实现步骤摘要】
基于端到端的深度学习解码方法、装置、设备及产品


[0001]本专利技术涉及人工智能
,尤其涉及一种基于端到端的深度学习解码方法、装置、设备及产品。

技术介绍

[0002]目前,用于SMT的组件深度学习的研究非常活跃。对数线性模型促进了基于深度学习的翻译特征的整合。各神经网络结构被设计出来以改进不同的子模块,使SMT的整体性能得到显著提高。例如,Devlin等人提出的联合神经模型在从阿拉伯语到英语的翻译中取得了至少6个BLEU值的惊人提升。然而,尽管人们使用深度学习来改进关键组件但SMT仍然在文本数据中使用了无法处理非线性数据的线性模型。由于新引人的神经特征具有全局依赖性,致使SMT无法设计出高效的动态编程训练和解码算法。因此,非常有必要去探索利用深度学习来提高机器翻译的新途径。

技术实现思路

[0003]本专利技术提供一种基于端到端的深度学习解码方法、装置、设备及产品,用以解决现有技术无法处理非线性数据的线性模型的缺陷。
[0004]根据本专利技术第一方面提供的一种基于端到端的深度学习解码方法,包括:获取编码语句,并提取所述编码语句的编码数据特征;基于神经网络模型映射所述编码数据特征至解码容器;所述解码容器输出与所述编码语句对应的目标语句。
[0005]根据本专利技术的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体包括:获取所述编码数据特征中的第一数据向量和第二数据向量,其中,所述第一数据向量指向所述编码语句的起始位置,所述第二数据向量指向所述编码语句的终止为止;根据所述第一数据向量生成第一数据映射向量;根据所述第二数据向量生成第二数据映射向量;根据所述第一数据映射向量和所述第二数据映射向量构建所述解码容器。
[0006]根据本专利技术的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体包括:提取所述编码数据特征中的第一编码用语和第二编码用语,所述第一编码用语指向非格式用语,所述第二编码用语指向格式用语;所述第一编码用语和所述第二编码用语基于神经网络模型映射至解码容器中;其中,所述第一编码用语和所述第二编码用语包含在解码语句中的位置信息。
[0007]根据本专利技术的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体还包括:提取所述编码数据特征中的第一标点特征和第二标点特征,所述第一标点特征连
接相邻两个所述第一编码用语,所述第二标点特征与所述第二编码用语对应;所述第一标点特征和所述第二标点特征基于神经网络模型映射至解码容器中。
[0008]根据本专利技术的一种实施方式,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体还包括:提取所述编码数据特征中的全部编码单词特征,并根据所述编码单词特征进行判断;确定全部所述编码单词特征之间的重复个数为零,则将每个所述编码单词特征映射至解码容器;确定全部所述编码单词特征中至少包括两个相同的单词,则将具有相同单词的所述编码单词特征作为重复编码单词特征,并将所述重复编码单词特征映射至编码容器。
[0009]根据本专利技术的一种实施方式,所述解码容器输出与所述编码语句对应的目标语句的步骤中,具体包括:获取所述编码数据特征携带的位置参数,所述位置参数标识相应的所述编码数据特征在目标语句中的位置;所述解码容器将全部所述编码数据特征以及对应的所述位置参数输出与所述编码语句对应的所述目标语句。
[0010]根据本专利技术第二方面提供的一种基于端到端的深度学习解码装置,包括:特征获取模块、特征映射模块和语句解码模块;所述特征获取模块用于获取编码语句,并提取所述编码语句的编码数据特征;所述特征映射模块用于基于神经网络模型映射所述编码数据特征至解码容器;所述语句解码模块用于所述解码容器输出与所述编码语句对应的目标语句。
[0011]根据本专利技术第三方面提供的一种电子设备,包括:存储器和处理器;所述存储器和所述处理器通过总线完成相互间的通信;所述存储器存储有,能够在所述处理器上运行的计算机指令;所述处理器调用所述计算机指令时,能够执行上述的基于端到端的深度学习解码方法。
[0012]根据本专利技术第四方面提供的一种计算机程序产品,其包括存储有计算机程序的非暂态机器可读介质,所述计算机程序被处理器执行时,实现上述的基于端到端的深度学习解码方法的步骤。
[0013]本专利技术中的上述一个或多个技术方案,至少具有如下技术效果之一:本专利技术提供的一种基于端到端的深度学习解码方法、装置、设备及产品,通过在使用神经网络直接将编码语句映射至解码容器,进而生成自然语言,实现了从数据中进行自然语句的解码,提高了机器翻译的效率。
附图说明
[0014]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1是本专利技术提供的基于端到端的深度学习解码方法的流程示意图;图2是本专利技术提供的基于端到端的深度学习解码装置的结构示意图;图3是本专利技术提供的电子设备的结构示意图。
[0016]附图标记:10、特征获取模块;20、特征映射模块;30、语句解码模块;810、处理器;820、通信接口;830、存储器;840、通信总线。
具体实施方式
[0017]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0018]下面结合说明书附图对本专利技术进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。在本专利技术的描述中,除非另有说明,“至少一个”包括一个或多个。“多个”是指两个或两个以上。例如,A、B和C中的至少一个,包括:单独存在A、单独存在B、同时存在A和B、同时存在A和C、同时存在B和C,以及同时存在A、B和C。在本专利技术中,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
[0019]下面结合具体实施方式对本专利技术进行具体说明。
[0020]在本专利技术的一些具体实施方案中,如图1所示,本方案提供一种基于端到端的深度学习解码方法、装置、设备及产品,用以解决现有技术无法处理非线性数据的线性模型的缺陷。
[0021]根据本专利技术第一方面提供的一种基于端到端的深度学习解码方法,包括:获取编码语句,并提取编码语句的编码数据特征;基于神经网络模型映射编码数据特征至解码容器;解码容器输出与编码语句对应的目标语句。
...

【技术保护点】

【技术特征摘要】
1.一种基于端到端的深度学习解码方法,其特征在于,包括:获取编码语句,并提取所述编码语句的编码数据特征;基于神经网络模型映射所述编码数据特征至解码容器;所述解码容器输出与所述编码语句对应的目标语句。2.根据权利要求1所述的基于端到端的深度学习解码方法,其特征在于,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体包括:获取所述编码数据特征中的第一数据向量和第二数据向量,其中,所述第一数据向量指向所述编码语句的起始位置,所述第二数据向量指向所述编码语句的终止为止;根据所述第一数据向量生成第一数据映射向量;根据所述第二数据向量生成第二数据映射向量;根据所述第一数据映射向量和所述第二数据映射向量构建所述解码容器。3.根据权利要求2所述的基于端到端的深度学习解码方法,其特征在于,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体包括:提取所述编码数据特征中的第一编码用语和第二编码用语,所述第一编码用语指向非格式用语,所述第二编码用语指向格式用语;所述第一编码用语和所述第二编码用语基于神经网络模型映射至解码容器中;其中,所述第一编码用语和所述第二编码用语包含在解码语句中的位置信息。4.根据权利要求3所述的基于端到端的深度学习解码方法,其特征在于,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体还包括:提取所述编码数据特征中的第一标点特征和第二标点特征,所述第一标点特征连接相邻两个所述第一编码用语,所述第二标点特征与所述第二编码用语对应;所述第一标点特征和所述第二标点特征基于神经网络模型映射至解码容器中。5.根据权利要求4所述的基于端到端的深度学习解码方法,其特征在于,所述基于神经网络模型映射所述编码数据特征至解码容器的步骤中,具体还包括:提取所述编...

【专利技术属性】
技术研发人员:邬青张军
申请(专利权)人:上海德衡数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1