位置编码方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36860047 阅读:14 留言:0更新日期:2023-03-15 18:23
本发明专利技术提供一种位置编码方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,该方法包括:获取目标结构化数据,目标结构化数据为Json格式;获取目标结构化数据的层级关系表示;基于层级关系表示,获取目标结构化数据的位置编码结果。本发明专利技术提供的位置编码方法、装置、电子设备及存储介质,通过获取Josn格式的目标结构化数据的层级关系表示之后,基于上述层级关系表示,获取目标结构化数据的位置编码结果,能更准确、更直观地表示目标结构化数据,能更准确地获得目标结构化数据的位置编码结果,能实现目标结构化数据的位置编码结果的平移不变性。的平移不变性。的平移不变性。

【技术实现步骤摘要】
位置编码方法、装置、电子设备及存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种位置编码方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来,在深度学习
,尤其是自然语言处理
,诸如Bert、Ernie以及CPM模型等预训练模型的使用,已成为主流趋势。
[0003]现有技术中,基于预训练模型的位置编码方法,主要包括绝对位置编码和相对位置编码。
[0004]但是,由于结构化数据特有的数据特点,使得基于上述两种现有的位置编码方法难以对结构化数据进行准确地位置编码。因此,如何对结构化数据进行更准确地位置编码,是本领域亟待解决的技术问题。

技术实现思路

[0005]本专利技术提供一种位置编码方法、装置、电子设备及存储介质,用以解决现有技术中难以对结构化数据进行准确地位置编码的缺陷,实现对结构化数据进行更准确地位置编码。
[0006]本专利技术提供一种位置编码方法,包括:获取目标结构化数据,所述目标结构化数据为Json格式;获取所述目标结构化数据的层级关系表示;基于所述层级关系表示,获取所述目标结构化数据的位置编码结果。
[0007]根据本专利技术提供的一种位置编码方法,所述获取所述目标结构化数据的层级关系表示,包括:将所述目标结构化数据中的每一实体数据,确定为一级根节点下的每一二级根节点;基于所述每一实体数据中的数据层级关系,将所述每一实体数据中嵌套的各级数据,分别确定为所述每一实体数据对应的二级根节点下级联的各级子节点,获得每一所述二级根节点的树形层级关系表示,进而获得所述目标结构化数据的层级关系表示;其中,所述一级根节点是预先设置的。
[0008]根据本专利技术提供的一种位置编码方法,所述基于所述层级关系表示,获取所述目标结构化数据的位置编码结果,包括:基于所述层级关系表示,获取所述层级关系表示中目标节点的结构化属性信息;其中,所述目标节点包括所述层级关系表示中除所述一级根节点之外的所有节点;隶属于所述目标结构化数据中同一实体数据的任意两个目标节点的结构化属性信息相同;对于所述层级关系表示中的任意两个目标节点,基于所述任意两个目标节点的结构化属性信息,判断所述任意两个目标节点是否隶属于所述目标结构化数据中的同一实体
数据;在确定所述任意两个目标节点分别隶属于所述目标结构化数据中的不同实体数据的情况下,基于所述任意两个目标节点的结构化属性信息以及预设距离阈值,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果,作为所述目标结构化数据的位置编码结果。
[0009]根据本专利技术提供的一种位置编码方法,所述基于所述任意两个目标节点的结构化属性信息以及预设距离阈值,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果,包括:基于所述任意两个目标节点的结构化属性信息,获取所述任意两个目标节点之间的相对位置关系;基于所述相对位置关系和所述预设距离阈值,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果。
[0010]根据本专利技术提供的一种位置编码方法,还包括:在所述目标结构化数据的起始位置添加第一位置编码,在所述目标结构化数据的终止位置添加第二位置编码;将所述第一位置编码确定为所述目标结构化数据中每一实体数据的起始位置编码,并基于所述每一实体数据的长度,确定所述每一实体数据与所述每一实体数据的起始位置编码之间的位置编码结果,作为所述目标结构化数据的位置编码结果,将所述第二位置编码确定为所述每一实体数据的终止位置编码,并基于所述每一实体数据的长度,确定所述每一实体数据与所述每一实体数据的终止位置编码之间的位置编码结果,作为所述目标结构化数据的位置编码结果。
[0011]根据本专利技术提供的一种位置编码方法,所述对于所述层级关系表示中的任意两个目标节点,基于所述任意两个目标节点的结构化属性信息,判断所述任意两个目标节点是否隶属于所述目标结构化数据中的同一实体数据之后,所述方法还包括:在确定所述任意两个目标节点隶属于所述目标结构化数据中的同一实体数据的情况下,基于T5模型,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果,作为所述目标结构化数据的位置编码结果。
[0012]根据本专利技术提供的一种位置编码方法,所述获取目标结构化数据,包括:获取原始结构化数据;在所述原始结构化数据为Json格式的情况下,将所述原始结构化数据确定为所述目标结构化数据,在所述原始结构化数据不为Json格式的情况下,通过对所述原始结构化数据进行建模,将所述原始结构化数据的转换为Json格式,进而将Json格式的原始结构化数据确定为所述目标结构化数据。
[0013]本专利技术还提供一种位置编码装置,包括:数据获取模块,用于获取目标结构化数据,所述目标结构化数据为Json格式;关系构建模块,用于获取所述目标结构化数据的层级关系表示;位置编码模块,用于基于所述层级关系表示,获取所述目标结构化数据的位置编码结果。
[0014]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理
器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述位置编码方法。
[0015]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述位置编码方法。
[0016]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述位置编码方法。
[0017]本专利技术提供的位置编码方法、装置、电子设备及存储介质,通过获取Josn格式的目标结构化数据的层级关系表示之后,基于上述层级关系表示,获取目标结构化数据的位置编码结果,能更准确、更直观地表示目标结构化数据,能更准确地获得目标结构化数据的位置编码结果,能实现目标结构化数据的位置编码结果的平移不变性。
附图说明
[0018]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本专利技术提供的位置编码方法的流程示意图;图2为本专利技术提供的位置编码方法中目标结构化数据的层级关系表示的示例图;图3为图2所示的目标结构化数据的层级关系表示中每一节点的结构化属性信息的示例图;图4是本专利技术提供的位置编码装置的结构示意图;图5是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0020]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]在专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种位置编码方法,其特征在于,包括:获取目标结构化数据,所述目标结构化数据为Json格式;获取所述目标结构化数据的层级关系表示;基于所述层级关系表示,获取所述目标结构化数据的位置编码结果。2.根据权利要求1所述的位置编码方法,其特征在于,所述获取所述目标结构化数据的层级关系表示,包括:将所述目标结构化数据中的每一实体数据,确定为一级根节点下的每一二级根节点;基于所述每一实体数据中的数据层级关系,将所述每一实体数据中嵌套的各级数据,分别确定为所述每一实体数据对应的二级根节点下级联的各级子节点,获得每一所述二级根节点的树形层级关系表示,进而获得所述目标结构化数据的层级关系表示;其中,所述一级根节点是预先设置的。3.根据权利要求2所述的位置编码方法,其特征在于,所述基于所述层级关系表示,获取所述目标结构化数据的位置编码结果,包括:基于所述层级关系表示,获取所述层级关系表示中目标节点的结构化属性信息;其中,所述目标节点包括所述层级关系表示中除所述一级根节点之外的所有节点;隶属于所述目标结构化数据中同一实体数据的任意两个目标节点的结构化属性信息相同;对于所述层级关系表示中的任意两个目标节点,基于所述任意两个目标节点的结构化属性信息,判断所述任意两个目标节点是否隶属于所述目标结构化数据中的同一实体数据;在确定所述任意两个目标节点分别隶属于所述目标结构化数据中的不同实体数据的情况下,基于所述任意两个目标节点的结构化属性信息以及预设距离阈值,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果,作为所述目标结构化数据的位置编码结果。4.根据权利要求3所述的位置编码方法,其特征在于,所述基于所述任意两个目标节点的结构化属性信息以及预设距离阈值,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果,包括:基于所述任意两个目标节点的结构化属性信息,获取所述任意两个目标节点之间的相对位置关系;基于所述相对位置关系和所述预设距离阈值,获取所述任意两个目标节点在所述目标结构化数据中对应的数据之间的位置编码结果。5.根据权利要求1所述的位置编码方法,其特征在于,还包括:在所述目标结构化数据的起始位置添加第一位置...

【专利技术属性】
技术研发人员:曾国洋张彬贾超
申请(专利权)人:北京面壁智能科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1