多元关系生成模型的训练方法、装置、电子设备及介质制造方法及图纸

技术编号:27685505 阅读:18 留言:0更新日期:2021-03-17 03:52
本申请公开了多元关系生成模型的训练方法、装置、电子设备及介质,涉及计算机技术领域,具体涉及自然语言处理、深度学习、知识图谱等人工智能技术领域。具体实现方案为:获取多个知识条目文本;对知识条目文本进行语义解析,以得到对应的多个实体和语义信息;根据实体和语义信息构建异构图;以及根据异构图训练初始的人工智能网络模型,以得到多元关系生成模型,能够较大程度地学习到多元知识条目的语义完整性,从而有效提升多元关系生成模型的多元关系表示的准确性,实现更加准确的多元知识推理。

【技术实现步骤摘要】
多元关系生成模型的训练方法、装置、电子设备及介质
本申请涉及计算机
,具体涉及自然语言处理、深度学习、知识图谱等人工智能
,尤其涉及多元关系生成模型的训练方法、装置、电子设备及介质。
技术介绍
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。知识图谱是由实体和关系构成的,用于描述世界、领域和语言知识的结构化知识库,通常知识图谱大多涉及实体之间的二元关系,将知识条目处理为以(主语,谓词,宾语)形式的三元组表示,例如,(玛丽·居里,所获奖项,诺贝尔物理学奖)。
技术实现思路
提供了一种多元关系生成模型的训练方法、装置、电子设备、存储介质及计算机程序产品。根据第一方面,提供了一种多元关系生成模型的训练方法,包括:获取多个知识条目文本;对所述知识条目文本进行语义解析,以得到对应的多个实体和语义信息;根据所述实体和所述语义信息构建异构图;以及根据所述异构图训练初始的人工智能网络模型,以得到多元关系生成模型。根据第二方面,提供了一种多元关系生成模型的训练装置,包括:获取模块,用于获取多个知识条目文本;解析模块,用于对所述知识条目文本进行语义解析,以得到对应的多个实体和语义信息;构建模块,用于根据所述实体和所述语义信息构建异构图;以及训练模块,用于根据所述异构图训练初始的人工智能网络模型,以得到多元关系生成模型。根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例的多元关系生成模型的训练方法。根据第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请实施例公开的多元关系生成模型的训练方法。根据第五方面,提出了一种计算机程序产品,包括计算机程序,当所述计算机程序由处理器执行时实现本申请实施例公开的多元关系生成模型的训练方法。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图;图2是本申请实施例中异构图的示意图;图3是根据本申请第二实施例的示意图;图4是本申请实施例中人工智能网络模型的示意图;图5是根据本申请第三实施例的示意图;图6是根据本申请第四实施例的示意图;图7是用来实现本申请实施例的多元关系生成模型的训练方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本申请第一实施例的示意图。其中,需要说明的是,本实施例的多元关系生成模型的训练方法的执行主体为多元关系生成模型的训练装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。本申请实施例涉及自然语言处理、深度学习、知识图谱等人工智能
其中,人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。自然语言处理(NaturalLanguageProcessing,NLP),能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。而知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。如图1所示,该多元关系生成模型的训练方法包括:S101:获取多个知识条目文本。其中,知识条目文本例如【玛丽·居里在1903年和皮埃尔·居里、亨利·贝可勒尔共同获得诺贝尔物理学奖】,其是通过五元关系表示的知识条目文本,或者,知识条目文本也可以包括任意数量的元关系表示,比如三元关系表示,四元关系表示,六元关系表示等,对此不做限制。本申请实施例中上述的各个知识条目文本中的元关系表示,可以是任意数量,从而在将多个知识条目文本作为训练用数据时,能够有效拓展训练用数据的特征维度,保障模型训练的准确性。S102:对知识条目文本进行语义解析,以得到对应的多个实体和语义信息。上述在获取多个知识条目文本之后,可以针对每个知识条目文本均进行语义解析,从中得到各个实体,以及该知识条目文本的语义信息。以上述知识条目文本为【玛丽·居里在1903年和皮埃尔·居里、亨利·贝可勒尔共同获得诺贝尔物理学奖】进行示例,实体可以例如“玛丽·居里”“所获奖项”“获奖时间”“共同获奖人”“共同获奖人”,相应的,语义信息,可以用于描述该知识条目文本对应的语义,或者,也可以用于描述上述各个实体对应的实际的语义内容,比如“1903年”“诺贝尔物理学奖”“皮埃尔·居里”“亨利·贝可勒尔”等等,对此不做限制。一些实施例中,其中,对知识条目文本进行语义解析,以得到对应的多个实体和语义信息,可以是对知识条目文本进行语义解析,以得到知识条目文本之中的多个实体;从多个实体中,确定出主属性和辅助属性;确定与主属性对应的主内容,和与辅助属性对应的辅助内容;以及将主内容和辅助内容作为语义信息。举例而言,以上述知识条目文本为【玛丽·居里在1903年和皮埃尔·居里、亨利·贝可勒尔共同获得诺贝尔物理学奖】进行示例,实体可以例如“玛丽·居里”“所获奖项”“获奖时间”“共同获奖人”“共同获奖人”,相应的,主属性可以是“所获奖项”,辅助属性可以是“获奖时间”“共同获奖人本文档来自技高网
...

【技术保护点】
1.一种多元关系生成模型的训练方法,包括:/n获取多个知识条目文本;/n对所述知识条目文本进行语义解析,以得到对应的多个实体和语义信息;/n根据所述实体和所述语义信息构建异构图;以及/n根据所述异构图训练初始的人工智能网络模型,以得到多元关系生成模型。/n

【技术特征摘要】
1.一种多元关系生成模型的训练方法,包括:
获取多个知识条目文本;
对所述知识条目文本进行语义解析,以得到对应的多个实体和语义信息;
根据所述实体和所述语义信息构建异构图;以及
根据所述异构图训练初始的人工智能网络模型,以得到多元关系生成模型。


2.根据权利要求1所述的方法,其中,所述对所述知识条目文本进行语义解析,以得到对应的多个实体和语义信息,包括:
对所述知识条目文本进行语义解析,以得到所述知识条目文本之中的所述多个实体;
从所述多个实体中,确定出主属性和辅助属性;
确定与所述主属性对应的主内容,和与所述辅助属性对应的辅助内容;以及
将所述主内容和所述辅助内容作为所述语义信息。


3.根据权利要求2所述的方法,其中,所述根据所述实体和所述语义信息构建异构图,包括:
分别将所述实体、所述主属性、所述辅助属性、所述主内容,以及所述辅助内容映射为对应的节点;
分别采用所述实体、所述主属性、所述辅助属性、所述主内容,以及所述辅助内容的词性,描述所对应节点的词性;
在具有对应关系的节点之间构建边;
根据所述边所连接节点对应的词性,形成所述边的词性类型;以及
采用所述词性类型对所述边进行标注,以根据所述节点、所述边,以及所述边的标注构建所述异构图。


4.根据权利要求3所述的方法,所述初始的人工智能网络模型包括输入表征层,图注意力层,以及线性预测层,其中,所述根据所述异构图训练初始的人工智能网络模型,以得到多元关系生成模型,包括:
将所述异构图输入至所述输入表征层之中,以得到所述输入表征层输出的与所述节点对应的向量表示,所述向量表示,描述与所述节点对应的内容之间的语义关系;
将所述异构图输入至所述图注意力层之中,以得到所述图注意力层输出的与所述边的词性类型对应的适配因子;
根据所述向量表示和所述适配因子输入至所述线性预测层之中,以得到所述线性预测层输出的预测多元关系;以及
根据所述预测多元关系和标注多元关系训练所述初始的人工智能网络模型,以得到多元关系生成模型。


5.根据权利要求4所述的方法,在所述将所述异构图输入至所述图注意力层之中,以得到所述图注意力层输出的与所述边的词性类型对应的适配因子之后,还包括:
根据所述适配因子调整所述图注意力层的注意力强度值。


6.根据权利要求4所述的方法,其中,所述根据所述预测多元关系和标注多元关系训练所述初始的人工智能网络模型,以得到多元关系生成模型,包括:
确定所述预测多元关系和标注多元关系之间的损失值;
如果所述损失值满足设定损失阈值,则将训练得到的人工智能网络模型作为所述多元关系生成模型。


7.一种多元关系生成模型的训练装置,包括:
获取模块,用于获取多个知识条目文本;
解析模块,用于对所述知识条目文本进行语义解析,以得到对应的多个实体和语义信息;
构建模块,用于根据...

【专利技术属性】
技术研发人员:王泉王海峰吕雅娟朱勇
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1