当前位置: 首页 > 专利查询>朱胜青专利>正文

实体关系抽取方法、终端和计算机可读存储介质技术

技术编号:27656464 阅读:18 留言:0更新日期:2021-03-12 14:18
本申请公开了一种实体关系抽取方法、终端和计算机可读存储介质,实体关系抽取方法包括:获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的技术问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。

【技术实现步骤摘要】
实体关系抽取方法、终端和计算机可读存储介质
本申请涉及计算机
,尤其涉及一种实体关系抽取方法、终端和计算机可读存储介质。
技术介绍
随着国际先进国家和中国在量子领域科学研究、产业化、市场化的推展,特别是量子计算机、量子加密技术逐步开始商业应用,量子科技在中国各行各业的影响与日俱增。从公开发表的网络新闻文本中识别量子相关的实体,并抽取这些量子相关实体之间的关系、构建量子企业间的关系图谱成为重要研究内容。目前,量子相关实体之间的关系主要以手动方式甄别为主,基于量子相关实体的信息提取、实体关系抽取的方法还不多。综上所述,现有量子相关的网络新闻和资信文本实体关系联合抽取主要存在以下问题:因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理。
技术实现思路
本申请实施例通过提供一种实体关系抽取方法、终端和计算机可读存储介质,旨在解决因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题。为实现上述目的,本申请一方面提供一种实体关系抽取方法,所述实体关系抽取方法包括以下步骤:获取与量子相关的文本数据,构建自注意力机制;基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。可选地,所述构建自注意力机制的步骤包括:对查询和键值进行点乘计算,得到权重因子;将所述权重因子进行缩放处理以获取缩放数据,将所述缩放数据进行归一化,得到权重系数,并将所述权重系数与设定值进行加权求和。可选地,所述基于所述自注意力机制构建双向长短期记忆网络的步骤包括:获取所述自注意力机制的数据层的数据;基于所述数据层的数据构建向前长短期记忆网络和向后长短期记忆网络,并基于所述向前长短期记忆网络和所述向后长短期记忆网络组成所述双向长短期记忆网络。可选地,所述基于所述双向长短期记忆网络计算实体感知注意力的步骤包括:基于所述双向长短期记忆网络计算相对位置特征和潜在类型的实体特征;根据所述相对位置特征和所述潜在类型的实体特征得到所述实体感知注意力。可选地,所述将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练的步骤包括:获取所述双向长短期记忆网络中参数共享层的第一数据以及所述实体感知注意力中联合解码层的第二数据;将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。可选地,所述将所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练的步骤包括:构建损失函数的梯度下降优化器;基于所述损失函数的梯度下降优化器对所述参数共享层的第一数据和所述联合解码层的第二数据进行联合训练。可选地,所述获取与量子相关的文本数据的步骤之后,包括:对所述文本数据进行结构化预处理,并进行分词和量子实体的识别操作,得到包含多个所述量子实体的句子;基于所述句子组成语料库。可选地,所述获取与量子相关的文本数据的步骤之后,还包括:基于所述文本数据进行量子实体命名,以及确定所述量子实体之前的关系。此外,为实现上述目的,本申请另一方面还提供一种终端,所述终端包括存储器、处理器及存储在存储器上并在处理器上运行的实体关系抽取程序,所述处理器执行所述实体关系抽取程序时实现如上所述实体关系抽取方法的步骤。此外,为实现上述目的,本申请另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实体关系抽取程序,所述实体关系抽取程序被处理器执行时实现如上所述实体关系抽取方法的步骤。本实施例通过获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。附图说明图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图;图2为本申请实体关系抽取方法第一实施例的流程示意图;图3为本申请实体关系抽取方法第二实施例的流程示意图;图4为本申请实体关系抽取方法中构建自注意力机制的流程示意图;图5为本申请实体关系抽取方法中基于所述自注意力机制构建双向长短期记忆网络的流程示意图;图6为本申请实体关系抽取方法中基于所述双向长短期记忆网络计算实体感知注意力的流程示意图;图7为本申请实体关系抽取方法中将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练的流程示意图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。本申请实施例的主要解决方案是:获取与量子相关的文本数据,构建自注意力机制;基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。由于现有量子相关的网络新闻和资信文本实体关系联合抽取存在以下问题:因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理。本申请通过获取与量子相关的文本数据,构建自注意力机制;基于自注意力机制构建双向长短期记忆网络,并基于双向长短期记忆网络计算实体感知注意力;将双向长短期记忆网络中的第一数据和实体感知注意力中的第二数据进行联合训练,得到训练模型;将文本数据输入至训练模型中进行训练,得到抽取结果。解决了因为行业急剧发展,众多量子相关的实体名称未能及时进行识别,以及各家量子相关实体之间的关系有待梳理的问题,避免了繁琐的特征工程,提高了实体关系联合抽取效率。如图1所示,图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图。如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存本文档来自技高网...

【技术保护点】
1.一种实体关系抽取方法,其特征在于,所述方法包括:/n获取与量子相关的文本数据,构建自注意力机制;/n基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;/n将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;/n将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。/n

【技术特征摘要】
1.一种实体关系抽取方法,其特征在于,所述方法包括:
获取与量子相关的文本数据,构建自注意力机制;
基于所述自注意力机制构建双向长短期记忆网络,并基于所述双向长短期记忆网络计算实体感知注意力;
将所述双向长短期记忆网络中的第一数据和所述实体感知注意力中的第二数据进行联合训练,得到训练模型;
将所述文本数据输入至所述训练模型中进行训练,得到抽取结果。


2.根据权利要求1所述的实体关系抽取方法,其特征在于,所述构建自注意力机制的步骤包括:
对查询和键值进行点乘计算,得到权重因子;
将所述权重因子进行缩放处理以获取缩放数据,将所述缩放数据进行归一化,得到权重系数,并将所述权重系数与设定值进行加权求和。


3.根据权利要求1所述的实体关系抽取方法,其特征在于,所述基于所述自注意力机制构建双向长短期记忆网络的步骤包括:
获取所述自注意力机制的数据层的数据;
基于所述数据层的数据构建向前长短期记忆网络和向后长短期记忆网络,并基于所述向前长短期记忆网络和所述向后长短期记忆网络组成所述双向长短期记忆网络。


4.根据权利要求1至3中任一项所述的实体关系抽取方法,其特征在于,所述基于所述双向长短期记忆网络计算实体感知注意力的步骤包括:
基于所述双向长短期记忆网络计算相对位置特征和潜在类型的实体特征;
根据所述相对位置特征和所述潜在类型的实体特征得到所述实体感知注意力。


5.根据权利要求1至3中任一项所述的实体关系抽取方法,其特征在于,所述将所述双向长短期记忆网络中...

【专利技术属性】
技术研发人员:朱胜青
申请(专利权)人:朱胜青
类型:发明
国别省市:新加坡;SG

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1