一种基于二维时序网络的端到端文本实体关系识别方法技术

技术编号：26651026 阅读：20 留言：0更新日期：2020-12-09 00:51

本发明专利技术提供了一种基于二维时序网络的端到端文本实体关系识别方法，属于自然语言处理技术领域。所述方法包括：对文本语句进行处理后嵌入embedding层，得到语句的向量表示；对向量表示编码处理后得到头实体张量和尾实体张量；从向量表示中识别出关系类别；用关系类别对头实体张量和尾实体张量进行缩放；从经缩放的头实体张量中识别出头实体类别和尾实体类别；对经缩放的头实体张量和尾实体张量进行加权处理；对头实体张量和尾实体张量进行缩放；对上一步经缩放的头实体张量和尾实体张量进行处理，得到最终的关系张量。本发明专利技术采用联合建模方式的端到端关系识别模型，相较于管道式的方法可以消除误差累加；本发明专利技术可以有效处理交织实体和交织关系的识别问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于二维时序网络的端到端文本实体关系识别方法
本专利技术属于自然语言处理
，具体涉及一种基于二维时序网络的端到端文本实体关系识别方法。
技术介绍
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向，它主要研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融计算机科学、语言学、数学、人工智能等于一体的交叉学科。实体关系识别与抽取是自然语言处理中的一项重要任务，通过从文本中抽取结构化的实体关系事实，可用于自动构建和扩充知识图谱。知识图谱则是以语义网络为基础的大型知识系统，通过“头实体－关系－尾实体”以及“实体－属性－属性值”的三元组数据基本格式来描述客观世界的。通过知识图谱的查询和推理，机器能够解决不同的问题输入。知识获取是知识图谱开发的重要一步，主要通过实体识别、关系识别、事件识别等方法从文本中获取三元组信息。目前常用的实体关系识别方法主要基于多模型的管道式信息处理思想。如公布号为CN111444715A的专利技术专利涉及一种实体关系识别方法，所述实体关系识别方法首先对待处理语句进行分词处理获得语句元素，并从所述语句元素中确定语句中的头实体；随后基于所述头实体对所述语句元素进行编码，并根据编码结果确定与所述头实体具有实体对应关系的尾实体。该方法的文本语句会按顺序经过分词、实体识别、关系识别等模型，后边模型的推理误差无法避免地会受到前边模型误差的影响，会出现模型误差叠加问题，进而影响识别结果。最近又提出了联合建模的实体关系识别方法，把多个文本处理...

【技术保护点】
1.一种基于二维时序网络的端到端文本实体关系识别方法，其特征在于：所述方法包括：/nS1、获取文本语句，对文本语句进行处理后嵌入embedding层，并对嵌入结果进行编码处理，得到语句的向量表示；/nS2、对步骤S1中得到的向量表示进行处理，得到头实体张量和尾实体张量；/nS3、对步骤S1中得到的向量表示进行识别处理，得到文本语句提及的关系类别；/nS4、用步骤S3中得到的关系类别对步骤S2中得到的头实体张量和尾实体张量进行缩放处理；/nS5、从步骤S4中经缩放的头实体张量中识别涉及到的实体类别，得到头实体类别；从步骤S4中经缩放的尾实体张量中识别涉及到的实体类别，得到尾实体类别；/nS6、对步骤S4中经缩放的头实体张量和尾实体张量分别进行加权处理；/nS7、用步骤S5中得到的头实体类别对步骤S6中经加权的头实体张量进行缩放处理，用步骤S5中得到的尾实体类别对步骤S6中经加权的尾实体张量进行缩放处理；/nS8、对步骤S7中经缩放的头实体张量和尾实体张量进行处理，得到最终的关系张量。/n

【技术特征摘要】
1.一种基于二维时序网络的端到端文本实体关系识别方法，其特征在于：所述方法包括：
S1、获取文本语句，对文本语句进行处理后嵌入embedding层，并对嵌入结果进行编码处理，得到语句的向量表示；
S2、对步骤S1中得到的向量表示进行处理，得到头实体张量和尾实体张量；
S3、对步骤S1中得到的向量表示进行识别处理，得到文本语句提及的关系类别；
S4、用步骤S3中得到的关系类别对步骤S2中得到的头实体张量和尾实体张量进行缩放处理；
S5、从步骤S4中经缩放的头实体张量中识别涉及到的实体类别，得到头实体类别；从步骤S4中经缩放的尾实体张量中识别涉及到的实体类别，得到尾实体类别；
S6、对步骤S4中经缩放的头实体张量和尾实体张量分别进行加权处理；
S7、用步骤S5中得到的头实体类别对步骤S6中经加权的头实体张量进行缩放处理，用步骤S5中得到的尾实体类别对步骤S6中经加权的尾实体张量进行缩放处理；
S8、对步骤S7中经缩放的头实体张量和尾实体张量进行处理，得到最终的关系张量。

2....

【专利技术属性】
技术研发人员：付勇，井友鼎，杜创胜，王旭峰，甘志芳，王顺智，
申请(专利权)人：河南合众伟奇云智科技有限公司，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人