当前位置: 首页 > 专利查询>贵州大学专利>正文

一种基于神经网络的中文关系抽取方法技术

技术编号:23787629 阅读:46 留言:0更新日期:2020-04-15 00:47
本发明专利技术公开了一种基于神经网络的中文关系抽取方法,该方法可以有效获取句子的结构信息和语义信息。在关系抽取任务中,单一的长短期记忆模型只能学习到某个特定维度的特征,而卷积神经网络可以利用多个卷积核学习不同维度特征。基于上述两个特点,本发明专利技术提出了一种多层双向长短期记忆‑注意力模型,该方法通过给长短期记忆模型设置不同大小的隐藏层,使其能自动从原始输入中抽取不同维度的、带依赖信息的抽象特征,并利用注意力机制捕获全局信息。实验显示,本发明专利技术中的方法相较多核卷积神经网络和单一的长短期记忆‑注意力模型能显著提高中文关系抽取效果,在ACE RDC 2005中文数据集上取得71.61%的F值,取得了很好的效果,这证明了该方法的有效性。

A method of Chinese relation extraction based on Neural Network

【技术实现步骤摘要】
一种基于神经网络的中文关系抽取方法
本专利技术涉及信息抽取领域,特别涉及到一种基于神经网络的中文关系抽取方法。属于自然语言处理和机器学习

技术介绍
随着人工智能的发展和信息抽取领域的技术爆炸,实体关系抽取作为信息抽取领域的重要研究课题受到越来越多学者的关注。其主要目的是抽取句子中已标记实体对之间的语义关系,即在实体识别的基础上确定无结构文本中实体对间的关系类别,并形成结构化的数据以便存储和取用。实体关系抽取的结果可用于构建知识图谱或本体知识库,还能为自动问答系统的构建提供数据支持。除此以外,实体关系抽取在语义网络标注、篇章理解、机器翻译方面具有重要的研究意义。早期的关系抽取主要是基于语法规则,通过分析句中的语法结构,将其作为关系发生的依据。尽管该方法取得不错的成绩,但是由于其严谨的规则导致召回率很难提升,且需要专业的语法知识和文学基础,适用性不高。随着技术的不断发展,关系抽取的方法分为有监督、半监督、无监督三种。基于本专利技术所涉及的内容,将重点研究有监督的关系抽取方法。有监督的关系抽取大都可看作是分类问题,概括起来主要有两种本文档来自技高网...

【技术保护点】
1.基于神经网络的中文关系抽取方法,其特征在于包括以下步骤:/n步骤1:构建BiLSTMA单元,抽取句子深层语义信息和全局依赖信息;/n步骤2:构建Multi-BiLSTMA模型,获取不同粒度的、带依赖关系的语义信息;/n步骤3:使用真实数据验证方法的有效性。/n

【技术特征摘要】
1.基于神经网络的中文关系抽取方法,其特征在于包括以下步骤:
步骤1:构建BiLSTMA单元,抽取句子深层语义信息和全局依赖信息;
步骤2:构建Multi-BiLSTMA模型,获取不同粒度的、带依赖关系的语义信息;
步骤3:使用真实数据验证方法的有效性。


2.根据权利要求1所述的方法,其特征在于,所述步骤1充分利用双向长短期记忆模型在处理长期依赖问题方面的优势和注意力机制能捕获到全局依赖信息的特点,构建...

【专利技术属性】
技术研发人员:王凯秦永彬李婷陈艳平
申请(专利权)人:贵州大学
类型:发明
国别省市:贵州;52

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1