一种基于深度学习的信息技术数据实体属性抽取方法技术

技术编号:26304097 阅读:116 留言:0更新日期:2020-11-10 19:59
本发明专利技术公开了一种基于深度学习的信息技术数据实体属性抽取方法,包括插入、编码、处理和判定四个步骤,将文本信息里的字或者词变成一个稠密的向量,便于取机器的识别,并创建一个为待变成稠密向量的词与实体之间的位置;通过算法对文本信息里的多个实体进行头实体的辨别,并通过多轮问答的方式对对应的头实体进行提问,得到对应的实体与头实体之间的关系,并通过制表的方式将头实体与实体之间的关系实现一一对应,便于机器根据算法进行文本信息内多个实体之间层级关系的区分,不会因两个实体之间的距离大小受到限制,通过表格使各个实体之间的关系更加的明显,防止出现关系错杂的情况,导致机器对文本信息的识别准确率下降。

【技术实现步骤摘要】
一种基于深度学习的信息技术数据实体属性抽取方法
本专利技术涉及信息抽取
,具体涉及一种基于深度学习的信息技术数据实体属性抽取方法。
技术介绍
信息抽取是把文本里包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始文本,输出的是固定格式的信息点。信息点从各种各样的文档中被抽取出来,然后以统一的形式集成在一起。这就是信息抽取的主要任务。信息以统一的形式集成在一起的好处是方便检查和比较。信息抽取技术并不试图全面理解整篇文档,只是对文档中包含相关信息的部分进行分析。至于哪些信息是相关的,那将由系统设计时定下的领域范围而定。现有技术存在以下不足:1、现有的信息抽取传统技术对层级关系的处理较困难,导致工作人员难以根据文本信息里的多个实体之间进行建模,使文本信息里的多个实体之间的层级关系难以被机器区分。2、现有的信息抽取传统技术在对一段文本信息进行处理时,文本信息里的两个实体之间的距离较远,且两个实体之间相互存在关系,使机器在进行信息抽取的过程中易因关系的错杂,导致识别准确率下降的情况。在所本文档来自技高网...

【技术保护点】
1.一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,包括以下具体步骤:/n一、插入——将字或者词变成一个稠密的向量,一般认为待变成稠密向量的词与实体之间的位置是一个相对位置;/n二、编码——对于关系识别来说,即包含卷积神经网络相关的,也包含运行相关的,把上下文的信息考虑进来。举例说明,一个脉冲耦合神经网络可通过两个实体把句子分为多个部分,每个部分分别做卷积神经网络的最大值池化,再经过Softmax分类器进行分类;/n三、处理——处理器可以处理分辨出两个实体是由于哪个词分辨出是顾佣的关系;/n四、判定——对定长的向量进行判定分类,主要是把两部分的一些模型的参数在底层被共享起来。/n

【技术特征摘要】
1.一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,包括以下具体步骤:
一、插入——将字或者词变成一个稠密的向量,一般认为待变成稠密向量的词与实体之间的位置是一个相对位置;
二、编码——对于关系识别来说,即包含卷积神经网络相关的,也包含运行相关的,把上下文的信息考虑进来。举例说明,一个脉冲耦合神经网络可通过两个实体把句子分为多个部分,每个部分分别做卷积神经网络的最大值池化,再经过Softmax分类器进行分类;
三、处理——处理器可以处理分辨出两个实体是由于哪个词分辨出是顾佣的关系;
四、判定——对定长的向量进行判定分类,主要是把两部分的一些模型的参数在底层被共享起来。


2.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,将文本信息里的字或者词变成一个稠密的向量,便于取机器的识别。


3.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,创建一个为待变成稠密向量的词与实体之间的位置。


4.根据权利要求1所述的一种基于深度学习的信息技术数据实体属性抽取方法,其特征在于,在获取对应...

【专利技术属性】
技术研发人员:郭绍翠杨旭宋正强孙维夫
申请(专利权)人:烟台职业学院
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1