当前位置: 首页 > 专利查询>新疆大学专利>正文

基于图卷积神经网络的中文旅游领域命名实体识别方法技术

技术编号:24457858 阅读:29 留言:0更新日期:2020-06-10 16:05
基于图卷积神经网络的中文旅游领域命名实体识别方法,图卷积神经网络包括输入层、嵌入层、图卷积层和层级结构,其中输入体包括命名实体和非实体;S1:以旅游领域文本的任意非实体为中心同时向两边扩展,直至遍历完整个句子中的单个字;S2:字符特征的提取;S3:提取字符特征;S4:输入和训练;S5:图卷积层优化;S6:旅游领域文本数据中全部的命名实体进行标注;在图卷积层中引入拉普拉斯正则化损失函数,以进行节点内部结构信息的挖掘和字符特征的提取;S7:获得命名实体和非实体之间的层级关系。本发明专利技术,利用图卷积神经网络构建字符特征提取方法,并对字符特征进行语义建模,以实现文本中命名实体的正确识别。

Named entity recognition of Chinese tourism based on graph convolution neural network

【技术实现步骤摘要】
基于图卷积神经网络的中文旅游领域命名实体识别方法
本专利技术涉及文旅游领域命名实体识别方法领域,尤其涉及基于图卷积神经网络的中文旅游领域命名实体识别方法。
技术介绍
命名实体识别是指从大量的非结构化或结构化文本中抽取出相应的人名、地名或组织机构等实体,并对其进行精确的分类识别。而传统的命名实体识别方法,严重依赖于语言学知识和特征工程,使其忽略了文本中实体所隐含的潜在信息,从而增加了文本中命名实体的识别难度。自然语言处理形态分析领域,随着人类生活水平的提高,出行旅游是我们的生活中并不缺少的一部分。人们对旅游领域的关注度越来越重视。目前为止。每天在互联网上出现海量的旅游信息,从海量的信息中抽取人们感兴趣内容是及时解决的问题之一。而且旅游领域命名实体识别是旅游信息抽取的重要的部分,所以本文中研究旅游领域命名实体识别。随着深度学习技术的不断成熟,大量的深度学习技术被应用到了命名实体抽取和识别中,并通过多层的神经网络结构以捕获文本中命名实体所隐含的潜在信息。如谷川等人利用双层条件随机场来获取底层条件随机场来识别出简单的实体,高层条件随机场本文档来自技高网...

【技术保护点】
1.基于图卷积神经网络的中文旅游领域命名实体识别方法,其特征在于,图卷积神经网络包括输入层、嵌入层、图卷积层和层级结构,其中输入体包括命名实体和非实体;/n图卷积层和层级结构中的每个节点代表旅游文本中的单个字;x

【技术特征摘要】
1.基于图卷积神经网络的中文旅游领域命名实体识别方法,其特征在于,图卷积神经网络包括输入层、嵌入层、图卷积层和层级结构,其中输入体包括命名实体和非实体;
图卷积层和层级结构中的每个节点代表旅游文本中的单个字;x1、x2、x3、x4、x5…xn,分别代表文本句子中的单个字;
图卷积层中的每个节点在提取命名实体的字符特征时,将自身所获得的特征信息经过非线性变化之后传输到下一个邻接节点,并依次传递到周围的多个节点中,具体的计算步骤如下:
S1:以旅游领域文本的任意非实体为中心同时向两边扩展,直至遍历完整个句子中的单个字;
S2:经过嵌入层将文本中的每个字逐个映射到低维的向量空间中,并输入图卷积神经网络的图卷积层中,以进行字符特征的提取;
S3:为提取文本中命名实体的字符特征,设图卷积层中的节点i有节点特征Ci,邻接矩阵为A,其图和节点矩阵的定义,如下公式A所示:
公式A:
公式A:中,v={v1,v2,v3…vn},代表图卷积层中图节点的集合;w={w1,w2,w3…wn},代表图节点边的权重集合;e={e1,e2,e3…en},代表节点与节点之间边的集合;n,m分别代表图节点数和节点特征数;
S4:文本在图卷积层中的输入和训练过程,如下公式B所示:
公式B:
公式B中,c,h,l分别代表输入特征、隐藏层和隐层层数;
S5:图卷积层的节点矩阵和邻接矩阵的优化过程,如下公式C所示:
公式C:
公式C中,σ与ω分别代表激活函数和上一层隐含层的权重;
S6:旅游领域文本数据中全部的命名实体进行标注,即,分类标签,仅可用于部分节点;在图卷积层中引入拉普拉斯正则化损失函数,对可用分类标签进行节点信息的传递,以进行节点内部结构信息的挖掘和字符特征的提取;其中,拉普拉斯正则化函数的计算过程,如下公式D所示:
公式D:
公式D中,δ0
表示部分分类标签的监督损失;f(*)函数代表图神经网络的可导函数;λ表示损失函数的加权因子;c代表图节点的特征向量矩阵;
S7:获得命名实体和非实体之间的层级关系。

【专利技术属性】
技术研发人员:西尔艾力·色提吾买尔江·买买提明吐尔根·依布拉音艾山·吾买尔买合木提·买买提娜迪热·艾来提阿拉提·阿扎提
申请(专利权)人:新疆大学
类型:发明
国别省市:新疆;65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1