一种基于GRU-CRF的命名实体识别方法技术

技术编号：18783596 阅读：33 留言：0更新日期：2018-08-29 06:53

本发明专利技术公开了一种基于GRU‑CRF的命名实体识别方法，属于自然语言处理领域。为了进一步提高命名实体识别的识别效果，本发明专利技术将GRU网络与CRF相结合，利用GRU网络提取句子特征，再结合CRF进行最后的实体标注来完成命名实体识别。GRU具有参数少，训练速度快等特点，减少了对大规模数据进行训练时所用的时间，CRF对一个位置进行标注的过程中可以利用到已经标注的信息，具有很好的实体标注效果。本发明专利技术将GRU网络应用于命名实体识别领域，在达到标注效果的基础上减少了网络内部的参数，提高了训练效率，具有很好的应用前景，可以广泛应用于各领域的实体识别场合。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GRU-CRF的命名实体识别方法
本专利技术涉及自然语言处理，尤其涉及一种基于GRU-CRF的命名实体识别方法。
技术介绍
随着互联网技术的快速发展，人类已经习惯从网络上获取大量知识，因此,命名实体识别方法的研究作为提高人们从网络获取和发现新知识的方法,得到了广泛的关注。命名实体识别是自然语言处理领域中的一项基本任务，也是是自然语言处理领域中的研究热点，从早期基于词典和规则的方法到传统机器学习的方法，再到近年来基于深度学习的方法，识别效果不断在提高。条件随机场(ConditionalRandomField，CRF)是近几年自然语言处理领域常用于命名实体识别的算法，选用具有人工定义的一些特征函数作为特征模板来进行命名实体识别研究，对于句子中的给定位置来说，不同的特征模板之间可以进行组合来形成一个新的特征模板。利用特征模板进行句子标注，但CRF对于命名实体识别具有局限性，整体效果不是很理想。循环神经网络(RecurrentNeuralNetworks，RNN)已经在众多自然语言处理中取得了广泛应用，但RNN在训练中很容易发生梯度消失问题，这导致训练时梯度不能在较长序列中一直传递下去，使RNN无法捕捉到长距离的影响。长短期记忆网络(LongShort-TermMemory，LSTM)解决了长距离信息丢失的影响，具有很好的效果，但由于LSTM结构相对复杂，导致需要大量的学习时间，因此，目前急需一种既可以解决梯度消失问题，又有较短学习时间的神经网络模型，2014年由KyunghyunCho等学者提出了门限递归网络循环神经网络(GatedRecurrentUn...

【技术保护点】
1.一种基于GRU‑CRF的命名实体识别方法，其特征在于，包括以下步骤：步骤(1)：将语料分成训练集和测试集；步骤(2)：对训练集进行预处理；步骤(3)：将训练集及测试集句子中的每个字用one‑hot向量表示；步骤(4)：将由训练集生成的字向量输入到GRU网络中进行特征提取；步骤(5)：结合CRF进行序列标注；步骤(6)：模型训练；步骤(7)：模型测试。

【技术特征摘要】
1.一种基于GRU-CRF的命名实体识别方法，其特征在于，包括以下步骤：步骤(1)：将语料分成训练集和测试集；步骤(2)：对训练集进行预处理；步骤(3)：将训练集及测试集句子中的每个字用one-hot向量表示；步骤(4)：将由训练集生成的字向量输入到GRU网络中进行特征提取；步骤(5)：结合CRF进行序列标注；步骤(6)：模型训练；步骤(7)：模型测试。2.根据权利要求1所述的一种基于GRU-CRF的命名实体识别方法，其特征在于，所述对语料进行预处理过程中，先使用分词软件对训练集进行分词，然后对分词后的每一个字进行BIO标记，最后利用标记后的训练集对word2vec进行训练。3.根据权利要求1所述的一种基于GRU-CRF的命名实体识别方法，其特征在于，所述GRU网络进行特征提取中所含计算如下：GRU的更新门公式为：zt＝σ(Uzxt+Wzst-1)其中，zt为GRU的更新门输出的特征向量，σ为sigmoid函数，Uz和Wz为训练参数，xt为t时刻的字向量，st-1为xt-1对应的GRU输出的特征向量，st为xt对应的GRU输出的特征向量，GRU的重置门公式为：rt＝σ(Urxt+Wrst-1)其中，rt为GRU的重置门输出的特征向量，Ur和Wr为训练参数，隐藏状态方程为：ht...

【专利技术属性】
技术研发人员：谢金宝，李佰蔚，殷楠楠，谢桂英，王玉静，王滨生，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：黑龙江,23

全部详细技术资料下载我是这个专利的主人