序列标注方法、系统和计算机设备技术方案

技术编号：24354621 阅读：25 留言：0更新日期：2020-06-03 02:17

本发明专利技术实施例提供了一种序列标注方法，所述方法包括：接收目标文本序列，并将所述目标文本序列转换为相应的句子向量、各个字的字向量和各个字的位置向量；将目标文本序列的句子向量、各个字的字向量和各个字的位置向量输入到训练后的BERT模型中，通过BERT模型输出与目标文本序列对应的第一标注序列；将第一标注序列输入到全连接层，通过全连接层输出第二标注序列；将第二标注序列作为条件随机场CRF模型的输入序列，以通过CRF模型输出标签序列Y＝(y

Sequence annotation method, system and computer equipment

全部详细技术资料下载

【技术实现步骤摘要】
序列标注方法、系统和计算机设备
本专利技术实施例涉及序列标注领域，尤其涉及一种序列标注方法、系统、计算机设备及计算机可读存储介质。
技术介绍
在所有的自然语言处理应用中，命名实体识别是最基本也是应用最广泛的一种。它是指识别文中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。命名实体识别这一应用是后续的其他应用如信息提取、问答系统、句法分析、机器翻译、面向semanticweb的元数据标注等应用领域的重要基础工具。通过对命名实体识别这一工具的应用，可以构建一种自然语言模型，这种语言模型可以像人类那样理解、分析并回答自然语言的结果。但是现有模型往往无法考虑长远的上下文信息，从而使得识别的准确率受到限制的技术问题。因此，如何解决现有模型无法考虑长远的上下文信息关系的问题，从而进一步提高序列标注的识别准确率，成为了当前要解决的技术问题之一。
技术实现思路
有鉴于此，有必要提供一种序列标注方法、系统、计算机设备及计算机可读存储介质，以解决现有模型无法考虑长远的上下文信息关系，从而使得序列标注的识...

【技术保护点】
1.一种序列标注方法，其特征在于，所述方法包括：/n接收目标文本序列，并将所述目标文本序列转换为相应的句子向量、各个字的字向量和各个字的位置向量；/n将所述目标文本序列的句子向量、各个字的字向量和各个字的位置向量输入到训练后的BERT模型中，通过所述BERT模型输出与所述目标文本序列对应的第一标注序列，其中，所述第一标注序列包括多个第一n维向量，每个第一n维向量对应所述目标文本序列中的一个字，所述第一n维向量表示对应字属于n个第一标签中各个第一标签的第一概率；/n将所述第一标注序列输入到全连接层，通过所述全连接层输出第二标注序列，其中，所述第二标注序列包括多个第二n维向量，每个第二n维向量对应...

【技术特征摘要】
1.一种序列标注方法，其特征在于，所述方法包括：
接收目标文本序列，并将所述目标文本序列转换为相应的句子向量、各个字的字向量和各个字的位置向量；
将所述目标文本序列的句子向量、各个字的字向量和各个字的位置向量输入到训练后的BERT模型中，通过所述BERT模型输出与所述目标文本序列对应的第一标注序列，其中，所述第一标注序列包括多个第一n维向量，每个第一n维向量对应所述目标文本序列中的一个字，所述第一n维向量表示对应字属于n个第一标签中各个第一标签的第一概率；
将所述第一标注序列输入到全连接层，通过所述全连接层输出第二标注序列，其中，所述第二标注序列包括多个第二n维向量，每个第二n维向量对应所述目标文本序列中的一个字，所述第二n维向量表示对应字的属于n个第二标签中各个第二标签的第二概率；
将所述第二标注序列作为条件随机场CRF模型的输入序列，以通过CRF模型输出标签序列Y＝(y1,y2,...,ym)；及
根据所述标签序列生成命名实体序列，并输出所述命名实体序列。

2.如权利要求1所述的序列标注方法，其特征在于，将所述目标文本序列转换为相应的句子向量、各个字的字向量和各个字的位置向量的步骤，包括：
将所述目标文本序列输入到嵌入层，通过所述嵌入层输出与所述目标文本序列对应的多个字向量，所述多个字向量中包括至少一个标点向量；
将所述多个字向量输入到分割层，根据所述至少一个标点向量对所述多个字向量进行分割，得到n个字向量集合，所述n个字向量集合对应n个分割码；
通过位置编码对每个分割码进行编码运算，确定每个分割码的位置信息编码，以得到所述目标文本序列中每个字的位置向量；及
根据所述目标文本序列中每个字的字向量以及所述每个字的位置向量，生成所述目标文本序列的句子向量。

3.如权利要求2所述的序列标注方法，其特征在于，所述通过所述BERT模型输出与所述目标文本序列对应的第一标注序列的步骤，包括：
通过所述BERT模型对所述目标文本序列的句子向量、各个字的字向量和各个字的位置向量进行特征提取，以得到所述目标文本序列中每个字的各个第一标签的第一概率；
根据所述目标文本序列中每个字的各个第一标签的第一概率，生成第一标注序列。

4.如权利要求3所述的序列标注方法，其特征在于，所述将所述第一标注序列输入到全连接层，通过所述全连接层输出第二标注序列的步骤，包括：
将所述第一标注序列输入到全连接层的神经网络结构中，进行额外特征提取，以得到所述目标文本序列中每个字的各个第二标签的第二概率，对于所述目标文本序列中第i个字的额外特征提取的运算公式为Bi＝wXi+b，其中，Xi是所述第一标注序列中第i个字的各个第一标签的第一概率，w与b是BERT模型学习参数；
根据所述目标文本序列中每个字的各个第二标签的第二概率，生成第二标注序列。

5.如权利要求1所述的序列标注方法，其特征在于，所述将所述第二将标注序列作为条件随机场CRF模型的输入序列，以通过CRF模型输出标签序列Y＝(y1,y2,......

【专利技术属性】
技术研发人员：金戈，徐亮，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人