一种确定文本标签的方法和系统技术方案

技术编号：24613495 阅读：44 留言：0更新日期：2020-06-24 01:08

本说明书的实施例公开了一种确定文本标签的方法和系统，所述方法包括：获取文本，所述文本对应至少一个候选标签；基于文本和至少一个候选标签中的一个组成文本标签对；将文本标签对输入判断模型，所述判断模型包含至少一个交互模型，判断模型基于交互模型输出的文本标签对中候选标签的交互编码，确定候选标签是否为文本的真实标签；其中，所述交互模型包含第一编码模型，所述第一编码模型基于第一多头注意力机制，得到候选标签的交互编码；其中：文本的编码作为第一多头注意力机制中计算K和V的输入，候选标签的编码作为第一多头注意力机制中计算Q的输入。

A method and system for determining text label

全部详细技术资料下载

【技术实现步骤摘要】
一种确定文本标签的方法和系统
本申请涉及自然语言处理领域，特别涉及一种确定文本标签的方法和系统。
技术介绍
文本标签抽取是自然语言处理（NLP，NaturalLanguageProcessing）领域的常见任务之一。文本标签抽取具有很高的实用价值，例如，从博客或者新闻中抽取语义标签，可以辅助人工管理和理解文本，又例如，可以给知识文档添加标签，建立多维度知识分类体系等。因此，希望提供一种能够准确确定文本标签的方法和系统。
技术实现思路
本说明书一个方面提供一种确定文本标签的方法，所述方法包括：获取文本，所述文本对应至少一个候选标签；基于文本和至少一个候选标签中的一个组成文本标签对；将文本标签对输入判断模型，所述判断模型包含至少一个交互模型，判断模型基于所述交互模型输出的文本标签对中候选标签的交互编码，确定候选标签是否为文本的真实标签；其中，所述交互模型包含第一编码模型，第一编码模型基于第一多头注意力机制，得到候选标签的交互编码；其中：文本的编码作为第一多头注意力机制中计算K和V的输入，候选标签的编码作为第一多头注意力机制中计算Q的输入。本说明书另一个方面提供一种确定文本标签的系统，所述系统包括：文本获取模块，用于获取文本，所述文本对应至少一个候选标签；文本标签对生成模块，用于基于所述文本和所述至少一个候选标签中的一个组成文本标签对；判断模块，用于将所述文本标签对输入判断模型，所述判断模型包含至少一个交互模型，所述判断模型基于所述交互模型输出的所述文本标签对中候选标签的交互编码，确定所...

【技术保护点】
1.一种确定文本标签的方法，包括：/n获取文本，所述文本对应至少一个候选标签；/n基于所述文本和所述至少一个候选标签中的一个组成文本标签对；/n将所述文本标签对输入判断模型，所述判断模型包含至少一个交互模型，所述判断模型基于所述交互模型输出的所述文本标签对中候选标签的交互编码，确定所述候选标签是否为所述文本的真实标签；/n其中，所述交互模型包含第一编码模型，所述第一编码模型基于第一多头注意力机制，得到所述候选标签的交互编码；其中：所述文本的编码作为所述第一多头注意力机制中计算K和V的输入，所述候选标签的编码作为所述第一多头注意力机制中计算Q的输入。/n

【技术特征摘要】
1.一种确定文本标签的方法，包括：
获取文本，所述文本对应至少一个候选标签；
基于所述文本和所述至少一个候选标签中的一个组成文本标签对；
将所述文本标签对输入判断模型，所述判断模型包含至少一个交互模型，所述判断模型基于所述交互模型输出的所述文本标签对中候选标签的交互编码，确定所述候选标签是否为所述文本的真实标签；
其中，所述交互模型包含第一编码模型，所述第一编码模型基于第一多头注意力机制，得到所述候选标签的交互编码；其中：所述文本的编码作为所述第一多头注意力机制中计算K和V的输入，所述候选标签的编码作为所述第一多头注意力机制中计算Q的输入。

2.如权利要求1所述的方法，所述交互模型还包括第二编码模型和第三编码模型；
所述第二编码模型对所述文本进行编码，得到所述文本的编码；
所述第三编码模型对所述候选标签进行编码，得到所述候选标签的编码。

3.如权利要求2所述的方法，所述第二编码模型基于第二多头注意力机制对所述文本进行编码，所述第三编码模型基于第三多头注意力机制对所述候选标签进行编码。

4.如权利要求2所述的方法，所述方法还包括：
当所述交互模型为N个时，第t-1个交互模型中第二编码模型的输出为第t个交互模型中第二编码模型的输入；第t-1个交互模型中第一编码模型的输出为第t个交互模型中第三编码模型的输入；
其中，，N为大于1的整数。

5.如权利要求1所述的方法，所述判断模型还包括聚合模型和分类模型，所述分类模型基于所述聚合模型输出的所述文本标签对中候选标签的特征向量，确定所述候选标签是否为所述文本的真实标签；
其中，所述聚合模型对所述候选标签中每个字对应的交互编码进行处理，得到所述候选标签的特征向量；所述候选标签中每个字对应的交互编码来源于所述候选标签的交互编码。

6.如权利要求5所述的方法，所述聚合模型对所述候选标签中每个字对应的交互编码进行处理，得到所述候选标签的特征向量，包括：
所述聚合模型基于第四多头注意力机制确定所述候选标签的特征向量，其中，以所述候选标签的交互编码作为所述第四多头注意力机制计算K和V的输入，以所述第四多头注意力机制的权重参数作为所述第四多头注意力机制计算Q的输入。

7.如权利要求2所述的方法，所述第一编码模型和所述第二模型还包括前馈神经网络。

8.如权利要求2所述的方法，所述第一编码模型、第二编码模型和第三模型还包括残差网络。

9.一种确定文本标签的系统，包括：
文本获取模块，用于获取文本，所述文本对应至少一个候选标签；
文本标签对生成模块...

【专利技术属性】
技术研发人员：梁忠平，温祖杰，张家兴，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人