槽填充模型训练方法和自然语言理解模型技术

技术编号：26259803 阅读：29 留言：0更新日期：2020-11-06 17:54

本发明专利技术公开一种槽填充模型训练方法，包括：对所述槽填充模型进行多轮次训练，每轮次训练包括以下步骤：从预设训练集中选择一个领域作为目标训练领域；为所述目标训练领域中的多个标签分别配置多个标注样本，以构成支撑集；从所述目标训练领域的其它标注样本中选择多个标注样本构成元测试数据，用于当前轮次训练的测试；将训练目标设置为最大化所述元测试数据的真实标注预测概率。本发明专利技术通过对槽填充模型进行多轮次训练，并且每轮次训练中都从预设训练集中的选择一个领域作为目标训练领域，同时在目标训练领域下配置支撑集和元测试数据进行训练，实现了采用少样本即可实现对槽填充模型的训练。

全部详细技术资料下载

【技术实现步骤摘要】
槽填充模型训练方法和自然语言理解模型
本专利技术涉及人工智能
，尤其涉及一种槽填充模型训练方法和自然语言理解模型。
技术介绍
槽填充任务(slottagging)是自然语言理解(NaturalLanguageUnderstanding,NLU)模块中一个典型的序列标注任务。当迁移至新的领域时往往面临数据稀缺的问题。为此，研究人员提出了针对少样本学习(few-shotlearning)的槽填充任务，目前主流趋势是采用元学习(meta-learning)中基于度量(metric-based)的方法。具体而言，这些方法从现有领域的训练数据中学习一个领域无关的编码器，用来为问句中每个单词编码，同时为不同任务的输出标签类别学习一个类别的表示(labelembedding)，通过某种距离度量函数，依次为每一个单词赋予最相近的标签。根据句子或类别编码方式的不同，常见的模型包括MatchingNetwork,PrototypicalNetwork,TapNet以及L-TapNet+CDT。专利技术人在实现本专利技术的过程中发现，以上常见的模型把关注的重点都放在了学习有效的编码器上，即如何学习待查询对象以及输出类别的特征表示，忽略了距离度量函数对于分类效果的影响。一个有效的距离度量函数能够极大地缓解特征学习的压力，而不合适的度量方法很有可能导致大量无效的特征学习。
技术实现思路
本专利技术实施例提供一种槽填充模型训练方法和自然语言理解模型，用于至少解决上述技术问题之一。第一方面，本专利技术实施例提供一种槽填充...

【技术保护点】
1.一种槽填充模型训练方法，包括：对所述槽填充模型进行多轮次训练，每轮次训练包括以下步骤：/n从预设训练集中选择一个领域作为目标训练领域；/n为所述目标训练领域中的多个标签分别配置多个标注样本，以构成支撑集；/n从所述目标训练领域的其它标注样本中选择多个标注样本构成元测试数据，用于当前轮次训练的测试；/n将训练目标设置为最大化所述元测试数据的真实标注预测概率。/n

【技术特征摘要】
1.一种槽填充模型训练方法，包括：对所述槽填充模型进行多轮次训练，每轮次训练包括以下步骤：
从预设训练集中选择一个领域作为目标训练领域；
为所述目标训练领域中的多个标签分别配置多个标注样本，以构成支撑集；
从所述目标训练领域的其它标注样本中选择多个标注样本构成元测试数据，用于当前轮次训练的测试；
将训练目标设置为最大化所述元测试数据的真实标注预测概率。

2.根据权利要求1所述的方法，其中，
所述预设训练集包含一系列标注样本对：其中，x＝(x1,x2,…,x|x|)表示输入句子序列，y＝(y1,y2,…,y|x|)表示输出序列标注，所述预设训练集中包含M个领域{D1,D2,…,DM}，每个领域配置有一套标签集合。

3.根据权利要求2所述的方法，其中，所述将训练目标设置为最大化所述元测试数据的真实标注预测概率通过以下公式实现：

其中，θ表示所述槽填充模型的参数，所述目标训练领域表示为Dt，所述支撑集为(x，y)对来自目标训练领域。

其中，fT(yi-1，yi)是第i步的转移分数，fE(yi，x，S)是第i步的发射分数；

SIM为单词-标签相似性函数，E表示上下文词嵌入函数，c...

【专利技术属性】
技术研发人员：俞凯，曹瑞升，朱苏，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人