槽识别模型训练方法及装置和槽填充方法及装置制造方法及图纸

技术编号：31023526 阅读：20 留言：0更新日期：2021-11-30 03:19

本申请公开了一种槽识别模型训练方法及装置和槽填充方法及装置，其中，槽识别模型训练方法包括：将训练样本的文本数据输入至预先构建的槽识别模型；槽识别模型对所述文本数据进行编码，得到所述文本数据中每个词的词向量；基于词向量进行粗标签分类，得到相应词的粗标签得分向量；其中，粗标签预先基于槽值的词性类别对槽进行分类得到；基于词向量以及词向量对应的粗标签得分向量，生成相应词的高级细标签得分向量；将高级细标签得分向量，输入至模型的条件随机场层处理，得到相应的细标签分类损失值；基于细标签分类损失值，调整模型的网络参数。采用本申请，能够实现零样本跨领域槽填充，且可以提高填充的准确性。且可以提高填充的准确性。且可以提高填充的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
槽识别模型训练方法及装置和槽填充方法及装置

[0001]本专利技术涉及人工智能技术，特别是涉及一种槽识别模型训练方法及装置和槽填充方法及装置。

技术介绍

[0002]随着深度学习技术的进步，任务型人机对话方面也有了长足的发展。任务型对话的目的是在特定领域通过多轮对话，协助用户完成某些具体的任务。任务型对话有两种研究方式，一种是流水线型设计(pipeline)，包括自然语言理解(NLU)、对话管理、自然语言生成三个模块；另一种是端到端形式(end to end)，这种形式是将文本输入送入端到端的模型，直接得到文本输出。相对于端到端形式，流水线型设计是一种更成熟的框架。其中，自然语言理解模块中最关键的一步是将用户的语义信息转换成预先定义好的槽，该过程称为槽填充。
[0003]图1为一槽填充结果示意图。如图1所示，在订机票意图中，预先定义了三个槽：日期(date)、出发地(from)和目的地(to)，当用户发出订机票的请求后，需要进行槽填充，以识别出这三个槽所具有的槽值，即date：明天、from：上海、to：北京。由于每个槽值在句子中的长度不固定，对于槽值的第一个字(英文中为第一个词)，使用的槽标签为B标签，表示起始(begin)，对于槽值的其余部分，使用的槽标签为I标签，表示中间(Intermediate)，对于不属于槽值的部分，使用的槽标签为O标签，表示其他(Other)标签。
[0004]槽填充需要基于大量领域内的标注数据进行训练。然而，在实际应用中，由于应用的新领域层出不穷，对新领域内数据的标注，

【技术保护点】

【技术特征摘要】
1.一种槽识别模型训练方法，其特征在于，包括：将训练样本的文本数据输入至预先构建的槽识别模型；所述槽识别模型对所述文本数据进行编码，得到所述文本数据中每个词的词向量；基于所述词向量，进行粗标签分类，得到相应词的粗标签得分向量；其中，所述粗标签预先基于槽值的词性类别对槽进行分类得到；基于所述词向量以及词向量对应的所述粗标签得分向量，生成相应词的高级细标签得分向量；将所述高级细标签得分向量，输入至所述槽识别模型的条件随机场CRF层处理，得到相应的细标签分类损失值；基于所述细标签分类损失值，对所述槽识别模型的网络参数进行调整。2.根据权利要求1所述的方法，其特征在于，所述粗标签包括：人名、地名、数量词、方位词、个性化名词、常见词和/或其他类型，所述其他类型由不属于人名、地名、数量词、方位词、个性化名词和常见词的槽组成。3.根据权利要求1所述的方法，其特征在于，所述基于所述词向量以及词向量对应的所述粗标签得分向量，生成相应词的高级细标签得分向量包括：对于每个所述词向量，将该词向量与相应的所述粗标签得分向量拼接；将所述拼接的结果和每个槽的槽描述信息向量，输入至所述槽识别模型的相似度处理层处理，得到每个所述词的初级细标签得分向量；所述初级细标签得分向量由相应词与每个槽的相似度得分组成；基于所述粗标签得分向量、所述初级细标签得分向量以及粗标签与槽的映射关系，按照加权计算方式，确定每个所述词的高级细标签得分向量。4.根据权利要求3所述的方法，其特征在于，所述确定每个所述词的高级细标签得分向量包括：计算E
f
＝Z+λE
c
M，得到所述高级细标签得分向量；其中，E
f
为由所有词的所述高级细标签得分向量组成的矩阵；E
c
为由所有词的所述粗标签得分向量组成的矩阵；Z为由所有词的所述初级细标签得分向量组成的矩阵；M为基于所述映射关系生成的映射矩阵；λ为预设的权重系数。5.一种槽填...

【专利技术属性】
技术研发人员：沈皓，王小捷，袁彩霞，刘俊鹏，江会星，武威，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人