多领域多意图的口语语义理解模型的训练方法技术

技术编号：38709337 阅读：11 留言：0更新日期：2023-09-08 14:49

本发明专利技术实施例提供一种多领域多意图的口语语义理解模型的训练方法。该方法包括：将带有标注的本体项数据输入至口语语义理解模型；基于口语语义理解模型内的本体编码模块，对对话文本进行语义编码，得到初始本体特征以及初始向量；基于双向关系图注意力网络的图编码器，对初始本体特征以及初始向量进行图神经网络编码，得到语义编码以及结构编码；将语义编码以及结构编码输入至口语语义理解模型内的解码器，得到口语语义理解结果的概率分布。本发明专利技术实施例从多意图口语语义理解任务出发，将口语语义理解任务扩展到多领域设定和层次化的语义框架输出。构造了一个源于工业界真实场景的多意图数据集，并有效地解决了多领域多意图的口语语义理解任务。图的口语语义理解任务。图的口语语义理解任务。

全部详细技术资料下载

【技术实现步骤摘要】
多领域多意图的口语语义理解模型的训练方法

[0001]本专利技术涉及智能语音领域，尤其涉及一种多领域多意图的口语语义理解模型的训练方法以及多领域多意图的口语语义理解模型。

技术介绍

[0002]现有的SLU(Spoken Language Understanding，口语语义理解)通常被解耦为意图识别(intent detection)和槽位填充(slot filling)两个子任务分别使用句子分类(sentence classification)和序列标注(sequence labeling)的经典模型进行联合多任务训练。然而这些SLU的研究通常集中在单意图设置上，即每个输入对话只包含一个用户意图。这种配置极大地限制了用户对话的表述形式和输出语义的能力。
[0003]为了能够与对用户的口语语义理解中识别到多意图，通常会使用以下方案：
[0004]1、意图组合枚举：对不同意图的组合进行枚举，并将每种组合后的意图作为一种单意图来处理；
[0005]2、输入子句划分：先对完整的用户输入进行子句拆分，假定每个子句至多包含一个意图，再分别对每个子句按照传统单意图任务进行解析；
[0006]3、多标签句子分类：将单意图情形下的多类别(multi
‑
class)句子分类器(只选择一个类别)，替换为多标签(multi
‑
label)句子分类器，分别判断每一个意图标签是否存在于用户输入中。
[0007]在实现本专利技术过程中，专利技术人发现相关技术中至少存在...

【技术保护点】

【技术特征摘要】
1.一种多领域多意图的口语语义理解模型的训练方法，包括：将带有标注的本体项数据输入至口语语义理解模型，其中，所述带有标注的本体项数据包括：标注领域
‑
意图
‑
槽值对的结构化语义框架的对话文本；基于所述口语语义理解模型内的本体编码模块，对所述对话文本进行语义编码，得到所述对话文本的初始本体特征以及所述对话文本中各单词的初始向量；基于所述口语语义理解模型内的基于双向关系图注意力网络的图编码器，对所述初始本体特征以及所述初始向量进行图神经网络编码，得到所述对话文本的语义编码以及用于表示各单词间结构层次关系的结构编码；将所述语义编码以及结构编码输入至所述口语语义理解模型内的解码器，得到口语语义理解结果的概率分布；若所述口语语义理解结果的概率分布没有达到预设训练目标，则将所述概率分布作为所述解码器下一时间步的输入，对所述口语语义理解模型进行训练，直至训练至所述概率分布达到预设训练目标为止。2.根据权利要求1所述的方法，其中，所述基于所述口语语义理解模型内的本体编码模块，对所述对话文本进行语义编码包括：通过所述对话文本中同一领域条件下的领域名称、所有意图名称以及所有槽位名称生成对话文本序列；将所述对话文本序列输入至自编码式预训练模型，得到带有领域上下文信息的词向量序列；将所述词向量序列输入至双向长短时记忆网络，输出所述对话文本的初始本体特征；将所述对话文本内的各单词输入至所述自编码式预训练模型或所述双向长短时记忆网络，得到各单词的初始向量。3.根据权利要求2所述的方法，其中，在所述通过所述对话文本中同一领域条件下的领域名称、所有意图名称以及所有槽位名称生成对话文本序列之前，所述方法还包括：为所述对话文本内的各单词插入对应的类别特征，用于避免模型训练的过度拟合排列偏差，其中，所述类别特征包括：领域、意图、槽。4.根据权利要求1所述的方法，其中，所述各单词间结构层次关系包括：单词结构的从属关系、单词顺序的前后关系。5.根据权利要求1所述的方法，其中...

【专利技术属性】
技术研发人员：俞凯，曹瑞升，朱苏，蒋胜，陈露，张晗翀，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人