多领域多意图的口语语义理解模型的训练方法技术

技术编号:38709337 阅读:11 留言:0更新日期:2023-09-08 14:49
本发明专利技术实施例提供一种多领域多意图的口语语义理解模型的训练方法。该方法包括:将带有标注的本体项数据输入至口语语义理解模型;基于口语语义理解模型内的本体编码模块,对对话文本进行语义编码,得到初始本体特征以及初始向量;基于双向关系图注意力网络的图编码器,对初始本体特征以及初始向量进行图神经网络编码,得到语义编码以及结构编码;将语义编码以及结构编码输入至口语语义理解模型内的解码器,得到口语语义理解结果的概率分布。本发明专利技术实施例从多意图口语语义理解任务出发,将口语语义理解任务扩展到多领域设定和层次化的语义框架输出。构造了一个源于工业界真实场景的多意图数据集,并有效地解决了多领域多意图的口语语义理解任务。图的口语语义理解任务。图的口语语义理解任务。

【技术实现步骤摘要】
多领域多意图的口语语义理解模型的训练方法


[0001]本专利技术涉及智能语音领域,尤其涉及一种多领域多意图的口语语义理解模型的训练方法以及多领域多意图的口语语义理解模型。

技术介绍

[0002]现有的SLU(Spoken Language Understanding,口语语义理解)通常被解耦为意图识别(intent detection)和槽位填充(slot filling)两个子任务分别使用句子分类(sentence classification)和序列标注(sequence labeling)的经典模型进行联合多任务训练。然而这些SLU的研究通常集中在单意图设置上,即每个输入对话只包含一个用户意图。这种配置极大地限制了用户对话的表述形式和输出语义的能力。
[0003]为了能够与对用户的口语语义理解中识别到多意图,通常会使用以下方案:
[0004]1、意图组合枚举:对不同意图的组合进行枚举,并将每种组合后的意图作为一种单意图来处理;
[0005]2、输入子句划分:先对完整的用户输入进行子句拆分,假定每个子句至多包含一个意图,再分别对每个子句按照传统单意图任务进行解析;
[0006]3、多标签句子分类:将单意图情形下的多类别(multi

class)句子分类器(只选择一个类别),替换为多标签(multi

label)句子分类器,分别判断每一个意图标签是否存在于用户输入中。
[0007]在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:
[0008]对于意图组合枚举,由于单领域的局限性,需要枚举所有可能的意图组合,当单意图数量增加时,容易导致组合后的意图数目指数爆炸,且无法从意图的部分组合方式泛化到其他组合上,也缺少能够用于模型训练的多意图基准数据集;
[0009]对于输入子句划分,该假设过强,对句子划分可能存在不合理的前提假设,实际场景下,用户的随意话语很有可能无法进行完美的子句划分;
[0010]对于多标签句子分类,对多意图问题的多度简化,其模型输出的是扁平化的语义框架,无法判断某个槽值对属于哪一个意图,比如“帮我打开蓝牙并关闭空调”一句中,槽值对“操作=打开”和“对象=蓝牙”属于意图“媒体控制”,而槽值对“操作=关闭”和“对象=空调”属于意图“机身控制”。因此,该方案无法处理“槽位

意图”的从属关系。致使上述现有技术在多领域多意图口语语义理解中准确性相对较低。

技术实现思路

[0011]为了至少解决现有技术中多领域多意图口语语义理解准确性相对较低的问题。
[0012]第一方面,本专利技术实施例提供一种多领域多意图的口语语义理解模型的训练方法,包括:
[0013]将带有标注的本体项数据输入至口语语义理解模型,其中,所述带有标注的本体项数据包括:标注领域

意图

槽值对的结构化语义框架的对话文本;
[0014]基于所述口语语义理解模型内的本体编码模块,对所述对话文本进行语义编码,得到所述对话文本的初始本体特征以及所述对话文本中各单词的初始向量;
[0015]基于所述口语语义理解模型内的基于双向关系图注意力网络的图编码器,对所述初始本体特征以及所述初始向量进行图神经网络编码,得到所述对话文本的语义编码以及用于表示各单词间结构层次关系的结构编码;
[0016]将所述语义编码以及结构编码输入至所述口语语义理解模型内的解码器,得到口语语义理解结果的概率分布;
[0017]若所述口语语义理解结果的概率分布没有达到预设训练目标,则将所述概率分布作为所述解码器下一时间步的输入,对所述口语语义理解模型进行训练,直至训练至所述概率分布达到预设训练目标为止。
[0018]第二方面,本专利技术实施例提供一种多领域多意图的口语语义理解模型,包括:
[0019]本体编码模块,用于对输入的对话文本进行语义编码,得到所述对话文本的初始本体特征以及所述对话文本中各单词的初始向量;
[0020]基于双向关系图注意力网络的图编码器,用于对所述初始本体特征以及所述初始向量进行图神经网络编码,得到所述对话文本的语义编码以及用于表示各单词间结构层次关系的结构编码;
[0021]基于双向关系图注意力网络的指针

生成解码器,用于对所述语义编码以及结构编码进行解码,得到对所述对话文本预测的领域

意图

槽值对的口语语义理解结果。
[0022]第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的多领域多意图的口语语义理解模型的训练方法的步骤。
[0023]第四方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本专利技术任一实施例的多领域多意图的口语语义理解模型的训练方法的步骤。
[0024]本专利技术实施例的有益效果在于:本方法从多意图口语语义理解任务出发,将口语语义理解任务扩展到多领域设定和层次化的语义框架输出。不仅构造了一个源于工业界真实场景的多意图数据集(本体项数据),并提出了BiRGAT模型有效地解决了传统单意图设定下,序列标注+句子分类无法解决的问题,使其能够在多领域多意图的口语语义理解任务中得到相对较优的结果。
附图说明
[0025]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]图1是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法的流程图;
[0027]图2是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法
的MIVS数据集中的单意图、多意图和多领域示意图;
[0028]图3是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法的BiRGAT模型结构示意图;
[0029]图4是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法的单词之间的关系示意图;
[0030]图5是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法在MVIS和TOPv2数据集的测试结果示意图;
[0031]图6是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法的BiRGAT编码器消融研究示意图;
[0032]图7是本专利技术一实施例提供的一种多领域多意图的口语语义理解模型的训练方法在车载控制领域的意图训练结果示意图;
[0033]图8是本专利技术一实施例提供的一种多领域多意图的口语语义理解模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多领域多意图的口语语义理解模型的训练方法,包括:将带有标注的本体项数据输入至口语语义理解模型,其中,所述带有标注的本体项数据包括:标注领域

意图

槽值对的结构化语义框架的对话文本;基于所述口语语义理解模型内的本体编码模块,对所述对话文本进行语义编码,得到所述对话文本的初始本体特征以及所述对话文本中各单词的初始向量;基于所述口语语义理解模型内的基于双向关系图注意力网络的图编码器,对所述初始本体特征以及所述初始向量进行图神经网络编码,得到所述对话文本的语义编码以及用于表示各单词间结构层次关系的结构编码;将所述语义编码以及结构编码输入至所述口语语义理解模型内的解码器,得到口语语义理解结果的概率分布;若所述口语语义理解结果的概率分布没有达到预设训练目标,则将所述概率分布作为所述解码器下一时间步的输入,对所述口语语义理解模型进行训练,直至训练至所述概率分布达到预设训练目标为止。2.根据权利要求1所述的方法,其中,所述基于所述口语语义理解模型内的本体编码模块,对所述对话文本进行语义编码包括:通过所述对话文本中同一领域条件下的领域名称、所有意图名称以及所有槽位名称生成对话文本序列;将所述对话文本序列输入至自编码式预训练模型,得到带有领域上下文信息的词向量序列;将所述词向量序列输入至双向长短时记忆网络,输出所述对话文本的初始本体特征;将所述对话文本内的各单词输入至所述自编码式预训练模型或所述双向长短时记忆网络,得到各单词的初始向量。3.根据权利要求2所述的方法,其中,在所述通过所述对话文本中同一领域条件下的领域名称、所有意图名称以及所有槽位名称生成对话文本序列之前,所述方法还包括:为所述对话文本内的各单词插入对应的类别特征,用于避免模型训练的过度拟合排列偏差,其中,所述类别特征包括:领域、意图、槽。4.根据权利要求1所述的方法,其中,所述各单词间结构层次关系包括:单词结构的从属关系、单词顺序的前后关系。5.根据权利要求1所述的方法,其中...

【专利技术属性】
技术研发人员:俞凯曹瑞升朱苏蒋胜陈露张晗翀
申请(专利权)人:思必驰科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1