【技术实现步骤摘要】
一种基于交替解码的口语理解方法、电子设备和存储介质
本专利技术涉及人机对话系统
,具体涉及一种基于交替解码的口语理解方法、电子设备和存储介质。
技术介绍
口语理解主要包括两个子任务:意图识别(IntentDetection)和槽位填充(SlotFilling)。意图识别和槽位填充两个任务不是相互独立的,槽位填充高度依赖于意图识别的结果,同时槽位填充也可以促进意图的识别。现有技术将两个任务联合建模来充分利用两个任务共有的知识信息,通常采用多任务(Multi-task)框架,两个子任务共享编码层,然后将两部分的损失函数相加来建模。现有的使用多任务框架,采用共享编码层、损失函数相加是一种隐式联合建模的方法,该方法没有显式地建模意图识别和槽位填充两个子任务之间的相互作用关系;也有研究提出Slot-Gated方法和SF-ID方法进行初步探索,但现有的模型还是不能充分利用槽与意图之间的共现关系,限制了它们的潜在性能。
技术实现思路
为了解决上述问题,本专利技术提出将词级别的意图识别和词级别的槽填充进行交替解码,并且使用句子级别的意图识别结果初始化整个解码状态,通过如此方式可以从全局和局部两个角度实现意图识别和槽位填充相互贡献,从而提升口语理解任务的效果。根据本专利技术实施例的一个方面,提供一种基于交替解码的口语理解方法,包括:S100基于输入序列得到预训练语言模型BERT的语义向量序列,以所述输入序列的第一个标记为分类标记;S200根据所述分类标记得到对应的最终隐藏状态,基于所述 ...
【技术保护点】
1.一种基于交替解码的口语理解方法,其特征在于,包括:/nS100基于输入序列得到预训练语言模型BERT的语义向量序列,以所述输入序列的第一个标记为分类标记;/nS200根据所述分类标记得到对应的最终隐藏状态,基于所述最终隐藏状态使用全连接神经网络和Softmax函数进行句子级别意图识别,得到句子级别全局意图信息;/nS300基于所述语义向量序列和所述句子级别全局意图信息进行词级别意图识别和槽位填充交替解码;/nS400基于所述交替解码的结果获取意图识别和槽位填充的结果。/n
【技术特征摘要】
1.一种基于交替解码的口语理解方法,其特征在于,包括:
S100基于输入序列得到预训练语言模型BERT的语义向量序列,以所述输入序列的第一个标记为分类标记;
S200根据所述分类标记得到对应的最终隐藏状态,基于所述最终隐藏状态使用全连接神经网络和Softmax函数进行句子级别意图识别,得到句子级别全局意图信息;
S300基于所述语义向量序列和所述句子级别全局意图信息进行词级别意图识别和槽位填充交替解码;
S400基于所述交替解码的结果获取意图识别和槽位填充的结果。
2.如权利要求1所述的基于交替解码的口语理解方法,其特征在于,所述交替解码包括:
基于所述语义向量序列和所述句子级别全局意图信息得到对应的解码器隐藏状态,
对所述解码器隐藏状态解码得到输出序列,所述输出序列长度为2n,基于所述输出序列得到词级别意图识别序列和词级别槽位填充序列,其中,所述解码器为单向的LSTM。
3.如权利要求2所述的基于交替解码的口语理解方法,其特征在于,
所述解码实施为将意图标签和槽标签映射到高维嵌入空间,显式地对分类类别进行区分和语义表示,以促进对分类标签的理解。
4.如权利要求2所述的基于交替解码的口语理解方法,其特征在于,还包括:
S310当解码到第i步,且i为奇数时,在预测第([i/2]+1)个词的意图时,基于所述语义向量序列、解析前一个词的意图和前一个词对应的槽位信息,其中,i∈[0,2n]。
5.如权利要求4所述的基于交替解码的口语理解方法,其特征在于,解码方法如下:
y[i/2]+1=argmax(softmax(Wyi)),
其中,Wy和Wo都是可训练参数,符号[]表示取整操作,表示意图标签y[i/2]的嵌入向量,表示槽标签o[i/2]的嵌入表示,
所述语义向量序列表示为e=(e[cls],e1,e2,e3,e4,...,en),
所述输出序列表示为y=(y1,o1,y2,o2,y3,o3,...,yn,on),
所述词级别意图识别序列为yi=(y1,y2,y3,...,y...
【专利技术属性】
技术研发人员:刘广灿,
申请(专利权)人:云知声智能科技股份有限公司,厦门云知芯智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。