一种多意图口语理解方法、电子设备和存储介质技术

技术编号：26971305 阅读：23 留言：0更新日期：2021-01-06 00:02

本发明专利技术公开了一种多意图口语理解方法、电子设备和存储介质，本发明专利技术对多意图信息进行细化拆分，进行层级化解码，来预测每个意图对应的槽位标签；并且使用注意力机制建模各层解码输出之间的关系，即根据前一层解码序列的全局信息指导当前层解码，一定程度上也缓解了解码t时刻不具备t+1等未来信息的情况。

全部详细技术资料下载

【技术实现步骤摘要】
一种多意图口语理解方法、电子设备和存储介质
本专利技术涉及人机对话系统
，具体涉及一种多意图口语理解方法、电子设备和存储介质。
技术介绍
口语理解主要包括两个子任务：意图识别(IntentDetection)和槽位填充(SlotFilling)。意图识别和槽位填充两个任务不是相互独立的，槽位填充高度依赖于意图识别的结果，同时槽位填充也可以促进意图的识别。现有技术将两个任务联合建模来充分利用两个任务共有的知识信息，通常采用多任务(Multi-task)框架，两个子任务共享编码层，然后将两部分的损失函数相加来建模。现有的使用多任务框架，采用共享编码层、损失函数相加是一种隐式联合建模的方法，该方法没有显式地建模意图识别和槽位填充两个子任务之间的相互作用关系；虽然目前也有研究关注如何有效利用多意图信息来引导槽位预测，但是很多方法只是把意图的上下文向量当做多意图信息，简单粗略的模拟意图和槽之间的关系，而这是远远不足够的，所以本专利技术提出层级解码的方式来解决该问题。
技术实现思路
为了解决上述问题，本专利技术对多意图信息进行细化拆分，进行层级化解码，来预测每个意图对应的槽位标签；并且使用注意力机制建模各层解码输出之间的关系，即根据前一层解码序列的全局信息指导当前层解码，一定程度上也缓解了解码t时刻不具备t+1等未来信息的情况。根据本专利技术实施例的一个方面，提供一种多意图口语理解方法，包括，S100基于输入序列得到预训练语言模型BERT的语义向量序列，以所述输入序列的第一个标记为分类标...

【技术保护点】
1.一种多意图口语理解方法，其特征在于，包括，/nS100基于输入序列得到预训练语言模型BERT的语义向量序列，以所述输入序列的第一个标记为分类标记；/nS200根据所述分类标记得到对应的最终隐藏状态，基于所述最终隐藏状态使用全连接神经网络和sigmoid函数进行多意图预测，得到多意图信息；/nS300根据所述多意图信息进行层级解码预测槽位标签；/nS400将各层级解码对应的负对数似然损失加和作为整体损失函数，进而训练模型，优化模型参数；/nS500在预测阶段使用阈值确定多意图识别结果，根据各层级解码序列的最后一层的解码输出槽填充结果，使用贪婪搜索进行采样得到槽位预测结果。/n

【技术特征摘要】
1.一种多意图口语理解方法，其特征在于，包括，
S100基于输入序列得到预训练语言模型BERT的语义向量序列，以所述输入序列的第一个标记为分类标记；
S200根据所述分类标记得到对应的最终隐藏状态，基于所述最终隐藏状态使用全连接神经网络和sigmoid函数进行多意图预测，得到多意图信息；
S300根据所述多意图信息进行层级解码预测槽位标签；
S400将各层级解码对应的负对数似然损失加和作为整体损失函数，进而训练模型，优化模型参数；
S500在预测阶段使用阈值确定多意图识别结果，根据各层级解码序列的最后一层的解码输出槽填充结果，使用贪婪搜索进行采样得到槽位预测结果。

2.如权利要求1所述的多意图口语理解方法，其特征在于，
所述层级解码使用表示第i层解码得到的槽位标签序列，其中，T表示解码序列的长度；
第i层解码器对应的隐藏状态为

3.如权利要求2所述的多意图口语理解方法，其特征在于，
所述解码器为单向LSTM，表示为fi，且每一层的所述解码器参数不共享。

4.如权利要求2所述的多意图口语理解方法，其特征在于，
所述第i层解码实施为基于所述第i层的某一步意图标签嵌入向量和所述某一步的上一步解码得到的槽位标签嵌入向量得到所述某一步的解码器对应的隐藏状态，并基于所述某一步的解码器对应的隐藏状态解码得到的所述某一步的槽位标签，以将标签映射到高维嵌入空间显式地对分类类别进行了区分和语义表示。

5.如权利要求2所述的多意图口语理解方法，其特征在于，
S310第一层解码的方法为：

...

【专利技术属性】
技术研发人员：刘广灿，
申请(专利权)人：云知声智能科技股份有限公司，厦门云知芯智能科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人