基于任务型对话系统的语义理解方法、装置、设备及介质制造方法及图纸

技术编号：28212974 阅读：15 留言：0更新日期：2021-04-24 14:52

本发明专利技术公开了一种基于任务型对话系统的语义理解方法、装置、设备及介质；在本方案中，提取的特征向量包括稀疏矩阵特征向量和稠密矩阵特征向量，通过该方式，可以让特征向量保留更多的语义信息、上下文和句子结构信息，提高语义理解的准确性；并且，本方案通过联合意图分类及实体分类的语义理解模块对特征向量进行处理，相比于单一任务具有更高的识别效率及准确率。及准确率。及准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于任务型对话系统的语义理解方法、装置、设备及介质

[0001]本专利技术涉及对话系统和自然语言理解领域，更具体地说，涉及一种基于任务型对话系统的语义理解方法、装置、设备及介质。

技术介绍

[0002]自然语言处理是人工智能的一个子领域，是指机器能够理解和解释人类语言的能力，应用场景非常广泛，例如情感分析，自动文摘，对话系统等。对话系统主要分为任务型，问答型和闲聊型三大类，其中任务型对话系统需要较强的领域知识，实现模块主要由语音识别(Automatic Speech Recognition，ASR)、语义理解(Natural Language Understanding，NLU)、对话管理(Dialog Management，DM)、自然语言生成(Natural Language Generation，NLG)和语音合成(Text To Speech，TIS)这五部分组成。
[0003]目前，对话系统的难点主要在于语义理解和对话管理，而语义理解模块是对话管理正常执行的前提和保障，目标是将语音识别后的文本转化为结构化的语义表示，主要包括意图分类和实体识别。当前主流的实现方法一般将两者当作独立的任务进行处理，即通过不同的模型分别进行识别。意图分类属于文本分类问题，目前主要方法有朴素贝叶斯，支持向量机(Support Vector Machine，SVN)等基于传统机器学习模型的方法，以及卷积神经网络(Convolutional Neural Networks，CNN)，循环神经网络(Recurrent Neura...

【技术保护点】

【技术特征摘要】
1.一种基于任务型对话系统的语义理解方法，其特征在于，包括：获取待处理的文本信息；确定所述文本信息中与每个字符对应的一维向量；将每个字符对应的一维向量输入特征提取模块，通过所述特征提取模块提取与所述文本信息对应的特征向量；所述特征向量包括稀疏矩阵特征向量和稠密矩阵特征向量；将所述特征向量输入语义理解模块，通过所述语义理解模块获得与所述文本信息对应的语义理解结果；其中，所述语义理解模块为联合意图分类及实体分类的语义理解模块。2.根据权利要求1所述的语义理解方法，其特征在于，所述将每个字符对应的一维向量输入特征提取模块，通过所述特征提取模块提取与所述文本信息对应的特征向量，包括：将每个字符对应的一维向量输入稀疏矩阵提取模块，获得与所述文本信息对应的稀疏矩阵特征向量；将每个字符对应的一维向量输入稠密矩阵提取模块，获得与所述文本信息对应的稠密矩阵特征向量；将所述稀疏矩阵特征向量与所述稠密矩阵特征向量拼接，获得与所述文本信息对应的特征向量。3.根据权利要求2所述的语义理解方法，其特征在于，所述将每个字符对应的一维向量输入稀疏矩阵提取模块，获得与所述文本信息对应的稀疏矩阵特征向量，包括：将每个字符对应的一维向量输入n
‑
gram语言模型，获取n
‑
gram特征；将所述n
‑
gram特征进行one
‑
hot编码获得与所述文本信息对应的稀疏矩阵特征向量。4.根据权利要求2所述的语义理解方法，其特征在于，所述将每个字符对应的一维向量输入稠密矩阵提取模块，获得与所述文本信息对应的稠密矩阵特征向量，包括：将每个字符对应的一维向量输入预训练模型，获得与所述文本信息对应的稠密矩阵特征向量。5.根据权利要求1所述的语义理解方法，其特征在于，所述语义理解模块的训练过程包括：确定训练数据；对所述训练数据进行意图标注和实体标注，得到意图标签和实体标...

【专利技术属性】
技术研发人员：王梦婷，李利娟，
申请(专利权)人：浙江诺诺网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人