一种多轮对话意图识别方法技术

技术编号：22295635 阅读：58 留言：0更新日期：2019-10-15 04:46

本发明专利技术公开了一种多轮对话意图识别方法，包括如下步骤：1)根据应用场景确定要识别的对话意图，并获取大量对话数据，人工找出对话数据中的对话块以及其对应的意图，进行语料标注；2)根据人工整理好的停用词表去除对话数据中的停用词；3)构建用于意图识别的句向量模型、BiLSTM‑CRF模型及StarSpace模型；4)由句向量模型、BiLSTM‑CRF模型和StarSpace模型实时获取对话数据，进行意图识别，输出最佳意图。本发明专利技术的有益效果是：意图识别高效，准确率高，泛化能力强，人工标注语料成本低。

An Intention Recognition Method for Multi-Round Dialogue

全部详细技术资料下载

【技术实现步骤摘要】
一种多轮对话意图识别方法
本专利技术涉及自然语言处理
，具体涉及一种多轮对话意图识别方法。
技术介绍
如今人类进入了人工智能时代，众多企业都在开发自己的客服机器人。这不仅方便用户24小时咨询问题，也减轻了企业雇佣客服人员的成本，然而目前多数客服机器人并没有非常智能，不能满足用户的实际需求，例如，目前，客服机器人对话意图识别方式类型主要有三种：第一种采用规则模板的方法。即通过收集大量用户语料，人工整理出用户咨询问题模板，然后机器人根据模板匹配结果回答用户问题。这种方式准确率较高，适合小规模的客服机器人。第二种采用传统机器学习的方法。即将意图识别问题看成分类问题，通过支持向量机、随机森林等分类方法，在基于用户标注语料训练下得到分类模型，然后机器人根据模型预测用户意图，进而回答用户问题。这种方式节省了大量人工整理用户问题模板时间，而且机器人泛化能力较强。第三种采用深度学习的方法。即采用当下最热门的深度学习模型，如长短期记忆网络、双向长短期记忆网络等方法，在基于巨大量的用户标注语料下得到深度学习模型，然后机器人根据模型预测用户意图，进而回答用户问题。这种方式考虑到了用户对话信息的上下文联系，而且机器人泛化能力强，适合于大规模的客服机器人。比较三种方法，方案一的缺点是，需要大量人工去整理用户语料，形成用户问题模板，然后对客服机器人进行配置。对于那些没有整理配置的问题，机器人无法进行回答，泛化能力很差。方案二，虽然也需要人工标注语料，但是标注难度比方案一小很多，并且可以采用模型辅助进行语料标注。客服机器人的泛化能力也有所提升。方案三，需要投入大量的人工去标注语料...

【技术保护点】
1.一种多轮对话意图识别方法，其特征在于，包括如下步骤：1)根据应用场景确定要识别的对话意图，并获取大量对话数据，人工找出对话数据中的对话块以及其对应的意图，进行语料标注；2)根据人工整理好的停用词表去除对话数据中的停用词；3)构建用于意图识别的句向量模型、BiLSTM‑CRF模型及StarSpace模型；4)由句向量模型、BiLSTM‑CRF模型和StarSpace模型实时获取对话数据，进行意图识别，输出最佳意图。

【技术特征摘要】
1.一种多轮对话意图识别方法，其特征在于，包括如下步骤：1)根据应用场景确定要识别的对话意图，并获取大量对话数据，人工找出对话数据中的对话块以及其对应的意图，进行语料标注；2)根据人工整理好的停用词表去除对话数据中的停用词；3)构建用于意图识别的句向量模型、BiLSTM-CRF模型及StarSpace模型；4)由句向量模型、BiLSTM-CRF模型和StarSpace模型实时获取对话数据，进行意图识别，输出最佳意图。2.根据权利要求1所述的一种多轮对话意图识别方法，其特征在于，所述步骤2)具体为：2.1)将对话数据使用分词工具进行分词；2.2)将分词结果中的每个词与停用词表中的词进行判断，若分词结果中的词在停用词表中存在，则去除该词，否则保留；2.3)将2.2)得到的结果拼接为句子。3.根据权利要求1所述的一种多轮对话意图识别方法，其特征在于，所述步骤3)中句向量模型构建步骤具体为：3.1)获取去除停用词后的人工标注语料，将语料中的每句话按字符拆分为List，最终得到整个语料的List列表；3.2)设置sentence2vec算法的预设参数，句子嵌入向量空间的维度n和语料总共使用的次数epoch；3.3)将3.1)中得到的语料List列表作为sentence2vec的输入，进行句向量模型训练；3.4)将3.3)训练得到的句向量模型存储到磁盘上。4.根据权利要求1所述的一种多轮对话意图识别方法，其特征在于，所述步骤3)中BiLSTM-CRF模型构建步骤具体为：3.5)获取去除停用词后的人工标注语料，首先使用句向量模型将对话转化为句向量，然后根据对话块标注块标签，其中，B表示块开始位置，I表示块中位置，E表示块结束位置，O表示其他位置；3.6)设置BiLSTM-CRF模型预设参数，模型隐藏层大小hidden_size、随机失...

【专利技术属性】
技术研发人员：曹斌，叶铱雷，范菁，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人