基于深度学习的单轮对话数据分类方法、装置和电子设备制造方法及图纸

技术编号：19692386 阅读：30 留言：0更新日期：2018-12-08 11:19

本申请涉及基于深度学习的单轮对话数据分类方法、装置和电子设备。该方法包括：对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示；通过双向长短期记忆层处理所述单轮对话数据的词向量表示以获得与所述单轮对话数据对应的隐状态序列；以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达；以及，以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布。这样，可以通过双向长短期记忆和注意力机制对单轮对话数据中的用户特征进行提取，从而改进单轮对话场景下的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的单轮对话数据分类方法、装置和电子设备
本专利技术总体地涉及数据处理领域，且更为具体地，涉及一种基于深度学习的单轮对话数据分类方法、装置和电子设备。
技术介绍
随着互联网技术的发展，越来越多的网站采用对话系统对用户进行服务。例如，在线票务预订网站或者在线购物网站通过与用户的在线对话来解决用户需求。在使用上述对话系统的过程中，为了提高服务效率，需要对用户输入进行大概分类。例如，可以通过用户意图分析确定预定场景下的用户意图，比如机票预订场景下的查询、订票、退票等意图。此外，还可能需要从用户的对话中获得其它信息，例如用户针对服务或者商品所要表达的主观情绪等。因此，如何基于对话系统中的用户数据，比如用户与系统之间的单轮对话数据挖掘出用户对于客观事物的感受，以更为全面地获取用户对于特定客观现实，比如事件或商品所要表达的主观信息，已逐渐成为当前自然语言处理领域的研究热点。因此，需要改进的用于对话系统的数据分类方案。
技术实现思路
为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于深度学习的单轮对话数据分类方法、装置和电子设备，其通过双向长短期记忆和注意力机制对单轮对话数据中的用户特征进行提取，从而改进单轮对话场景下的分类效果。根据本申请的一方面，提供了一种基于深度学习的单轮对话数据分类方法，包括：对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示；通过双向长短期记忆层处理所述单轮对话数据的词向量表示以获得与所述单轮对话数据对应的隐状态序列；以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子...

【技术保护点】
1.一种基于深度学习的单轮对话数据分类方法，包括：对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示；通过双向长短期记忆层处理所述单轮对话数据的词向量表示以获得与所述单轮对话数据对应的隐状态序列；以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达；以及以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布。

【技术特征摘要】
1.一种基于深度学习的单轮对话数据分类方法，包括：对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示；通过双向长短期记忆层处理所述单轮对话数据的词向量表示以获得与所述单轮对话数据对应的隐状态序列；以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达；以及以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布。2.如权利要求1所述的基于深度学习的单轮对话数据分类方法，其中，在以用于分类的逻辑回归模型处理所述句子向量表达以获得所述单轮对话数据相对于所述逻辑回归模型的多个标签的概率分布之后进一步包括：将与所述概率分布中最大概率对应的标签确定为所述单轮对话数据的分类结果。3.如权利要求1所述的基于深度学习的单轮对话数据分类方法，其中，所述标签是所述单轮对话数据所反映的用户意图，以及对获取的单轮对话数据进行词向量转化以获得所述单轮对话数据的词向量表示包括：对所述单轮对话数据进行实体识别以获得所述单轮对话数据中每个词对应的实体标签；对所述单轮对话数据进行词性标注以获得所述单轮对话数据中每个词对应的词性标签；将所述单轮对话数据中的每个词及其实体标签和词性标签进行向量转化以获得所述每个词的词向量矩阵、所述实体标签的实体向量矩阵和所述词性标签的词性向量矩阵；以及连接所述词向量矩阵、所述实体向量矩阵以及所述词性向量矩阵以获得所述单轮对话数据的词向量表示。4.如权利要求1所述的基于深度学习的单轮对话数据分类方法，其中，以注意力机制层对所述隐状态序列中的每个隐状态进行加权求和以获得与所述单轮对话数据对应的句子向量表达包括：计算所述每个隐状态的平均值以获得临时句子向量；基于每个隐状态和所述临时句子向量通过神经网络计算每个隐状态对应的权重；以及基于所述每个隐状态对应的权重对所述隐状态序列进行加权求和以获得所述句子向量表达。5.如权利要求1所述的基于深度学习的单轮对话数据分类方法，其中，所述用于...

【专利技术属性】
技术研发人员：杨鹏，
申请(专利权)人：北京慧闻科技发展有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人