一种真实场景下用户与客服对话的数据分析方法技术

技术编号：21184649 阅读：24 留言：0更新日期：2019-05-22 15:15

本发明专利技术公开了一种真实场景下用户与客服对话的数据分析方法，其特点是在原始会话数据中抽取用户会话的意图和重要句段，并将不同表述的相同意图聚集在一起进行文本摘要，得到同一意图的场景描述信息。本发明专利技术与现有技术相比具有从文档中提取表达整篇文章关键信息的部分，为后续的文本分析提供了极大地便利，场景信息分析正确，有效挖掘和分析大量非结构化数据，为智能客服系统提供了有效的解决方案，工作效率高，尤其是对网络客服系统的对话文本挖掘，提出了一个十分有效的优化方法，具有广泛的实用意义。

A Data Analysis Method for User-Customer Dialogue in Real Scene

The invention discloses a data analysis method for user-customer conversation in a real scene, which is characterized by extracting user conversation intentions and important sentences from the original session data, and gathering the same intentions of different expressions together for text summary to obtain scene description information with the same intentions. Compared with the existing technology, the invention has the part of extracting and expressing key information of the whole article from documents, which provides great convenience for subsequent text analysis, correct scene information analysis, effective mining and analysis of large amounts of unstructured data, provides an effective solution for intelligent customer service system, and has high work efficiency, especially for dialogue text mining of network customer service system. A very effective optimization method is proposed, which has a wide range of practical significance.

全部详细技术资料下载

【技术实现步骤摘要】
一种真实场景下用户与客服对话的数据分析方法
本专利技术涉及文本挖掘
，尤其是一种基于文本聚类和文本挖掘的真实场景下用户与客服对话的数据分析方法。
技术介绍
客服部门在日常运营过程中，会产生大量的非结构化的文本数据，这些数据中往往蕴含了用户对企业产品最真实的反馈数据，客服部门在日常工作中，投入了大量的人力进行人工回复和分析。在知识爆炸的时代，人们每天都需要面对海量数据，合理利用信息，高效地处理文本提取有用的信息就变得极为重要。文本聚类是自然语言处理中的一项重要技术，它主要将大量文本语料通过机器处理，自动分成若干类别。作为一种无监督的机器学习方法，文本聚类技术不需要预先对文档手工标注类别，因此具有较强的灵活性和自动化处理能力。文本聚类已经成为对文本信息进行有效地挖掘、摘要提取的重要手段，所以利用文本摘要技术能够从文档中提取表达整篇文章关键信息的部分，为后续的文本分析提供了极大地便利，有望提升该类数据的分析与挖掘能力，不仅有望降低人工回复、分析和客服部门的日常运营成本，还能大大提升公司产品设计的优化水平。现有技术的客服系统存在的问题是人工回复和分析，不但浪费了大量的人力资源，而且运营成本高，效率低。
技术实现思路
本专利技术的目的是针对现有技术的不足而设计的一种真实场景下用户与客服对话的数据分析方，采用意图聚类以及会话摘要技术，从文档中提取表达整篇文章关键信息的部分，有效挖掘和分析大量非结构化数据，对真实场景下用户与客服的对话进行分析，得到同一意图的场景描述信息，为智能客服系统提供了有效的解决方案，场景信息分析正确，工作效率高，尤其是对客服系统中对话文本挖掘的...

【技术保护点】
1.一种真实场景下用户与客服对话的数据分析方法，其特征在于采用文本聚类和文本摘要技术，对真实场景下用户与客服的对话进行分析，得到同一意图的场景描述信息，其具体分析包括下述步骤：a）、从原始会话数据中抽取用户会话的意图；b）、从原始会话数据中抽取重要句段；c）、对会话意图进行聚类；d）、对有相同意图的会话内容进行文本摘要，得到同一意图下的场景描述。

【技术特征摘要】
1.一种真实场景下用户与客服对话的数据分析方法，其特征在于采用文本聚类和文本摘要技术，对真实场景下用户与客服的对话进行分析，得到同一意图的场景描述信息，其具体分析包括下述步骤：a）、从原始会话数据中抽取用户会话的意图；b）、从原始会话数据中抽取重要句段；c）、对会话意图进行聚类；d）、对有相同意图的会话内容进行文本摘要，得到同一意图下的场景描述。2.根据权利要求1所述真实场景下用户与客服对话的数据分析方法，其特征在于所述抽取用户会话的意图是在用户会...

【专利技术属性】
技术研发人员：杨燕，张琪，陈成才，郁建峰，战蕾，李芸，贺樑，
申请(专利权)人：华东师范大学，上海智臻智能网络科技股份有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人