The invention discloses a data analysis method for user-customer conversation in a real scene, which is characterized by extracting user conversation intentions and important sentences from the original session data, and gathering the same intentions of different expressions together for text summary to obtain scene description information with the same intentions. Compared with the existing technology, the invention has the part of extracting and expressing key information of the whole article from documents, which provides great convenience for subsequent text analysis, correct scene information analysis, effective mining and analysis of large amounts of unstructured data, provides an effective solution for intelligent customer service system, and has high work efficiency, especially for dialogue text mining of network customer service system. A very effective optimization method is proposed, which has a wide range of practical significance.
【技术实现步骤摘要】
一种真实场景下用户与客服对话的数据分析方法
本专利技术涉及文本挖掘
,尤其是一种基于文本聚类和文本挖掘的真实场景下用户与客服对话的数据分析方法。
技术介绍
客服部门在日常运营过程中,会产生大量的非结构化的文本数据,这些数据中往往蕴含了用户对企业产品最真实的反馈数据,客服部门在日常工作中,投入了大量的人力进行人工回复和分析。在知识爆炸的时代,人们每天都需要面对海量数据,合理利用信息,高效地处理文本提取有用的信息就变得极为重要。文本聚类是自然语言处理中的一项重要技术,它主要将大量文本语料通过机器处理,自动分成若干类别。作为一种无监督的机器学习方法,文本聚类技术不需要预先对文档手工标注类别,因此具有较强的灵活性和自动化处理能力。文本聚类已经成为对文本信息进行有效地挖掘、摘要提取的重要手段,所以利用文本摘要技术能够从文档中提取表达整篇文章关键信息的部分,为后续的文本分析提供了极大地便利,有望提升该类数据的分析与挖掘能力,不仅有望降低人工回复、分析和客服部门的日常运营成本,还能大大提升公司产品设计的优化水平。现有技术的客服系统存在的问题是人工回复和分析,不但浪费了大量的人力资源,而且运营成本高,效率低。
技术实现思路
本专利技术的目的是针对现有技术的不足而设计的一种真实场景下用户与客服对话的数据分析方,采用意图聚类以及会话摘要技术,从文档中提取表达整篇文章关键信息的部分,有效挖掘和分析大量非结构化数据,对真实场景下用户与客服的对话进行分析,得到同一意图的场景描述信息,为智能客服系统提供了有效的解决方案,场景信息分析正确,工作效率高,尤其是对客服系统中对话文本挖掘的 ...
【技术保护点】
1.一种真实场景下用户与客服对话的数据分析方法,其特征在于采用文本聚类和文本摘要技术,对真实场景下用户与客服的对话进行分析,得到同一意图的场景描述信息,其具体分析包括下述步骤:a)、从原始会话数据中抽取用户会话的意图;b)、从原始会话数据中抽取重要句段;c)、对会话意图进行聚类;d)、对有相同意图的会话内容进行文本摘要,得到同一意图下的场景描述。
【技术特征摘要】
1.一种真实场景下用户与客服对话的数据分析方法,其特征在于采用文本聚类和文本摘要技术,对真实场景下用户与客服的对话进行分析,得到同一意图的场景描述信息,其具体分析包括下述步骤:a)、从原始会话数据中抽取用户会话的意图;b)、从原始会话数据中抽取重要句段;c)、对会话意图进行聚类;d)、对有相同意图的会话内容进行文本摘要,得到同一意图下的场景描述。2.根据权利要求1所述真实场景下用户与客服对话的数据分析方法,其特征在于所述抽取用户会话的意图是在用户会...
【专利技术属性】
技术研发人员:杨燕,张琪,陈成才,郁建峰,战蕾,李芸,贺樑,
申请(专利权)人:华东师范大学,上海智臻智能网络科技股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。