对话文本聚类方法及相关设备技术

技术编号：39940175 阅读：40 留言：0更新日期：2024-01-08 22:30

本说明书实施例公开了一种对话文本聚类方法及相关设备，涉及自然语言处理领域。在本说明书中，通过获取多个对话文本，该对话文本由至少两个用户在对话过程中产生，进一步通过提取各对话文本分别对应的语义特征信息和词频特征信息，综合各对话文本分别对应的语义特征信息和词频特征信息，将多个对话文本进行聚类，从而得到多个对话文本对应的至少一个聚类结果，各聚类结果中包括至少一个对话文本。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及自然语言处理领域，尤其涉及一种对话文本聚类方法及相关设备。

技术介绍

1、随着科技和互联网技术的发展，文本数据量不断增加，采用对话文本聚类方法可以高效地从文本数据中获得有使用价值的信息。例如，消费金融公司作为持牌的非银金融机构，智能化建设和运营的客服体系可以完成用户在信贷产品使用全周期内的疑难咨询和问题解决。而且随着互联网技术的发展，客服系统已从电话服务逐渐迈向在线服务和电话服务并存的现状。换而言之，在线服务是由用户和客服人员借助聊天文本框完成沟通交流的一种形式。然而，由于用户与客服进行沟通的文本内容多样，且存在大量的冗余表达。因此对在线客服系统中产生的沟通文本进行聚类，通过聚类对沟通文本进行挖掘和理解，提升对用户的沟通偏好及来访意图的识别和感知，是在线客服系统的智能化建设和运营中不可或缺的一环。

2、目前，对话文本聚类方法主要采用人工智能技术中的机器学习或深度学习的技术确定。

3、基于机器学习的对话文本聚类方法主要将对话文本聚类问题分成特征工程和分类器两部分。其中特征工程包含文本预处理、特征提取、文...

【技术保护点】

1.一种对话文本聚类方法，所述对话文本聚类方法包括：

2.根据权利要求1所述的对话文本聚类方法，所述根据所述多个对话文本，基于各所述对话文本中至少一个第一关键词提取各所述对话文本对应的语义特征信息，以及基于各所述对话文本中至少一个第二关键词提取各所述对话文本对应的词频特征信息，包括：

3.根据权利要求2所述的对话文本聚类方法，所述根据各所述对话文本中至少一个第一关键词，提取各所述对话文本对应的语义特征信息，包括：

4.根据权利要求3所述的对话文本聚类方法，所述根据各所述对话文本中至少一轮关键子对话文本，提取各所述对话文本对应的语义特

【技术特征摘要】

1.一种对话文本聚类方法，所述对话文本聚类方法包括：

3.根据权利要求2所述的对话文本聚类方法，所述根据各所述对话文本中至少一个第一关键词，提取各所述对话文本对应的语义特征信息，包括：

4.根据权利要求3所述的对话文本聚类方法，所述根据各所述对话文本中至少一轮关键子对话文本，提取各所述对话文本对应的语义特征信息，包括：

5.根据权利要求4所述的对话文本聚类方法，所述根据各所述对话文本中至少一轮关键子对话文本，对各所述对话文本中至少一轮关键子对话文本分别进行数据扩增处理，得到各所述对话文本中至少一轮关键子对话文本分别对应的扩增文本，包括：

6.根据权利要求1或2所述的对话文本聚类方法，所述根据所述多个对话文本，基于各所述对话文本中至少一个第一关键词提取各所述对话文本对应的语义特征信息，以及基于各所述对话文本中至少一个第二关键词提取各所述对话文本对应的词频特征信息，包括：

7.根据权利要求1所述的对话文本聚类方法，所述第一关键词与情绪和/或观点有关，所述第二关键词与具体事务有关。

8.根据权利要求1所述的对话文本聚类方法，所述根据各所述对话文本分别对应的语义特征信息和词频特征信息，...

【专利技术属性】
技术研发人员：周宇，
申请(专利权)人：重庆蚂蚁消费金融有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人