数据处理方法、数据处理装置和服务器制造方法及图纸

技术编号:20025741 阅读:42 留言:0更新日期:2019-01-06 04:35
本说明书实施例提供一种数据处理方法、数据处理装置和服务器。所述方法包括:对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。

【技术实现步骤摘要】
数据处理方法、数据处理装置和服务器
本说明书实施例涉及计算机
,特别涉及一种数据处理方法、数据处理装置和服务器。
技术介绍
随着互联网和通信技术的发展,越来越多的网站或平台开始提供对话助手。所述对话助手可以为一种面向客服人员的平台型工具。客服人员可以使用所述对话助手,答复用户提出的咨询问题,从而极大地降低人工客服的数量,达到降低服务成本的目的。在相关技术中,开发人员通常需要预先配置知识库。所述知识库可以包括至少一个知识点。每个知识点可以包括相关联的标准咨询信息和标准答复信息。终端设备可以基于用户的操作,向运行有所述对话助手的服务器发送来自用户的目标咨询信息。所述服务器可以接收所述目标咨询信息;可以从所述知识库中选取知识点,选取的知识点中的标准咨询信息能够表征所述目标咨询信息的语义;可以在所述对话助手的会话界面展示选取的知识点中的标准答复信息。客服人员可以浏览审核展示的标准答复信息;在认为没有问题后,可以向所述服务器发送答复指令。所述服务器可以接收所述答复指令;可以向所述终端设备发送展示的标准答复信息。所述终端设备可以接收并展示标准答复信息。在上述相关技术中,知识点中的标准咨询信息和标准答复信息,通常是由一个或多个运营人员基于人工经验预先设定的。受限于运营人员的数量和认知水平,这种根据人工经验来设定标准咨询信息和标准答复信息的方法,通常会出现与业务实际不相符的情况,从而影响用户体验。例如,来自用户的语义相同的咨询信息会有多种不同的表述方式,知识点中的标准咨询信息无法覆盖所述多种不同的表述方式。另举一例,知识点中的标准答复信息与来自用户的咨询信息并不能够很好的形成匹配,导致用户不满。
技术实现思路
本说明书实施例的目的是提供一种数据处理方法、数据处理装置和服务器,能够生成相关联的标准咨询信息和标准答复信息。生成的标准咨询信息和标准答复信息更加符合业务实际,从而可以提高用户体验。为实现上述目的,本说明书实施例提供一种数据处理方法,包括:对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种数据处理装置,包括:聚类单元,用于对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;生成单元,用于分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种服务器,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令,实现以下步骤:对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种数据处理方法,包括:对语料数据中的原始答复信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始答复信息和与该类簇中的原始答复信息相关联的原始咨询信息,为该类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种数据处理装置,包括:聚类单元,用于对语料数据中的原始答复信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;生成单元,用于分别基于类簇中的原始答复信息和与该类簇中的原始答复信息相关联的原始咨询信息,为该类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种服务器,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令,实现以下步骤:对语料数据中的原始答复信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始答复信息和与该类簇中的原始答复信息相关联的原始咨询信息,为该类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种数据处理方法,包括:对语料数据中的原始咨询信息进行聚类,得到至少一个第一类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于第一类簇中的原始咨询信息和与该第一类簇中的原始咨询信息相关联的原始答复信息,为该第一类簇生成相关联的标准咨询信息和标准答复信息;对第一子语料数据中的原始答复信息进行聚类,得到至少一个第二类簇;所述第一子语料数据包括所述语料数据中除去与第一类簇中的原始咨询信息相关联的原始答复信息后剩余的原始答复信息;分别基于第二类簇中的原始答复信息和与该第二类簇中的原始答复信息相关联的原始咨询信息,为该第二类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种数据处理装置,包括:第一聚类单元,用于对语料数据中的原始咨询信息进行聚类,得到至少一个第一类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;第一生成单元,用于分别基于第一类簇中的原始咨询信息和与该第一类簇中的原始咨询信息相关联的原始答复信息,为该第一类簇生成相关联的标准咨询信息和标准答复信息;第二聚类单元,用于对第一子语料数据中的原始答复信息进行聚类,得到至少一个第二类簇;所述第一子语料数据包括所述语料数据中除去与第一类簇中的原始咨询信息相关联的原始答复信息后剩余的原始答复信息;第二生成单元,用于分别基于第二类簇中的原始答复信息和与该第二类簇中的原始答复信息相关联的原始咨询信息,为该第二类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种服务器,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令,实现以下步骤:对语料数据中的原始咨询信息进行聚类,得到至少一个第一类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于第一类簇中的原始咨询信息和与该第一类簇中的原始咨询信息相关联的原始答复信息,为该第一类簇生成相关联的标准咨询信息和标准答复信息;对第一子语料数据中的原始答复信息进行聚类,得到至少一个第二类簇;所述第一子语料数据包括所述语料数据中除去与第一类簇中的原始咨询信息相关联的原始答复信息后剩余的原始答复信息;分别基于第二类簇中的原始答复信息和与该第二类簇中的原始答复信息相关联的原始咨询信息,为该第二类簇生成相关联的标准咨询信息和标准答复信息。为实现上述目的,本说明书实施例提供一种数据处理方法,包括:基于特征值,淘汰知识库中的至少一个知识点;所述知识库包括至少一个知识点;所述知识点对应有特征值。为实现上述目的,本说明书实施例提供一种数据处理装置,包括:淘汰单元,用于基于特征值,淘汰知识库中的至少一个知识点;所述知识库包括至少一个知识点;所述知识点对应有特征值。为实现上述目的,本说明书实施例提供一种服务器,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指本文档来自技高网
...

【技术保护点】
1.一种数据处理方法,包括:对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。

【技术特征摘要】
1.一种数据处理方法,包括:对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。2.如权利要求1所述的方法,为类簇生成的标准咨询信息能够表征该类簇中原始咨询信息的语义;为类簇生成的标准答复信息能够表征与该类簇中的原始咨询信息相关联的原始答复信息的语义。3.一种数据处理装置,包括:聚类单元,用于对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;生成单元,用于分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。4.一种服务器,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令,实现以下步骤:对语料数据中的原始咨询信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始咨询信息和与该类簇中的原始咨询信息相关联的原始答复信息,为该类簇生成相关联的标准咨询信息和标准答复信息。5.一种数据处理方法,包括:对语料数据中的原始答复信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始答复信息和与该类簇中的原始答复信息相关联的原始咨询信息,为该类簇生成相关联的标准咨询信息和标准答复信息。6.如权利要求5所述的方法,为类簇生成的标准咨询信息能够表征与该类簇中的原始答复信息相关联的原始咨询信息的语义;为类簇生成的标准答复信息能够表征该类簇中原始答复信息的语义。7.一种数据处理装置,包括:聚类单元,用于对语料数据中的原始答复信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;生成单元,用于分别基于类簇中的原始答复信息和与该类簇中的原始答复信息相关联的原始咨询信息,为该类簇生成相关联的标准咨询信息和标准答复信息。8.一种服务器,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令,实现以下步骤:对语料数据中的原始答复信息进行聚类,得到至少一个类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于类簇中的原始答复信息和与该类簇中的原始答复信息相关联的原始咨询信息,为该类簇生成相关联的标准咨询信息和标准答复信息。9.一种数据处理方法,包括:对语料数据中的原始咨询信息进行聚类,得到至少一个第一类簇;所述语料数据包括至少一个原始咨询信息和至少一个原始答复信息;分别基于第一类簇中的原始咨询信息和与该第一类簇中的原始咨询信息相关联的原始答复信息,为该第一类簇生成相关联的标准咨询信息和标准答复信息;对第一子语料数据中的原始答复信息进行聚类,得到至少一个第二类簇;所述第一子语料数据包括所述语料数据中除去与第一类簇中的原始咨询信息相关联的原始答复信息后剩余的原始答复信息;分别基于第二类簇中的原始答复信息和与该第二类簇中的原始答复信息相关联的原始咨询信息,为该第二类簇生成相关联的标准咨询信息和标准答复信息。10.如权利要求9所述的方法,所述第一子语料数据还包括所述语料数据中除去第一类簇中的原始咨询信息后剩余的原始咨询信息;与第二类簇中的原始答复信息相关联的原始咨询信息位于所述第一子语料数据。11.如权利要求9所述的方法,为第一类簇生成的标准咨询信息能够表征该第一...

【专利技术属性】
技术研发人员:崔恒斌张家兴李小龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1