对话处理方法、装置、设备及存储介质制造方法及图纸

技术编号:36533243 阅读:23 留言:0更新日期:2023-02-01 16:17
本公开涉及一种对话处理方法、装置、设备及存储介质。本公开通过目标类别建立多个预设类别中除所述目标类别之外的其他预设类别中不同预设类别的关键词之间的语义关系,从所述目标类别对应的一个或多个聚类簇中选取基准聚类簇,以及从所述其他预设类别对应的多个聚类簇中确定出一个或多个目标聚类簇,使得所述目标聚类簇和所述基准聚类簇的相似度满足预设条件。进一步,将所述一个或多个目标聚类簇中的关键词融合到所述基准聚类簇中,使得不同预设类别的关键词通过目标类别这种数据结构连接在一起,保证了连接在一起的关键词之间存在语义关系,避免将没有关联关系的关键词组合在一起构成结构化数据,从而提高了结构化数据的准确度。的准确度。的准确度。

【技术实现步骤摘要】
对话处理方法、装置、设备及存储介质


[0001]本公开涉及信息
,尤其涉及一种对话处理方法、装置、设备及存储介质。

技术介绍

[0002]目前,通过对真人客服和消费者之间的对话记录进行分析,可以从该对话记录中提取出结构化数据,从而给消费者提供更精准、更智能的商品推荐能力。
[0003]但是,现有技术可能会将对话记录中没有关联关系的关键词组合在一起构成结构化数据,从而降低了结构化数据的准确度。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种对话处理方法、装置、设备及存储介质,以提高结构化数据的准确度。
[0005]第一方面,本公开实施例提供一种对话处理方法,包括:
[0006]获取一个或多个对话中与用户诉求相关的一个或多个导购问句;
[0007]针对所述一个或多个导购问句中的每个导购问句,根据所述导购问句中每个文本单元的表示向量,确定所述导购问句中与多个预设类别中至少一个预设类别分别对应的关键词,所述多个预设类别包括目标类别,所述目标类别用于建立所述多个预设类别中除所述目标类别之外的其他预设类别中不同预设类别的关键词之间的语义关系;
[0008]针对所述多个预设类别中的每个预设类别,根据所述一个或多个导购问句中与所述预设类别对应的一个或多个关键词分别对应的表示向量,对所述一个或多个关键词进行聚类,得到一个或多个聚类簇;
[0009]从所述目标类别对应的一个或多个聚类簇中选取基准聚类簇,从所述其他预设类别对应的多个聚类簇中确定出一个或多个目标聚类簇,所述目标聚类簇和所述基准聚类簇的相似度满足预设条件;
[0010]将所述一个或多个目标聚类簇中的关键词融合到所述基准聚类簇中。
[0011]第二方面,本公开实施例提供一种对话处理装置,包括:
[0012]获取模块,用于获取一个或多个对话中与用户诉求相关的一个或多个导购问句;
[0013]第一确定模块,用于针对所述一个或多个导购问句中的每个导购问句,根据所述导购问句中每个文本单元的表示向量,确定所述导购问句中与多个预设类别中至少一个预设类别分别对应的关键词,所述多个预设类别包括目标类别,所述目标类别用于建立所述多个预设类别中除所述目标类别之外的其他预设类别中不同预设类别的关键词之间的语义关系;
[0014]聚类模块,用于针对所述多个预设类别中的每个预设类别,根据所述一个或多个导购问句中与所述预设类别对应的一个或多个关键词分别对应的表示向量,对所述一个或多个关键词进行聚类,得到一个或多个聚类簇;
[0015]选取模块,用于从所述目标类别对应的一个或多个聚类簇中选取基准聚类簇;
[0016]第二确定模块,用于从所述其他预设类别对应的多个聚类簇中确定出一个或多个目标聚类簇,所述目标聚类簇和所述基准聚类簇的相似度满足预设条件;
[0017]融合模块,用于将所述一个或多个目标聚类簇中的关键词融合到所述基准聚类簇中。
[0018]第三方面,本公开实施例提供一种电子设备,包括:
[0019]存储器;
[0020]处理器;以及
[0021]计算机程序;
[0022]其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
[0023]第四方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面所述的方法。
[0024]本公开实施例提供的对话处理方法、装置、设备及存储介质,通过获取一个或多个对话中与用户诉求相关的一个或多个导购问句,针对所述一个或多个导购问句中的每个导购问句,根据所述导购问句中每个文本单元的表示向量,确定所述导购问句中与多个预设类别中至少一个预设类别分别对应的关键词。由于所述多个预设类别包括目标类别,所述目标类别用于建立所述多个预设类别中除所述目标类别之外的其他预设类别中不同预设类别的关键词之间的语义关系,因此,针对所述多个预设类别中的每个预设类别,根据所述一个或多个导购问句中与所述预设类别对应的一个或多个关键词分别对应的表示向量,对所述一个或多个关键词进行聚类,得到一个或多个聚类簇后,可以从所述目标类别对应的一个或多个聚类簇中选取基准聚类簇,以及从所述其他预设类别对应的多个聚类簇中确定出一个或多个目标聚类簇,使得所述目标聚类簇和所述基准聚类簇的相似度满足预设条件。进一步,将所述一个或多个目标聚类簇中的关键词融合到所述基准聚类簇中,使得不同预设类别的关键词通过目标类别这种数据结构连接在一起,保证了连接在一起的关键词之间存在语义关系,避免将没有关联关系的关键词组合在一起构成结构化数据,从而提高了结构化数据的准确度。
附图说明
[0025]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0026]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0027]图1为本公开实施例提供的对话处理方法流程图;
[0028]图2为本公开实施例提供的应用场景的示意图;
[0029]图3为本公开实施例提供的对话的示意图;
[0030]图4为本公开另一实施例提供的对话处理方法流程图;
[0031]图5为本公开另一实施例提供的联合任务的示意图;
[0032]图6为本公开另一实施例提供的聚类的示意图;
[0033]图7为本公开另一实施例提供的对话处理方法流程图;
[0034]图8为本公开另一实施例提供的同质匹配和异质匹配的示意图;
[0035]图9为本公开实施例提供的对话处理装置的结构示意图;
[0036]图10为本公开实施例提供的电子设备实施例的结构示意图。
具体实施方式
[0037]为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
[0038]在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
[0039]目前,通过对真人客服和消费者之间的对话记录进行分析,可以从该对话记录中提取出结构化的数据,从而给消费者提供更精准、更智能的商品推荐能力。但是,现有技术可能会将对话记录中没有关联关系的关键词组合在一起构成结构化数据,从而降低了结构化数据的准确度。针对该问题,本公开实施例提供了一种对话处理方法,下面结合具体的实施例对该方法进行介绍。
[0040]图1为本公开实施例提供的对话处理方法流程图。该方法可以由对话处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话处理方法,其中,所述方法包括:获取一个或多个对话中与用户诉求相关的一个或多个导购问句;针对所述一个或多个导购问句中的每个导购问句,根据所述导购问句中每个文本单元的表示向量,确定所述导购问句中与多个预设类别中至少一个预设类别分别对应的关键词,所述多个预设类别包括目标类别,所述目标类别用于建立所述多个预设类别中除所述目标类别之外的其他预设类别中不同预设类别的关键词之间的语义关系;针对所述多个预设类别中的每个预设类别,根据所述一个或多个导购问句中与所述预设类别对应的一个或多个关键词分别对应的表示向量,对所述一个或多个关键词进行聚类,得到一个或多个聚类簇;从所述目标类别对应的一个或多个聚类簇中选取基准聚类簇,从所述其他预设类别对应的多个聚类簇中确定出一个或多个目标聚类簇,所述目标聚类簇和所述基准聚类簇的相似度满足预设条件;将所述一个或多个目标聚类簇中的关键词融合到所述基准聚类簇中。2.根据权利要求1所述的方法,其中,从所述其他预设类别对应的多个聚类簇中确定出一个或多个目标聚类簇,所述目标聚类簇和所述基准聚类簇的相似度满足预设条件,包括:将所述其他预设类别对应的多个聚类簇中的每个聚类簇作为候选簇,根据所述候选簇中的所有关键词的表示向量、以及所述基准聚类簇中与所述候选簇具有相同预设类别的关键词的表示向量,确定所述候选簇和所述基准聚类簇的第一相似度;根据所述候选簇中的所有关键词的表示向量、以及所述基准聚类簇中的所有关键词的表示向量,确定所述候选簇和所述基准聚类簇的第二相似度;在所述第一相似度满足第一预设条件,和/或所述第二相似度满足第二预设条件的情况下,将所述候选簇作为所述目标聚类簇。3.根据权利要求2所述的方法,其中,根据所述候选簇中的所有关键词的表示向量、以及所述基准聚类簇中与所述候选簇具有相同预设类别的关键词的表示向量,确定所述候选簇和所述基准聚类簇的第一相似度,包括:计算所述候选簇中的所有关键词的表示向量的第一平均值;计算所述基准聚类簇中与所述候选簇具有相同预设类别的关键词的表示向量的第二平均值;根据所述第一平均值和所述第二平均值,确定所述候选簇和所述基准聚类簇的第一相似度。4.根据权利要求2所述的方法,其中,根据所述候选簇中的所有关键词的表示向量、以及所述基准聚类簇中的所有关键词的表示向量,确定所述候选簇和所述基准聚类簇的第二相似度,包括:计算所述候选簇中的所有关键词的表示向量的第一平均值;计算所述基准聚类簇中的所有关键词的表示向量的第三平均值;根据所述第一平均值和所述第三平均值,确定所述候选簇和所述基准聚类簇的第二相似度。5.根据权利要求1所述的方法...

【专利技术属性】
技术研发人员:樊艳
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1