问题聚类方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36044483 阅读:14 留言:0更新日期:2022-12-21 10:52
本发明专利技术提供一种问题聚类方法、装置、电子设备和存储介质,其中方法包括:获取第一问题簇,所述第一问题簇包括待聚类的第一问题;确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。本发明专利技术提供的方法、装置、电子设备和存储介质,基于第一问题以基准回复作为对话回复的回复概率进行问题聚类,使得问题聚类的依据能够更加贴合实际对话场景下的问题语义,由此保证问题聚类的可靠性,优化问题聚类效果。果。果。

【技术实现步骤摘要】
问题聚类方法、装置、电子设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种问题聚类方法、装置、电子设备和存储介质。

技术介绍

[0002]聊天机器人作为一个人机交互的平台,在人们工作生活中各式各样的电子设备中得以应用。而构建聊天机器人的一个核心步骤,即,对线上回复不佳的用户问题的回复资源进行迭代优化。
[0003]考虑到人机交互所产生的用户问题的数据量巨大,对于其中回复不佳的用户问题进行聚类汇总后再对相应回复资源进行迭代优化,能够极大节省人力和时间成本。
[0004]目前的问题聚类方法均是抽取句子语义并计算距离的方式进行聚类,却忽略了人机交互本身属于对话场景,单个句子的语义并不能反映所在对话的语境,由此实现的聚类效果并不理想。

技术实现思路

[0005]本专利技术提供一种问题聚类方法、装置、电子设备和存储介质,用以解决现有技术中应用问题语义进行聚类而忽略实际对话场景,导致聚类效果不佳的缺陷。
[0006]本专利技术提供一种问题聚类方法,包括:
[0007]获取第一问题簇,所述第一问题簇包括待聚类的第一问题;
[0008]确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;
[0009]基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。
[0010]根据本专利技术提供的一种问题聚类方法,所述基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇,包括:
[0011]基于所述第一问题的回复概率,以及所述基准问题以所述基准回复作为对话回复的概率,确定所述第一问题的聚类得分;
[0012]基于所述第一问题的聚类得分,对所述第一问题进行聚类,得到第二问题簇。
[0013]根据本专利技术提供的一种问题聚类方法,所述基于所述第一问题的聚类得分,对所述第一问题进行聚类,得到第二问题簇,包括:
[0014]基于所述第一问题的聚类得分,从所述第一问题簇中确定出包括所述基准问题在内的第二问题簇;
[0015]从所述第一问题簇中移出所述第二问题簇,得到更新后的第一问题簇,并重新确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题的聚类得分,直至所述第一问题簇中不存在第一问题。
[0016]根据本专利技术提供的一种问题聚类方法,所述确定所述第一问题簇中的基准问题及其基准回复,包括:
[0017]在所述第一问题簇中存在携带预设回复的问题的情况下,将所述携带预设回复的问题确定为所述基准问题,将所述预设回复确定为所述基准回复;
[0018]在所述第一问题簇中不存在携带预设回复的问题的情况下,将所述第一问题簇中的任一问题确定为所述基准问题,并生成所述基准问题的对话回复作为所述基准回复。
[0019]根据本专利技术提供的一种问题聚类方法,所述获取第一问题簇,包括:
[0020]基于所述第一问题的语义特征,对所述第一问题进行语义聚类,得到所述第一问题簇。
[0021]根据本专利技术提供的一种问题聚类方法,所述对所述第一问题进行语义聚类,得到所述第一问题簇,包括:
[0022]基于所述第一问题的语义特征,以及多个预设问题簇中的预设问题的语义特征,对所述第一问题进行语义聚类,得到多个语义问题簇,将包含有所述第一问题的语义问题簇作为所述第一问题簇。
[0023]根据本专利技术提供的一种问题聚类方法,所述第一问题的语义特征的确定步骤包括:
[0024]基于语义特征模型,提取第一问题的语义特征;
[0025]所述语义特征模型是基于属于同一预设问题簇的预设问题的语义特征之间的距离,和/或,属于不同预设问题簇的预设问题的语义特征之间的距离训练得到的。
[0026]根据本专利技术提供的一种问题聚类方法,所述回复概率的确定步骤包括:
[0027]基于对话生成模型,确定以所述第一问题为输入、以所述基准回复为输出的概率,作为所述回复概率;
[0028]所述对话生成模型是以对话数据中的上文为样本、以所述对话数据中的下文为标签训练得到的。
[0029]本专利技术还提供一种问题聚类装置,包括:
[0030]问题确定单元,用于获取第一问题簇,所述第一问题簇包括待聚类的第一问题;
[0031]概率确定单元,用于确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;
[0032]聚类单元,用于基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。
[0033]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述问题聚类方法。
[0034]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述问题聚类方法。
[0035]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述问题聚类方法。
[0036]本专利技术提供的问题聚类方法、装置、电子设备和存储介质,基于第一问题以基准回复作为对话回复的回复概率进行问题聚类,使得问题聚类的依据能够更加贴合实际对话场景下的问题语义,由此保证问题聚类的可靠性,优化问题聚类效果。
附图说明
[0037]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1是本专利技术提供的问题聚类方法的流程示意图之一;
[0039]图2是本专利技术提供的问题聚类方法中步骤130的流程示意图;
[0040]图3是本专利技术提供的问题聚类方法中步骤132的流程示意图;
[0041]图4是本专利技术提供的问题聚类方法的流程示意图之二;
[0042]图5是本专利技术提供的问题聚类装置的结构示意图;
[0043]图6是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0044]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0045]目前,用于实现问题聚类的方法,多是先提取问题的句子语义,得到问题的语义特征,再通过计算语义特征之间的距离,来判断两个问题是否相似,或者利用预先设定的距离阈值来对问题进行聚类。
[0046]但是上述方法并没有考虑到问题的实际应用场景是对话场景,而在对话场景下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题聚类方法,其特征在于,包括:获取第一问题簇,所述第一问题簇包括待聚类的第一问题;确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。2.根据权利要求1所述的问题聚类方法,其特征在于,所述基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇,包括:基于所述第一问题的回复概率,以及所述基准问题以所述基准回复作为对话回复的概率,确定所述第一问题的聚类得分;基于所述第一问题的聚类得分,对所述第一问题进行聚类,得到第二问题簇。3.根据权利要求2所述的问题聚类方法,其特征在于,所述基于所述第一问题的聚类得分,对所述第一问题进行聚类,得到第二问题簇,包括:基于所述第一问题的聚类得分,从所述第一问题簇中确定出包括所述基准问题在内的第二问题簇;从所述第一问题簇中移出所述第二问题簇,得到更新后的第一问题簇,并重新确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题的聚类得分,直至所述第一问题簇中不存在第一问题。4.根据权利要求1至3中任一项所述的问题聚类方法,其特征在于,所述确定所述第一问题簇中的基准问题及其基准回复,包括:在所述第一问题簇中存在携带预设回复的问题的情况下,将所述携带预设回复的问题确定为所述基准问题,将所述预设回复确定为所述基准回复;在所述第一问题簇中不存在携带预设回复的问题的情况下,将所述第一问题簇中的任一问题确定为所述基准问题,并生成所述基准问题的对话回复作为所述基准回复。5.根据权利要求1至3中任一项所述的问题聚类方法,其特征在于,所述获取第一问题簇,包括:基于所述第一问题的语义特征,对所述第一问题进行语...

【专利技术属性】
技术研发人员:刘洋王栋刘权王士进
申请(专利权)人:科大讯飞北京有限公司河北省讯飞人工智能研究院
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1