答案聚类方法及其装置、电子设备、计算机可读介质制造方法及图纸

技术编号:20566701 阅读:28 留言:0更新日期:2019-03-14 09:29
本申请公开了一种答案聚类方法及其装置、电子设备、计算机可读介质,答案聚类方法包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。本实施例实现了针对相同或者相似的问题进行了聚类分析,避免了智能问答社区答案的重复以及冗余。

Answer Clustering Method and Its Devices, Electronic Equipment and Computer Readable Media

This application discloses an answer clustering method and its device, electronic equipment and computer readable media. The answer clustering method includes: obtaining multiple answers to the same question in an intelligent question answering community; carrying out similarity clustering analysis for the multiple answers to the same question according to the set clustering rules; and carrying out similarity clustering analysis for the multiple answers according to the similarity clustering analysis for the multiple answers. As a result, the multiple answers were hierarchically divided. This example realizes clustering analysis for the same or similar problems, avoiding duplication and redundancy of answers in intelligent question answering community.

【技术实现步骤摘要】
答案聚类方法及其装置、电子设备、计算机可读介质
本申请涉及互联网领域,尤其涉及一种答案聚类方法及其装置、电子设备、计算机可读介质。
技术介绍
通过问题和对该问题的回答是人们获取现实世界信息的一种有效方式。与此同时,随着互联网技术的发展及互联网应用的快速发展,人们越来越多地依赖于互联网网络获取信息。目前通过搜索平台搜索相关的信息来实现该通过问答方式获取信息,尤其在问答社区内搜索问题、提出问题、回答问题、浏览问题或追加问题等,这已成为用户间进行互动信息交流的重要方式。其中,常见的智能问答社区有百度知道、搜搜问问、新浪爱问等。但是,现有技术中,针对相同或者相似的问题,存在大量相似的答案,由此导致智能问答社区中提供的答案存在大量重复,甚至冗余。
技术实现思路
本申请的目的在于提出一种答案聚类方法及其装置、电子设备、计算机可读介质,用于解决现有技术中上述技术问题。第一方面,本申请实施例提供一种答案聚类方法,其包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。可选地,本申请的任一实施例中,所述答案聚类方法还包括:对每一个所述答案进行语义分析提取其中的实体关键词;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的实体关键词相似度,并根据设定的实体关键词相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类方法还包括:对所述实体关键词进行类别属性划分;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的类别属性相似度,并根据设定的类别属性相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类方法还包括:获取关联与多个所述答案的多个问题;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计关联与多个所述答案的多个问题的相似度,并根据设定的问题相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类方法还包括:对多个所述答案分别进行解析以生成对应的特征向量;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的特征向量的相似度,并根据设定的特征向量相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分,包括:根据对所述多个答案进行相似性聚类分析的结果,将对所述多个答案按照相似度高低分别配置于答案外露层或者答案收起层。可选地,本申请的任一实施例中,所述答案聚类方法还包括:为所述答案外露层与所述答案收起层中的答案配置不同的优先显示级别。可选地,本申请的任一实施例中,所述答案聚类方法还包括:所述答案外露层中的答案的优先显示级别大于所述答案收起层中的答案的优先显示级别。第二方面,本申请实施例还提供一种答案聚类装置,其包括:获取单元,用于获取智能问答社区中针对同一问题的多个答案;聚类单元,用于根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;层级划分单元,用于根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。可选地,本申请的任一实施例中,所述答案聚类装置还包括:提取单元,用于对每一个所述答案进行语义分析提取其中的实体关键词;对应地,所述聚类单元进一步用于统计所述多个答案的实体关键词相似度,并根据设定的实体关键词相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类装置还包括:划分单元,用于对所述实体关键词进行类别属性划分;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:所述聚类单元进一步用于统计所述多个答案的类别属性相似度,并根据设定的类别属性相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类装置还包括:关联单元,用于获取关联与多个所述答案的多个问题;对应地,所述聚类单元进一步用于统计关联与多个所述答案的多个问题的相似度,并根据设定的问题相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类装置还包括:解析单元,用于对多个所述答案分别进行解析以生成对应的特征向量;对应地,所述聚类单元进一步用于统计所述多个答案的特征向量的相似度,并根据设定的特征向量相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。第三方面,本申请实施例提供一种电子设备,包括:一个或多个处理器;计算机可读介质,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如任一实施例中所述的方法。第四方面,本申请实施例提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如任一实施例中所述的方法。本申请提供的技术方案中,通过获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。本实施例实现了针对相同或者相似的问题进行了聚类分析,避免了智能问答社区答案的重复以及冗余。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本申请实施例一答案聚类方法流程示意图;图2为本申请实施例二答案聚类方法流程示意图;图3为本申请实施例三答案聚类方法流程示意图;图4为本申请实施例四答案聚类方法流程示意图;图5为本申请实施例五答案聚类装置结构示意图;图6为本申请实施例六答案聚类装置结构示意图;图7为本申请实施例七答案聚类装置结构示意图;图8为本申请实施例八答案聚类装置结构示意图;图9为本申请实施例九答案聚类装置结构示意图;图10为本申请实施例十电子设备的结构示意图;图11为本申请实施例十一电子设备的硬件结构。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅配置为解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。本申请下述实施例提供的技术方案中,其主要思想在于,获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。以下图1为本申请实施例一答案聚类方法流程示意图;如图1所示,其可以包括下步骤:S101、获取智能问答社区中针对同一问题的多个答案;本本文档来自技高网...

【技术保护点】
1.一种答案聚类方法,其特征在于,包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。

【技术特征摘要】
1.一种答案聚类方法,其特征在于,包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。2.根据权利要求1所述的方法,其特征在于,还包括:对每一个所述答案进行语义分析提取其中的实体关键词;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的实体关键词相似度,并根据设定的实体关键词相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。3.根据权利要求1所述的方法,其特征在于,还包括:对所述实体关键词进行类别属性划分;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的类别属性相似度,并根据设定的类别属性相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。4.根据权利要求1所述的方法,其特征在于,还包括:获取关联与多个所述答案的多个问题;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计关联与多个所述答案的多个问题的相似度,并根据设定的问题相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。5.根据权利要求1所述的方法,其特征在于,还包括:对多个所述答案分别进行解析以生成对应的特征向量;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的特征向量的相似度,并根据设定的特征向量相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。6.根据权利要求1-5任一项所述的方法,其特征在于,根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分,包括:根据对所述多个答案进行相似性聚类分析的结果,将对所述多个答案按照相似度高低分别配置于答案外露层或者答案收起层。7.根据权利要求6所述的方法,其特征在于,还包括:为所述答案外露层与所述答案收起层中的答案配置不同的优先显示级别。8.根据权利要求7所述的方法...

【专利技术属性】
技术研发人员:高雪陈喆焦碧碧李秋豪莫智慧毛书宇王亚军
申请(专利权)人:广州神马移动信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1