This application discloses an answer clustering method and its device, electronic equipment and computer readable media. The answer clustering method includes: obtaining multiple answers to the same question in an intelligent question answering community; carrying out similarity clustering analysis for the multiple answers to the same question according to the set clustering rules; and carrying out similarity clustering analysis for the multiple answers according to the similarity clustering analysis for the multiple answers. As a result, the multiple answers were hierarchically divided. This example realizes clustering analysis for the same or similar problems, avoiding duplication and redundancy of answers in intelligent question answering community.
【技术实现步骤摘要】
答案聚类方法及其装置、电子设备、计算机可读介质
本申请涉及互联网领域,尤其涉及一种答案聚类方法及其装置、电子设备、计算机可读介质。
技术介绍
通过问题和对该问题的回答是人们获取现实世界信息的一种有效方式。与此同时,随着互联网技术的发展及互联网应用的快速发展,人们越来越多地依赖于互联网网络获取信息。目前通过搜索平台搜索相关的信息来实现该通过问答方式获取信息,尤其在问答社区内搜索问题、提出问题、回答问题、浏览问题或追加问题等,这已成为用户间进行互动信息交流的重要方式。其中,常见的智能问答社区有百度知道、搜搜问问、新浪爱问等。但是,现有技术中,针对相同或者相似的问题,存在大量相似的答案,由此导致智能问答社区中提供的答案存在大量重复,甚至冗余。
技术实现思路
本申请的目的在于提出一种答案聚类方法及其装置、电子设备、计算机可读介质,用于解决现有技术中上述技术问题。第一方面,本申请实施例提供一种答案聚类方法,其包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。可选地,本申请的任一实施例中,所述答案聚类方法还包括:对每一个所述答案进行语义分析提取其中的实体关键词;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的实体关键词相似度,并根据设定的实体关键词相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。可选地,本申请的任一实施例中,所述答案聚类方法还包括:对所述实体关键词 ...
【技术保护点】
1.一种答案聚类方法,其特征在于,包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。
【技术特征摘要】
1.一种答案聚类方法,其特征在于,包括:获取智能问答社区中针对同一问题的多个答案;根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析;根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分。2.根据权利要求1所述的方法,其特征在于,还包括:对每一个所述答案进行语义分析提取其中的实体关键词;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的实体关键词相似度,并根据设定的实体关键词相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。3.根据权利要求1所述的方法,其特征在于,还包括:对所述实体关键词进行类别属性划分;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的类别属性相似度,并根据设定的类别属性相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。4.根据权利要求1所述的方法,其特征在于,还包括:获取关联与多个所述答案的多个问题;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计关联与多个所述答案的多个问题的相似度,并根据设定的问题相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。5.根据权利要求1所述的方法,其特征在于,还包括:对多个所述答案分别进行解析以生成对应的特征向量;对应地,根据设定的聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析,包括:统计所述多个答案的特征向量的相似度,并根据设定的特征向量相似度聚类规则,对所述针对同一个问题的多个答案进行相似性聚类分析。6.根据权利要求1-5任一项所述的方法,其特征在于,根据对所述多个答案进行相似性聚类分析的结果,对所述多个答案进行层级划分,包括:根据对所述多个答案进行相似性聚类分析的结果,将对所述多个答案按照相似度高低分别配置于答案外露层或者答案收起层。7.根据权利要求6所述的方法,其特征在于,还包括:为所述答案外露层与所述答案收起层中的答案配置不同的优先显示级别。8.根据权利要求7所述的方法...
【专利技术属性】
技术研发人员:高雪,陈喆,焦碧碧,李秋豪,莫智慧,毛书宇,王亚军,
申请(专利权)人:广州神马移动信息科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。