评论观点聚类方法、装置和终端制造方法及图纸

技术编号:20567236 阅读:26 留言:0更新日期:2019-03-14 09:44
本发明专利技术提出一种评论观点聚类方法、装置和终端,所述方法包括:提取用户评论文本中的多条评论观点;将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合;计算每个情感类评论观点集合中的各评论观点之间的语义相似度;根据语义相似度对各评论观点进行聚类,生成评论观点聚类集合。通过对特定产品的评论进行观点提取,并对提取到的评论观点进行聚类展示,可以帮助开发者了解该产品在用户中的口碑,通过对比同一类型不同商品或商家的评论观点信息,可以辅助用户进行消费决策。商家对自己产品的评论观点极性分析监控,可以及时发现用户对产品的评价和舆情信息。具备更好的泛化能力,可以得到更高的准确率和召回率。

【技术实现步骤摘要】
评论观点聚类方法、装置和终端
本专利技术涉及互联网舆情分析
,具体涉及一种评论观点聚类方法、装置和终端。
技术介绍
情感评论观点挖掘旨在提取用户评论中的情感观点信息,基于情感评论观点挖掘可以帮助商家进行产品分析,辅助用户进行消费决策。具体的,对于给定的产品(如商品或服务)的用户评论文本,通过对评论关注维度(如酒店的服务、房间、交通)和评论观点(如不错、简陋、便利)进行自动分析,输出评论观点标签(服务不错,房间简陋、交通方便)以及评论观点极性(好评或差评)。用户评论文本作为一种特殊的文本形式,其情感观点的展现也具备很多特殊性。首先,不同垂类下评论观点多种多样,例如『美食』垂类中用户的评论观点包括“味道不错”、“菜品很好”、“烤鸭好吃”、“鱼汤好喝”、“服务好”、“服务不错”、“前台服务员态度好”等。在“教育”垂类中用户评论常包含“教学质量不错”、“教学质量好”、“教学质量一般”、“老师水平很高”、“孩子成绩提高快”等。其次,特定领域下各个评论观点之间存在语义归一关系,例如“味道不错”、“菜品很好”、“烤鸭好吃”、“鱼汤好喝”都可以归一为观点“味道不错”,“教学质量不错”、“教学质量好”、“孩子成绩提高快”可以归一为“教学质量好”。然而,现有的评论观点聚类的方法,例如,针对固定垂类人工构建评论观点聚类的方法,虽然可以获得较高的准确率,但是需要消耗大量的人工成本。并且人工总结的评论观点聚合关系比较有限,需要标注人员具备较深的领域知识,否则无法实现各个领域之间快速的适应和迁移。例如,基于无监督的聚类方法,不仅依赖人工构建特征,而且最终模型的效果强依赖于特征设计的有效性,最终效果无法很好的满足用户需求。这些方法依赖大量的人工参与以及人工构造特征的有效性。
技术实现思路
本专利技术实施例提供一种评论观点聚类方法、装置和终端,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种评论观点聚类方法,包括:提取用户评论文本中的多条评论观点;将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合;计算每个所述情感类评论观点集合中的各评论观点之间的语义相似度;根据所述语义相似度对各评论观点进行聚类,生成评论观点聚类集合。在一种实施方式中,将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合,包括:对每条所述评论观点进行情感类型判断,使得每条所述评论观点具有对应的情感类型标签,所述情感类型标签包括积极情感标签和消极情感标签;根据所述情感类型标签对各评论观点进行分类,生成积极情感评论观点集合和消极情感评论观点集合。在一种实施方式中,计算每个所述情感类评论观点集合中的各评论观点之间的语义相似度,包括:利用查询评论文本、所述情感类评论观点集合中的相关评论观点以及不相关评论观点训练得到语义相似度模型,所述相关评论观点与所述查询评论文本语义相关,所述不相关评论观点与所述查询评论文本语义不相关;将所述情感类评论观点集合中的各评论观点输入至所述语义相似度模型中,得到评论观点之间的语义相似度。在一种实施方式中,利用查询评论文本、所述情感类评论观点集合中的相关评论观点以及不相关评论观点训练得到语义相似度模型,包括:获取用户输入的所述查询评论文本;在所述情感类评论观点集合中,对所述查询评论文本进行深度语义学习,并根据学习结果构造所述相关评论观点以及所述不相关评论观点;计算所述查询评论文本和所述相关评论观点之间的第一余弦相似度,以及所述查询评论文本和所述不相关评论观点之间的第二余弦相似度;将所述第一余弦相似度和所述第二余弦相似度输入至排序模型中,生成所述语义相似度模型。在一种实施方式中,根据所述语义相似度对所述评论观点进行聚类,生成评论观点聚类集合,包括:将所述语义相似度输入至无监督学习聚类模型中,生成评论观点聚类集合。第二方面,本专利技术提供了一种评论观点聚类装置,包括:评论观点提取模块,用于提取用户评论文本中的多条评论观点;情感分类模块,用于将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合;语义相似度计算模块,用于计算每个所述情感类评论观点集合中的各评论观点之间的语义相似度;聚类模块,用于根据所述语义相似度对各评论观点进行聚类,生成评论观点聚类集合。在一种实施方式中,所述情感分类模块包括:情感类型判断单元,用于对每条所述评论观点进行情感类型判断,使得每条所述评论观点具有对应的情感类型标签,所述情感类型标签包括积极情感标签和消极情感标签;情感类型分类单元,用于根据所述情感类型标签对各评论观点进行分类,生成积极情感评论观点集合和消极情感评论观点集合。在一种实施方式中,所述语义相似度计算模块包括:语义相似度模型训练单元,用于利用查询评论文本、所述情感类评论观点集合中的相关评论观点以及不相关评论观点训练得到语义相似度模型,所述相关评论观点与所述查询评论文本语义相关,所述不相关评论观点与所述查询评论文本语义不相关;语义相似度预测单元,用于将所述情感类评论观点集合中的各评论观点输入至所述语义相似度模型中,得到评论观点之间的语义相似度。第三方面,本专利技术实施例提供了一种评论观点聚类终端,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,评论观点聚类终端的结构中包括处理器和存储器,所述存储器用于存储支持评论观点聚类终端执行上述第一方面中评论观点聚类方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述评论观点聚类终端还可以包括通信接口,用于评论观点聚类终端与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储评论观点聚类装置所用的计算机软件指令,其包括用于执行上述第一方面中评论观点聚类方法为评论观点聚类装置所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:利用情感分类模型将评论观点初步分成多情感类评论观点集合,在每个情感类评论观点集合内,计算评论观点之间的语义相似度,利用语义相关性进行进一步聚类。通过对特定产品的评论进行观点提取,并对提取到的评论观点进行聚类展示,可以帮助开发者了解该产品在用户中的口碑,通过对比同一类型不同商品或商家的评论观点信息,可以辅助用户进行消费决策。商家对自己产品的评论观点极性分析监控,可以及时发现用户对产品的评价和舆情信息。具备更好的泛化能力,可以得到更高的准确率和召回率。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为本专利技术实施例提供的一种评论观点聚类方法流程图;图2为本专利技术实施例提供的一种评论观点聚类方法示意图;图3为本专利技术实施例提供的另一种评论观点聚类方法流程图;图4为本专利技术实施例提供的一种情感分类方法示意图;图5为本专利技术实施例提供的一种语义相似度模型训练方法流程图;图6为本专利技术实施例提本文档来自技高网
...

【技术保护点】
1.一种评论观点聚类方法,其特征在于,包括:提取用户评论文本中的多条评论观点;将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合;计算每个所述情感类评论观点集合中的各评论观点之间的语义相似度;根据所述语义相似度对各评论观点进行聚类,生成评论观点聚类集合。

【技术特征摘要】
1.一种评论观点聚类方法,其特征在于,包括:提取用户评论文本中的多条评论观点;将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合;计算每个所述情感类评论观点集合中的各评论观点之间的语义相似度;根据所述语义相似度对各评论观点进行聚类,生成评论观点聚类集合。2.如权利要求1所述的方法,其特征在于,将多条评论观点输入至情感分类模型中,输出多个情感类评论观点集合,包括:对每条所述评论观点进行情感类型判断,使得每条所述评论观点具有对应的情感类型标签,所述情感类型标签包括积极情感标签和消极情感标签;根据所述情感类型标签对各评论观点进行分类,生成积极情感评论观点集合和消极情感评论观点集合。3.如权利要求1所述的方法,其特征在于,计算每个所述情感类评论观点集合中的各评论观点之间的语义相似度,包括:利用查询评论文本、所述情感类评论观点集合中的相关评论观点以及不相关评论观点训练得到语义相似度模型,所述相关评论观点与所述查询评论文本语义相关,所述不相关评论观点与所述查询评论文本语义不相关;将所述情感类评论观点集合中的各评论观点输入至所述语义相似度模型中,得到评论观点之间的语义相似度。4.如权利要求3所述的方法,其特征在于,利用查询评论文本、所述情感类评论观点集合中的相关评论观点以及不相关评论观点训练得到语义相似度模型,包括:获取用户输入的所述查询评论文本;在所述情感类评论观点集合中,对所述查询评论文本进行深度语义学习,并根据学习结果构造所述相关评论观点以及所述不相关评论观点;计算所述查询评论文本和所述相关评论观点之间的第一余弦相似度,以及所述查询评论文本和所述不相关评论观点之间的第二余弦相似度;将所述第一余弦相似度和所述第二余弦相似度输入至排序模型中,生成所述语义相似度模型。5.如权利要求1所述的方法,其特征在于,根...

【专利技术属性】
技术研发人员:刘昊何伯磊肖欣延吕雅娟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1