一种兼顾多样性和有效性的评论排序和筛选方法技术

技术编号:13732622 阅读:60 留言:0更新日期:2016-09-21 14:19
本发明专利技术涉及一种兼顾多样性和有效性的评论排序和筛选方法,具体为:①从待排序评论集中提取评论目标的特征集。②依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征数。③对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中。④在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进行排序。⑤设定选取数量为m,从每个聚类中选取前n为聚类数。然后,将选取出来的条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示。本发明专利技术方法使评论列表排序效果更符合人类认知,能够优先输出对其他用户更有帮助的列表排序,而且兼顾评论内容的全面性。

【技术实现步骤摘要】

本专利技术涉及一种兼顾多样性和有效性的评论排序和筛选方法,属于计算机应用

技术介绍
评论数据(Review Data)是一种发布在互联网上,表达评论目标某些特征方面状况和自己对评价目标情感的数据。围绕同一个评论目标的评论文本构成了评论数据集,在展示评论数据集时多采用列表的方式。传统的排序方法大多是基于评论文本的某一项属性进行排序,例如按照评论发表的时间先后顺序、按照评论的点赞数排序、按照评论人的用户级别等。这类方法的排序对象之间仅存在排序属性上的次序关系,而这些排序属性是符合用户思路或者产品需求的,对评论文本排序具有良好的效果。但是,评论文本是用户对评论目标基于自身认识而发表的个人意见性文本,评论中包含了对评论目标的使用感受、情感和特征描述等内容,对于其他用户具有参考价值,评论内容的有效性也是影响评论排序的关键因素。此外,不同用户发表的评论文本在描述评价对象时的侧重点不同,围绕评论目标进行全方位的评论文本展示具有很重要的作用。因此,传统基于单一排序属性的方法不适合对评论文本列表进行排序。目前,在已有文献中,还未有兼顾多个特征的评论排序和筛选方法的相关记载。
技术实现思路
本专利技术的目的是提出一种兼顾多样性和有效性的评论排序和筛选方法。该方法能够筛选出比依赖单一排序属性方法更加符合人类需求的排序结果。本专利技术的目的是通过下述技术方案实现的。本专利技术的一种兼顾多样性和有效性的评论排序和筛选方法,其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集。步骤1.1:采用词性标注工具对评论进行标注。步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数的名词构成评价目标的特征集。步骤二、依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征数。步骤三、对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中。步骤四、在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进行排序。步骤五、设定选取数量为m,从每个聚类中选取前条评论,其中,n为聚类数。然后,将选取出来的条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示。经过上述步骤的操作,即兼顾多样性和有效性,对待评论集评论中的评论进行排序和筛选。有益效果本专利技术提出的兼顾多样性和有效性的评论排序和筛选方法与已有技术相比较,本专利技术方法使评论列表排序效果更符合人类认知,能够优先输出对其他用户更有帮助的列表排序,节省用户寻找有用评论的时间,并且兼顾评论内容的全面性,便于用户全面了解目标以及其他用户对于该目标的观点。具体实施方式下面结合附图和具体实施例对本专利技术技术方案做进一步描述。本实施例使用兼顾多样性和有效性的评论排序和筛选方法对一个企业评论集进行排序和筛选,其操作流程如图1所示,其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集。待排序评论集是A公司员工对本公司的260条评论,获取特征集的方法为:步骤1.1:采用词性标注工具对评论进行标注。步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数的名词构成评价目标的特征集。经过该步骤的操作,得到的特征集为:{员工待遇、加班情况、伙食、出差补助、管理方式、开会次数、面试难度、工作压力、名气本文档来自技高网...

【技术保护点】
一种兼顾多样性和有效性的评论排序和筛选方法,其特征在于:其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集;步骤1.1:采用词性标注工具对评论进行标注;步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数的名词构成评价目标的特征集;步骤二、依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征数;步骤三、对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中;步骤四、在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进行排序;步骤五、设定选取数量为m,从每个聚类中选取前条评论,其中,n为聚类数;然后,将选取出来的条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示;经过上述步骤的操作,即兼顾多样性和有效性,对待评论集评论中的评论进行排序和筛选。

【技术特征摘要】
2016.04.15 CN 20161023569461.一种兼顾多样性和有效性的评论排序和筛选方法,其特征在于:其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集;步骤1.1:采用词性标注工具对评论进行标注;步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数的名词构成评价目标的特征集;步骤二、依次对待排序评论集中的每一条评...

【专利技术属性】
技术研发人员:牛振东陈杰
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1