【技术实现步骤摘要】
本专利技术涉及一种兼顾多样性和有效性的评论排序和筛选方法,属于计算机应用
技术介绍
评论数据(Review Data)是一种发布在互联网上,表达评论目标某些特征方面状况和自己对评价目标情感的数据。围绕同一个评论目标的评论文本构成了评论数据集,在展示评论数据集时多采用列表的方式。传统的排序方法大多是基于评论文本的某一项属性进行排序,例如按照评论发表的时间先后顺序、按照评论的点赞数排序、按照评论人的用户级别等。这类方法的排序对象之间仅存在排序属性上的次序关系,而这些排序属性是符合用户思路或者产品需求的,对评论文本排序具有良好的效果。但是,评论文本是用户对评论目标基于自身认识而发表的个人意见性文本,评论中包含了对评论目标的使用感受、情感和特征描述等内容,对于其他用户具有参考价值,评论内容的有效性也是影响评论排序的关键因素。此外,不同用户发表的评论文本在描述评价对象时的侧重点不同,围绕评论目标进行全方位的评论文本展示具有很重要的作用。因此,传统基于单一排序属性的方法不适合对评论文本列表进行排序。目前,在已有文献中,还未有兼顾多个特征的评论排序和筛选方法的相关记载。
技术实现思路
本专利技术的目的是提出一种兼顾多样性和有效性的评论排序和筛选方法。该方法能够筛选出比依赖单一排序属性方法更加符合人类需求的排序结果。本专利技术的目的是通过下述技术方案实现的。本专利技术的一种兼顾多样性和有效性的评论排序和筛选方法,其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集。步骤1.1:采用词性标注工具对评论进行标注。步骤1.2:对待排序评论集中的名词出现次数进行 ...
【技术保护点】
一种兼顾多样性和有效性的评论排序和筛选方法,其特征在于:其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集;步骤1.1:采用词性标注工具对评论进行标注;步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数的名词构成评价目标的特征集;步骤二、依次对待排序评论集中的每一条评论进行处理,得到每条评论中涉及的特征数;步骤三、对待排序评论集根据特征进行聚类,使每条评论归属到一个特征类别中;步骤四、在每个聚类中,按照评论涉及的评论数由高到低的顺序,对该聚类中的评论进行排序;步骤五、设定选取数量为m,从每个聚类中选取前条评论,其中,n为聚类数;然后,将选取出来的条评论,按照评论涉及的评论数由高到低的顺序重新排序并展示;经过上述步骤的操作,即兼顾多样性和有效性,对待评论集评论中的评论进行排序和筛选。
【技术特征摘要】
2016.04.15 CN 20161023569461.一种兼顾多样性和有效性的评论排序和筛选方法,其特征在于:其具体操作步骤为:步骤一、从待排序评论集中提取评论目标的特征集;步骤1.1:采用词性标注工具对评论进行标注;步骤1.2:对待排序评论集中的名词出现次数进行统计,利用出现次数大于频次中位数的名词构成评价目标的特征集;步骤二、依次对待排序评论集中的每一条评...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。