预测应用好评率的方法和装置制造方法及图纸

技术编号:16154298 阅读:37 留言:0更新日期:2017-09-06 19:01
本发明专利技术提供了预测应用好评率的方法和装置,该方法包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的应用好评率预测模型,对待预测应用的评论信息进行好评率预测。本技术方案可确定待测应用程序的质量,并根据各个应用程序的质量为用户准确地推荐质量好的应用程序提供了有效地参考依据。

【技术实现步骤摘要】
预测应用好评率的方法和装置
本专利技术涉及计算机领域,具体而言,本专利技术涉及一种预测应用好评率的方法和一种预测应用好评率的装置。
技术介绍
随着互联网的发展,移动终端也从传统的数字移动终端发展到了智能移动终端。智能移动终端不仅实现了传统的数字移动终端的所有功能,还通过安装多种应用程序来满足用户的各种需求,如娱乐需求、学习需求、购物需求、办公需求等。为了满足上述用户的各种需求,相应的,安装在智能移动终端的应用程序数量和种类也越来越多;同时,用户还可以自主通过应用商店,获取相应的应用程序的安装包,继而在智能移动终端中进行安装和使用该应用程序。现有技术中,用户一般通过应用商店中对应用程序的推荐,来选取自己需要的应用程序,例如:“首页”应用程序推荐、“游戏页”应用程序推荐。在应用商店对应用程序进行推荐的过程中,应用商店一般是将下载率或点击率最高的应用程序最优先地推荐给用户,但是通过下载率或点击率并不能够准确说明该应用程序的质量就是最优质的;为了保证用户的最优良的应用程序体验度,需要将最优质的应用程序优先推荐给用户;然而如何保证推荐给用户的应用程序的质量是最优质的,是需要解决的问题。
技术实现思路
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:本专利技术的一个实施例提出了一种预测应用好评率的方法,包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的应用好评率预测模型,对待预测应用的评论信息进行好评率预测。优选地,基于预置分类规则,对各个样本应用的评论信息进行分类的步骤,具体包括:基于预置的分类类型,将各个样本应用的评论信息划分至其各自所属的分类类型;基于划分结果,从各个样本应用的评论信息中选取评论信息正样本和评论信息负样本。优选地,基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率的步骤,具体包括:针对评论信息正样本和评论信息负样本中包括的任一分词,确定任一分词在评论信息正样本和评论信息负样本中的出现频率;当任一分词在评论信息正样本中的出现频率不小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息正样本中的出现频率与该分词在评论信息负样本中的出现频率的比值;当任一分词在评论信息正样本中的出现频率小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息负样本中的出现频率与该分词在评论信息正样本中的出现频率的比值。优选地,当任一分词在评论信息正样本中的出现频率和/或在评论信息负样本中的出现频率为预定数值时,还包括:基于预定的校准数值,对任一分词在评论信息正样本中的出现频率和评论信息负样本中的出现频率进行校准。优选地,基于分频率,来提取预置数量的分词以建立情感词库的步骤,具体包括:依据分辨率从大到小的顺序对分词进行排序,并提取排序前预定个数的分词。优选地,基于训练完成的应用好评率预测模型,对待预测应用的评论信息进行好评率预测的步骤,具体包括:基于预置分类规则,对待预测应用的评论信息进行分类;基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率;针对任一评论信息,确定属于情感词库中的该评论信息的至少一个分词的词频向量;将该评论信息的至少一个分词的词频向量输入到训练完成的应用好评率预测模型中,确定待预测应用的评论信息的好评率;基于评论信息的好评率的平均值,确定待测应用的好评率。本专利技术的另一个实施例提出了一种预测应用好评率的装置,包括:分类模块,用于基于预置分类规则,对各个样本应用的评论信息进行分类;情感词库建立模块,用于基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于分频率来提取预置数量的分词以建立情感词库;词频向量确定模块,用于针对任一评论信息,确定属于情感词库中的该评论信息的至少一个分词的词频向量;训练模块,用于基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;预测模块,用于基于训练完成的应用好评率预测模型,对待预测应用的评论信息进行好评率预测。优选地,分类模块包括:划分单元,用于基于预置的分类类型,将各个样本应用的评论信息划分至其各自所属的分类类型;选取单元,用于基于划分结果,从各个样本应用的评论信息中选取评论信息正样本和评论信息负样本。优选地,情感词库建立模块包括:第一确定单元,用于针对评论信息正样本和评论信息负样本中包括的任一分词,确定任一分词在评论信息正样本和评论信息负样本中的出现频率;第二确定单元,用于当任一分词在评论信息正样本中的出现频率不小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息正样本中的出现频率与该分词在评论信息负样本中的出现频率的比值;第三确定单元,用于当任一分词在评论信息正样本中的出现频率小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息负样本中的出现频率与该分词在评论信息正样本中的出现频率的比值。优选地,当任一分词在评论信息正样本中的出现频率和/或在评论信息负样本中的出现频率为预定数值时,情感词库建立模块还包括:校准单元,用于基于预定的校准数值,对任一分词在评论信息正样本中的出现频率和评论信息负样本中的出现频率进行校准。优选地,情感词库建立模块还包括:提取单元,用于依据分辨率从大到小的顺序对分词进行排序,并提取排序前预定个数的分词。优选地,预测模块包括:分类单元,用于基于预置分类规则,对待预测应用的评论信息进行分类;第四确定单元,用于基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率;第五确定单元,用于针对任一评论信息,确定属于情感词库中的该评论信息的至少一个分词的词频向量;第六确定单元,用于将该评论信息的至少一个分词的词频向量输入到训练完成的应用好评率预测模型中,确定待预测应用的评论信息的好评率;第七确定单元,用于基于评论信息的好评率的平均值,确定待测应用的好评率。本专利技术的技术方案中,对各个样本应用的评论信息进行分类;从而基于分类结果来确定任一评论信息中的各个分词针对各分类的分辨率,并基于分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的应用好评率预测模型,对待预测应用的评论信息进行好评率预测;继而可确定待测应用程序的质量,并根据各个应用程序的质量为用户准确地推荐质量好的应用程序提供了有效地参考依据,进而最终能够实现为用户提供优良的推荐服务,大大提高用户的应用程序体验度的目的。本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上本文档来自技高网...
预测应用好评率的方法和装置

【技术保护点】
一种预测应用好评率的方法,其特征在于,包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于所述分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于所述情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的所述应用好评率预测模型,对待预测应用的评论信息进行好评率预测。

【技术特征摘要】
1.一种预测应用好评率的方法,其特征在于,包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于所述分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于所述情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的所述应用好评率预测模型,对待预测应用的评论信息进行好评率预测。2.根据权利要求1所述的方法,其中,基于预置分类规则,对各个样本应用的评论信息进行分类的步骤,具体包括:基于预置的分类类型,将各个样本应用的评论信息划分至其各自所属的分类类型;基于划分结果,从各个样本应用的评论信息中选取评论信息正样本和评论信息负样本。3.根据权利要求2所述的方法,其中,基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率的步骤,具体包括:针对评论信息正样本和评论信息负样本中包括的任一分词,确定所述任一分词在评论信息正样本和评论信息负样本中的出现频率;当任一分词在评论信息正样本中的出现频率不小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息正样本中的出现频率与该分词在评论信息负样本中的出现频率的比值;当任一分词在评论信息正样本中的出现频率小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息负样本中的出现频率与该分词在评论信息正样本中的出现频率的比值。4.根据权利要求3所述的方法,其中,当任一分词在评论信息正样本中的出现频率和/或在评论信息负样本中的出现频率为预定数值时,还包括:基于预定的校准数值,对所述任一分词在评论信息正样本中的出现频率和评论信息负样本中的出现频率进行校准。5.根据权利要求1所述的方法,其中,基于所述分频率,来提取预置数量的分词以建立情感词库的步骤,具体包括:依据分辨率从大到小的顺序对分词进行排序,并提取排序前预定个数的分词。6.根据权利要求1所述的方法,其中,基于训练完成的所述应用好评率预测模型,对待预测应用的评论信息进行好评率预测的步骤,具体包括:基于所述预置分类规则,对待预测应用的评论信息进行分类;基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率;针对任一评论信息,确定属于所述情感词库中的该评论信息的至少一个分词的词频向量;将该评论信息的至少一个分词的词频向量输入到训练完成的所述应用好评率预测模型中,确定所述待预测应用的评论信息的好评率;基于所述评论信息的好评率的平均值,确定待测应用的好评率。7.一种预测应用好评率的装置,其特征在...

【专利技术属性】
技术研发人员:潘岸腾
申请(专利权)人:广州优视网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1