【技术实现步骤摘要】
预测应用好评率的方法和装置
本专利技术涉及计算机领域,具体而言,本专利技术涉及一种预测应用好评率的方法和一种预测应用好评率的装置。
技术介绍
随着互联网的发展,移动终端也从传统的数字移动终端发展到了智能移动终端。智能移动终端不仅实现了传统的数字移动终端的所有功能,还通过安装多种应用程序来满足用户的各种需求,如娱乐需求、学习需求、购物需求、办公需求等。为了满足上述用户的各种需求,相应的,安装在智能移动终端的应用程序数量和种类也越来越多;同时,用户还可以自主通过应用商店,获取相应的应用程序的安装包,继而在智能移动终端中进行安装和使用该应用程序。现有技术中,用户一般通过应用商店中对应用程序的推荐,来选取自己需要的应用程序,例如:“首页”应用程序推荐、“游戏页”应用程序推荐。在应用商店对应用程序进行推荐的过程中,应用商店一般是将下载率或点击率最高的应用程序最优先地推荐给用户,但是通过下载率或点击率并不能够准确说明该应用程序的质量就是最优质的;为了保证用户的最优良的应用程序体验度,需要将最优质的应用程序优先推荐给用户;然而如何保证推荐给用户的应用程序的质量是最优质的,是需要解决的问题。
技术实现思路
为克服上述技术问题或者至少部分地解决上述技术问题,特提出以下技术方案:本专利技术的一个实施例提出了一种预测应用好评率的方法,包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于情感词库中的该评论信息的至少 ...
【技术保护点】
一种预测应用好评率的方法,其特征在于,包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于所述分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于所述情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的所述应用好评率预测模型,对待预测应用的评论信息进行好评率预测。
【技术特征摘要】
1.一种预测应用好评率的方法,其特征在于,包括:基于预置分类规则,对各个样本应用的评论信息进行分类;基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率及对应的分类标记信息,并基于所述分频率来提取预置数量的分词以建立情感词库;针对任一评论信息,确定属于所述情感词库中的该评论信息的至少一个分词的词频向量;基于任一评论信息中至少一个分词的词频向量及分类标记信息,训练预置的应用好评率预测模型;基于训练完成的所述应用好评率预测模型,对待预测应用的评论信息进行好评率预测。2.根据权利要求1所述的方法,其中,基于预置分类规则,对各个样本应用的评论信息进行分类的步骤,具体包括:基于预置的分类类型,将各个样本应用的评论信息划分至其各自所属的分类类型;基于划分结果,从各个样本应用的评论信息中选取评论信息正样本和评论信息负样本。3.根据权利要求2所述的方法,其中,基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率的步骤,具体包括:针对评论信息正样本和评论信息负样本中包括的任一分词,确定所述任一分词在评论信息正样本和评论信息负样本中的出现频率;当任一分词在评论信息正样本中的出现频率不小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息正样本中的出现频率与该分词在评论信息负样本中的出现频率的比值;当任一分词在评论信息正样本中的出现频率小于该分词在评论信息负样本中的出现频率,则确定该分词针对各分类的分辨率为,该分词在评论信息负样本中的出现频率与该分词在评论信息正样本中的出现频率的比值。4.根据权利要求3所述的方法,其中,当任一分词在评论信息正样本中的出现频率和/或在评论信息负样本中的出现频率为预定数值时,还包括:基于预定的校准数值,对所述任一分词在评论信息正样本中的出现频率和评论信息负样本中的出现频率进行校准。5.根据权利要求1所述的方法,其中,基于所述分频率,来提取预置数量的分词以建立情感词库的步骤,具体包括:依据分辨率从大到小的顺序对分词进行排序,并提取排序前预定个数的分词。6.根据权利要求1所述的方法,其中,基于训练完成的所述应用好评率预测模型,对待预测应用的评论信息进行好评率预测的步骤,具体包括:基于所述预置分类规则,对待预测应用的评论信息进行分类;基于所述评论信息的分类结果,确定任一评论信息中的各个分词针对各分类的分辨率;针对任一评论信息,确定属于所述情感词库中的该评论信息的至少一个分词的词频向量;将该评论信息的至少一个分词的词频向量输入到训练完成的所述应用好评率预测模型中,确定所述待预测应用的评论信息的好评率;基于所述评论信息的好评率的平均值,确定待测应用的好评率。7.一种预测应用好评率的装置,其特征在...
【专利技术属性】
技术研发人员:潘岸腾,
申请(专利权)人:广州优视网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。