一种基于聚类的移动应用下载量预测方法技术

技术编号：11904934 阅读：86 留言：0更新日期：2015-08-19 17:53

本发明专利技术提供一种基于聚类的移动应用下载量预测方法，包括：1)从后台数据中收集所有已知的app的历史数据，2)源数据处理，3)模式聚类，下载量预测。本发明专利技术创新性地进行app下载量预测，在app领域需求明显，并且具有良好拓展性，在其他电商领域具有十分广泛的应用前景，并且，本发明专利技术在考虑app下载曲线特性的基础上修改K-means算法，并优化求解效率。整个聚类过程可以在线下完成，而下载量的预测值计算在线上完成，优化了用户体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于移动互联网应用领域。主要利用了余弦相似度与K中心聚类方法，实现了一种针对移动应用（app)下载量的预测机制。
技术介绍
随着移动互联网大潮的到来，近年来移动应用（app)蓬勃发展，以谷歌市场为例 (GooglePlay)目前其app数目已超过100万，而累计下载量则超过500亿。不论android 还是ios的app应用市场，其网页或者应用端的展示页面都十分有限制，而大部分的app得不到有效的展示。工业界将传统电商中的推荐机制逐渐引入到app领域，以此作为用户发现感兴趣优质app的一种途径，同时也是一部分欠热门优质app曝光的有效途径。但目前没有一种对潜在的优质app的发掘方法。
技术实现思路
本专利技术所要解决的技术问题是提供，能够根据app的已知下载量对其后一段时间的总下载量进行预测。本专利技术解决技术问题所采用的技术方案是：一种基于聚类的移动应用下载量预测方法，包括以下步骤： 1)从后台数据中收集所有已知的app的历史数据。 2)源数据处理，对步骤1)中的数据进行处理，生成长度为L的离散时间序列X以表示每一个app的下载曲线，至此所有app的下载曲线组成一个离散时间序列训练数据集； 3)模式聚类，将步骤2)中生成的离散时间序列数据集进行聚类，得到k个下载模式； 4)下载量预测，给定一个app在m天内的下载曲线，与k个下载模式进行匹配，计算之后（L-m)天的总下载量，得到预测结果。在采用上述技术方案的同时，本专利技术还可以采用或者组合采用以下进一步的技术方案：所述步骤2)具体包括以下步骤： (1...

【技术保护点】
一种基于聚类的移动应用下载量预测方法，其特征在于：所述方法包括以下步骤：1)从后台数据中收集所有已知的app的历史数据。2)源数据处理，对步骤1)中的数据进行处理，生成长度为L的离散时间序列x以表示每一个app的下载曲线，至此所有app的下载曲线组成一个离散时间序列训练数据集；3)模式聚类，将步骤2)中生成的离散时间序列数据集进行聚类，得到k个下载模式；4)下载量预测，给定一个app在m天内的下载曲线，与k个下载模式进行匹配，计算之后(L‑m)天的总下载量，得到预测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：吴健，邱奇波，陈亮，邓水光，李莹，尹建伟，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人