【技术实现步骤摘要】
一种个性化推荐方法、装置、计算机设备及存储介质
本专利技术实施例涉及数据挖掘
,尤其涉及一种个性化推荐方法、装置、计算机设备及存储介质。
技术介绍
随着科技的进步,人工智能领域相关技术飞速发展,信息化和智能化将成为互联网时代的主要标志,互联网的快速发展也随之引发信息量巨大且以指数级的快速增长等问题。对于互联网所面临的挑战——信息过载,推荐算法恰好可以在一定程度上解决这个问题,且目前已经被广泛地应用于多个领域。例如用户在网上购物时,商家根据用户的浏览记录和购买记录向用户推荐其感兴趣的商品。但是,用户需求通常具有不确定性和模糊性,因此优秀的推荐算法具有非常高的研究和应用价值。目前比较流行的推荐算法是协同过滤(CollaborativeFiltering,CF)推荐算法。CF的基本思想是根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐感兴趣的物品。以分类为基础的推荐算法包括支持向量机(SVM)算法、朴素贝叶斯算法、自适应提升(AdaBoost)算法和随机森林(RandomForest)算法等。但是现 ...
【技术保护点】
1.一种个性化推荐方法,其特征在于,包括:/n通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集;/n通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象;/n通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。/n
【技术特征摘要】
1.一种个性化推荐方法,其特征在于,包括:
通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集;
通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象;
通过协同过滤推荐算法对所述目标推荐对象进行TopN推荐。
2.根据权利要求1所述的方法,其特征在于,所述预设聚类算法为改进的K均值K-means聚类算法;
所述通过预设聚类算法对原始样本数据集进行聚类处理,得到目标数据集,包括:
在所述原始样本数据集中随机选取k个对象作为初始聚类中心;
将所述原始样本数据集中的样本按照最小距离原则分配到最近的初始聚类中心,得到聚类结果;
根据所述聚类结果重新计算k个聚类中心,作为待处理聚类中心;
对所述待处理聚类中心进行样本细化处理,得到目标聚类中心;
返回执行将所述原始样本数据集中的样本按照最小距离原则分配到最近的初始聚类中心的操作,直至所述目标聚类中心不再发生变化;
根据所述目标聚类中心形成所述目标数据集。
3.根据权利要求2所述的方法,其特征在于,所述对所述待处理聚类中心进行样本细化处理,包括:
当所述待处理聚类中心中待处理类别的样本数少于第一阈值时,删除所述待处理类别;
当所述待处理聚类中心中待处理类别的样本数大于第二阈值时,将距离所述待处理类别对应的待处理聚类中心最近的设定数据的样本作为新的聚类中心。
4.根据权利要求1-3任一所述的方法,其特征在于,所述通过优化的随机森林算法对所述目标数据集进行分类处理,得到目标推荐对象,包括:
对所述目标数据集进行数据预处理,得到训练集和测试集;
根据所述训练集构造至少一个目标决策树;
对所述目标决策树采用果蝇优化算法进行参数优化,得到目标参数;
根据所述目标参数构建目标模型,并根据所述目标模型和所述测试集进行预测,得到所述目标推荐对象。
5.根据权利要求4所述的方法,其特征在于,所述...
【专利技术属性】
技术研发人员:陈录城,张俊普,孙兆群,汪洪涛,刘希军,王浩宇,
申请(专利权)人:海尔数字科技上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。