当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于多目标进化算法的个性化商品推荐方法技术

技术编号:20845180 阅读:32 留言:0更新日期:2019-04-13 09:00
本发明专利技术公开了一种基于多目标进化算法的个性化商品推荐方法,包括:按照预设比例将多类数据集分成多类训练集与测试集,再将多类训练集以一对多方式分成若干个二类训练子集;对多目标种群进行初始化,并对二类训练子集进行二进制编码得到N个个体;将N个个体体进行多目标迭代得到pareto前沿面;将pareto前沿面上AUC值最大的个体对应的SVM分类器作为预测模型;根据模型改进策略对预测模型进行改进,得到目标预测模型;根据目标预测模型对测试集进行预测,根据测试集中每个样本的AUC值对测试集中每个样本进行分类,得到测试集中每个样本的类别。

【技术实现步骤摘要】
一种基于多目标进化算法的个性化商品推荐方法
本专利技术涉及是商品推荐
,尤其涉及一种基于多目标进化算法的个性化商品推荐方法。
技术介绍
当今社会日新月异,科学技术的不断发展使人们的生活更加便利,人们可以很便利地从各个渠道获取商品资源信息并购买想要的商品,同时大量的商品信息又容易造成客户选择困难;如何有效对海量商品资源进行检索和访问,商品推荐就变得非常重要。目前个性化商品推荐方法的应用非常广泛,特别在电子商务领域,呈现出良好情景。对于大多数客户来说,他们想要的商品资源信息是他们所需要的,所感兴趣的;而目前的现状是自主经营的电商平台拥有较为丰富的商品类目及商品,但缺少用户量,同时积累的用户历史行为数据也相对较少,而且没有办法获取用户更多维度的信息,这就导致电商无法有效根据客户以往购买或者历史查询商品信息来构建一种有效对客户推荐商品的方法,因此急需要一种高效的个性化商品推进方法来解决上述问题。
技术实现思路
基于
技术介绍
存在的技术问题,本专利技术提出了一种基于多目标进化算法的个性化商品推荐方法;本专利技术提出的一种基于多目标进化算法的个性化商品推荐方法,包括:S1、按照预设比例将多类数据集分成多类训练集与测试集,再将多类训练集以一对多方式分成若干个二类训练子集;S2、对多目标种群进行初始化,并对二类训练子集进行二进制编码得到N个个体;S3、将N个个体体进行多目标迭代得到pareto前沿面;S4、将pareto前沿面上AUC值最大的个体对应的SVM分类器作为预测模型;S5、根据模型改进策略对预测模型进行改进,得到目标预测模型;S6、根据目标预测模型对测试集进行预测,根据测试集中每个样本的AUC值对测试集中每个样本进行分类,得到测试集中每个样本的类别,根据每个样本的类别确定每个样本对应的商品种类。优选地,步骤S2,具体包括:S21、对二类训练子集中的样本进行二进制编码,得到一组长度为二类训练子集样本数相同的01字符串,0表示选取该训练样本,1表示不选取该训练样本,将得到的二进制字符串记为一个个体;S22、重复执行步骤S21,直到得到N个个体。优选地,步骤S3,具体包括:S31、将N个个体作为父代进入多目标种群迭代过程,并计算每个个体的TPR与FPR,TPR=TP/(TP+FN),FPR=FP/(FP+TN),其中,TP表示正样本被正确分类成正类样本的个数,FN表示负样本被错误分类成正类样本的个数,FP表示正样本被错误分类成负类样本的个数,TN表示负样本被正确分类成负类样本的个数;S32、根据TPR与FPR计算拥挤距离和适应度值,并产生子代个体;S33、将父代与子代合并进入第一次迭代,并通过精英机制选出新的子代且作为下一次迭代中的父代;S34、重复步骤S31至步骤S33,直到迭代次数达到预设的最大迭代数,得到pareto前沿面,所述pareto前沿面表示一组非支配的个体,每个个体为一组二进制字符串。优选地,步骤S4,具体包括:S41、选取pareto前沿面上的所有个体所对应的训练样本,然后利用线性SVM训练训练样本,得到每个个体的分类器,根据各个体的分类器计算各个体的AUC值;S42、选取各个体的AUC值中AUC值最大的个体对应的SVM分类器作为预测模型。优选地,步骤S5,具体包括:S51、将预测模型对应的AUC值与预设的阈值进行比较,若预测模型对应的AUC值小于阈值时,执行步骤S52;否则,将预测模型作为目标预测模型;S52、选取pareto前沿面上AUC值最大的个体对应的训练样本,然后将该训练样本中多数类样本进行欠采样技术,并与少数类样本进行合并后训练得到新的SVM分类器,并计算得到新的AUC值;;S53、重复执行步骤S52,直到得到N个新SVM分类器与对应的AUC值;S54、将N个AUC值中最大值的与预测模型对应的AUC值进行比较,选取二者中较大AUC值对应的SVM分类器作为目标预测模型。本专利技术利用多目标进化算法能够快速实时的识别出当前的商品种类,同时随着多目标迭代过程的不断深入其对商品种类的识别率将越来越高,然后对商品进行针对性的个性化推荐操作,相对于此前的其他商品推荐方法更加高效,从而使得商品推荐的过程更加方便快捷,其次,只针对用户比较感兴趣的商品进行推荐,提高了商品推荐的有效率,进而减少了用户选择感兴趣商品的花费时间,有利于不同人群在最短时间内获取自己想要的商品种类,进一步的,在训练样本选择过程中,使用二进制进行样本编码,从而可以产生具有一定差异性的个体,从而保证了每一次的迭代过程都会有优异的预测模型产生,使用多目标进行迭代处理,每次从父代个体中产生新的子代个体,并与父代合并进行下一代进化,不仅可以保留父代中优异的解,同时也可以通过父代优异的解产生更优异的子代的解,从而得到分类效果很好的分类器,因此比较适用于商品推荐的场景,最后,在商品推荐预测模型的选择过程中,引入阈值进行判断,对小于阈值的预测模型进行模型改进,提高了性能较差的某些类的预测模型,进而提高分类精度。附图说明图1为本专利技术提出的一种基于多目标进化算法的个性化商品推荐方法的流程示意图。具体实施方式参照图1,本专利技术提出的一种基于多目标进化算法的个性化商品推荐方法,包括:步骤S1,按照预设比例将多类数据集分成多类训练集与测试集,再将多类训练集以一对多方式分成若干个二类训练子集。在具体方案中,按照预设比例将多类数据集分成多类训练集与测试集,如:将80%的多类数据集划分为多类训练集,将20%的多类数据集划分为测试集,目的是将多类问题间接转化为二类问题进行解决,这样可以节省训练分类器时间,同时也可以将问题简化。步骤S2,对多目标种群进行初始化,并对二类训练子集进行二进制编码得到N个个体。本步骤具体包括:S21、对二类训练子集中的样本进行二进制编码,得到一组长度为二类训练子集样本数相同的01字符串,0表示选取该训练样本,1表示不选取该训练样本,将得到的二进制字符串记为一个个体;S22、重复执行步骤S21,直到得到N个个体。在具体方案中,选用部分的训练样本进行训练得到不同的学习分类器,使得分类器间具有一定的差异性,提高分类精度。步骤S3,将N个个体体进行多目标迭代得到pareto前沿面。本步骤具体包括:S31、将N个个体作为父代进入多目标种群迭代过程,并计算每个个体的TPR与FPR,TPR=TP/(TP+FN),FPR=FP/(FP+TN),其中,TP表示正样本被正确分类成正类样本的个数,FN表示负样本被错误分类成正类样本的个数,FP表示正样本被错误分类成负类样本的个数,TN表示负样本被正确分类成负类样本的个数;S32、根据TPR与FPR计算拥挤距离和适应度值,并产生子代个体;S33、将父代与子代合并进入第一次迭代,并通过精英机制选出新的子代且作为下一次迭代中的父代;S34、重复步骤S31至步骤S33,直到迭代次数达到预设的最大迭代数,得到pareto前沿面,所述pareto前沿面表示一组非支配的个体,每个个体为一组二进制字符串。在具体方案中,利用多目标迭代方法来获得一组非支配解,这不仅可以从迭代过程中产生新的好个体,也可以从迭代后筛选得到一组最好的个体,这些个体之间都是非支配的关系,即没有任一个体a比个体b好或坏,有利于学习得到一组最好的分类器。步骤本文档来自技高网...

【技术保护点】
1.一种基于多目标进化算法的个性化商品推荐方法,其特征在于,包括:S1、按照预设比例将多类数据集分成多类训练集与测试集,再将多类训练集以一对多方式分成若干个二类训练子集;S2、对多目标种群进行初始化,并对二类训练子集进行二进制编码得到N个个体;S3、将N个个体体进行多目标迭代得到pareto前沿面;S4、将pareto前沿面上AUC值最大的个体对应的SVM分类器作为预测模型;S5、根据模型改进策略对预测模型进行改进,得到目标预测模型;S6、根据目标预测模型对测试集进行预测,根据测试集中每个样本的AUC值对测试集中每个样本进行分类,得到测试集中每个样本的类别,根据每个样本的类别确定每个样本对应的商品种类。

【技术特征摘要】
1.一种基于多目标进化算法的个性化商品推荐方法,其特征在于,包括:S1、按照预设比例将多类数据集分成多类训练集与测试集,再将多类训练集以一对多方式分成若干个二类训练子集;S2、对多目标种群进行初始化,并对二类训练子集进行二进制编码得到N个个体;S3、将N个个体体进行多目标迭代得到pareto前沿面;S4、将pareto前沿面上AUC值最大的个体对应的SVM分类器作为预测模型;S5、根据模型改进策略对预测模型进行改进,得到目标预测模型;S6、根据目标预测模型对测试集进行预测,根据测试集中每个样本的AUC值对测试集中每个样本进行分类,得到测试集中每个样本的类别,根据每个样本的类别确定每个样本对应的商品种类。2.根据权利要求1所述的基于多目标进化算法的个性化商品推荐方法,其特征在于,步骤S2,具体包括:S21、对二类训练子集中的样本进行二进制编码,得到一组长度为二类训练子集样本数相同的01字符串,0表示选取该训练样本,1表示不选取该训练样本,将得到的二进制字符串记为一个个体;S22、重复执行步骤S21,直到得到N个个体。3.根据权利要求1所述的基于多目标进化算法的个性化商品推荐方法,其特征在于,步骤S3,具体包括:S31、将N个个体作为父代进入多目标种群迭代过程,并计算每个个体的TPR与FPR,TPR=TP/(TP+FN),FPR=FP/(FP+TN),其中,TP表示正样本被正确分类成正类样本的个数,FN表示负样本被错误分类成正类样本的个数,FP表示正样本被错误分类成负类样本的个数,TN表示...

【专利技术属性】
技术研发人员:程凡许飞袁莘智王子立
申请(专利权)人:安徽大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1