获取推荐数据的方法和装置制造方法及图纸

技术编号:15691096 阅读:55 留言:0更新日期:2017-06-24 04:01
本发明专利技术公开了一种获取推荐数据的方法和装置。其中,该方法包括:根据目标对象的操作数据从数据库中筛选得到待选数据集,其中,数据库中的每一条数据至少包括如下参数:数据标识和用户偏好;利用遗传算法对待选数据集的数据进行处理得到目标数据集;当目标数据集中的数据的适应度之和达到第一预设阈值时,根据目标数据集的数据确定目标对象的推荐数据。本发明专利技术解决了无法准确得到推荐数据的技术问题。

Method and device for obtaining recommendation data

The invention discloses a method and a device for obtaining recommendation data. Among them, the method includes: according to the operation data of the target object to get the data set, which screened from the database, each data in the database includes at least the following parameters: the data identification and user preference; using genetic algorithm to select data sets of data processing to obtain the target data set; when the target data set the data fitness and reached the first preset threshold, the recommended data object is determined according to the target data set data. The invention solves the technical problem that the recommended data can not be accurately obtained.

【技术实现步骤摘要】
获取推荐数据的方法和装置
本专利技术涉及数据分析领域,具体而言,涉及一种获取推荐数据的方法和装置。
技术介绍
现在的大多数网站,例如视频网站、电商网站、金融网站等,都会有用户推荐的模块,用于向用户推荐用户可能感兴趣的数据内容。目前,推荐算法大致有:基于内容、基于协同过滤、基于关联规则、基于效用、基于知识的推荐算法。基于内容的数据推荐方法的理论,理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。基于协同过滤的推荐算法理论上可以推荐世界上的任何一种东西,包括图片、音乐等。协同过滤算法主要是通过对未评分项进行评分,从而得到预测数据。基于关联规则的推荐(AssociationRule-basedRecommendation)是以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性,在零售业中已经得到了成功的应用。基于效用的推荐(Utility-basedRecommendation)是建立在对用户使用项目的效用情况上计算的,其核心问题是怎么样为每一个用户去创建一个效用函数,因此,用户资料模型很大程度上是由系统所采用的效用函数决定的。基于知识的推荐(Knowledge-basedRecommendation)在某种程度是可以看成是一种推理(Inference)技术,它不是建立在用户需要和偏好基础上推荐的。基于知识的方法因它们所用的功能知识不同而有明显区别。效用知识(FunctionalKnowledge)是一种关于一个项目如何满足某一特定用户的知识,因此能解释需要和推荐的关系,所以用户资料可以是任何能支持推理的知识结构,它可以是用户已经规范化的查询,也可以是一个更详细的用户需要的表示。但是,向用户推荐数据不是一个简单的工作,因为用户的兴趣是千奇百怪的,通常情况下,利用上述算法,计算机无法很准确地捕捉用户的兴趣点,只能通过用户的标签或者用户经常浏览的节目记录来进行整合数据,并向用户推荐数据。通过上述方法得到的推荐数据,是比较基础但又笨拙的方法,没有去深入挖掘用户的潜在兴趣,不能准确的得到目标用户的推荐数据。针对上述无法准确得到推荐数据的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种获取推荐数据的方法和装置,以至少解决无法准确得到推荐数据的技术问题。根据本专利技术实施例的一个方面,提供了一种获取推荐数据的方法,包括:根据目标对象的操作数据从数据库中筛选得到待选数据集,其中,数据库中的每一条数据至少包括如下参数:数据标识和用户偏好;利用遗传算法对待选数据集的数据进行处理得到目标数据集;当目标数据集中的数据的适应度之和达到第一预设阈值时,根据目标数据集的数据确定目标对象的推荐数据。进一步地,根据目标对象的操作数据从数据库中筛选得到待选数据集包括:通过数据库中的每一条数据的数据标识和用户偏好,计算得到数据库中的任意两条数据的数据关联度;根据目标对象的操作数据以及数据关联度生成待选数据集。进一步地,通过如下第一公式计算得到数据库中的任意两条数据的数据关联度其中,i,j为自然数,N(i)为喜欢节目i的用户数,N(j)为喜欢节目j的用户数。进一步地,通过如下第二公式生成待选数据集Pij:其中,u为自然数,N(u)为目标对象喜欢的节目的集合,Rui为常数,表示目标对象对节目i的兴趣程度。进一步地,利用遗传算法对待选数据集的数据进行处理得到目标数据集包括:对待选数据集中数据进行编码操作,以无符号二进制数来表示待选数据集中数据,其中,无符号二进制数中任一个数字为数据的一个基因;通过对无符号二进制数来表示的待选数据集中数据进行遗传运算,得到目标数据集,其中,遗传运算包括以下运算中的至少一项或者多项:选择运算、交叉运算、变异运算。进一步地,通过对无符号二进制数来表示的待选数据集中数据进行遗传运算,得到目标数据集包括:计算待选数据集中数据的适应度,通过适应度来确定数据的遗传概率,其中,遗传概率用于确定数据被选中进行遗传运算的次数;将选定的待选数据集中的数据进行交叉运算,得到第一子目标数据集,其中,交叉运算为将待选数据集中的被选中的数据进行随机配对,通过随机选择数据的至少一个基因进行交换;对第一子目标数据集的数据进行变异运算,得到目标数据集,其中,变异运算为随机确定第一子目标数据集中数据的基因变异位置,对基因变异位置的基因值进行基因值取反操作。根据本专利技术实施例的另一方面,还提供了一种获取推荐数据的装置,其特征在于,包括:选择模块,用于根据目标对象的操作数据从数据库中筛选得到待选数据集,其中,数据库中的每一条数据至少包括如下参数:数据标识和用户偏好;算法模块,用于利用遗传算法对待选数据集的数据进行处理得到目标数据集;确定模块,用于当目标数据集中的数据的适应度之和达到第一预设阈值时,根据目标数据集的数据确定目标对象的推荐数据。进一步地,选择模块包括:计算子模块,用于通过数据库中的每一条数据的数据标识和用户偏好,计算得到数据库中的任意两条数据的数据关联度;生成子模块,用于根据目标对象的操作数据以及数据关联度生成待选数据集。进一步地,算法模块包括:编码子模块,用于对待选数据集中数据进行编码操作,以无符号二进制数来表示待选数据集中数据,其中,无符号二进制数中任一个数字为数据的一个基因;算法子模块,用于通过对无符号二进制数来表示的待选数据集中数据进行遗传运算,得到目标数据集,其中,遗传运算包括以下运算中的至少一项或者多项:选择运算、交叉运算、变异运算。进一步地,算法子模块包括:选择运算单元,用于计算待选数据集中数据的适应度,通过适应度来确定数据的遗传概率,其中,遗传概率用于确定数据被选中进行遗传运算的次数;交叉运算单元,用于将选定的待选数据集中的数据进行交叉运算,得到第一子目标数据集,其中,交叉运算为将待选数据集中的被选中的数据进行随机配对,通过随机选择数据的至少一个基因进行交换;变异运算单元,用于对第一子目标数据集的数据进行变异运算,得到目标数据集,其中,变异运算为随机确定第一子目标数据集中数据的基因变异位置,对基因变异位置的基因值进行基因值取反操作。在本专利技术实施例中,通过采用根据目标对象的操作数据从数据库中筛选得到待选数据集,其中,数据库中的每一条数据至少包括如下参数:数据标识和用户偏好;利用遗传算法对待选数据集的数据进行处理得到目标数据集;当目标数据集中的数据的适应度之和达到第一预设阈值时,根据目标数据集的数据确定目标对象的推荐数据,达到了准确获取推荐数据,并且可以对提供推荐数据进行自我学习及优化的目的,进而解决了无法准确得到推荐数据的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例一的一种可选的获取推荐数据的方法的流程图;图2是根据本专利技术实施例二的一种可选的获取推荐数据的装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分本文档来自技高网
...
获取推荐数据的方法和装置

【技术保护点】
一种获取推荐数据的方法,其特征在于,包括:根据目标对象的操作数据从数据库中筛选得到待选数据集,其中,所述数据库中的每一条数据至少包括如下参数:数据标识和用户偏好;利用遗传算法对所述待选数据集的数据进行处理得到目标数据集;当所述目标数据集中的数据的适应度之和达到第一预设阈值时,根据所述目标数据集的数据确定所述目标对象的推荐数据。

【技术特征摘要】
1.一种获取推荐数据的方法,其特征在于,包括:根据目标对象的操作数据从数据库中筛选得到待选数据集,其中,所述数据库中的每一条数据至少包括如下参数:数据标识和用户偏好;利用遗传算法对所述待选数据集的数据进行处理得到目标数据集;当所述目标数据集中的数据的适应度之和达到第一预设阈值时,根据所述目标数据集的数据确定所述目标对象的推荐数据。2.根据权利要求1所述的方法,其特征在于,根据目标对象的操作数据从数据库中筛选得到待选数据集包括:通过所述数据库中的所述每一条数据的所述数据标识和所述用户偏好,计算得到所述数据库中的任意两条数据的数据关联度;根据所述目标对象的所述操作数据以及所述数据关联度生成所述待选数据集。3.根据权利要求2所述的方法,其特征在于,通过如下第一公式计算得到所述数据库中的任意两条数据的数据关联度Wij:其中,i,j为自然数,N(i)为喜欢节目i的用户数,N(j)为喜欢节目j的用户数。4.根据权利要求3所述的方法,其特征在于,通过如下第二公式生成所述待选数据集Pij:其中,u为自然数,N(u)为所述目标对象喜欢的节目的集合,Rui为常数,表示所述目标对象对节目i的兴趣程度。5.根据权利要求1所述的方法,其特征在于,利用遗传算法对所述待选数据集的数据进行处理得到目标数据集包括:对所述待选数据集中数据进行编码操作,以无符号二进制数来表示所述待选数据集中所述数据,其中,所述无符号二进制数中任一个数字为所述数据的一个基因;通过对所述无符号二进制数来表示的所述待选数据集中所述数据进行遗传运算,得到所述目标数据集,其中,所述遗传运算包括以下运算中的至少一项或者多项:选择运算、交叉运算、变异运算。6.根据权利要求5所述的方法,其特征在于,通过对所述无符号二进制数来表示的所述待选数据集中所述数据进行遗传运算,得到所述目标数据集包括:计算所述待选数据集中所述数据的适应度,通过所述适应度来确定所述数据的遗传概率,其中,所述遗传概率用于确定所述数据被选中进行遗传运算的次数;将选定的所述待选数据集中的数据进行交叉运算,得到第一子目标数据集,其中,所述交...

【专利技术属性】
技术研发人员:裴长龙
申请(专利权)人:珠海迈科智能科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1