基于人工智能的信息推荐方法、装置、电子设备制造方法及图纸

技术编号:25479895 阅读:20 留言:0更新日期:2020-09-01 23:01
本发明专利技术提供了一种基于人工智能的信息推荐方法、装置、电子设备及计算机可读存储介质;方法包括:获取第一信息集合中每个信息的逻辑回归特征;基于所述第一信息集合中每个信息的逻辑回归特征,预测对应的第一点击率,并从所述第一点击率的降序排序结果中选取排序在前的多个信息,以形成第二信息集合;基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,并基于所述第二点击率的降序排序结果执行推荐操作。通过本发明专利技术,能够减少特征工程复杂度并提高推荐响应速度。

【技术实现步骤摘要】
基于人工智能的信息推荐方法、装置、电子设备
本专利技术涉及人工智能技术,尤其涉及一种基于人工智能的信息推荐方法、装置、电子设备及计算机可读存储介质。
技术介绍
人工智能(AI,ArtificialIntelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。信息推荐是人工智能的重要应用,推荐系统中的排序模块通常是基于机器学习模型预测点击率并排序,将评分高的作为优先推荐的对象。相关技术中为了提高为机器学习模型的点击率预测精度进行了各种努力,例如在特征工程阶段构建大量的特征数据以使机器学习模型进行充分学习,特征数据的匮乏将影响点击率预测精度进而影响信息推荐的精度。从而,特征数据的匮乏与信息推荐的精度之间的矛盾成为相关技术中难以解决的技术问题。
技术实现思路
本专利技术实施例提供一种基于人工智能的信息推荐方法、装置、电子设备及计算机可读存储介质,能够以复用的特征数据进行精确地点击率预测,从而保证信息推荐的精度。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种基于人工智能的信息推荐方法,包括:获取第一信息集合中每个信息的逻辑回归特征;基于所述第一信息集合中每个信息的逻辑回归特征,预测对应的第一点击率,并从所述第一点击率的降序排序结果中选取排序在前的多个信息,以形成第二信息集合;基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,并基于所述第二点击率的降序排序结果执行推荐操作。本专利技术实施例提供一种基于人工智能的信息推荐装置,包括:特征获取模块,用于获取第一信息集合中每个信息的逻辑回归特征;第一点击率预测模块,用于基于所述第一信息集合中每个信息的逻辑回归特征,预测对应的第一点击率,并从所述第一点击率的降序排序结果中选取排序在前的多个信息,以形成第二信息集合;推荐模块,用于基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,并基于所述第二点击率的降序排序结果执行推荐操作。在上述方案中,所述特征获取模块,还用于:针对所述第一信息集合中的每个信息执行以下处理:从逻辑回归模型的特征数据库中,查询与所述信息的特征数据对应的逻辑回归特征;其中,所述逻辑回归模型用于基于所述逻辑回归特征预测所述信息的第一点击率;当所述信息的特征数据是对应所述逻辑回归模型的特征数据,且从所述逻辑回归模型的特征数据库中未查询到所述特征数据时,将所述特征数据的特征值转化为特征索引,并将所述特征索引进行哈希处理,得到特征索引编码;将所述特征数据的特征名称进行哈希处理得到特征名称编码,并将所述特征名称编码以及所述特征索引编码进行组合,得到所述信息的逻辑回归特征。在上述方案中,所述推荐模块,还用于:针对所述第二信息集合中每个信息执行以下处理:将所述信息的多个逻辑回归特征进行不同方式地组合,其中,每次所述组合所使用的逻辑回归特征部分不同或完全不同,以形成所述信息的多个组合特征;以所述信息的每个所述组合特征的点击率影响因子为权重参数,将所述信息的每个所述组合特征加权求和处理,得到所述信息的第二点击率;其中,所述组合特征的点击率影响因子是所述组合特征所包括的逻辑回归特征的点击率关联影响因子的乘积。在上述方案中,所述推荐模块,还用于:针对所述第二信息集合中的每个信息执行以下处理:获取所述信息的附加特征,且所述附加特征与点击用户相关;将所述信息的多个逻辑回归特征、以及多个附加特征进行不同方式地组合,其中,每次所述组合使用所述逻辑回归特征和/或所述附加特征,且每次组合使用的所述逻辑回归特征和/或所述附加特征部分不同或完全不同,以形成所述信息的多个组合特征;基于所述信息的每个所述组合特征的权重参数,将所述信息的每个所述组合特征加权求和处理,得到所述信息的第二点击率;其中,所述组合特征的权重参数是所述组合特征所包括的逻辑回归特征和/或所述附加特征的点击率关联影响因子的乘积。在上述方案中,其特征在于,所述信息的附加特征的类型包括一阶特征和多阶特征;所述推荐模块,还用于:获取所述信息的点击用户的多个维度的用户特征,并将每个所述维度的用户特征作为所述一阶特征;通过以下组合方式至少之一得到所述多阶特征:将所述点击用户的至少一个维度的用户特征与所述信息的至少一个维度相关的特征组合;将所述点击用户的至少一个维度的用户特征与环境相关的至少一个维度的特征组合。在上述方案中,所述推荐模块,还用于:执行以下至少之一:将至少两个不同的所述逻辑回归特征进行相乘处理,将得到的相乘结果作为对应的组合特征;将至少一个所述逻辑回归特征和至少一个所述附加特征进行相乘处理,将得到的相乘结果作为对应的组合特征;将至少两个不同的所述附加特征进行相乘处理,将得到的相乘结果作为对应的组合特征。在上述方案中,所述所述推荐模块,还用于:以所述信息的每个所述组合特征的点击率影响因子为权重参数,对所述信息的每个所述组合特征进行加权求和处理,得到第一加权求和结果;以所述多个逻辑回归特征以及所述多个附加特征分别对应的点击率影响因子为权重参数,对所述多个逻辑回归特征以及所述多个附加特征进行加权求和处理,得到第二加权求和结果;将所述第一加权求和结果和所述第二加权求和结果的加和进行偏置处理,得到所述信息的第二点击率。在上述方案中,所述第一点击率预测模块,还用于:针对所述第一信息集合中的每个信息执行以下处理:以所述信息的多个所述逻辑回归特征分别对应的点击率影响因子为权重,对多个所述逻辑回归特征进行加权求和处理;对加权求和处理结果进行偏置处理,得到对应所述信息的第一点击率。在上述方案中,所述第一点击率预测模块,还用于:将所述第一信息集合中第一点击率最高的信息转移到第二信息集合,以作为所述第二信息集合中的首个信息;当所述第二信息集合中的信息的数目小于信息数目阈值时,针对所述第一信息集合中第一点击率最高的信息,执行以下处理:确定所述第一信息集合中第一点击率最高的信息与所述首个信息之间的语义距离;当所述语义距离大于语义距离阈值时,将所述第一点击率最高的信息从所述第一信息集合转移到所述第二信息集合,并更新为所述第二信息集合中的首个信息。在上述方案中,所述第二点击率的预测是通过调用因子分解机模型实现的;所述装置还包括:训练模块,用于在获取第一信息集合中每个信息的逻辑回归特征之前:将窗口时间内的点击日志、展示日志以及特征日志合并成推荐日志,并从所述推荐日志中获取信息样本以及对应的真实第二点击率;对所获取的信息样本的多个逻辑回归特征以及多个附加特本文档来自技高网...

【技术保护点】
1.一种基于人工智能的信息推荐方法,其特征在于,所述方法包括:/n获取第一信息集合中每个信息的逻辑回归特征;/n基于所述第一信息集合中每个信息的逻辑回归特征,预测对应的第一点击率,并/n从所述第一点击率的降序排序结果中选取排序在前的多个信息,以形成第二信息集合;/n基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,并/n基于所述第二点击率的降序排序结果执行推荐操作。/n

【技术特征摘要】
1.一种基于人工智能的信息推荐方法,其特征在于,所述方法包括:
获取第一信息集合中每个信息的逻辑回归特征;
基于所述第一信息集合中每个信息的逻辑回归特征,预测对应的第一点击率,并
从所述第一点击率的降序排序结果中选取排序在前的多个信息,以形成第二信息集合;
基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,并
基于所述第二点击率的降序排序结果执行推荐操作。


2.根据权利要求1所述的方法,其特征在于,所述获取第一信息集合中每个信息的逻辑回归特征,包括:
针对所述第一信息集合中的每个信息执行以下处理:
从逻辑回归模型的特征数据库中,查询与所述信息的特征数据对应的逻辑回归特征;其中,所述逻辑回归模型用于基于所述逻辑回归特征预测所述信息的第一点击率;
当所述信息的特征数据是对应所述逻辑回归模型的特征数据,且从所述逻辑回归模型的特征数据库中未查询到所述特征数据时,将所述特征数据的特征值转化为特征索引,并将所述特征索引进行哈希处理,得到特征索引编码;
将所述特征数据的特征名称进行哈希处理得到特征名称编码,并将所述特征名称编码以及所述特征索引编码进行组合,得到所述信息的逻辑回归特征。


3.根据权利要求1所述的方法,其特征在于,所述基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,包括:
针对所述第二信息集合中每个信息执行以下处理:
将所述信息的多个逻辑回归特征进行不同方式地组合,其中,每次所述组合所使用的逻辑回归特征部分不同或完全不同,以形成所述信息的多个组合特征;
以所述信息的每个所述组合特征的点击率影响因子为权重参数,将所述信息的每个所述组合特征加权求和处理,得到所述信息的第二点击率;
其中,所述组合特征的点击率影响因子是所述组合特征所包括的逻辑回归特征的点击率关联影响因子的乘积。


4.根据权利要求1所述的方法,其特征在于,所述基于所述第二信息集合中每个信息的多个逻辑回归特征、以及所述多个逻辑回归特征之间的关联关系,预测对应的第二点击率,包括:
针对所述第二信息集合中的每个信息执行以下处理:
获取所述信息的附加特征,且所述附加特征与点击用户相关;
将所述信息的多个逻辑回归特征、以及多个附加特征进行不同方式地组合;
其中,每次所述组合使用所述逻辑回归特征和/或所述附加特征,且每次组合使用的所述逻辑回归特征和/或所述附加特征部分不同或完全不同,以形成所述信息的多个组合特征;
基于所述信息的每个所述组合特征的权重参数,将所述信息的每个所述组合特征加权求和处理,得到所述信息的第二点击率;
其中,所述组合特征的权重参数是所述组合特征所包括的逻辑回归特征和/或所述附加特征的点击率关联影响因子的乘积。


5.根据权利要求4所述的方法,其特征在于,
所述信息的附加特征的类型包括一阶特征和多阶特征;
所述获取所述信息的附加特征,包括:
获取所述信息的点击用户的多个维度的用户特征,并将每个所述维度的用户特征作为所述一阶特征;
通过以下组合方式至少之一得到所述多阶特征:
将所述点击用户的至少一个维度的用户特征与所述信息的至少一个维度相关的特征组合;将所述点击用户的至少一个维度的用户特征与环境相关的至少一个维度的特征组合。


6.根据权利要求4所述的方法,其特征在于,将所述信息的多个逻辑回归特征、以及多个附加特征进行不同方式地组合,包括:
执行以下操作至少之一:
将至少两个不同的所述逻辑回归特征进行相乘处理,将得到的相乘结果作为对应的组合特征;
将至少一个所述逻辑回归特征和至少一个所述附加特征进行相乘处理,将得到的相乘结果作为对应的组合特征;
将至少两个不同的所述附加特征进行相乘处理,将得到的相乘结果作为对应的组合特征。


7.根据权利要求4所述的方法,其特征在于,所述基于所述信息的每个所述组合特征的权重参数,将所述信息的每个所述组合特征加权求和处理,得到所述信息的第二点击率,包括:
以所述信息的每个所述组合特征的点击率影响因子为权重参数,对所述信息的每个所述组合特征进行加权求和处理,得到第一加权求和结果;
以所述多个逻辑回归特征以及所述多个附加特征分别对应的点击率影响因子为权重参数,对所述多个逻辑回归特征以及所述多个附加特征进行加权求和处理,得到第二加权求和结果;
将所述第一加权求和结果和所述第二加权求和结果的加和进行...

【专利技术属性】
技术研发人员:张晗
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1