一种个性化信息推荐方法和装置制造方法及图纸

技术编号:20389813 阅读:20 留言:0更新日期:2019-02-20 02:49
本发明专利技术提供一种个性化的信息推荐方法和装置。该方法包括:采集用户的多维属性特征、商品的多维属性特征和商铺的多维属性特征;基于获得的用户的多维属性特征、商品的多维属性特征、商铺的多维属性特征提取标签信息并计算标签的权值,以构建用户画像、商品画像、商铺画像;基于所构建的用户画像、商品画像或商铺画像为用户提供推荐信息。利用本发明专利技术的方法能够准确、有效地为用户提供个性化的信息推荐。

【技术实现步骤摘要】
一种个性化信息推荐方法和装置
本专利技术涉及信息处理
,尤其涉及一种个性化信息推荐方法和装置。
技术介绍
推荐系统基于用户的历史行为数据或物品数据,通过一定的算法,为用户推荐符合要求的物品。在信息过载时,推荐系统预测用户的兴趣和需求,帮助用户快速找到感兴趣的物品。用户画像简单来说就是对用户的信息进行标签化,用户画像作为推荐系统的副产品,可以将用户进行标签化,刻画出用户的社会属性、行为习惯与偏好信息,解决推荐系统中新用户的冷启动问题,支撑推荐系统的数据基础。然而,在现有推荐系统的画像技术中,仅仅包括对用户画像的构建,并且粒度较粗,不够全面,忽略了商品和商铺的特征挖掘和画像信息构建,因此,在商品或商铺推荐时很难获得精准的效果。因此,需要对现有技术进行改进,以提供更加全面完整、包含多维特征的推荐系统中的画像构建方法。
技术实现思路
本专利技术的目的在于克服上述现有技术的缺陷,提供一种个性化信息推荐方法和装置,通过建立多维度的标签体系,为推荐系统提供更加丰富的特征。根据本专利技术的第一方面,提供了一种个性化的信息推荐方法。该方法包括以下步骤:步骤1:采集用户的多维属性特征、商品的多维属性特征和商铺的多维属性特征;步骤2:基于获得的用户的多维属性特征、商品的多维属性特征、商铺的多维属性特征提取标签信息并计算标签的权值,以构建用户画像、商品画像、商铺画像;步骤3:基于所构建的用户画像、商品画像或商铺画像为用户提供推荐信息。在一个实施例中,所述用户的多维属性特征包括性别、年龄、业务性质、关注行业、搜索行为、收藏行为、浏览行为、购物车行为、点赞行为、消费行为、评论行为、用户设备、用户位置中的至少一项。在一个实施例中,所述商品的多维属性特征包括商品的分类、品牌、价格、所在行业、附属词、点击率中的至少一项。在一个实施例中,所述商铺的多维属性特征包括商铺位置、主营商品、点击率、行业信息、品牌信息、帖子的多标签分类中的至少一项。在一个实施例中,所述用户画像包括性别标签、年龄标签、业务性质标签、关注行业标签、用户兴趣偏好标签、设备标签、用户位置标签、消费能力标签、忠诚度标签、活跃度标签、用户价值标签中的至少一项。在一个实施例中,根据以下步骤计算所述用户兴趣偏好标签的权重:。其中,w(i)是浏览行为、搜索行为、收藏行为、购物车行为、点赞行为、消费行为、评论行为对应的权重值,i是行为的索引,是衰减因子,staytimefactor(st)是浏览行为的停留时间因子,对于搜索行为、收藏行为、购物车行为、点赞行为、消费行为、评论行为的停留时间因子为1,deepfactor(j)是搜索行为的深度因子,对于浏览行为、收藏行为、购物车行为、点赞行为、消费行为、评论行为的深度因子为1,m是行为的个数,n是行为发生时间距离当前日期的天数,t是浏览网页时的停留时间,d是搜索关键词后的访问深度,α为常数。在一个实施例中,根据以下公式计算用户价值标签的权值:其中,σ是sigmoid函数,i是用于表示消费能力、忠诚度或活跃度的索引,xi表示消费能力标签、忠诚度标签或活跃度标签的权值,wi是用户价值相对于消费能力、忠诚度、活跃度三者的权值。在一个实施例中,所述商品画像包括商品的分类标签、品牌标签、价格标签、行业标签、附属词标签、热度标签中的至少一项。在一个实施例中,采用以下步骤获得所述商品画像:对所述商品的多维属性特征中的商品的多分类取前K个结果得到商品的分类标签,其中K为大于等于2的整数;根据商品的品牌信息直接获得商品的品牌标签;根据商品的价格获得商品的价格区间标签;根据商品的所在行业信息获得商品的行业标签;根据商品的附属词信息获得商品的附属词标签;根据商品的点击率与所有商品的点击率之和相除,获得商品的点击比作为商品的热度标签。在一个实施例中,所述商铺画像包括商铺位置标签、商铺主营商品标签、商铺行业标签、商铺热度标签、商铺品牌标签中的至少一项。在一个实施例中,根据以下步骤获得所述商铺画像:将所述商铺的多维属性特征中的位置特征抽取出商铺位置标签;将商铺主营商品特征进行分词处理并与帖子的多标签分类进行合并获得商铺主营商品标签;将商铺点击率特征与所有商铺的点击率之和相除,获得商铺的点击比作为商铺热度标签;将商铺行业信息抽取出商铺行业类型作为商铺行业标签;将商铺中商品的品牌信息进行合并获得商铺品牌标签。根据本专利技术的第二方面,提供了一种个性化的信息推荐装置。该装置包括:特征提取模块:采集用户的多维属性特征、商品的多维属性特征和商铺的多维属性特征;画像构建模块:基于获得的用户的多维属性特征、商品的多维属性特征、商铺的多维属性特征提取标签信息并计算标签的权值,以构建用户画像、商品画像、商铺画像;实时推荐模块:用于基于所构建的用户画像、商品画像或商铺画像为用户提供推荐信息。与现有技术相比,本专利技术的优点在于:通过采集多源用户行为数据,为用户、商品、商铺分别建立画像,并动态更新画像中的标签权重值,构建的画像不仅全面完整,而且具有较好的时效性,为个性化推荐系统提供数据支撑。附图说明以下附图仅对本专利技术作示意性的说明和解释,并不用于限定本专利技术的范围,其中:图1示出了根据本专利技术一个实施例的推荐系统中画像构建方法的流程图;图2示出了根据本专利技术一个实施例的推荐系统中画像构建装置的示意图。具体实施方式为了使本专利技术的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。根据本专利技术的一个实施例,提供了一种推荐系统中的画像构建方法,该方法能够从用户、商品、商铺等多方面,构建多维度的标签体系,参见图1所示,该方法包括以下步骤:步骤S110,获取数据并对数据进行预处理。获取的数据包括用户行为日志和社交网络数据,其中,用户行为日志包括用户标识、URL、来源URL、IP、商品或商铺ID、sessionID、user-agent信息、用户行为日志的数据源标识等信息,社交网络数据包括普通用户与商铺用户的社交关系、帖子发布、评论、点赞数据等。在实际应用中,可从日志服务器上获得多源用户行为日志,所述多源用户行为日志包括不同省份、国家的多站点的用户行为日志。社交网络数据可通过查询业务数据库获得,其中,业务数据库中还包括用户信息、商品信息、商铺信息、用户收藏信息、购物车信息、订单信息、点赞信息等数据。数据预处理过程包括对非结构化的用户行为日志进行处理,以得到统一规范格式化的用户行为日志,对获得的社交网络数据中的帖子内容(例如包括商铺上新、商铺库存、用户求购、热门动态等)和评论信息等进行处理,抽取出帖子和评论信息的多标签分类,得到用户和商铺的社交网络属性特征。数据预处理过程还对用户行为日志进行检测,过滤爬虫以删除无关网页信息以及过滤异常数据等。在一个实施例中,通过对多源用户行为日志进行预处理之后,提取的关键字段包括用户标识、URL、来源URL、IP、商品或商铺ID、sessionID、行为发生的时间、user-agent信息、多源用户行为日志的数据源标识等中的一项或多项。在一个实施例中,通过以下过程获得用户和商铺的社交网络属性特征:对所述帖子内容中的文本信息和评论信息进行分词处理,得到多个分词结果;对多本文档来自技高网...

【技术保护点】
1.一种个性化的信息推荐方法,包括以下步骤:步骤1:采集用户的多维属性特征、商品的多维属性特征和商铺的多维属性特征;步骤2:基于获得的用户的多维属性特征、商品的多维属性特征、商铺的多维属性特征提取标签信息并计算标签的权值,以构建用户画像、商品画像、商铺画像;步骤3:基于所构建的用户画像、商品画像或商铺画像为用户提供推荐信息。

【技术特征摘要】
1.一种个性化的信息推荐方法,包括以下步骤:步骤1:采集用户的多维属性特征、商品的多维属性特征和商铺的多维属性特征;步骤2:基于获得的用户的多维属性特征、商品的多维属性特征、商铺的多维属性特征提取标签信息并计算标签的权值,以构建用户画像、商品画像、商铺画像;步骤3:基于所构建的用户画像、商品画像或商铺画像为用户提供推荐信息。2.根据权利要求1所述的方法,其中,所述用户的多维属性特征包括性别、年龄、业务性质、关注行业、搜索行为、收藏行为、浏览行为、购物车行为、点赞行为、消费行为、评论行为、用户设备、用户位置中的至少一项。3.根据权利要求1所述的方法,其中,所述商品的多维属性特征包括商品的分类、品牌、价格、所在行业、附属词、点击率中的至少一项。4.根据权利要求1所述的方法,其中,所述商铺的多维属性特征包括商铺位置、主营商品、点击率、行业信息、品牌信息、帖子的多标签分类中的至少一项。5.根据权利要求1所述的方法,其中,所述用户画像包括性别标签、年龄标签、业务性质标签、关注行业标签、用户兴趣偏好标签、设备标签、用户位置标签、消费能力标签、忠诚度标签、活跃度标签、用户价值标签中的至少一项。6.根据权利要求5所述的方法,其中,根据以下步骤计算所述用户兴趣偏好标签的权重:。其中,w(i)是浏览行为、搜索行为、收藏行为、购物车行为、点赞行为、消费行为、评论行为对应的权重值,i是行为的索引,是衰减因子,staytimefactor(st)是浏览行为的停留时间因子,对于搜索行为、收藏行为、购物车行为、点赞行为、消费行为、评论行为的停留时间因子为1,deepfactor(j)是搜索行为的深度因子,对于浏览行为、收藏行为、购物车行为、点赞行为、消费行为、评论行为的深度因子为1,m是行为的个数,n是行为发生时间距离当前日期的天数,t是浏览网页时的停留时间,d是搜索关键词后的访问深度,α为常数。7.根据权利要求5所述的方法,其中,根据以下公式计算用户价值标签的权值:其中,σ是sigmoid函数,i是用于表示消费能力、忠诚度或活跃度的索引,xi表示消费能力标签、忠诚度标签或活...

【专利技术属性】
技术研发人员:张梦菲方金云韩聪
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1