The invention discloses a method and device for clustering of articles, which relates to the field of computer technology. One embodiment of the method includes: acquiring data, including data items of information; according to the relationship between different subjects and items of information to determine the data corresponding to each subject; according to the items of information acquisition items, so as to realize the product clustering based on topic. The embodiment can match the needs of users of the theme of the scene based on the specific purpose of the choice to create space for the user, can be very good to help improve the recommendation system recommended conversion rate, while improving the user site stickiness, attract more traffic and consumption.
【技术实现步骤摘要】
物品聚类的方法和装置
本专利技术涉及计算机
,尤其涉及一种物品聚类的方法和装置。
技术介绍
在竞争日益激烈的网络服务平台的营销活动中,场景营销起着很重要的作用,不仅仅可以吸引流量,而且还可以极大地提高营销手段的转化率。场景营销,是基于网民的上网行为始终处在输入场景、搜索场景和浏览场景这三大场景之一的一种新营销理念。浏览器和搜索引擎则广泛服务于资料搜集、信息获取和网络娱乐、网购等大部分网民网络行为。针对这三种场景,以充分尊重用户网络体验为先,围绕网民输入信息、搜索信息、获得信息的行为路径和上网场景,构建了以“兴趣引导+海量曝光+入口营销”为线索的网络营销新模式。用户在“感兴趣、需要和寻找时”,企业的营销推广信息才会出现,充分结合了用户的需求和目的,是一种充分满足推广企业“海量+精准”需求的营销方式。目前,网络服务平台一般是通过推荐系统来进行营销活动。例如:电商平台通过推荐系统向用户推荐商品来吸引用户进行购物;网络信息提供商、搜索引擎服务提供商,通过推荐系统向用户推荐热点信息来吸引更多的访问流量;网上学习平台通过推荐系统向用户推荐感兴趣的图书来吸引更多的访问流量 ...
【技术保护点】
一种物品聚类的方法,其特征在于,包括:获取语料数据,所述语料数据包括物品信息;根据所述语料数据确定不同主题与物品信息之间的关联关系;根据所述物品信息获取每个主题对应的物品,从而实现基于主题的物品聚类。
【技术特征摘要】
1.一种物品聚类的方法,其特征在于,包括:获取语料数据,所述语料数据包括物品信息;根据所述语料数据确定不同主题与物品信息之间的关联关系;根据所述物品信息获取每个主题对应的物品,从而实现基于主题的物品聚类。2.根据权利要求1所述的方法,其特征在于,所述物品信息为商品产品词;并且,获取语料数据的步骤包括:使用商品标识作为主键,将订单信息和商品产品词信息进行数据关联,所述订单信息和商品产品词信息中均包括商品标识;对关联后的数据进行过滤;对过滤后的数据进行合并转置,以得到预定格式的语料数据。3.根据权利要求1所述的方法,其特征在于,根据所述语料数据确定不同主题与物品信息之间的关联关系的步骤包括:通过将所述语料数据输入文档主题生成模型进行运算,以得到不同主题与物品信息之间的关联关系。4.根据权利要求3所述的方法,其特征在于,所述文档主题生成模型被封装在计算引擎Spark内执行。5.根据权利要求1所述的方法,其特征在于,根据所述物品信息获取每个所述主题对应的物品的步骤之前,还包括:根据预定规...
【专利技术属性】
技术研发人员:闫强,申肆,李爱华,葛胜利,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。