一种面向电子商务的用户首次购数据整合方法及装置制造方法及图纸

技术编号:17939613 阅读:21 留言:0更新日期:2018-05-15 20:02
本发明专利技术提供一种面向电子商务的用户首次购数据整合方法及装置,该方法包括:从订单模型和订单明细模型中选择与用户首次购信息相关的筛选信息,生成精缩订单表和/或精缩订单明细表数据;根据精缩订单表和精缩订单明细表数据,将用户属性和订单信息进行拼接,建立用户首次购模型,该用户首次购模型包括订单级用户首次购模型和订单明细级用户首次购模型,对订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分,分别生成静态数据和动态数据,动态数据的更新方式为全量更新,动态数据根据设定条件转移至静态数据。本发明专利技术在满足对首次购买数据的统计需求的前提下,实现了对首次购数据模型的整合,降低统计模型的维护成本和风险。

User oriented data integration method and device for electronic commerce

The present invention provides a user first purchase data integration method and device for electronic commerce. The method includes selecting the screening information related to the first purchase of information from the user from the order model and the order detail model, generating the refined order table and / or refining the order list data; according to the refined order table and refined order detail The user's first model, including the first model of order level users and the first order model of order detail level users, is set up for the first purchase model of order level users. State data and dynamic data. The updating way of dynamic data is full volume updating, and dynamic data are transferred to static data according to the set conditions. The invention realizes the integration of the first purchase data model and reduces the maintenance cost and risk of the statistical model on the premise of meeting the statistical demand for the first purchase data.

【技术实现步骤摘要】
一种面向电子商务的用户首次购数据整合方法及装置
本专利技术涉及数据分析及计算机软件领域,具体涉及一种面向电子商务的用户首次购数据整合方法及装置。
技术介绍
伴随着电子商务的不断发展,用户的行为和购买数据在不断地快速积累。用户首次下单的相关数据(即用户首次购)的分析和挖掘,在购买数据分析中占有绝对重要的地位。由于首次购买数据需求复杂多样,如:全站范围的用户首次购,各渠道用户首次购,去恶意订单后的首次购,去风险用户首次购等。因为用户首次购的相关信息,需要系统对所有用户的全部订单数据进行遍历,对于大型电商公司来说,这会对仓库的资源或性能带来挑战。现有技术中是通过数据抽取工具,将线上数据抽取到数据仓库中,然后通过模型搭建来满足数据业务需求。然后,根据业务方数据需求的不同分别设计多个模型来逐一满足。例如:(1)按不同渠道划分的用户首次购模型,即一个用户每个渠道的首次购订单信息为一条记录,这样一个用户有几个渠道下单就有几条记录;(2)按用户划分的用户首次购模型,即一个用户所有下单中的首次购订单信息为一条记录,这样一个用户仅一条记录;(3)按用户一级品类划分的首次购模型,即一个用户每个一级品类首次购订单信息为一条记录,这样一个用户在不同的一级品类下过单,就有几条记录;(4)按用户去恶意订单后的首次购模型,即一个用户所有下单中,去掉恶意订单的首次购订单。这样一个用户仅有一条记录。由于类似上述不同的首次购业务需求还有很多,如果分别满足不同的业务数据需求,那么需要设计并构建多个相似的模型。这样的话,多个全量扫描订单的表执行起来会对集群产生较大压力,并且在后期维护时,对同一个口径的修改需要修改多个底层脚本。对于大量级的数据存储,大多进行增量或全量加工,这将对抽取和加工产生较大压力,未来发展到一定阶段,这种方式必然将产生数据处理瓶颈。通过现有技术的方法来处理用户首次购数据的需求,会产生如下情况:(1)集群压力大:如果同样是用户首次购数据,若存在多个相似的模型,那就要对订单全量数据进行多次扫描,集群压力会非常大。(2)后期维护成本高:如果一个共有指标同时存在于较多模型中,在将来对该指标的加工口径进行调整时就需要维护多个模型,成本高,风险大;(3)直接根据订单GDM层模型进行加工,其实用户首次购并不需要这么多指标,加工时带着大量无用指标必然会影响加工效率;(4)需要根据业务场景建立较多首次购相关的模型,模型量大、口径不统一、划分角度不统一。
技术实现思路
有鉴于此,本专利技术的目的是提供一种面向电子商务的用户首次购数据整合方法及装置,在满足大多数对首次购买数据的统计需求的前提下,以实现对首次购数据模型的整合,进而降低统计模型的维护成本和风险。本专利技术的技术方案是提供一种面向电子商务的用户首次购数据整合方法,所述方法包括:从订单模型和订单明细模型中选择与用户首次购信息相关的筛选信息,生成精缩订单表和精缩订单明细表数据;根据所述精缩订单表和所述精缩订单明细表数据,将用户属性和订单信息进行拼接,建立用户首次购模型,其中所述用户首次购模型包括订单级用户首次购模型和订单明细级用户首次购模型,并对所述订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分,分别生成静态数据和动态数据,所述静态数据不进行更新,所述动态数据的更新方式为全量更新,并且所述动态数据根据设定条件转移至所述静态数据。可选地,所述用户首次购信息至少包括:订单维度、用户属性指标、订单指标以及去恶意订单指标。可选地,所述精缩订单表和精缩订单明细表数据保存于临时数据层。可选地,所述订单级用户首次购模型至少包括:第一维度区、第一用户属性指标区、第一订单指标区以及去恶意订单后的订单指标区,其中所述第一维度区包括用户账号以及下单渠道;所述第一用户属性指标区包括用户风险级别、用户风险管理、用户绑定状态,用户注册时间;所述第一订单指标区至少包括订单编号、下单日期、全局首次购标志、实付金额;所述去恶意订单后的订单指标区至少包括去恶意订单编号、去恶意后下单日期、全局首次购标志、收获地址、实付金额以及销售订单种类代码。可选地,所述订单明细级用户首次购模型至少包括:第二维度区、第二用户属性指标区、第二订单指标区,其中,所述第二维度区包括用户账号、商品一级分类代码以及商品一级分类名称;所述第二用户属性指标至少包括用户注册时间等用户属性;所述订单指标包括订单编号、下单日期、简单订单来源、全局首次购标志。可选地,在对所述订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分的步骤中,还包括:根据不同业务场景设定的拆分条件对订单数据进行数据拆分,将所述订单数据分别生成所述静态数据和所述动态数据。本专利技术还提供一种面向电子商务的用户首次购数据整合装置,所述装置包括:数据精缩模块,用于从订单模型和订单明细模型中选择与用户首次购信息相关的筛选信息,生成精缩订单表和精缩订单明细表数据;数据搭建模块,用于根据所述精缩订单表和所述精缩订单明细表数据,将用户属性和订单信息进行拼接,建立用户首次购模型,其中所述用户首次购模型包括订单级用户首次购模型和订单明细级用户首次购模型,并对所述订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分,分别生成静态数据和动态数据,所述静态数据不进行更新,所述动态数据的更新方式为全量更新,并且所述动态数据根据设定条件转移至所述静态数据。可选地,所述用户首次购信息至少包括:订单维度、用户属性指标、订单指标以及去恶意订单指标。可选地,所述精缩订单表和精缩订单明细表数据保存于临时数据层。可选地,所述订单级用户首次购模型至少包括:第一维度区、第一用户属性指标区、第一订单指标区以及去恶意订单后的订单指标区,其中所述第一维度区包括用户账号以及下单渠道;所述第一用户属性指标区包括用户风险级别、用户风险管理、用户绑定状态,用户注册时间;所述第一订单指标区至少包括订单编号、下单日期、全局首次购标志、实付金额;所述去恶意订单后的订单指标区至少包括去恶意订单编号、去恶意后下单日期、全局首次购标志、收获地址、实付金额以及销售订单种类代码。可选地,所述订单明细级用户首次购模型至少包括:第二维度区、第二用户属性指标区、第二订单指标区,其中,所述第二维度区包括用户账号、商品一级分类代码以及商品一级分类名称;所述第二用户属性指标至少包括用户注册时间等用户属性;所述订单指标包括订单编号、下单日期、简单订单来源、全局首次购标志。可选地,所述装置还包括:数据拆分模块,所述数据拆分模块用于根据不同业务场景设定条件对订单数据进行数据拆分,将所述订单数据分别生成所述静态数据和所述动态数据。通过本专利技术提供的面向电子商务的用户首次购数据整合方法及装置,从订单和订单明细的视角(维度),通过对与用户首次购信息相关信息进行精缩,并且按照合理的维度,将用户属性和订单信息的顺序拼接,建立用户首次购模型,从而实现对用户首次购数据进行高效整合。此外,通过对用户首次购数据进行动静态数据拆分,将数据后期的加工性能提高,降低加工时长和资源占用。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的本文档来自技高网
...
一种面向电子商务的用户首次购数据整合方法及装置

【技术保护点】
一种面向电子商务的用户首次购数据整合方法,其特征在于,所述方法包括:从订单模型和订单明细模型中选择与用户首次购信息相关的筛选信息,生成精缩订单表和精缩订单明细表数据;根据所述精缩订单表和所述精缩订单明细表数据,将用户属性和订单信息进行拼接,建立用户首次购模型,其中所述用户首次购模型包括订单级用户首次购模型和订单明细级用户首次购模型,并对所述订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分,分别生成静态数据和动态数据,所述静态数据不进行更新,所述动态数据的更新方式为全量更新,并且所述动态数据根据设定条件转移至所述静态数据。

【技术特征摘要】
1.一种面向电子商务的用户首次购数据整合方法,其特征在于,所述方法包括:从订单模型和订单明细模型中选择与用户首次购信息相关的筛选信息,生成精缩订单表和精缩订单明细表数据;根据所述精缩订单表和所述精缩订单明细表数据,将用户属性和订单信息进行拼接,建立用户首次购模型,其中所述用户首次购模型包括订单级用户首次购模型和订单明细级用户首次购模型,并对所述订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分,分别生成静态数据和动态数据,所述静态数据不进行更新,所述动态数据的更新方式为全量更新,并且所述动态数据根据设定条件转移至所述静态数据。2.根据权利要求1所述的方法,其特征在于,所述用户首次购信息至少包括:订单维度、用户属性指标、订单指标以及去恶意订单指标。3.根据权利要求1所述的方法,其特征在于,所述精缩订单表和精缩订单明细表数据保存于临时数据层。4.根据权利要求1所述的方法,其特征在于,所述订单级用户首次购模型至少包括:第一维度区、第一用户属性指标区、第一订单指标区以及去恶意订单后的订单指标区,其中所述第一维度区包括用户账号以及下单渠道;所述第一用户属性指标区包括用户风险级别、用户风险管理、用户绑定状态,用户注册时间;所述第一订单指标区至少包括订单编号、下单日期、全局首次购标志、实付金额;所述去恶意订单后的订单指标区至少包括去恶意订单编号、去恶意后下单日期、全局首次购标志、收获地址、实付金额以及销售订单种类代码。5.根据权利要求1所述的方法,其特征在于,所述订单明细级用户首次购模型至少包括:第二维度区、第二用户属性指标区、第二订单指标区,其中,所述第二维度区包括用户账号、商品一级分类代码以及商品一级分类名称;所述第二用户属性指标至少包括用户注册时间等用户属性;所述订单指标包括订单编号、下单日期、简单订单来源、全局首次购标志。6.根据权利要求1所述的方法,其特征在于,在对所述订单级用户首次购模型和订单明细级用户首次购模型进行数据拆分的步骤中,还包括:根据不同业务场景设定的拆分条件对订单数据进行数据拆分,将所述订单数据分别生成所述静态数据和所述动态数据。...

【专利技术属性】
技术研发人员:阎开品
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1