处理用户行为数据的方法和装置制造方法及图纸

技术编号:11410733 阅读:93 留言:0更新日期:2015-05-06 10:08
本发明专利技术提供一种处理用户行为数据的方法和装置,有助于判断未下单用户是否存在需求,以此为基础可以确定商品需求量。本发明专利技术的处理用户行为数据的方法包括:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量,并且记录各用户在预选时间段之后是否购买了该商品;根据多个用户的数据建立训练集,在该训练集对应的模型中,输入量为用户对指定商品的行为的数量,输出量为该用户是否购买该指定商品;对训练集进行线性回归训练以确定训练集的多个参数,从而得到模型;统计目标未下单用户在预设时间段内的行为的数量,将该数量作为输入量输入到模型中,得出模型的输出量。

【技术实现步骤摘要】
处理用户行为数据的方法和装置
本专利技术涉及计算机
,特别地涉及一种处理用户行为数据的方法和装置。
技术介绍
在电子商务平台中,采销人员常常要对商品的需求进行量化,从而确定商品的库存和补货策略。商品需求的量化通常是计算商品的需求用户量。目前的一种方式是采用商品的下单用户量近似替代商品需求量。在该方式中,根据商品标识来统计该商品在一个时段例如一周的下单量,以该下单量作为该商品每周的需求量。这种方式没有考虑未下单用户的需求,容易导致需求量预测的数据偏小。目前采用的另一种方式是考虑用户的浏览量,对于指定的商品,统计在一个历史时段例如一周的下单量,另外还统计对该商品的浏览量达到预设值的用户数量,将该用户数量加上该下单量,作为该商品的需求量。这种方式仍不够准确,因为在用户浏览某个商品时,如发现该商品显示为无库存,则不再浏览,导致浏览量达不到上述的预设值,使需求量的统计仍偏小。因此需要一种方法来确定用户对商品的需求,以此为基础可以确定该商品的需求量。
技术实现思路
有鉴于此,本专利技术提供一种处理用户行为数据的方法和装置,有助于判断未下单用户是否存在需求,以此为基础可以确定商品需求量。为实现上述目的,根据本专利技术的一个方面,提供了一种处理用户行为数据的方法。本专利技术的处理用户行为数据的方法包括:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量,并且记录各用户在所述预选时间段之后是否购买了该商品;根据所述多个用户的数据建立训练集,在该训练集对应的模型中,输入量为用户对所述指定商品的行为的数量,输出量为该用户是否购买该指定商品;对所述训练集进行线性回归训练以确定所述训练集的多个参数,从而得到所述模型;统计目标未下单用户在预设时间段内的行为的数量,将该数量作为输入量输入到所述模型中,得出所述模型的输出量。可选地,所述模型为如下等式:Y=β0+β1X1+β2X2+…+βnXn+ε;其中Y的取值对应于用户是否购买商品,ε表示预设常数,β0、β1、……βn表示权重系数,对于X1、X2、…Xn,当自然数下标n的值对应于所述用户对商品的行为的次数时,Xn取第一预设值,否则取第二预设值。可选地,所述线性回归训练采用梯度下降法。可选地,在得到所述模型之后,还包括:统计多个目标用户在预设时间段内的行为的数量,将这些数量分别作为输入量输入到所述模型中,得出所述模型的多个输出量;根据所述多个输出量确定所述多个目标用户中购买所述指定商品的用户的数量。根据本专利技术的另一方面,提供了一种处理用户行为数据的装置。本专利技术的处理用户行为数据的装置包括:统计模块,用于对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量;记录模块,用于记录所述各用户在所述预选时间段之后是否购买了所述指定商品;训练模块,用于对训练集进行线性回归训练以确定所述训练集的多个参数,从而得到该训练集对应的模型;该训练集是根据所述多个用户的数据建立,在所述模型中,输入量为用户对商品的行为的数量,输出量为该用户是否购买所述指定商品;计算模块,用于统计目标用户在预设时间段内的行为的数量,将该数量作为输入量输入到所述模型中,得出所述模型的输出量。可选地,所述模型为如下等式:Y=β0+β1X1+β2X2+…+βnXn+ε;其中Y的取值对应于用户是否购买所述指定商品,ε表示预设常数,β0、β1、……βn表示权重系数,对于X1、X2、…Xn,当自然数下标n的值对应于所述用户对该商品的行为的次数时,Xn取第一预设值,否则取第二预设值。可选地,所述线性回归训练采用梯度下降法。可选地,所述计算模块还用于:统计多个目标未下单用户在预设时间段内对所述指定商品的行为的数量,将这些数量分别作为输入量输入到所述模型中,得出所述模型的多个输出量;根据所述多个输出量确定所述多个目标用户中购买所述指定商品的用户的数量。根据本专利技术的技术方案,采用历史数据进行模型训练得到模型,再用该模型来预测未下单用户是否在后期下单,在训练集比较大的情况下能够收到相当准确的预测效果,有助于准确确定商品的需求量。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的处理用户行为数据的方法的主要步骤的示意图;图2是根据本专利技术实施例的处理用户行为数据的装置的主要模块的示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在本专利技术实施例中,对于用户的针对商品的行为进行建模来预测用户对于未下单但浏览的商品是否有需求。以下结合图1进行说明。图1是根据本专利技术实施例的处理用户行为数据的方法的主要步骤的示意图。步骤S11:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量。上述用户对商品的行为可以是一种行为,例如对该商品的直接浏览;最好是综合统计用户的多种行为,例如直接浏览该商品、通过搜索引擎搜索该商品、通过搜索入口访问该商品等。步骤S12:记录各用户在所述预选时间段之后是否购买了上述指定商品。上述两个步骤是数据准备阶段,根据历史数据得到训练集的数据。这里的预选时间段可以是一天、几天或者更长时间,根据实际情况选择。步骤S13:建立训练集。训练集是根据上述步骤得到的数据而得出。训练集对应的模型的输出量表示用户是否购买上述指定的商品。例如设置输出量为0表示用户未下单,1表示已下单。当然也可以采用其他数值。该模型的输入量是用户对该商品的行为的数量。例如采用浏览量,则可以设置浏览量上限为300,如某一用户的浏览量为20,则对应于该用户的向量[X1,X2,…Xn]为[0,0,…1,…0],其中只有第20个元素的值为1,其他元素值为0。这里第20个元素是根据浏览量为20确定。又如采用直接浏览该商品、通过搜索引擎搜索该商品、通过搜索入口访问该商品这三种行为,则可以分别设置三种行为的上限是300,将各行为对应的向量连接成维度为900的向量并设定其中不为0的元素的位置与行为数量一致,例如用户直接浏览量是10,搜索引擎搜索该商品5次,通过搜索入口访问该商品3次,则上述的维度为900的向量中只有第10、305、603个元素为1,其他元素为0。训练集对应的模型可采用如下等式:Y=β0+β1X1+β2X2+…+βnXn+ε;其中Y为上述的输出量,其取值对应于用户是否购买商品,例如Y为0表示用户未下单,为1表示已下单。ε表示预设常数,用来调节模型的准确性。β0、β1、……βn表示权重系数,X1、X2、…Xn是上述的向量中的元素,根据上文的描述,当自然数下标n的值对应于用户对商品的行为的次数时,Xn取第一预设值例如1,否则取第二预设值例如0。步骤S14:对训练集进行线性回归训练。本步骤是要确定上述的权重系数β0、β1、……βn。具体可采用梯度下降法。在确定上述的权重系数之后,模型即随之确定。步骤S15:对于预设的时间段,统计目标未下单用户在该时间段本文档来自技高网...
处理用户行为数据的方法和装置

【技术保护点】
一种处理用户行为数据的方法,其特征在于,包括:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量,并且记录各用户在所述预选时间段之后是否购买了该商品;根据所述多个用户的数据建立训练集,在该训练集对应的模型中,输入量为用户对所述指定商品的行为的数量,输出量为该用户是否购买该指定商品;对所述训练集进行线性回归训练以确定所述训练集的多个参数,从而得到所述模型;统计目标未下单用户在预设时间段内的行为的数量,将该数量作为输入量输入到所述模型中,得出所述模型的输出量。

【技术特征摘要】
1.一种处理用户行为数据的方法,其特征在于,包括:对于多个用户在预选时间段内的未下单的指定商品,分别统计其中各用户在该预选时间段内对该商品的行为的数量,并且记录各用户在所述预选时间段之后是否购买了该商品;根据所述多个用户的数据建立训练集,在该训练集对应的模型中,输入量为用户对所述指定商品的行为的数量,输出量为该用户是否购买该指定商品;所述模型为如下等式:Y=β0+β1X1+β2X2+…+βnXn+ε;其中Y的取值对应于用户是否购买商品,ε表示预设常数,β0、β1、……βn表示权重系数,对于X1、X2、…Xn,当自然数下标n的值对应于所述用户对商品的行为的次数时,Xn取第一预设值,否则取第二预设值;对所述训练集进行线性回归训练以确定所述训练集的多个参数,从而得到所述模型;统计目标未下单用户在预设时间段内的行为的数量,将该数量作为输入量输入到所述模型中,得出所述模型的输出量。2.根据权利要求1所述的方法,其特征在于,所述线性回归训练采用梯度下降法。3.根据权利要求1所述的方法,其特征在于,在得到所述模型之后,还包括:统计多个目标用户在预设时间段内的行为的数量,将这些数量分别作为输入量输入到所述模型中,得出所述模型的多个输出量;根据所述多个输出量确定所述多个目标用户中购买所述指定商品的用户的数量。4.一种处理用户行为数据的装置...

【专利技术属性】
技术研发人员:陈海勇牟川邢志峰
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1