用户行为量化方法、系统、设备及存储介质技术方案

技术编号:19143094 阅读:23 留言:0更新日期:2018-10-13 09:07
本发明专利技术提供了用户行为量化的方法、系统、设备及存储介质,包括步骤:将订单涉及的所有动作按固定次序预先排列为一参考序列;采集用户订单下单前的操作的动作,按形成时序排列动作以形成动作序列;将动作序列转换为动作矩阵;构建循环神经网络模型,将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行训练;输出最后一层的隐藏层作为输出结果。本发明专利技术通过动作序列采集包括时序信息的动作,通过转换动作向量,以实现时序信息的初步数值化,通过构建以及训练循环神经网络模型,输出最后一层的隐藏层,从而实现处理和预测时间序列数据,以应用于用户行为监督模型,有效提高预测准确性。

User behavior quantification method, system, device and storage medium

The invention provides a method, a system, a device and a storage medium for quantifying user behavior, including steps: arranging all the actions involved in an order into a reference sequence in a fixed order; collecting the actions of the operations before the user orders are placed, arranging the actions according to the formation sequence to form the action sequence; converting the action sequence into the action sequence; Action matrix; Construct a cyclic neural network model, input multiple action matrices and sample labels corresponding to the action matrix into the cyclic neural network model for training; output the last hidden layer as the output results. The invention collects actions including timing information through action sequences, and realizes preliminary numeralization of timing information by transforming action vectors. By constructing and training cyclic neural network model, the hidden layer of the last layer is output, thereby realizing processing and predicting time series data and applying it to user behavior monitoring model. Type, effectively improving the accuracy of prediction.

【技术实现步骤摘要】
用户行为量化方法、系统、设备及存储介质
本专利技术涉及用户信用评估领域,具体地说,涉及用户行为量化方法、系统、设备及存储介质。
技术介绍
随着大数据时代的到来,旅游行业日新月异,用户不仅可以“说走就走”,还有机会享受“免押金,免查房,离店后付款”的优质住宿体验,这在一定程度上取决于用户信用风险的高低。当一个用户享受信用产品后拒绝履约时,就会造成资金损失,所以做好风险的预估显得尤为重要。除了旅游行业,在其他多个行业也越来越多地涉及信用支付,因此准确的用户信用评估也日趋重要。评估用户信用的纬度可以有很多,用户行为跟踪(UserBehaviorTracking,UBT)也是其中的一种。UBT数据十分庞大复杂,基于互联网环境下,进行互联网订单的UBT数据分析,处理方式大多只能简单地统计用户的浏览次数,点击次数,浏览时长等。然而,UBT数据的发生次序也具有重要作用,例如一笔正常的订单,往往有着相对完整的行为路径:如先搜索酒店,再筛选,然后查看酒店详情,图片,往返多次后下单。现有技术没有考虑UBT数据的时间序列信息,更无法将带有时序信息的用户行为量化输入用户行为监督模型。
技术实现思路
针对上述技术中的问题,本专利技术为了解决上述技术问题,提供了一种用户行为量化的方法、系统、设备及存储介质,本专利技术的第一方面提供一种用户行为量化的方法,包括以下步骤:S10、将订单涉及的所有动作按固定次序预先排列为一参考序列;S11、采集用户订单下单前的操作的动作,按形成时序排列动作以形成动作序列;S12、将动作序列中的每一个动作匹配参考序列而转换为一组由0或1表示的动作向量,以将动作序列转换为动作矩阵;S13、构建循环神经网络模型,循环神经网络模型符合公式:st=f(U*xt+W*st-1+b)其中,f为激活函数,St以及St-1为构建循环神经网络的隐藏层,U,W为模型的参数矩阵,b为偏置项,xt为步骤S12中的动作向量;S14、将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据,输入循环神经网络模型,以训练循环神经网络模型;S15、输出最后一层的隐藏层作为输出结果。优选地,步骤S11包括:S111、采集用户订单下单前的所有动作,并按形成时序排列动作以形成动作序列;S113、保留下单前的t次动作,其中t为正整数。优选地,在步骤S11中,在步骤S113前还包括步骤:S112、合并动作序列中相邻的重复动作。优选地,在步骤S14的循环神经网络模型中构建损失函数loss,将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行迭代,最小化损失函数,以获得最优的U,W,b,损失函数loss符合以下公式:其中,pi为预测概率,yi为与动作矩阵对应的订单的样本标签。优选地,在步骤S14中,预测概率pi符合下述公式:pi=softmaz(w_out*st+b_out)其中,w_out为模型的参数矩阵,b_out为偏置项,St为构建循环神经网络的隐藏层;将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入循环神经网络模型进行迭代,最小化损失函数,以获得最优的w_out以及b_out。优选地,在步骤S13中,设定循环神经网络模型的隐含层节点数为q,第一个隐含层S0为任意q*1维向量。优选地,还包括步骤:S16、将步骤S15中的输出结果作为输入数据,输入用户行为监督模型,以进行用户行为监督模型训练。本专利技术的第二方面提供一种用户行为量化的系统,包括:动作采集模块,动作采集模块用于采集用户订单下单前的动作,按形成时序排列动作以形成动作序列;转换模块,转换模块用于将订单涉及的所有动作按固定次序预先排列为一参考序列,将动作序列中的每一个动作匹配参考序列而转换为一组由0或1表示的动作向量,以将动作序列转换为动作矩阵;模型构建模块,模型构建模块用于构建循环神经网络模型,循环神经网络模型符合公式:st=f(U*xt+W*st-1+b)其中,f为激活函数,St以及St-1为构建循环神经网络的隐藏层,U,W为模型的参数矩阵,b为偏置项,xt为转换模块转换后的动作向量;模型训练模块,模型训练模块用于将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据,输入循环神经网络模型,以训练循环神经网络模型;输出模块,输出模块用于输出最后一层的隐藏层作为输出结果。本专利技术的第三方面还提供一种用户行为量化设备,包括:处理器;存储器,其中存储有处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述第一方面的用户行为量化的方法的步骤。本专利技术的第四方面还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现上述第一方面的用户行为量化的方法的步骤。本专利技术所提供的用户行为量化的方法、系统、设备及存储介质通过对于订单下单前动作的采集,按时序形成动作序列,从而获取UBT数据的时间序列信息。通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量,以将所述动作序列转换为动作矩阵,从而实现时序信息的初步数值化。通过构建循环神经网络模型以及训练循环神经网络模型,输出最后一层的隐藏层,从而实现处理和预测时间序列数据,以使得提取后的时序数据能够被量化,以应用于用户行为监督模型。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显。图1是本专利技术一实施例的用户行为量化的方法的流程图;图2是图1中步骤S11的详细流程图;图3是本专利技术一实施例的循环神经网络模型的示意图;图4是本专利技术一实施例的包括用户行为量化的系统的模块示意图;图5是本专利技术一实施例的用户行为量化的设备的结构示意图;以及图6是本专利技术一实施例的计算机可读存储介质的结构示意图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本专利技术将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。现有技术在进行互联网订单的UBT数据分析,处理方式大多只能简单地统计用户的浏览次数,点击次数,浏览时长等,而没有考虑UBT数据的时间序列信息。传统的监督模型大多只能够接受矩阵输入数据格式,而无法利用用户浏览数据中的“先后顺序”。无法有效地提取出UBT数据中隐藏的时间序列信息,并量化为传统模型训练可以接受的数据格式。本专利技术采集订单下单前动作,按时序形成动作序列,通过将动作序列中的每一个动作匹配预设的参考序列而转换为一组由0或1表示的动作向量,以将所述动作序列转换为动作矩阵,通过构建循环神经网络模型以及训练循环神经网络模型,输出最后一层的隐藏层,从而实现了时间序列信息的采集以及量化,使得时序信息能够被在监督模型中计算,从而有效地提高用户信用评估的准确性。图1是本专利技术一实施例的用户行为量化的方法的流程图。如图1所示,本专利技术的用户行为量化的方法,包括以下步骤:S10、将订单涉及的所有动作按固定次序预先排列为一参考序列。预先定义用户进行互联网订单下单前的所有操作的动作。例如在酒店下单场景下,用户下单前的操作的动作包括浏览酒店列表页面,浏览酒店图片,浏览酒店评价,搜索酒店名称,筛选酒店本文档来自技高网...

【技术保护点】
1.一种用户行为量化的方法,其特征在于,包括以下步骤:S10、将订单涉及的所有动作按固定次序预先排列为一参考序列;S11、采集用户订单下单前的操作的动作,按形成时序排列所述动作以形成动作序列;S12、将所述动作序列中的每一个动作匹配所述参考序列而转换为一组由0或1表示的动作向量,以将所述动作序列转换为动作矩阵;S13、构建循环神经网络模型,所述循环神经网络模型符合公式:st=f(U*xt+W*st‑1+b)其中,f为激活函数,St以及St‑1为构建循环神经网络的隐藏层,U,W为模型的参数矩阵,b为偏置项,xt为步骤S12中的所述动作向量;S14、将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据,输入所述循环神经网络模型,以训练循环神经网络模型;S15、输出最后一层的隐藏层作为输出结果。

【技术特征摘要】
1.一种用户行为量化的方法,其特征在于,包括以下步骤:S10、将订单涉及的所有动作按固定次序预先排列为一参考序列;S11、采集用户订单下单前的操作的动作,按形成时序排列所述动作以形成动作序列;S12、将所述动作序列中的每一个动作匹配所述参考序列而转换为一组由0或1表示的动作向量,以将所述动作序列转换为动作矩阵;S13、构建循环神经网络模型,所述循环神经网络模型符合公式:st=f(U*xt+W*st-1+b)其中,f为激活函数,St以及St-1为构建循环神经网络的隐藏层,U,W为模型的参数矩阵,b为偏置项,xt为步骤S12中的所述动作向量;S14、将多个动作矩阵以及与动作矩阵对应的订单的样本标签作为输入数据,输入所述循环神经网络模型,以训练循环神经网络模型;S15、输出最后一层的隐藏层作为输出结果。2.如权利要求1所述的用户行为量化的方法,其特征在于,所述步骤S11包括:S111、采集用户订单下单前的所有动作,并按形成时序排列所述动作以形成动作序列;S113、保留下单前的t次动作,其中t为正整数。3.如权利要求2所述的用户行为量化的方法,其特征在于,在所述步骤S11中,在步骤S113前还包括步骤:S112、合并动作序列中相邻的重复动作。4.如权利要求1所述的用户行为量化的方法,其特征在于在步骤S14的循环神经网络模型中构建损失函数loss,将多个动作矩阵以及与动作矩阵对应的订单的样本标签输入所述循环神经网络模型进行迭代,最小化损失函数,以获得最优的U,W,b,损失函数loss符合以下公式:其中,pi为预测概率,yi为与动作矩阵对应的订单的样本标签。5.如权利要求4所述的用户行为量化的方法,其特征在于在步骤S14中,预测概率pi符合下述公式:pi=softmax(w_out*st+b_out)其中,w_out为模型的参数矩阵,b_out为偏置项,St为构建循环神经网...

【专利技术属性】
技术研发人员:李腾龙霍文虎
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1