System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及互联网信息数据处理领域,尤其涉及一种下单预测模型的构建方法、装置和下单预测方法。
技术介绍
1、互联网时代下,用户在浏览网页和使用应用软件时都会产生大量的用户评论数据和用户行为数据,两种数据分别以文本和数值的形式存在。在购物平台上或者机票预定平台上,用户在下单之前往往会产生大量上述数据,因此能够利用评论来预估用户的下单概率。
2、但是在目前的社会生产实践中,大部分的下单预测方法只采用了用户行为数据,通过机器学习类的算法进行用户下单预测。这样的方法中使用了数值特征,而忽略了文本特征,不能结合数值特征和文本特征对用户下单行为进行预测。
技术实现思路
1、本专利技术要解决的技术问题是为了克服现有技术中无法结合用户行为数据和评论数据预测用户下单的缺陷,提供一种下单预测模型的构建方法、装置和下单预测方法。
2、本专利技术是通过下述技术方案来解决上述技术问题:
3、第一方面,本专利技术提供一种下单预测模型构建方法,所述下单预测模型构建方法用于构建下单预测模型,所述下单预测模型用于计算用户的下单概率,所述下单预测模型构建方法包括以下步骤:
4、采集用户的行为数据和用户的评论数据,对所述行为数据和所述评论数据分别进行预处理,得到训练样本集,所述训练样本集包含行为数据样本集和评论数据样本集;
5、采用评论数据提取模型和行为数据提取模型,分别对所述评论数据和所述行为数据进行特征提取,生成所述评论数据的特征向量和所述行为数据的特征
6、采用特征融合模型融合所述评论数据的特征向量和所述行为数据的特征向量;
7、基于所述训练样本集,对所述数据提取模型、所述行为数据提取模型和所述特征融合模型进行训练,得到应用预测模型。
8、具体地,所述对两种数据分别进行预处理的步骤包括:
9、在所述用户行为数据中,筛选部分行为数据生成所述用户行为数据训练样本集;
10、对所述用户行为数据训练样本集进行最小-最大标准化处理。
11、本专利技术中,对用户行为数据训练样本集进行最小-最大标准化能够在训练过程中统一数据尺度,有利于模型的收敛。
12、具体地,所述对两种数据分别进行预处理的步骤还包括:
13、在所述评论数据中,提取字符生成词表,所述词表通过词嵌入矩阵匹配生成预训练嵌入矩阵;
14、从预训练嵌入矩阵中,获取所述评论数据的向量表示形式,生成所述评论数据样本集。
15、具体地,所述评论数据提取模型为text cnn。
16、具体地,所述行为数据提取模型由特征工程得到。
17、具体地,所述采用特征融合模型融合所述评论数据的特征向量和所述行为数据的特征向量的步骤包括:
18、在所述评论数据的特征向量和行为数据的特征向量的第一维度,拼接所述评论数据的特征向量和所述行为数据的特征向量生成第三特征向量;
19、所述特征融合模型采用两层全连接层,第一全连接层将所述第三特征向量缩放到第一预设数值,第二全连接层将所述缩放后的第三特征向量缩放到第二预设数值。
20、具体地,所述对所述评论数据提取模型、所述行为数据提取模型和所述特征融合模型进行训练的步骤包括:
21、采用反向传播算法和梯度下降算法在所述评论数据提取模型、所述行为数据提取模型和所述特征融合模型中迭代计算损失值,当所述损失值小于第三预设数值时终止训练。
22、具体地,所述评论数据包括所述用户对商品的评论、所述用户对商品的提问、所述用户针对所述提问的回答内容的评论和所述用户对其他用户关于商品的分享内容的评论,所述分享内容包括文章和视频。
23、第二方面,本专利技术提供一种下单预测模型构建装置,所述下单预测模型构建装置用于构建下单预测模型,所述下单预测模型用于计算用户的下单概率,所述下单预测模型构建装置包括以下模块:
24、采集模块,用于采集用户的行为数据和用户的评论数据,对两种数据分别进行预处理,得到训练样本集,所述训练样本集包含行为数据样本集和评论数据样本集;
25、特征提取模块,用于采用评论数据提取模型和行为数据提取模型,分别对所述评论数据和所述行为数据进行特征提取,生成所述评论数据的特征向量和所述行为数据的特征向量;
26、特征融合模块,用于采用特征融合模型融合所述评论数据的特征向量和所述行为数据的特征向量;
27、模型训练模块,用于基于所述训练样本集,对所述数据提取模型、所述行为数据提取模型和所述特征融合模型进行训练,得到应用预测模型。
28、第三方面,本专利技术提供一种下单预测方法,所述下单预测方法通过第一发面所述的构建方法构建的下单预测模型实现,所述下单预测方法包括以下步骤:
29、获取用户的行为数据和用户的评论数据;
30、将所述行为数据和评论数据输入到所述下单预测模型,计算所述用户的下单概率。
31、本专利技术的积极进步效果在于:评论数据和行为数据的多维度特征提取能够更全面地捕捉用户行为与评论信息中的关键因素,使得模型能够更深层次理解用户的购物意图和偏好;通过特征融合模型将不同来源的数据特征结合起来,可以让模型捕获更多关联信息,增加了特征信息的丰富度和细腻度,增强了模型的特征提取能力,提高了预测的准确性,能够较为准确地预测用户是否会对商品进行下单,从而为购物平台提供决策支持。
本文档来自技高网...【技术保护点】
1.一种下单预测模型构建方法,其特征在于,所述下单预测模型构建方法用于构建下单预测模型,所述下单预测模型用于计算用户的下单概率,所述下单预测模型构建方法包括以下步骤:
2.如权利要求1所述的下单预测模型构建方法,其特征在于,所述行为数据和所述评论数据分别进行预处理的步骤包括:
3.如权利要求1所述的下单预测模型构建方法,其特征在于,所述行为数据和所述评论数据分别进行预处理的步骤还包括:
4.如权利要求1所述的下单预测模型构建方法,其特征在于,所述评论数据提取模型为Text CNN。
5.如权利要求1所述的下单预测模型构建方法,其特征在于,所述行为数据提取模型由特征工程得到。
6.如权利要求1所述的下单预测模型构建方法,其特征在于,所述采用特征融合模型融合所述评论数据的特征向量和所述行为数据的特征向量的步骤包括:
7.如权利要求6所述的下单预测模型构建方法,其特征在于,所述对所述评论数据提取模型、所述行为数据提取模型和所述特征融合模型进行训练的步骤包括:
8.如权利要求1所述的下单预测模型构建方法,
9.一种下单预测模型构建装置,其特征在于,所述下单预测模型构建装置用于构建下单预测模型,所述下单预测模型用于计算用户的下单概率,所述下单预测模型构建装置包括以下模块:
10.一种下单预测方法,其特征在于,所述下单预测方法通过如权利要求1-8任一项所述的构建方法构建的下单预测模型实现,所述下单预测方法包括以下步骤:
...【技术特征摘要】
1.一种下单预测模型构建方法,其特征在于,所述下单预测模型构建方法用于构建下单预测模型,所述下单预测模型用于计算用户的下单概率,所述下单预测模型构建方法包括以下步骤:
2.如权利要求1所述的下单预测模型构建方法,其特征在于,所述行为数据和所述评论数据分别进行预处理的步骤包括:
3.如权利要求1所述的下单预测模型构建方法,其特征在于,所述行为数据和所述评论数据分别进行预处理的步骤还包括:
4.如权利要求1所述的下单预测模型构建方法,其特征在于,所述评论数据提取模型为text cnn。
5.如权利要求1所述的下单预测模型构建方法,其特征在于,所述行为数据提取模型由特征工程得到。
6.如权利要求1所述的下单预测模型构建方法,其特征在于,所述采用特征融合模型融合所述评论数据的特征向量和所述行为数据...
【专利技术属性】
技术研发人员:陈晶,邵峰峰,张坤莲,裴旭东,李虹宇,张晓强,
申请(专利权)人:携程旅游网络技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。