数据确定方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:20969668 阅读:26 留言:0更新日期:2019-04-29 17:24
本公开实施例公开了一种数据确定方法、装置、电子设备及计算机可读存储介质,所述数据确定方法包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理,根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。该技术方案能够提高用户下单概率等数据确定的准确性,为平台、为商户提供可靠的数据支持。

Data determination methods, devices, electronic devices and computer-readable storage media

The present disclosure embodiments disclose a data determination method, device, electronic equipment and computer readable storage medium. The data determination method includes: acquiring user history data in a preset period of time and extracting the feature vectors of the historical data; preprocessing discrete and continuous features of the feature vectors respectively, and acquiring them according to the pre-processed feature vectors. The training eigenvector is obtained, and the training eigenvector is used to train the data to determine the model, and the data to determine the model is determined according to the data. The technical scheme can improve the accuracy of data determination such as user's single probability, and provide reliable data support for platform and merchants.

【技术实现步骤摘要】
数据确定方法、装置、电子设备及计算机可读存储介质
本公开涉及数据处理
,具体涉及一种数据确定方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,越来越多的商家或者服务提供商通过互联网平台来为用户提供服务。为了提高服务质量、提升用户的使用体验,同时提高用户的下单率,很多平台都根据历史下单用户的特征信息确定当前用户下单的概率。但现有技术在进行下单概率的确定时,通常只考虑用户的平台属性特征,特征比较单一,另外,现有技术对于所有特征执行相同的处理操作,没有考虑特征的特点,这就使得现有技术中对于当前用户下单概率确定的准确性较为低下,无法为平台、为商户提供可靠的数据支持。
技术实现思路
本公开实施例提供一种数据确定方法、装置、电子设备及计算机可读存储介质。第一方面,本公开实施例中提供了一种数据确定方法。具体的,所述数据确定方法,包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理;根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。结合第一方面,本公开在第一方面的第一种实现方式中,所述特征向量包括以下特征中的一种或多种:标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征。结合第一方面和第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,所述获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量,包括:获取预设时间段内的用户历史数据;基于所述历史数据提取所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征;将所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征组合起来,得到所述用户的特征向量。结合第一方面、第一方面的第一种实现方式和第一方面的第二种实现方式,本专利技术实施例在第一方面的第三种实现方式中,所述对所述特征向量中的离散特征和连续特征分别进行预处理,包括:获取所述特征向量中的离散特征,对于所述离散特征进行编码处理,并生成所述离散特征的第一索引值和第一特征值;获取所述特征向量中的连续特征,对于所述连续特征进行归一化处理,并生成所述连续特征的第二索引值和第二特征值。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式和第一方面的第三种实现方式,本专利技术实施例在第一方面的第四种实现方式中,所述根据预处理后的特征向量获得训练特征向量,包括:组合所述第一索引值和第二索引值,得到特征索引集合,组合所述第一特征值和第二特征值,得到特征值集合;将所述用户的特征索引集合、特征值集合和相应的标签特征组成所述训练特征向量。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式和第一方面的第四种实现方式,本专利技术实施例在第一方面的第五种实现方式中,所述利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定,包括:利用所述训练特征向量训练得到数据确定模型;获取待确定用户的特征索引和特征值;将所述待确定用户的特征索引和特征值输入至所述数据确定模型中,得到所述待确定用户的数据确定结果。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式和第一方面的第五种实现方式,本专利技术实施例在第一方面的第六种实现方式中,所述数据确定模型为DeepFM模型。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第四种实现方式、第一方面的第五种实现方式和第一方面的第六种实现方式,本专利技术实施例在第一方面的第七种实现方式中,所述训练特征向量、所述待确定用户的特征索引和特征值均来自所述预处理后的特征向量。第二方面,本公开实施例中提供了一种数据确定装置。具体的,所述数据确定装置,包括:提取模块,被配置为获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;预处理模块,被配置为对所述特征向量中的离散特征和连续特征分别进行预处理;获得模块,被配置为根据预处理后的特征向量获得训练特征向量;确定模块,被配置为利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。结合第二方面,本专利技术实施例在第二方面的第一种实现方式中,所述特征向量包括以下特征中的一种或多种:标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征。结合第二方面和第二方面的第一种实现方式,本专利技术实施例在第二方面的第二种实现方式中,所述提取模块包括:第一获取子模块,被配置为获取预设时间段内的用户历史数据;提取子模块,被配置为基于所述历史数据提取所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征;第一组合子模块,被配置为将所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征组合起来,得到所述用户的特征向量。结合第二方面、第二方面的第一种实现方式和第二方面的第二种实现方式,本专利技术实施例在第二方面的第三种实现方式中,所述预处理模块包括:编码子模块,被配置为获取所述特征向量中的离散特征,对于所述离散特征进行编码处理,并生成所述离散特征的第一索引值和第一特征值;归一化子模块,被配置为获取所述特征向量中的连续特征,对于所述连续特征进行归一化处理,并生成所述连续特征的第二索引值和第二特征值。结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式和第二方面的第三种实现方式,本专利技术实施例在第二方面的第四种实现方式中,所述获得模块包括:第二组合子模块,被配置为组合所述第一索引值和第二索引值,得到特征索引集合,组合所述第一特征值和第二特征值,得到特征值集合;第三组合子模块,被配置为将所述用户的特征索引集合、特征值集合和相应的标签特征组成所述训练特征向量。结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式和第二方面的第四种实现方式,本专利技术实施例在第二方面的第五种实现方式中,所述确定模块包括:训练子模块,被配置为利用所述训练特征向量训练得到数据确定模型;第二获取子模块,被配置为获取待确定用户的特征索引和特征值;确定子模块,被配置为将所述待确定用户的特征索引和特征值输入至所述数据确定模型中,得到所述待确定用户的数据确定结果。结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式和第二方面的第五种实现方式,本专利技术实施例在第二方面的第六种实现方式中,所述数据确定模型为DeepFM模型。结合第二方面、第二方面的第一种实现方式、第二方面的第二种实现方式、第二方面的第三种实现方式、第二方面的第四种实现方式、第二方面的第五种实现方式和第二方面的第六种实现方式,本专利技术实施例在第二方面的第七种实现方式中,所述训练特征向量、所述待确定用户的特征索引和特征值均来自所述预处理后的特征向量。第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条支持数据确定装置执行上述第一方面中数据确定方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算本文档来自技高网...

【技术保护点】
1.一种数据确定方法,其特征在于,包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理;根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。

【技术特征摘要】
1.一种数据确定方法,其特征在于,包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理;根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。2.根据权利要求1所述的方法,其特征在于,所述特征向量包括以下特征中的一种或多种:标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征。3.根据权利要求2所述的方法,其特征在于,所述获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量,包括:获取预设时间段内的用户历史数据;基于所述历史数据提取所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征;将所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征组合起来,得到所述用户的特征向量。4.根据权利要求1-3任一所述的方法,其特征在于,所述对所述特征向量中的离散特征和连续特征分别进行预处理,包括:获取所述特征向量中的离散特征,对于所述离散特征进行编码处理,并生成所述离散特征的第一索引值和第一特征值;获取所述特征向量中的连续特征,对于所述连续特征进行归一化处理,并生成所述连续特征的第二索引值和第二特征值。5.一种数据确定装置,其特征在于,包括:提取模块,被配置为获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;预处理模块,被配置为对所述特征向量中的离散特征和连续特征分别进行预处理;获得模块,被配置为根据预处理后的特征向量获得训练特征向量;确定模块,被配置为利用所述训练特征向量训练得到数据确定模...

【专利技术属性】
技术研发人员:周小又
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1