The present disclosure embodiments disclose a data determination method, device, electronic equipment and computer readable storage medium. The data determination method includes: acquiring user history data in a preset period of time and extracting the feature vectors of the historical data; preprocessing discrete and continuous features of the feature vectors respectively, and acquiring them according to the pre-processed feature vectors. The training eigenvector is obtained, and the training eigenvector is used to train the data to determine the model, and the data to determine the model is determined according to the data. The technical scheme can improve the accuracy of data determination such as user's single probability, and provide reliable data support for platform and merchants.
【技术实现步骤摘要】
数据确定方法、装置、电子设备及计算机可读存储介质
本公开涉及数据处理
,具体涉及一种数据确定方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,越来越多的商家或者服务提供商通过互联网平台来为用户提供服务。为了提高服务质量、提升用户的使用体验,同时提高用户的下单率,很多平台都根据历史下单用户的特征信息确定当前用户下单的概率。但现有技术在进行下单概率的确定时,通常只考虑用户的平台属性特征,特征比较单一,另外,现有技术对于所有特征执行相同的处理操作,没有考虑特征的特点,这就使得现有技术中对于当前用户下单概率确定的准确性较为低下,无法为平台、为商户提供可靠的数据支持。
技术实现思路
本公开实施例提供一种数据确定方法、装置、电子设备及计算机可读存储介质。第一方面,本公开实施例中提供了一种数据确定方法。具体的,所述数据确定方法,包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理;根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。结合第一方面,本公开在第一方面的第一种实现方式中,所述特征向量包括以下特征中的一种或多种:标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征。结合第一方面和第一方面的第一种实现方式,本专利技术实施例在第一方面的第二种实现方式中,所述获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量,包括:获取预设时间段内的用户历史数据;基于所述历史数据提取所述用户的标识特征、属性特征 ...
【技术保护点】
1.一种数据确定方法,其特征在于,包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理;根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。
【技术特征摘要】
1.一种数据确定方法,其特征在于,包括:获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;对所述特征向量中的离散特征和连续特征分别进行预处理;根据预处理后的特征向量获得训练特征向量;利用所述训练特征向量训练得到数据确定模型,并根据所述数据确定模型进行数据确定。2.根据权利要求1所述的方法,其特征在于,所述特征向量包括以下特征中的一种或多种:标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征。3.根据权利要求2所述的方法,其特征在于,所述获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量,包括:获取预设时间段内的用户历史数据;基于所述历史数据提取所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征;将所述用户的标识特征、属性特征、位置特征、喜好特征、行为特征和标签特征组合起来,得到所述用户的特征向量。4.根据权利要求1-3任一所述的方法,其特征在于,所述对所述特征向量中的离散特征和连续特征分别进行预处理,包括:获取所述特征向量中的离散特征,对于所述离散特征进行编码处理,并生成所述离散特征的第一索引值和第一特征值;获取所述特征向量中的连续特征,对于所述连续特征进行归一化处理,并生成所述连续特征的第二索引值和第二特征值。5.一种数据确定装置,其特征在于,包括:提取模块,被配置为获取预设时间段内的用户历史数据,并提取所述历史数据的特征向量;预处理模块,被配置为对所述特征向量中的离散特征和连续特征分别进行预处理;获得模块,被配置为根据预处理后的特征向量获得训练特征向量;确定模块,被配置为利用所述训练特征向量训练得到数据确定模...
【专利技术属性】
技术研发人员:周小又,
申请(专利权)人:拉扎斯网络科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。