【技术实现步骤摘要】
样本生成方法、装置、计算机可读存储介质和计算机设备
本申请涉及人工智能
,特别是涉及一种样本生成方法、装置、计算机可读存储介质和计算机设备。
技术介绍
目前,随着人工智能技术的快速发展,使用机器学习或深度学习等人工智能方法来解决实际问题已逐渐成为时代趋势。然而,现有的机器学习模型建模过程中,往往容易出现特征穿越而导致模型线上效果非常差的情况,例如在模型训练时,错误地将结果当作原因来使用,不仅会导致模型训练所用数据的准确率较低,还会导致模型当前的学习规律与事实不符,进而导致最终的模型预测精度较差等问题。因此,现有技术中的模型训练样本存在训练模型有效率低的问题。
技术实现思路
基于此,有必要针对现有技术中模型训练样本存在训练模型有效率低的技术问题,提供一种样本生成方法、装置、计算机可读存储介质和计算机设备。一方面,本专利技术实施例提供一种样本生成方法,包括:获取目标商品在网络媒介信息投放后的资源转移数据;资源转移数据包括资源转移时间;确定网络媒介信息的信息投放时间,并根据信息投放 ...
【技术保护点】
1.一种样本生成方法,其特征在于,包括如下步骤:/n获取目标商品在网络媒介信息投放后的资源转移数据;所述资源转移数据包括资源转移时间;/n确定所述网络媒介信息的信息投放时间,并根据所述信息投放时间与所述资源转移时间,从预存的至少两组候选特征数据中确定目标特征数据;/n根据所述目标特征数据与所述资源转移数据,生成模型训练样本。/n
【技术特征摘要】
1.一种样本生成方法,其特征在于,包括如下步骤:
获取目标商品在网络媒介信息投放后的资源转移数据;所述资源转移数据包括资源转移时间;
确定所述网络媒介信息的信息投放时间,并根据所述信息投放时间与所述资源转移时间,从预存的至少两组候选特征数据中确定目标特征数据;
根据所述目标特征数据与所述资源转移数据,生成模型训练样本。
2.根据权利要求1所述的方法,其特征在于,所述确定所述网络媒介信息的信息投放时间,并根据所述信息投放时间与所述资源转移时间,从预存的至少两组候选特征数据中确定目标特征数据,包括:
确定所述网络媒介信息的信息投放时间;
将所述信息投放时间与所述资源转移时间进行匹配;
若所述信息投放时间与所述资源转移时间不匹配,则根据所述信息投放时间,从预存的至少两组候选特征数据中确定目标特征数据。
3.根据权利要求2所述的方法,其特征在于,所述若所述信息投放时间与所述资源转移时间不匹配,则根据所述信息投放时间,从预存的至少两组候选特征数据中确定目标特征数据,包括:
若所述信息投放时间与所述资源转移时间不匹配,则从预存的至少两组候选特征数据中,确定与所述信息投放时间相匹配的候选特征数据,作为所述目标特征数据。
4.根据权利要求1所述的方法,其特征在于,所述获取目标商品在网络媒介信息投放后的资源转移数据,包括:
获取所述目标商品在网络媒介信息投放后的历史日志数据;
读取所述历史日志数据中的资源转移状态;
当所述资源转移状态为已转移状态时,确定所述历史日志数据,作为所述资源转移数据。
5.根据...
【专利技术属性】
技术研发人员:李伟,苏函晶,王文瀚,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。