【技术实现步骤摘要】
一种生成预测数据的方法及系统
本专利技术属于数据预测领域,具体涉及一种生成预测数据的方法及系统。
技术介绍
用户画像系统中,业务需求变得越来越多种多样,业务也越来越关注通过算法、模型推测出的标签数据,但是用户标签数据的创建需要人工手动创建和分析数据,庞大的业务数据由人工进行特征分析,关联分析,耗费大量时间筛选出影响算法和标签数据的特征组,特别对于基于算法类生成标签数据的情况,虽然算法的数量有限,但是为了生成不同的标签数据,需要做大量的数据分析、特征挑选和算法参数调优的操作,许多重复工作耗费大量的人力和计算资源。
技术实现思路
本专利技术提供了一种生成预测数据的方法及系统。为了解决上述技术问题,本专利技术实施例提供了如下的技术方案:本专利技术第一方面提供一种生成预测数据的方法,所述方法包括,基于基础数据得到第一数据;所述第一数据用于表征用户的特征;基于预测数据确定相应的算法模型;基于所述预测数据与算法模型,从所述第一数据中确定出第二数据;所述第二数据表征用户的特征,其 ...
【技术保护点】
1.一种生成预测数据的方法,所述方法包括,/n基于基础数据得到第一数据;所述第一数据用于表征用户的特征;/n基于预测数据确定相应的算法模型;/n基于所述预测数据与算法模型,从所述第一数据中确定出第二数据;所述第二数据表征用户的特征,其中,所述第二数据与所述预测数据的相关度高于第一数据与所述预测数据的相关度;/n从所述第二数据中确定出特征数据,其中,所述特征数据与所述预测数据的相关度高于第二数据与所述预测数据的相关度;/n基于所述特征数据对所述算法模型进行训练,得到能够生成所述预测数据的预测模型,所述预测模型至少与特征数据的权重参数相关。/n
【技术特征摘要】
1.一种生成预测数据的方法,所述方法包括,
基于基础数据得到第一数据;所述第一数据用于表征用户的特征;
基于预测数据确定相应的算法模型;
基于所述预测数据与算法模型,从所述第一数据中确定出第二数据;所述第二数据表征用户的特征,其中,所述第二数据与所述预测数据的相关度高于第一数据与所述预测数据的相关度;
从所述第二数据中确定出特征数据,其中,所述特征数据与所述预测数据的相关度高于第二数据与所述预测数据的相关度;
基于所述特征数据对所述算法模型进行训练,得到能够生成所述预测数据的预测模型,所述预测模型至少与特征数据的权重参数相关。
2.根据权利要求1所述的方法,所述方法还包括,
基于所述预测模型生成所述预测数据。
3.根据权利要求1所述的方法,所述基于基础数据得到第一数据,包括,从所述基础数据中筛选出一部分数据作为所述第一数据。
4.根据权利要求1所述的方法,所述基于所述特征数据对所述算法模型进行训练,得到能够生成所述预测数据的预测模型,包括,
基于所述特征数据生成多组待训练算法模型;
基于所述特征数据对所述多组待训练算法模型进行训练,得到所述预测模型。
5.根据权利要求4所述的方法,所述基于所述特征数据生成多组待训练算法模型,包括,
基于所述特征数据形成多组特征数据的权重参数组合;
基于所述权重参数组合形成多组待训练算法模型的模型参数组合;
基于所述模型参数组合形成多组待训练算法模型。
6.根据权利要求4所述的方法,所述基于所述特征数据对所述多组待训练算法模型进行训练,得到所述预测模型,包括,
基于所述特征数据同时对...
【专利技术属性】
技术研发人员:于博杰,李斌,王永生,
申请(专利权)人:联想北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。