【技术实现步骤摘要】
一种基于数据自学习的画像构建方法
本专利技术涉及数据画像
,具体提供一种基于数据自学习的画像构建方法。
技术介绍
数据挖掘,是利用一种工具和算法,对数据进行处理和模型训练,从而能够发现数据之间的关联关系和隐藏于数据之间信息的过程。数据画像,是利用一种工具对数据进行抽象化,提取出数据蕴含的典型特征,并赋予其标签名称,给数据内容进行打标签,同时基于一定的统计学要素、场景等描述,形成一个画像原型的过程。随着科技的发展,我们已经进入万物互联的智能时代,人与人之间的交流更加频繁,数据价值应用凸显,实现数据的智慧化应用成为各行各业的利器。企业、产品、业务、人等都可以借助数据画像从而更深刻的理解企业经营情况、产品使用情况、业务经营情况、人的健康状况等,依靠数据决策,依靠数据提供的参考,更科学更智慧。随着海量数据产生以及大数据技术的不断发展,数据之间的壁垒被打破从而实现了数据的互联互通,使得数据之间关联关系得以发掘和利用。其中画像的构建就是为了更加形象直观的展现数据之间的关系,发掘数据的价值,从而为现实中的决策 ...
【技术保护点】
1.一种基于数据自学习的画像构建方法,其特征在于,所述方法通过定义算法,发布并授权给相应的实体算法权限,给实体定义一个标签并绑定标签与算法之间的对应关系;/n将一个实体下的多个标签进行分组,指定每个分组下的标签列表组合;/n将实体与数据集进行绑定,并指定数据集之间关联条件;/n构建实体画像任务。/n
【技术特征摘要】
1.一种基于数据自学习的画像构建方法,其特征在于,所述方法通过定义算法,发布并授权给相应的实体算法权限,给实体定义一个标签并绑定标签与算法之间的对应关系;
将一个实体下的多个标签进行分组,指定每个分组下的标签列表组合;
将实体与数据集进行绑定,并指定数据集之间关联条件;
构建实体画像任务。
2.根据权利要求1所述的一种基于数据自学习的画像构建方法,其特征在于,所述方法通过对实体画像任务的标签列表作为数据源进行二次关联分析,剖析实体与各标签之间的关系,对画像的精准度进行评分,并根据评分给出异常标签值,进行标签绑定算法的参数优化和逻辑优化。
3.根据权利要求1所述的一种基于数据自学习的画像构建方法,其特征在于,所述实体与数据集进行绑定的过程包括内容如下:
所述实体对应的数据集包含多个不同维度的数据表,各数据表之间具有一定的关联关系,绑定时将相关数据表之间的关联关系进行指定。
4.根据权利要求3所述的一种基于数据自学习的画像构建方法,其特征在于,所述构建实体画像任务的过程包括内容如下:
选中实体后,展示数据集下的详细字段列表;
根据需要批量选择字段,绑定字段与标签之间的输入关系,并指定标签的执行顺序和分组的统计顺序,构建实体标签任务,得到标签结果。
5.根据权利要求4所述的一种基于数据自学习的画像构建方法,其特征在于,所述标签结果同步到目标数据库中供前端的画像系统进行可视化的呈现,并可为市场分...
【专利技术属性】
技术研发人员:张中华,王树峥,欧钰鹏,张伟,金明林,
申请(专利权)人:济南慧天云海信息技术有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。