【技术实现步骤摘要】
基于大数据的标签推送方法、装置、电子设备及存储介质
本专利技术涉及大数据
,具体涉及一种基于大数据的标签推送方法、装置、电子设备及存储介质。
技术介绍
传统的标签技术,是基于数据源进行提取,通过埋点等手段,获取用户的行为数据,根据用户的行为习惯及基本信息打上各种各样的标签,并且传统的标签都是从业务或产品角度出发,依靠经验进行相关维度组合和阈值设定,绝大多数标签都是无人问津。现有的执行业务系统的标签库是基于执行业务流程来做的,标签库中的标签包含了大量的手工操作,并且大部分标签来源于数据的简单归集整理,未对每个业务节点的数据进行清洗处理,提取有价值的信息创建标签库,导致用户无法根据推荐的标签快速的得到想要的资料和数据,在确定每步操作前需要查阅大量的资料和数据,推荐的标签的准确率低。
技术实现思路
鉴于以上内容,有必要提出一种基于大数据的标签推送方法、装置、电子设备及存储介质,通过清洗原始数据并提取多维度目标特征得到每个节点的初始标签,并聚类为不同对象的标签体系,提高了标签推荐的准确率。本 ...
【技术保护点】
1.一种基于大数据的标签推送方法,其特征在于,所述基于大数据的标签推送方法包括:/n从预设的多个数据源中采集多个原始数据,其中,每个所述原始数据中对应有节点标识;/n对每个所述原始数据按照预设的数据清洗策略进行数据清洗,得到样本数据;/n从每个节点对应的样本数据中提取多维度的目标特征,将所述多维度的目标特征按照预设的归类模型进行归类,得到每个节点的初始标签;/n对所述每个节点的初始标签进行聚类分析形成不同对象的标签体系;/n当监测到目标节点被触发时,推送所述目标节点对应的标签体系中的初始标签。/n
【技术特征摘要】
1.一种基于大数据的标签推送方法,其特征在于,所述基于大数据的标签推送方法包括:
从预设的多个数据源中采集多个原始数据,其中,每个所述原始数据中对应有节点标识;
对每个所述原始数据按照预设的数据清洗策略进行数据清洗,得到样本数据;
从每个节点对应的样本数据中提取多维度的目标特征,将所述多维度的目标特征按照预设的归类模型进行归类,得到每个节点的初始标签;
对所述每个节点的初始标签进行聚类分析形成不同对象的标签体系;
当监测到目标节点被触发时,推送所述目标节点对应的标签体系中的初始标签。
2.如权利要求1所述的基于大数据的标签推送方法,其特征在于,所述对所述每个节点的初始标签进行聚类分析形成不同对象的标签体系包括:
根据k均值聚类算法对所述每个节点的初始标签进行聚类,获得多个对象;
以所述多个对象中的任一对象作为所述目标对象,将所述目标对象及所述目标对象对应的初始标签设置为所述目标对象对应的标签体系。
3.如权利要求1所述的基于大数据的标签推送方法,其特征在于,在对所述每个节点的初始标签进行聚类分析形成不同对象的标签体系之后,所述方法还包括:
实时监控预设周期内每个初始标签的点击率及转化率;
判断所述每个初始标签的点击率是否大于对应的点击率阈值,及判断所述每个初始标签的转化率是否大于对应的转化率阈值;
当所述每个初始标签的点击率大于或者等于所述对应的点击率阈值,及所述每个初始标签的转化率大于或者等于所述对应的转化率阈值时,将所述初始标签划分为热门标签;
当所述每个初始标签的点击率小于所述对应的点击率阈值,或者所述每个初始标签的转化率小于所述对应的转化率阈值时,将所述初始标签划分为无用标签。
4.如权利要求1所述的基于大数据的标签推送方法,其特征在于,所述对所述原始数据按照预设的数据清洗策略进行数据清洗,得到样本数据包括:
识别每个原始数据的节点标识;
获取所述节点标识对应的预设的数据清洗策略;
按照所述预设的数据清洗策略清洗所述节点标识对应的原始数据;
将清洗过的所述原始数据转换成预设类型的结构化数据;
将所述结构化的数据按照所述节点标识进行归类得到样本数据,并将所述样本数据存放至预设的数据库中。
5.如权利要求1所述的基于大数据的标签推送方法,其特征在于,所述从每个节点对应的样本数据中提取多维度的目标特征,将所述多维度的目...
【专利技术属性】
技术研发人员:张永强,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。