【技术实现步骤摘要】
一种用户监察标签分类的方法和装置
本专利技术涉及计算机
,尤其涉及一种用户监察标签分类的方法和装置。
技术介绍
现有的大数据平台,例如用户监察大数据平台,数据来源广泛、类型复杂。然而现有的大数据平台各类数据参差不齐,数据模型不统一,给用户展示的信息繁杂。现有的数据集成可视化无法有效的利用各类数据,从而造成数据浪费。
技术实现思路
有鉴于此,本专利技术实施例提供一种用户监察标签分类的方法和装置,能够采用机器学习的分类、聚类算法,运用大数据技术和标签技术,实现全面概括和准确性高的用户监察标签类别,及时发现干部员工日常工作的异常行为,辅助提升用户监察工作科学化和智能化管理。降低了大数据管理的复杂度,提高了业务数据分类的管理效率和使用效率。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种用户监察标签分类的方法,包括:构建用户监察标签体系;对所述用户监察标签体系进行标签分类并根据所述用户监察标签分类生成模型规则;基于所述模型规则以可视化展示所述用户监察标签体系。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述构建用户监察标签体系包括:获取源数据;对所述源数据标准化以生成标准化数据;获取所述标准化数据的特征值;基于所获取的特征值对所述标准化数据进行聚类;形成聚类标签。根据本专利技术实施例的一个方面的用户监察标签分类的方法,其中,所述用户监察标签分类是多层次的分类,至少包括以下中的一种或多种 ...
【技术保护点】
1.一种用户监察标签分类的方法,其特征在于,包括:/n构建用户监察标签体系;/n对所述用户监察标签体系进行用户监察标签分类并根据所述用户监察标签分类生成模型规则;/n基于所述模型规则以可视化展示所述用户监察标签体系。/n
【技术特征摘要】
1.一种用户监察标签分类的方法,其特征在于,包括:
构建用户监察标签体系;
对所述用户监察标签体系进行用户监察标签分类并根据所述用户监察标签分类生成模型规则;
基于所述模型规则以可视化展示所述用户监察标签体系。
2.根据权利要求1所述的方法,其特征在于,所述构建用户监察标签体系包括:
获取源数据;
对所述源数据标准化以生成标准化数据;
获取所述标准化数据的特征值;
基于所获取的特征值对所述标准化数据进行聚类;
形成聚类标签。
3.根据权利要求1所述的方法,其特征在于,所述用户监察标签分类是多层次的分类,至少包括以下中的一种或多种:
基础标签,所述基础标签是基于简单规则应用的标签分类;
刻画标签,所述刻画标签是基于机器学习算法应用的标签分类;
用户标签,所述用户标签是用于数据整合处理的标签分类。
4.根据权利要求1所述的方法,其特征在于,基于所述模型规则以可视化展示所述用户监察标签体系包括:
在数据仓库层面进行数据预加载,在可视化展示前端对数据接口进行关联展示;
展示数据来源和加工规则以查看和校验标签溯源。
5.根据权利要求2所述的方法,其特征在于,所述获取源数据包括:
获取一个或多个数据源;
在所述一个或多个数据源中选择满足以下条件的数据源优先接入:可直接使用的数据源,或者,关注度高的数据源;
获取来自所述数据源的源数据。
6.根据权利要求2所述的方法,其特征在于,所述对所述源数据标准化包括:
将来自所述数据源的数据在企业级数据仓库中统一标准化处理。
7.根据权利要求2所述的方法,其特征在于,所述基于所获取的特征值对所述标准化数据进行聚类包括:
基于所述标准化数据生成一个或多个第一数据集;
基于第一预设条件将所述一个或多个第一数据集拆分成一个或多个第二数据集,所述第二数据集小于所述第一数据集;
利用聚类分析,根据预定原则对所述一个或多个第二数据集进行二次分类,直到满足第二预设条件。
8.根据权利要求7所述的方法,其特征在于,所述聚类分析是层次聚类分析。
9.根据权利要求7所述的方法,其特征在于,所述预定原则至少包括以下中的一项或多项:
最小连接距离;
最大连接距离;
平均连接距离。
10.根据权利要求9所述的方法,其特征在于,所述满足第二预设条件包括:
满足业务预设条件;或者
所述一个或多个第二数据集的数目达到预设阈值;或者
任意两个第二数据集之间的距离达到预设阈值。
11.根据权利要求3所述的方法,其特征在于,所述多层次的分类至少包括标签大类、标签中类、标签细类。
12.根据权利要求...
【专利技术属性】
技术研发人员:王怡冰,朱克鹏,王德刚,申中华,张雨,贾飞,金亮,陆亦敏,刘水泉,魏聪惠,刘洋,薛飞,朱佳,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。